商品
米国株
米国株現物取引
米国株信用取引
日本株
日本株現物取引
ひと株(単元未満株)
投資信託
ツール・アプリ
スマートフォンアプリ
デモ取引
moomooプレミアム
NISA
手数料
キャンペーン
投資情報
マーケット
株式
オプション
先物
ETF
FX
注目機能
デモ取引
銘柄スクリーナー
ヒートマップ
機関投資家の動向
テーマ投資
決算カレンダー
ニュース
ハイライト
ニュース速報
経済カレンダー
米国経済
ホット トピックス
動画
揭示板
フィード
トピック
投資戦略
学ぶ
投資ライブラリー
株式
オプション
投資戦略と洞察
投資視点
Mooガイド
よくある質問
moomoo証券について
会社案内
新着情報
もっと見る
よくある質問
moomoo証券について
会社案内
新着情報
ログイン
ダウンロード
スマホ版
デスクトップアプリ
ダウンロード
詳しくはこちら
ログイン
米国株
米国株信用取引
日本株
ひと株(単元未満株)
投資信託
商品
米国株
米国株現物取引
米国株信用取引
日本株
日本株現物取引
ひと株(単元未満株)
投資信託
ツール・アプリ
スマートフォンアプリ
デモ取引
moomooプレミアム
NISA
手数料
キャンペーン
投資情報
マーケット
株式
オプション
先物
ETF
FX
注目機能
デモ取引
ヒートマップ
機関投資家の動向
テーマ投資
決算カレンダー
ニュース
ハイライト
ニュース速報
経済カレンダー
米国経済
ホット トピックス
動画
揭示板
フィード
トピック
投資戦略
学ぶ
投資ライブラリー
株式
オプション
投資戦略と洞察
投資視点
Mooガイド
よくある質問
moomoo証券について
会社案内
新着情報
日本語
ダーク
ライト
口座開設
ダウンロード
アプリをダウンロード
ログイン後利用可能
トップに戻る
マイクロソフトが開発者会議でAIの新機能を公開!
閲覧 90K
コンテンツ 27
認証アカウント
Meltyy
がディスカッションに参加しました · 2023/05/30 16:39
GPTのステータスがやっと明確になりました!
$マイクロソフト (MSFT.US)$
今日からアンドレイ・カルパシ氏のプレゼンテーションを観ながらTwitterのノートを取って、一緒に楽しみましょう。
アンドレイ・カルパシ氏はステージから始めます:
1 - プレトレーニング - 数ヶ月x何千ものGPU
2、3、4 - 数時間または数日かかるファインチューニングステージ
プレトレーニング開始前には、2つの準備ステップがあります。
データ収集 - 異なるソースから大量のデータを取得します(ここではAndrej LLaMaの混合)。
トークナイズ - 語句を整数に変換する、損失のない変換。
「モデルに含まれるパラメータの数だけで、モデルのパワーを判断するべきではありません」
LLaMaは1兆-1.4兆トークンに対して、GPT-3は300Bトークンに対してトレーニングされました。
「残念ながらトランスフォーマーの仕組みについて詳しく説明する時間がありません」
アンドレイ氏が教育に情熱を持っていることが大好きです!
正直に言って、これをツイートにまとめることはできません。
こちらはニューヨーク・タイムズの例で、シェイクスピアに基づいたGPTモデルを訓練しました。
多くの反復を経てLMがシェイクスピアテキストの次にどの単語が来るかをより正確に予測するようになっていることがわかります。
率直に言って、ここでは大幅に言い換えますが、各反復で、トレーニングモデルは次のトークン/整数が緑のトークンの次に来るかを予測しようとします。このトレーニング曲線で予測がどの程度元のテキストと一致するかが明らかに示されています。
GPT-2以降、業種では、プロンプトを特定の方法で構成し、いくつかの例(Few Shot prompting)を提供すると、ベースモデルはプロンプトで提供された指示を自動完了するように"騙される"ことがわかりました。
Andresさんはこれを何度も繰り返し、現在はLLaMaを使用するのが最善であるとされている最高のオープンソースモデルは、AIです(OAIはGPT-4について何もリリースしていません)。
$メタ・プラットフォームズ (META.US)$
GPT-2-リリース+重み
GPT-3- APIを介してベースモデルが利用可能(da-vinci)
GPT-4- APIを介して利用可能ではない
ベースモデルは助手ではなく、基本的な意味であなたが求めることはできません。ただの自動完了テキストです。
でも少しの Few-shot プロンプトを使ってドキュメントの構造を構成すると、ベースモデルは人工知能と人間の間のチャットとして自動完了するように"騙され"るようになります。
しかし、このトリックだけでは不十分です。ですから、ステップ2に移ります。
教師付きのファインチューニングです。
指示の小規模だが高品質な(人間の請負業者を思い浮かべてください)データセットを収集し、交換用のデータセットでモデルのトレーニングを継続します。そうすることで、SFT(教師付きファインチューニング)モデルを得ることができます。
SFTモデルは...まだグッと言えるレベルではなく、決してchatgptの品質ではありません。ですから、トレーニングは続きます。
SFTモデルの質問と回答を生成し、ユーザーが3つのバージョンを比較して最高のものをランク付けし、モデルがユーザーによって選択された選択肢で再トレーニングされるようになっています。
これは、より優れた投票された応答を重んじることで実現されます。たとえば、あなたが打つと
3つのバージョンを生成し、ユーザーがそれらを比較してランク付けして、モデルに選択肢をトレーニングさせるように求めます。
、それらを比較してランク付けし、選択肢をモデルにトレーニングさせます。
または
chatgpt関連では、応答を再生成することができますが、それらの信号はRLHFにとって非常に良いです。
Andrejは、RLHFモデルが私たちにとって"感じ"が良い理由について説明しています。少なくとも、良いアシスタントである点に関しては。
もしこのまま読み続ける方がいらっしゃったら、私はこのビデオを紹介します。
興味深いことに、AndrejはRLHFについて、ベースモデルよりも改良されているわけではないと話しています。RLHFモデルはエントロピーが少ないため、より"発明的"になる可能性があります。
そのため、基本モデルの方がまだ優れているため、それらはまだ混沌としています。
これは、ランキングに基づいてバークレー大学の人々によってランク付けされたモデルの現在の状態です。
興味深いことに、karpathyはGPT-4が遥かに最高であると言っていますが、表では、Claudeの1224 ELOレーティングに対して1274であり、「遥かに」とは思えません。
RLHFモデルはより優れており、上位3つ全てがRLHFモデルで、残り(彼の知る限り)はSFTモデルです。
やったね!講義の前半が終わりました。これらのモデルの問題へのアプリケーションに移ります。
そして、Andejは、人間がステートメントを書くプロセスとの違いについてかなり深く掘り下げています。
"カリフォルニアの人口は、アラスカの53倍です"
人間の脳は、ループ処理、事実チェック、計算、反省を経ています。
一方、GPTはオートコンプリートをしようとしていますが、内部的には対話はありません。
トークンごとに、数字を見つける必要があるか、確認する必要があるファクトであるかに関係なく、同じ"コンピュート"を費やしていますが、彼らは広範な知識と完璧な記憶(コンテキストウィンドウ)を持っています。
一連の考えのような方法は、ステップバイステップで考えて"より多くのトークン"、"より多くの考える時間"を提供することによって、モデルに提供されます。
これにより、モデルは自分の作業を示し、より良い答えを得るために"考える時間"を与えられます。
今、Andrejは自己反省を方法の1つとして説明しています。
モデルは既にサンプリングしたトークンをキャンセルする方法がないため、"引っかかって"しまうことがあります。
間違った単語を言って途中で止めて、「言い換えよう」と言う場合を想像してみてください。
モデルにはそのような贅沢はないため、間違った道へと進むことがあります...
ただし、セルフリフレクションのような例では、モデルに出力内容をレビューし、それを評価するよう求めることによって、モデルには出力の推論をもう一度行う「セカンドチャンス」が与えられ、結果が改善されます!
アンドレイは、システム1とシステム2の思考モデルを用いたThinking Fast and SlowをLLMsに使用することが大好きです。
CoT、セルフリフレクション、そして最近リリースされたTree of thoughtのようなこれらの技術は、よりゆっくりと、より慎重な考えをするシステム2を構築する試みです。
類推。
$シースリー・エーアイ (AI.US)$
$アルファベット クラスA (GOOGL.US)$
$テスラ (TSLA.US)$
$Nasdaq Composite Index (.IXIC.US)$
$SPDR S&P 500 ETF (SPY.US)$
免責事項:このコミュニティは、Moomoo Technologies Inc.が教育目的でのみ提供するものです。
さらに詳しい情報
2
5
+0
2
5
読み込みに失敗しました。
クリックして再試行
読み込み中
コンテンツがありません
7
3
原文を見る
報告
45K 回閲覧
コメント
サインイン
コメントをする
Meltyy
挣钱养猫猫😺
2193
フォロワー
24
フォロー中
18K
訪問者
フォロー
ランキング
米国株
米国株
香港株
カナダ株
日本株
豪州株
シンガポール株
マレーシ
中国A株
コード
ミニチャート
現在値
NVDA
エヌビディア
--
131.760
TSLA
テスラ
--
396.360
RGTI
リジッティ・コンピューティング・インク
--
8.9500
AMD
アドバンスト・マイクロ・デバイシズ
--
116.090
PLTR
パランティア・テクノロジーズ
--
65.910
ニュース
トランプ氏、第47代米大統領に就任
21分前
中国の資産感情は回復の兆しを見せている
01/20 19:25
トランプが就任宣誓を行い、アメリカ合衆国大統領になる
25分前
就任式日のトランプ・テックエクストラバガンザ
00:09
トランプ経済に関する大統領令、覚書はエネルギーとインフレに焦点を当てている
01/20 23:14
現在の話題
Trump 2.0 countdown: What's the next big opportunity in the markets?
▪️Could Trump's cryptocurrency policies potentially benefit the crypto market? ▪️Might his tariff policies have a positive effect on Chinese
もっと見る
Popular on moomoo
01/13 17:43
トランプ2.0オポチュニティプレビュー:大統領が就任する前に市場の勝者を推測してください!
Meltyy
挣钱养猫猫😺
2193
フォロワー
24
フォロー中
18K
訪問者
フォロー