Newsletter #431:OpenAIのo1は 「立ち止まって考える」ことで他のLLMを凌駕する、他。

作成者: ARK Invest|2024/09/16

本レポートは、2024916ARK社のHPに公開された、英語による「Newsletter #431」の日本語訳です。内容については英語による原本が日本語版に優先します。また、情報提供のみを目的としたものです。

 

1. OpenAIo1 「立ち止まって考える」ことで他のLLMを凌駕する

By Frank Downing | @downingARK
Director of Research, Next Generation Internet

 

既存の大規模言語モデル(LLM)の出力は、どうやら実体のない記号体系からの「直感的な」応答であり、質問の答えになりそうな最初のコンテンツを提示するシステムになっているようです。残念ながら、人間であれLLMであれ、質問に対する最初の答えは最も賢明なものではないかもしれません。十分に論理的に考え抜かれた答えを出すには、思考と時間の両方が必要です。

OpenAI社の最新モデル(その名も「o1」)は、思考の連鎖を促すプロンプティングや、モデルに問題を分解させて、それを段階的に解決していくプロセスに似た手法を含む「推論」への新しいアプローチで、この問題に対処しようとしています。  

プロンプトが与えられると、o1は数秒から数分間一時停止し、「思慮深い」応答へつながるパスを探索して、反復します。OpenAI社のベンチマーク結果では、o1の新しい推論機能により、特にコーディング、数学、科学的なタスクにおいて、以前のモデルと比較してモデルのパフォーマンスが大幅に向上していることがすでに実証されています。

重要なことは、次の図の左側に示されているように、o1の回答の質は、推論中に思考に費やした時間に応じて向上する傾向があることです。いわゆる「テスト時」の性能は、モデルトレーニングの典型的なスケーリング法則に似ており、トレーニングの計算量が増えるにつれてモデルの性能が予測通りに向上することを示唆しています。 

注:上のX軸は、モデルのトレーニング(左のグラフ)と実行(右のグラフ)に費やされた計算時間を対数スケールで表しています。OpenAIは絶対的な単位を提供していませんが、これはおそらく機密情報の漏洩を防ぐためでしょう。具体的な時間の測定に関わらず、このチャートは推論/トレーニング時間が長いほど一貫して優れたパフォーマンスをもたらすことを示すものです。出所:OpenAI 2024 [1] 本資料は情報提供のみを目的としたものであり、投資アドバイスや特定の証券の売買・保有を推奨するものではありません。また、過去の実績は将来の結果を示すものではありません。

 

その興味深いパフォーマンスに加えて、o1はビジネスモデルにも重要な影響を及ぼす可能性があります。OpenAI社の新しいアプローチは、推論アプリケーション・プログラミング・インターフェース(API)の頻繁な使用を奨励するはずであり、性能の向上は、R&D(研究開発)に関連する資本支出よりも、営業費用であるCOGS(売上原価)に大きく依存することになります。

o1の推論機能とユーザーとのインタラクションにより、同社のすべてのモデルを継続的に改善するのに役立つ思考パターンの貴重なデータセットが作成される可能性があります。競争力と安全性の両方を考慮し、同社は推論プロセス中に生成されたテキストをエンドユーザーには非表示にしています。明らかに、OpenAIの経営陣はそのデータの価値の高さを認識しているのでしょう。

 

2. WaymoUberはオースティンとアトランタに提携を拡大中

By Daniel Maguire, ACA | @DMaguireARK
Research Associate

 

先週、Waymo(ウェイモ)とUber(ウーバー)は、2025年初頭にオースティンとアトランタに提携を拡大すると発表しました[2]。フェニックスでの以前の非独占的提携とは異なり、オースティンとアトランタでの Waymoの車両はUberのアプリでのみ利用可能になります[3]。注目すべきは、Waymoが事業を展開する都市はアトランタで5都市目となり、4月に同地でテストが開始されて以来、急速に拡大していることです[4] 。また、Uberは車両の清掃、修理、その他の車両基地運営業務など、これまで同社が提供していなかった車両管理サービスも提供する予定です。

他の自動運転関連の提携や投資に加えて[5] UberWaymoとの提携にさらに力を入れていることは、2020年に自動運転部門をAurora Innovation (オーロラ・イノベーション)に売却して以来の大きな戦略転換であり、電動ロボタクシーの未来に参画する意欲を新たにしたことを示唆しています[6]

当社はロボットタクシーのビジネス機会を継続的にモニターしており、今後の発表、特に10月に開催されるTesla社のロボタクシーお披露目イベントでの発表に期待しています。

 

3. Tempus AIの新しいアプリ「olivia」は、患者のヘルスケアジャーニーに力を与えるか?

By Nemo Marjanovic, PhD | @NMDespotARK
Research Analyst

 

先週、Tempus AI(テンパスAI)社は、患者が自身の健康データを管理・活用できないことに対処するために、新しいアプリolivia(オリヴィア)」をリリースしました[7]。現在の医療システムは断片化されており、特に慢性疾患を抱える患者にとっては、医療提供者、専門医、システムからの医療記録を整理する必要があります。断片化は、患者のケアを複雑にするだけでなく、健康状態を改善するための重要な洞察を妨げています。Tempus AIoliviaは、医療記録を集約し、症状を追跡し、患者を医師の診察に備えることで、複雑さを解消します。

患者に負担をかけているボトルネックに対処することは、現在の医療制度に課題をもたらすでしょうか?その問いが、患者ケアを変革するoliviaのアプローチの核心にあります。oliviaの破壊的な力は、生成AIによるものです。AIの機能を活用することで、oliviaはデータを分析し、ユーザーが自分の健康についてリアルタイムで質問できるようなパーソナライズされた洞察を提供することで、単純なデータ集計の域を超えています。深い医学的専門知識を必要とせずに、患者が自分の健康を総合的に理解できるようにすることで、医療のパラダイムを変えることが出来ます。

したがって、私たちはoliviaの最先端のAIソリューションが、患者と医療システムとの関わり方を再定義するかどうかを見守ることを楽しみにしています。このテクノロジーは、制度的な抵抗を克服し、患者が自分の医療データを所有するように促すことになるでしょうか?

 

 

 

 

 

 

 

[1] OpenAI. 2024. “Learning to Reason with LLMs.”

[2] Waymo, 2024. “Waymo and Uber Expand Partnership to Bring Autonomous ride-Hailing to Austin and Atlanta.” Waymo Waypoint Blog.

[3] Waymo. 2023. “The Waymo Driver: Now Available on Uber in Phoenix.” Waymo Waypoint Blog.

[4] Waymo. 2024. “Winter in Buffalo, Spring in DC, and Summer in Atlanta…” X.

[5] Cruise. 2024. “ Uber and Cruise to Deploy Autonomous Vehicles on the Uber Platform.” See also Waymo. 2024. “Winter in Buffalo, Spring in DC, and Summer in Atlanta…” X. See also  Carey, N. 2024. “Uber Invests in UK Startup Wayve to Speed Up Self-Driving Projects.” Reuters, via Yahoo! Finance.

[6] Uber Investor. 2020. “Aurora is acquiring Uber’s self-driving unit, Advanced Technologies Group, accelerating development of the Aurora Driver.”

[7] Tempus AI. 2024. “Tempus Launches Beta Version of olivia, its AI-enabled Personal Health Concierge App for Patients.”

 

 

 

ARK’s statements are not an endorsement of any company or a recommendation to buy, sell or hold any security. For a list of all purchases and sales made by ARK for client accounts during the past year that could be considered by the SEC as recommendations, click here. It should not be assumed that recommendations made in the future will be profitable or will equal the performance of the securities in this list. For full disclosures, click here.