熟考する生成AI!o1モデルシリーズがAzureにも登場。– 従来のGPTモデルとの違いとビジネス活用の可能性

o1モデルの優れた思考プロセスがビジネスデータ分析を加速する

AzureでのOpenAI「o1-preview」と「o1-mini」発表

米国時間の9月12日、以下の発表がありました。

Microsoft Azure向けに、OpenAIの新たな推論モデルシリーズ「o1」を発表

azure.microsoft.com

これら情報を踏まえて、本コラムは、以下の3ステップでお届けします。

  1. o1モデルの説明
  2. Microsoft社の記事に基づく日本語での解説
  3. o1モデルについてのビジネス適用に関する考察

1.o1モデルの説明

o1モデルの特徴

OpenAIの「o1モデル」は、2024年9月12日に発表された従来のGPTシリーズとは異なる新たな大規模言語モデルシリーズです。o1モデルの最大の特徴は、出力前に思考プロセスを通る点です。従来のGPTモデルは、入力に対して即座に回答を生成しましたが、o1は複雑なタスクを段階的に考え、その結果としてより正確で深みのあるアウトプットを提供します。 技術的に見て、o1モデルは単なるトークンベースの予測に頼らず、新しい思考プロセスを取り入れています。GPT-4や他の従来モデルは、確率的なアプローチで次の単語を予測しながら回答を生成していましたが、o1モデルは「考える」プロセスを挿入し、人間のような思考プロセスを再現します。これは、まさに人間が何かを行う際、いきなり作業に入るのではなく、まず「目標や現状を加味して、どのように進めるべきか」を考えてから作業を始めることと同じです。このプロセスにより、ビジネス戦略やPL(損益計算書)の計算といった高度な分析や長期的な計画においても、より現実的で有用な提案が可能になりました。

GPT-4oとo1の違い

GPT-4oと比較すると、o1は特にビジネスの意思決定や戦略立案において優れた能力を発揮します。例えば、数値データに基づく分析や評価など、単なる自然言語処理を超えたロジックや計算が可能です。GPT-4oでも同様のアウトプットが期待できますが、o1は段階的な思考プロセスを挿入することで、より人間に近いアプローチで精度を高めている点が特徴です。 さらに、o1は安全性にも配慮されており、不適切な発言や危険な提案を防ぐための仕組みが強化されています。これにより、企業は安心してAIを活用できる環境が整っています。

2.Microsoft社の記事に基づく日本語での解説

Introducing o1: OpenAI’s new reasoning model series for developers and enterprises on Azure解説

The o1-preview and o1-mini models are now accessible in Azure AI Studio and GitHub Models to a select group of Azure customers to collaboratively explore and identify the unique strengths of each model. The o1 series of advanced reasoning models excel at complex and nuanced problem spaces like these: Complex code generation: Capable of algorithm generation and advanced coding tasks to help developers. Advanced problem solving: Perfect for comprehensive brainstorming sessions and tackling multifaceted issues. Complex document comparison: Ideal for analyzing contracts, case files, or legal documents to discern subtle differences. Instruction following and workflow management: Particularly adept at handling workflows that require shorter context.
o1-previewとo1-miniモデルは、Azure AI StudioおよびGitHub Modelsにて、選ばれたAzure顧客向けに提供されています。これにより、各モデルの特有の強みを共同で探求し、特定することが可能です。この高度なo1モデルシリーズは、以下のような複雑かつ微妙な問題に優れています。

1. 複雑なコード生成: アルゴリズム生成や高度なコーディングタスクを支援する能力
2. 高度な問題解決: 包括的なブレインストーミングや複雑な課題に対応
3. 複雑な文書比較: 契約書、訴訟資料、法的文書などの微妙な違いの分析に最適
4. 指示の遵守とワークフロー管理: より短いコンテキストのワークフローに最適

この4つは、非常に有益な観点です。

New updates in our commitment to responsible AI and Safety by default. Safety continues to be our top priority in delivering new generative AI models, o1 and o1-mini models in Azure OpenAI Service have “on-by-default” Content Safety features, at no additional cost for you. 
安全性は引き続き新しい生成AIモデルの提供における最優先事項であり、Azure OpenAIサービスのo1およびo1-miniモデルには、追加料金なしで「デフォルトでオン」のコンテンツセーフティ機能が含まれています。OpenAIは、モデルが安全でないリクエストを拒否できるようにする新しい手法など、追加の安全対策にも投資しています。これにより、o1シリーズのモデルは、これまでに導入された中で最も堅牢なモデルとなっています。

o1では、従来のモデルと比較して安全性が大幅に向上しています。詳細は割愛しますが、ジェイルブレイクテストというテストがあります。このテストは、ユーザーがAIを意図的に暴走させたり、内部の情報を抜き取ろうとする試みを行った際に、AIがどれだけ規則を守り続けるかを評価するものです。GPT-4oが100点満点中22点だったのに対し、o1-previewモデルは84点を獲得したという報告もあります。

To better understand o1-preview and o1-mini’s place in our model lineup, here’s a quick overview of the key models powering Azure OpenAI Service: o1-preview: Focused on advanced reasoning and solving complex problems, including math and science tasks. Ideal for applications that require deep contextual understanding and agentic workflows. o1-mini: Smaller and faster, and 80% cheaper than o1-preview, performs well at code generation and small context operations. GPT-4o: A versatile, multimodal model that excels in both text and image processing, with superior performance in non-English languages and vision tasks. Suitable for applications needing enhanced accuracy and multilingual capabilities. The model also features JSON Structured Outputs for consistent, well-defined data formats, reducing post-processing needs and improving application efficiency. Designed for real-time applications that require fast, reliable text responses at minimal cost. GPT-4o Mini: A smaller, cost-effective version of GPT-4o, optimized for environments with limited resources or high cost constraints. Retains text and image processing capabilities, making it ideal for lightweight applications. DALL-E: Generates images from text prompts with safety, ideal for creative content and marketing. Whisper: Transcribes and translates speech to text, suitable for real-time transcription and multilingual communication.
o1-previewとo1-miniの位置づけを理解するために、Azure OpenAIサービスを支える主要モデルの概要を以下に示します。

• o1-preview: 高度な推論と複雑な問題解決に焦点を当てており、数学や科学のタスクに適しています。深いコンテキスト理解とエージェントワークフローを必要とするアプリケーションに最適です。
• o1-mini: 小型で高速、o1-previewより80%安価で、コード生成や小規模なコンテキスト操作に優れています。
• GPT-4o: テキストおよび画像処理に優れた多目的なモデルで、非英語言語やビジョンタスクでも卓越したパフォーマンスを発揮します。JSON構造化出力機能を備え、データ形式の一貫性を保ち、後処理の必要性を減らしてアプリケーションの効率を向上させます。リアルタイムアプリケーションに最適です。
• GPT-4o Mini: GPT-4oの小型でコスト効率の高いバージョンで、リソースが限られている環境やコスト制約のある環境に最適です。テキストおよび画像処理機能を保持しており、軽量アプリケーションに最適です。
• DALL-E: テキストプロンプトから画像を生成し、安全に創造的なコンテンツやマーケティング素材を作成できます。
• Whisper: 音声をテキストに変換し、リアルタイムの文字起こしや多言語コミュニケーションに適しています。

詳しく知りたい方は、以下のMicrosoft Learnをご覧ください

Azure OpenAI Service models - Azure OpenAI | Microsoft Learn

Innovating at scale with Azure The latest OpenAI models are backed with all the capabilities of the Azure platform, including enterprise-grade security, flexible deployment options, and broad regional availability, which helps customers meet data residency and compliance needs. We have over 60,000 Azure AI customers with exciting production use cases across industries.
最新のOpenAIモデルは、エンタープライズレベルのセキュリティ、柔軟な展開オプション、広範な地域可用性を備えたAzureプラットフォームの機能に支えられています。これにより、データの所在とコンプライアンス要件を満たすことができます。60,000社以上のAzure AI顧客が、業界を問わずエキサイティングな実用ケースを展開しています。

Azure OpenAIサービスに限らず、扱う情報全てのセキュリティを考慮し、各企業のユースケースに合わせて、柔軟かつ迅速にビジネスに活用できる仕組み作りを高品質に提供することが重要です。

3. o1モデルについてのビジネス適用に関する考察

Azureでo1モデルを利用するには?

以下のURLに詳細が記載されています。

learn.microsoft.com

o1-previewおよびo1-miniモデルは、East US2地域でAI Studioの早期アクセスプレイグラウンドを通じて限定的に利用可能です。o1モデルのデータ処理は、利用可能な地域とは異なる地域で行われる場合があります。 早期アクセスプレイグラウンドでo1-previewおよびo1-miniモデルを試すには、登録が必要であり、アクセスはMicrosoftの適格基準に基づいて付与されます。

2024年9月13日時点では、o1-previewおよびo1-miniはMicrosoftの申請制となっており、Azureでの利用は申請承認後のEarly Access Playground(プレビュー)でのみ可能です。

ビジネスへのメリット

o1の導入により、企業は次のようなビジネス的なメリットを享受できると考えられます。

高度な戦略立案

o1は、企業の財務データや事業計画を高度に分析する能力を持っています。このo1の分析結果を基に、戦略や施策を段階的に整理し、具体的なKPIや売上目標を現実的に設定することが可能です。

複雑なタスクの効率化

特に複雑なコーディングタスクや数学的な問題解決において、従来のLLMでは困難だった深い思考が可能となります。これにより、IT分野に限らず、さまざまなエンジニアの生産性を大幅に向上させることが期待されます。

製造業でのユースケース例

o1モデルは、従来以上に多くの変数や制約条件を考慮できるため、以下のようなタスクをより高精度に実現できると考えられます。

  • 生産プロセスの最適化
  • 高度な品質管理
  • 革新的な製品開発
  • 高度な安全性分析
  • 効率的なトラブルシューティング
  • 高度な予測保全

金融業でのユースケース例

o1モデルの優れた推論能力と数学的スキルを活かし、より複雑で高度な金融分析が可能になると考えられます。

  • 高度なリスク分析
  • 精密な市場予測
  • 複雑な金融商品の評価
  • 長期的な投資戦略
  • 複雑な金融商品の説明
  • パーソナライズされたアドバイス
  • カスタマーサービスの向上

まとめ

今回のo1モデルは、GPTシリーズと比較して、より未来的なAIの可能性を感じさせるモデルです。このモデルによって、複雑なビジネス課題に対するAIの活用はさらに進化していくでしょう。

特にAzure OpenAI Serviceを利用した安心・安全な環境でこのモデルを活用することで、企業が扱う重要な数値や詳細なデータを用いた分析が、より精度高く実行できます。多くの企業がこの新しいAIの力を活用することで、複雑な課題解決や戦略立案の効率化を実現できるでしょう。

今後のAI活用において、このo1モデルが大きな役割を果たすことは間違いありません。

執筆
AITC センター長
深谷 勇次