Azure OpenAI Serviceで、GPT-4 Turbo with VisionがGA（一般公開）されました！ - AITC - ISID

GPT-4 Turbo with VisionがGA（一般公開）されました

GPT-4 Turbo with Visionは、テキスト生成能力に加えて画像を理解し処理する能力を持っており、多くの分野でその活用が進んでいます。

弊社のお客様でもすでに、Know Narrator/ノウナレーター（https://aitc.dentsusoken.com/products/knownarrator.html）で、プレビュー版のGPT-4 Turbo with Vision活用して業務に活用いただいているお客様もいらっしゃいますが、GAによって、より安定的にGPT-4 Turbo with Visionを利用できるようになります。

www.dentsusoken.com

本コラムでは、改めてGAに関する説明を行ったうえで、以下Microsoft社のブログ記事を元に、GPT-4 Turbo with VisionのGAに関して説明したいと思います。

techcommunity.microsoft.com

GA（General Availability:一般公開）とは？

Microsoft Azureで「GA（General Availability）」という用語は、特定のサービスが一般公開され、全てのユーザーが利用可能になった状態を指します。これは、そのサービスが開発とテストのフェーズを終え、安定して動作すると評価された後の段階です。

GAする前の段階には、通常「プレビュー」や「ベータ」といった状態があります。これらの段階では、限られたユーザーや開発者が新機能を試すことができ、フィードバックが求められます。これにより、Microsoftはバグの修正や機能改善を行い、製品の品質を高めることができます。

GAになると、以下のような変化があります：

信頼性とサポート: GAされたサービスは、フルサポートが提供され、SLA（サービスレベルアグリーメント）が適用されます。これにより、製品のダウンタイムや問題に対して一定の保証が得られます。
機能の安定性: プレビュー期間中のフィードバックに基づいて機能が改善され、不具合が修正されます。GA後は、これらの機能が安定して利用できるようになります。
料金体系の明確化: プレビュー段階では料金が無料であったり、割引が適用されている場合が多いですが、GA後は正式な料金体系が確立されます。
幅広いアクセス: プレビュー段階では利用できるリージョンが限られることがありますが、GAではより多くのリージョンでサービスが利用できるようになります。

つまり、AzureのサービスがGAになることは、そのサービスが実運用環境で広く利用される準備が整ったという信頼の証であると言えます。

Announcing the General Availability of GPT-4 Turbo with Vision on Azure OpenAI Service

We are excited to announce the general availability (GA) of GPT-4 Turbo with Vision on the Azure OpenAI Service. The GA model, gpt-4-turbo-2024-04-09, is a multimodal model capable of processing both text and image inputs to generate text outputs. This model replaces the following preview models: gpt-4-1106-preview gpt-4-0125-preview gpt-4-vision-preview Our customers and partners have been utilizing GPT-4 Turbo with Vision to create new processes, enhance efficiencies, and innovate within their businesses. Applications range from retailers improving the online shopping experience, to media and entertainment companies enriching digital asset management, and various organizations deriving insights from charts and diagrams. We will be showcasing detailed case studies from these applications at the upcoming Build conference.

Azure OpenAIサービスにて、GPT-4 Turbo with Visionの一般公開（GA）を発表します。この一般公開モデル「gpt-4-turbo-2024-04-09」は、テキストと画像入力の両方を処理しテキスト出力を生成するマルチモーダルモデルです。このモデルは、以下のプレビューモデルを置き換えます：

gpt-4-1106-preview
gpt-4-0125-preview
gpt-4-vision-preview

GPT-4 Turbo with Visionを使用したアプリケーション事例は、間もなく開催されるBuildカンファレンスで公開する予定のようです。

build.microsoft.com

Existing Azure OpenAI Service customers can now deploy gpt-4-turbo-2024-04-09 in Sweden Central and East US 2. For more information, please visit our model availability page.

既存のAzure OpenAIサービスのお客様は、現在「gpt-4-turbo-2024-04-09」をスウェーデン・セントラルおよび米国東部2のリージョンでデプロイすることができます。詳細については、モデルの利用可能性に関するページをご覧ください。

つまり、２０２４年５月１日時点では、GAされたモデルは、スウェーデン・セントラルおよび米国東部2の２つのリージョンのみです。早く日本リージョンにも来てほしいものです。

Guide to Deploying GPT-4 Turbo with Vision GA To deploy this GA model from the Studio UI, select "GPT-4" and then choose the "turbo-2024-04-09" version from the dropdown menu. The default quota for the gpt-4-turbo-2024-04-09 model will be the same as current quota for GPT-4-Turbo. See the regional quota limits.

今回GAされる具体的なモデル名は、「gpt-4の"turbo-2024-04-09"」になります。

Changes to GPT-4 Vision Enhancements Enhancements such as Optical Character Recognition (OCR), object grounding, video prompts, and "Azure OpenAI Service on your data with images", that were integrated with the gpt-4-vision-preview model will not be available with the GA model. We are dedicated to enhancing our products to provide value to our customers, and are actively exploring how to best integrate these features into future offerings.

GPT-4 Visionの機能強化の変更光学文字認識（OCR）、オブジェクトグラウンディング、ビデオプロンプト、および「あなたのデータと画像でのAzure OpenAIサービス」などの機能強化は、GAモデルでは利用できません。私たちは製品の機能強化に取り組んでおり、これらの機能を将来のオファリングにどのように最適に統合するかを積極的に探求しています。

OCRが必要な場合は、引き続きAzure AI Document Intelligenceを利用した方が良さそうです

azure.microsoft.com

まとめ

２０２４年５月１日にGPT-4 Turbo with VisionがGA（一般公開）されましたので、さっそくブログにしました。

広告やコンテンツデザイン制作で、ユーザーが入力したテキストに基づいて適切な画像を生成する視覚コンテンツの自動生成用途や、製造上で撮影された部品や完成品の画像を分析し、傷や不具合を自動的に検出する品質管理、店舗の商品写真を分析し、在庫の状況を自動で把握する在庫管理とプランニングなど、GPT-4 Turbo with Visionをビジネス向けに活用する例は多岐にわたります。

GPT-4 Turbo with Visionを活用したいというお客様は、こちらのお問い合わせフォームからご連絡ください。

AITCお問い合わせフォーム

筆者
AIトランスフォーメーションセンター　センター長
深谷勇次