Azure OpenAI Serviceで最新のGPTモデル、GPT-4 TurboとGPT-3.5 Turbo 1106が使えるようになりました(日本リージョンは未)

11月6日に、OpenAI’s first developer conferenceが開催されました。発表内容は、本家のサイトは英語なので、日本語では以下のサイトが分かりやすいかなと思います。

www.gizmodo.jp

その発表の中の1つに、新モデルである、GPT-4 Turbo(gpt-4-1106-preview)と、GPT-3.5 Turbo(gpt-3.5-turbo-1106)の発表がありました。

先日のMicrosoft Igniteで、上記のモデルはAzureで直ぐに使えるようになりますという発表がありましたが、

isid-ai.jp

既にAzureで利用可能になっています!

そのリリース内容が、以下のMicrosoft社のコラムで分かりやすく説明されていますので、このコラムの内容を訳しながら、ポイントを説明していきたいと思います。

techcommunity.microsoft.com

以下のリージョンで利用可能です。

GPT-4 Turbo (gpt-4-1106-preview) and GPT-3.5 Turbo 1106 (gpt-35-turbo-1106) are available to all Azure OpenAI customers immediately.
GPT-4 Turbo (gpt-4-1106-preview) および GPT-3.5 Turbo 1106 (gpt-35-turbo-1106) は、すべての Azure OpenAI 顧客にすぐに利用可能です。

モデル 地域
GPT-4 Turbo
(gpt-4-1106-preview)
オーストラリア東部
カナダ東部
米国東部 2
フランス中部
ノルウェー東部
南インド
スウェーデン
英国中部 南部
米国西部
GPT-3.5 Turbo 1106
(gpt-35-turbo-1106)
オーストラリア東部
カナダ東部
フランス中部
南インド
スウェーデン
英国中部 南部
米国西部

日本リージョンでまだ提供されていないのが残念です。

また、今回提供されたモデルはプレビュー段階にあり、今後数週間以内に安定した運用対応バージョンに置き換えられる予定のため、実際の運用は、その安定版:GAバージョンがリリースされてから利用された方が良さそうです。

GPT-4 Turbo

GPT-4 Turbo is more capable and has knowledge of world events up to April 2023. It has a 128K context window so your applications benefit from a lot more custom data tailored to your use case using techniques like RAG (Retrieval Augmented Generation).
GPT-4 Turbo はより高性能で、2023 年 4 月までの世界の出来事に関する知識を持っています。 GPT-4 Turbo には 128K のコンテキスト ウィンドウがあるため、アプリケーションは、RAG (Retrieval Augmented Generation) などの技術を使用して、ユースケースに合わせて調整されたより多くのカスタム データから恩恵を受けることができます。

今までのGPTは2021年9月までの知識でしたが、一気に今年の4月までの知識になりました。また既存のGPT4の入力トークン数は最大32Kでしたが、4倍の128Kに拡大されました。どれくらい入力できるかというと、“英文だと、300ページを超える長い文書を1つのプロンプトに入れられる“規模になります。

GPT-4 Turbo is available to all Azure OpenAI customers immediately. GPT-4 Turbo pricing is 3x most cost effective for input tokens and 2x more cost effective for output tokens compared to GPT-4, while offering more than 15x the context window.
GPT-4 Turbo は、すべての Azure OpenAI 顧客にすぐに利用可能です。GPT-4 Turbo の価格設定は、GPT-4 と比較して、入力トークンのコスト効率が 3 倍、出力トークンのコスト効率が 2 倍高く、15 倍を超えるコンテキスト ウィンドウを提供します。

以下、既存のGPT4とのコスト比較です。このTurboによって、GPT-4がコスト的にかなり使いやすくなりました。

モデル 入力 出力
gpt-4-1106-preview $0.01 / 1000 トークン $0.03 / 1000 トークン
GPT-4-8K $0.03 / 1000 トークン $0.06 / 1000 トークン
GPT-4-32K $0.06 / 1000 トークン $0.12 / 1000 トークン

Improved Function Calling

もともと2023 年 6 月から提供されている関数呼び出しでしたが、アプリケーションが外部システムをより効率的に使用できるように、複数の関数呼び出しとツール呼び出しを並行して生成できるようになりました。

JSON Mode

JSON モードが導入されました。他システムと相互連携をしやすくなります。 JSON モードを使用するには、response_format を { "type": "json_object" } に設定します。

Reproducible Output(再現可能な出力)

GPT-4 Turbo のような生成 AI モデルは、出力を確率的に生成しますが、新しいシード パラメーターを利用することで、出力結果を固定できるようになりました。

Preview

GPT-4 Turbo の最初のバージョンである gpt-4-1106-preview はプレビュー段階にあり、今後数週間以内に安定した運用対応バージョンに置き換えられる予定です。

GPT-3.5 Turbo 1106

GPT-3.5 Turbo 1106 is generally available to all Azure OpenAI customers immediately. GPT-3.5 Turbo pricing is 3x most cost effective for input tokens and 2x more cost effective for output tokens compared to GPT-3.5 Turbo 16k. To deploy GPT-3.5-Turbo 1106 from the Studio UI, select version 1106. Version 1106 has separate quota from the existing versions of GPT-3.5 Turbo, enabling customers to start experimenting with it immediately without impacting existing GPT-3.5 deployments.
GPT-3.5 Turbo 1106 は、すべての Azure OpenAI 顧客に直ちに一般提供されます。GPT-3.5 Turbo の価格は、GPT-3.5 Turbo 16k と比較して、入力トークンのコスト効率が 3 倍、出力トークンのコスト効率が 2 倍高くなります。Studio UI から GPT-3.5-Turbo 1106 をデプロイするには、バージョン 1106 を選択します。バージョン 1106 には、GPT-3.5 Turbo の既存のバージョンとは別のクォータがあるため、お客様は既存の GPT-3.5 デプロイメントに影響を与えることなく、すぐに実験を開始できます。

以下、既存のGPT3.5とのコスト比較です。この新しいモデルは、あの元祖GPT-3.5-turboより4倍のトークン数を扱えるにもかかわらず、入力トークンが25%リーズナブルに利用できるようになりました

モデル 入力 出力
gpt-35-turbo-1106 $0.001 / 1000 トークン $0.002 / 1000 トークン
GPT-3.5-Turbo-4k $0.0015 / 1000 トークン $0.002 / 1000 トークン
GPT-3.5-Turbo-16k $0.003 / 1000 トークン $0.004 / 1000 トークン

Next Steps

Get started building with GPT-4 Turbo and GPT-3.5-Turbo 1106 today! We will be making these highly capable and more cost effective models more widely available in the coming weeks, including availability with Provisioned Throughput. We can’t wait to see what you build!
今すぐ GPT-4 Turbo および GPT-3.5-Turbo 1106 を使って構築を始めましょう! これらの高機能でコスト効率の高いモデルは、プロビジョンド スループットでの利用も含め、今後数週間でさらに広く利用できるようになります。あなたが何を構築するか楽しみです!

今まで、コストの問題で、GPT4は利用せず、3.5のみを利用していたお客様も多かったですが、このGPT-4 Turboをきっかけに、GPT4のお客様利用が拡大しそうです。


執筆
AITC センター長
深谷 勇次