激安GPT-4oモデル:GPT-4o miniがon Azureで登場!これでRAGも生成AIエージェントもよりリーズナブルに運用可能に


GPT4oにくらべて、価格は約1/30!
7/19時点では、Azure OpenAI Studio Playgroundでのみ利用可能。
7/27に、リクエストを受け、GPT-4o-mini、GPT-4o、GPT-3.5-Turboを一覧で纏めた表を追加
8/1(日本時間)に、APIがリリースされましたので、追加でコラムを公開しています。

https://aitc.dentsusoken.com/column/gpt4o-mini-azure-api

AzureからもGPT-4o miniがリリース

GPT-4o miniは、7月18日(米国時間)にOpenAI社が発表した最新のマルチモーダルAIモデルですが、AzureからもGPT-4o miniがリリースされました!

以下、Microsoft社の記事を参考にこのインパクトをシンプルに纏めます。

GPT-4o miniと、GPT4oの比較

GPT4oとの比較は、以下のOpenAI社のサイトにあります。

性能に関しては、GPT-4o miniよりもGPT-4oの方が優れていますが、コストの比較表を作ると以下のようになり、GPT-4o miniのコストはGPT-4oの約1/30になります。

 GPT-4oGPT-4o Mini
入力(100万トークンあたり)$5.00$0.15
出力(100万トークンあたり)$15.00$0.60

本日利用してみたところ、おおよそのタスクではその差がわからない性能を感じました。価格がこれだけ違うと、通常のタスクは、GPT-4o miniで十分だと思います。

これだけ価格が安くなったことで、毎回ある程度のボリュームの文章を参照して質問に回答するRAG(Retrieval-Augmented Generation)の仕組みや、生成AIが生成AIを利用し続ける生成AIエージェントを実行する場合、かなりのコスト削減を実感できるようになります。

GPT-4o miniは、GPT-3.5 Turboを完全に置き換えます

GPT-4o miniは、GPT-3.5 Turboと比較して、コストは60%以上削減され、Measuring Massive Multitask Language Understanding (MMLU) スコアで、82%のスコアを獲得し、70%を超えるパフォーマンスを実現しています。また、GPT-4o mini は128Kのコンテキストウィンドウと改良された多言語対応能力が提供されます。

 GPT-3.5 TurboGPT-4o Mini
入力(100万トークンあたり)$0.50$0.15
出力(100万トークンあたり)$1.50$0.60

つまりGPT-4o miniは、GPT-3.5 Turboと比べると負け無しと言えます。

つまり、GPT-4o-mini、GPT-4o、GPT-3.5-Turboを一覧でまとめると

以下のようになります。

 GPT-4o-miniGPT-4oGPT-3.5-Turbo
入力最大トークン128,000128,00016,000
出力最大トークン16,0004,0964,096
入出力価格(100万トークンあたり)入力: $0.15
出力: $0.60
入力: $5.00
出力: $15.00
入力: $0.50
出力: $1.50
入力形式(24年7月時点)テキスト / 画像テキスト / 画像テキストのみ
GPTが学習したデータの最終更新日2023年10月2023年10月2021年9月

Azure におけるGPT-4o mini

Azure AIでは、GPT-4o miniは今月中にBatchサービスで利用可能になります。Batchはオフピーク容量を利用して50%の割引率で24時間以内に高スループットのジョブを提供します。さらに、GPT-4o miniのファインチューニングもリリースされ、お客様が特定のユースケースやシナリオに合わせてモデルをカスタマイズできるようになります。

まとめ

本コラムは、本日リリースされたGPT-4o miniを、Azure OpenAI Studio Playgroundで使ってみて、情報を整理していて感動したので、これはコラムにしたいと思い作成しました。

GPT4oの時も、最初AzureからはAzure OpenAI Studio Playgroundのみのリリースでしたが、数週間でAPI利用できるようになりましたので、GPT-4o miniもすぐにAPIとして利用できるようになると思います。Azure OpenAI ServiceのAPIとしてGPT-4o miniが利用できるようになりましたら、Know Narrator(
https://aitc.dentsusoken.com/products/knownarrator
)でも利用できるようにしていきます。

RAGや生成AIエージェントで利用しているGPT4やGPT-4oから、GPT-4o miniに切り替えることで、かなりコストが抑えられ、かつパフォーマンスも向上します。

GPT-4o miniを利用して、本格的にRAGや生成AIエージェントの業務運用を開始していきませんか?

執筆
AITC センター長
深谷 勇次