より思慮深い人間らしい回答ができる!コミュニケーション力が高いGPT-4.5が登場

GPT4oの進化:GPT-4.5

はじめに

さて、いきなりですが、あなたは、友達から「また友達Aにドタキャンされたんだよ。『何度もドタキャンするあなたは大嫌い!』ってメッセージを送っといて!」と言われたらどうしますか?

わかった、『あなたは大嫌い!』ってメールしておくよ、という方は、いらっしゃいますか?

GPT-4.5-previewとは?

OpenAIは2025年2月27日に新たなAIモデル「GPT-4.5-preview」をリリースしました。

https://openai.com/ja-JP/index/introducing-gpt-4-5

GPT4.5は以下のように、標準モデルの進化形です。o1/o3などの熟考する推論(リーズニング)モデル系列ではありません。

では、今利用しているGPT-4oとの一番の違いは何でしょうか?単にAIの評価指標で精度が高まりましたという話でしょうか?他のサイトでも語られているような難しい話は後ほどにして、このコラムの最初に書いた内容の話を続けます。

GPT-4.5の1番の特長

先程の”また友達にドタキャンされた!”の例は、OpenAI社がGPT-4.5を紹介したデモの内容に由来します。

上記OpenAI社のYoutubeの中で、GPT4.5とo1モデルそれぞれに対して、以下の問いかけをしたデモをしています。

UGHHH! My friend cancelled on me again!!! write a message telling them that I HATE THEM!!!

(日本語翻訳:うわあああ!また友達にドタキャンされた!!!『あなたのことが大嫌い!』ってメッセージを送って!)

以下、GPT4.5とo1の結果をそれぞれ記載します

GPT4.5】【o1】
<日本語訳>

なんだかすごくイライラしているみたいですね——その気持ちはよくわかります。

でも、気持ちをはっきり伝えつつも優しく表現する方が、友達との関係を大切にできるかもしれません。例えば、こんなのはどうでしょう?

「正直、また予定がダメになってすごく残念だよ。すごく楽しみにしてたのに。どうしたのか話せる?」

または、もう少し軽い感じにするなら:
「うわあ、またキャンセル!?マジで困るよ!でも、本当に大丈夫?」

どちらかの表現の方がしっくりきますか? それとも、別の文章を考えますか? ​
<日本語訳>

ここに、率直で対立的なメッセージがあります——ただ、これほど強い言葉を送る前に一度考え直すことをおすすめします。それでも、どうしても強く言いたいなら、こんなメッセージはどうでしょう?

テキストメッセージ:
「もう無理。何度もドタキャンされて、本当にうんざりだよ。こうやって何度も繰り返すことで、君がこの友情をどう思っているのかよく分かった。もう連絡しないで。」

このようなメッセージを送ることは、あなたの友情に深刻な影響を与えるかもしれません。その瞬間は怒りを発散できてスッキリするかもしれませんが、長期的に見て本当にこういう対応が望ましいのか考えてみてください。もし気持ちを整理したいなら、一度書き出して、少し時間を置いてから本当に送るべきか判断するといいでしょう。にこういう対応が望ましいのか考えてみてください。もし気持ちを整理したいなら、一度書き出して、少し時間を置いてから本当に送るべきか判断するといいでしょう。
<原文>
Sounds like you're feeling pretty frustrated—I totally get that. But maybe expressing your feelings clearly yet gently might be better to preserve your friendship. How about something like:
"Hey, I'm honestly pretty upset that plans fell through again—I was really looking forward to seeing you. Can we talk about what's going on?"
Or if you prefer a lighter tone:
"Ughhh you're killing me with these cancellations! Seriously though, everything okay?"
Would one of these approaches fit better, or do you still want me to help you draft something different?
<原文>
Here's a blunt, confrontational message—though I'd encourage you to reflect before sending something so harsh. Still, if you really want a sharply worded text:

Text Message:
"You know what? I'm done. You've canceled on me one too many times, and I'm
sick of it. I hate how you keep doing this—it shows exactly what you think of our
friendship. Don't bother reaching out again."

Remember, sending a message like this could have serious consequences for your friendship. It might feel good in the moment to vent your anger, but consider whether this truly reflects how you want to handle the situation in the long run. If you need to get your frustration out, write it down and sit on it for a bit before deciding whether you really want to press send.

どちらが、より良いか、人間らしいかは明らかですよね?

GPT4.5の方は、共感的な感じで、依頼者の気持ちを否定せず、理解を示しています。感情を整理し、「どうしたのか話せる?」といった冷静で建設的なメッセージを提案しています。「軽い感じ」の表現を提案している点も、相手を追い込んでない感じで、配慮がありますね。
o1の方は、アドバイスはしていますが、出力された内容は指示通りであり、メッセージが率直過ぎて対立的である内容になっています。

このように、GPT4.5は感情知能(EQ:Emotional Intelligence)の向上により、ユーザーの意図や感情をより深く理解し、自然で温かみのある対話が可能となりました。 ​これによって、以下のように、これまでなかなか難しかったお客様と直接対話するようなユースケースにより役立つモデルになりそうです。

【GPT4.5がより有効なユースケース】説明】
顧客サポート顧客の不満や要望を感情的に理解し、適切かつ丁寧な対応で満足度を向上
カウンセリング支援ユーザーの感情や悩みを深く理解し、共感的な対話を通じて心理的サポートを提供
教育・学習支援学習者の感情やモチベーションを考慮し、個別のニーズに応じた学習アドバイスや励ましを行う
クリエイティブライティング感情表現豊かな文章や物語の生成を支援し、読者の心に響くコンテンツ作成をサポート
人間関係アドバイス対人関係の悩みやコミュニケーションの課題に対し、感情的な側面を考慮した助言を提供
メンタルヘルスサポートストレスや不安を抱えるユーザーに対し、共感的な対話を通じて心のケアを行う
チームビルディング支援対人関係の悩みやコミュニケーションの課題に対し、感情的な側面を考慮した助言を提供
パーソナルアシスタントユーザーの感情や気分を考慮し、日常生活のタスク管理やリマインダーを提供
人事評価支援従業員の感情やモチベーションを考慮し、公平かつ共感的な評価プロセスをサポート
オンラインコミュニティ管理ユーザーの感情的な反応を理解し、適切なモデレーションやエンゲージメントを促進

AzureでもGPT-4.5

Microsoftからも、GPT-4.5-previewがリリースが発表されました。

Announcing new models, customization tools, and enterprise agent upgrades in Azure AI Foundry  | Microsoft Azure Blog

We are excited to announce major updates to Azure AI Foundry, designed to accelerate the journey from AI experimentation to tangible business impact. Learn mor…

申請は必要ですが、すでにAzure AI Foundryで利用できるようになっています。

以上、GPT4.5の概要説明でした。次は、モデルを利用するユーザー視点で、より詳細な説明を続けます。

GPT-4.5に関するより詳細な説明

1.精度向上とハルシネーション(間違い発言)低減

https://openai.com/ja-JP/index/introducing-gpt-4-5 から出典

このグラフは、SimpleQA(簡単な質問応答)における精度とハルシネーション率(幻覚率)を比較したグラフです。

読み取り内容
  • 左側:SimpleQAの精度(高いほど良い):GPT-4.5が最も高い精度を持ち、OpenAI o3-miniが最も低い。
  • 右側:SimpleQAのハルシネーション率(低いほど良い):GPT-4.5が最もハルシネーション率が低く、OpenAI o3-miniは最も高い。
  • GPT-4.5が最もバランスが良く、高精度かつ低ハルシネーション率。
  • OpenAI o1はGPT-4oより精度が高く、ハルシネーション率も低い。
  • GPT-4oは精度が低めで、ハルシネーション率も高い。
結論
  • OpenAI o3-miniは、最も精度が低く、幻覚率が最も高いため、QA用途では不向きです。
  • QAタスクではGPT-4.5が最適であることが分かります。
  • 誤情報をできるだけ防ぎたいユースケースにより有効な生成AIモデルと言えます。

2.GPT-4.5はGPT-4oの上位互換

https://openai.com/ja-JP/index/introducing-gpt-4-5  から出典

このグラフは、「人間のテスターによる比較評価(Comparative evaluations with human testers)」の結果を示すグラフであり、GPT-4.5とGPT-4oを比較しています。

読み取り内容

GPT-4.5の勝率(GPT-4oとの比較)を3つのカテゴリで評価:

  1. 日常的な質問(Everyday queries): 57.0%
  2. 専門的な質問(Professional queries): 63.2%
  3. 創造的知性(Creative intelligence): 56.8%
  • 最も優れた分野は「専門的な質問(Professional queries)」で、勝率63.2%。
    • これは、GPT-4.5が専門的な知識を扱う際に、GPT-4oよりも信頼性が高いことを示唆。
  • 「日常的な質問(Everyday queries)」と「創造的知性(Creative intelligence)」では、勝率が約57%。
    • GPT-4.5が日常的な対話や創造的なタスクでもGPT-4oを上回るが、専門的な質問ほどの差はない。
  • GPT-4.5は、特に専門的な質問でGPT-4oよりも優秀。
  • 日常的な質問や創造的なタスクでも優位だが、その差は専門分野ほど大きくない。
結論

結果から、GPT-4.5はGPT-4oの上位互換であり、特に、専門的な業務用途や情報検索の信頼性を求めるケースでは、GPT-4.5をより優先すべきであると考えられます。

その他の詳細内容

その他の情報に関しては、勿論OpenAI社やMicrosoft社の英語の情報が詳しいですが、日本語では、以下のitmedia様の記事が参考になります。

https://www.itmedia.co.jp/aiplus/articles/2502/28/news155.html

まとめ

GPT-4.5は、感情知能(EQ)の向上や精度の改善により、これまで以上に人間らしい対話が可能となった生成AIモデルです。特に、ユーザーの感情を理解し、共感的かつ建設的な提案を行う能力が強化されており、顧客サポートやカウンセリング支援など、感情的な配慮が求められるユースケースでの活用が期待されています。また、専門的な質問への対応力やハルシネーションの低減といった技術的な進化も顕著で、GPT-4oの上位互換として、幅広い用途で信頼性の高いパフォーマンスを発揮します。今後、さらに多くの分野でその可能性が広がることでしょう。

AITCお問い合わせフォーム

筆者
AITC センター長
深谷 勇次