OpenAI最新モデル「GPT-4o」について徹底解説

GPTの新モデル「GPT-4o(フォーオー)」が2024年5月13日(米国時間)に発表され、全ユーザーが利用できるようになりました!

これまでのChatGPTと何が違うのでしょうか?
この記事では、GPT-4oについて徹底解説します。

▼公式ページ
https://openai.com/index/hello-gpt-4o/

①性能

従来まで利用されていたGPT-4 Turboと比較して、高い性能を誇ります。

さらに、最強のLLMと呼び声高いClaude 3 Opusと比較しても、圧倒的な性能。また、最近話題になっていたgpt2が、実はGPT-4oだったということも発表されています。

Image

②高速応答

従来のGPT-4と比較して、応答速度が超高速になりました。

GrokやLlamaのように、ストレスフリーでChatGPTを使えるようになります。

③マルチモーダル(音声・画像・テキストの統合処理)

GPT-4oのoは「omni:すべて」という意味で、音声・視覚・テキストなどの処理を統合したことを示しています。

従来はそれぞれの入力を個別に処理していたため、音声・画像入力から応答までに時間がかかっていました。しかし、GPT-4oではすべての入力を同時にリアルタイム処理することで、高速応答が可能になっています。

④動画認識や音声認識の機能

進化した音声機能や動画認識機能がChatGPTに追加されます。

音声認識機能では、ユーザーの感情を理解できるように。
また、感情を込めた流暢な言葉を話せるようになります。

動画認識機能

画面を共有しながら対話ができるようになります。

たとえば、オンライン会議の議事録をリアルタイムで作成できるとも発表されています。

⑤高度なOCR

これまでのChatGPTにも文字読み取り(OCR)機能は搭載されていましたが、GPT-4oではその性能が向上しています。

日本語読み取り性能も大きく向上していて、漫画も一コマ一コマ認識できています。

Imageこの漫画の台詞を書き起こし、解説します。 --- 1コマ目: (幾翔が部屋に入る) 幾翔:「なんかキーホルダー置いてあるけどこれいるやつ?」 2コマ目: (カエルのキーホルダーのクローズアップ) 3コマ目: (黒髪の女性、美澄が話す) 美澄:「この前仕事先で」 4コマ目: (美澄の回想シーン) 美澄:「このキャラお好きって言ってましたよね。」 5コマ目: (回想シーン、美澄がキーホルダーを手渡す) 女性:「よければどうぞ」 美澄:「つって。でも私グッズとか集めない種族だから…」 6コマ目: (幾翔がキーホルダーを見つめる) 幾翔:「いらないとはいえ即ゴミ箱も悪いししばらく家の微妙な場所に放置して」 7コマ目: (キーホルダーが置かれた場所) 幾翔:「込められた恩が時間経過と共に蒸発しきった頃に捨てるようにしてるの」 8コマ目: (美澄が冷たい視線を送る) 美澄:「これぞ恩落としの儀」 9コマ目: (幾翔が驚いた顔で) 幾翔:「いらないってこと?」 10コマ目: (美澄が冷たい視線を送る) 美澄:「恩知らず…」 ---

⑥無料ユーザーでもGPT-4/GPTs/GPTストアの使用が可能に

無料ユーザーでも様々な機能が利用可能になりました。

これまで無料版ChatGPTは、テキストでの対話しかできませんでしたが、 今回のアップデートで無料でもChatGPTの使い道が大幅に広がりました。

Image

⑦デスクトップアプリのリリース

ChatGPTがついにPCアプリで利用可能になります。

キーボードショートカット(Option + スペース)で質問できるため、利便性が向上されます。Mac版は既に利用可能で、Windows版は2024年後半にリリース予定。

⑧API利用料が半額に

API利用料が半額になリました!

OpenAIのAPIで日本語の生成AIアプリを作っている人には朗報ですね。スピードも精度も高いので、ますます(今のところ)他の生成AI系のAPIを使用するメリットが見つかりませんね…

日本語のトークン数も変化したので3倍以上安くなっている可能性アリ

OpenAIのAPIで日本語の生成AIアプリを作っている人にはさらに朗報!

日本語トークン数の考え方も最適化されていて、英語と同じで1単語1トークンになる単語数も増えました。特に日本語の場合は、以前までのモデルは「こんにちは」とか「ありがとう」くらいしか1単語としか考えず、他の文字は全て1文字2~3トークンだったので、今回のアップデートで実質APIの使用量を日本語を使用する場合は3倍以上抑えることも可能となりました。

「ChatGPT API × LINE」Udemy講座を販売中

OpenAI社のAPIを使ったLINEチャットボットの作り方のUdemy講座を公開中!

まだChatGPTのAPIを使って生成AIアプリ開発をしたことがない方はもちろん、非エンジニアの方にも分かりやすくプログラミングの基礎から丁寧に2時間半かけて解説しています。是非Udemy講座も併せてチェックしてご受講いただけると幸いです!