こんにちは!2024年5月13日、OpenAIが「Spring Update」イベントを開催し、待望のChatGPTの大型アップデートを発表しました。今回は、このイベントで明らかになった新機能や今後の展望についてまとめていきたいと思います。
OpenAIは、2022年11月に対話型AI「ChatGPT」を公開して以来、自然言語処理の分野で大きな注目を集めてきました。GPT-3.5や GPT-4 などの大規模言語モデルを次々とリリースし、その高度な会話能力は世界中のユーザーを魅了してきました。
今回のイベントでは、CEOのサム・アルトマン氏やCTOのミラ・ムラティ氏が登壇し、ChatGPTの新バージョン「GPT-4o」を中心とした最新アップデートを披露しました。
OpenAIの公式サイトはこちら:https://openai.com/
GPT-4oは、テキスト・音声・画像を統合的に処理できるマルチモーダルAIです。ユーザーは様々な形式の入力を組み合わせて対話でき、出力もテキスト・音声・画像と多岐にわたります。
音声入力に対して、わずか232ミリ秒(平均320ミリ秒)という人間に近い反応速度を実現。自然な会話の流れを妨げることなく、スムーズなやりとりが可能になりました。
英語とプログラミングコードの理解は、既存の GPT-4 Turbo と同等以上。非英語のテキスト処理は大幅に改善され、より幅広い言語に対応しています。
APIでの利用では、GPT-4 Turbo の半額という低価格を実現。それでいて2倍の高速処理が可能なため、開発者にとって大きなメリットになるでしょう。
GPT-4oは、単なる音声認識や音声合成ではなく、抑揚や感情までも込めた自然な対話を実現します。デモでは、ユーザーの話し方に合わせて丁寧に受け答えする様子が披露されました。
カメラで撮影した画像をGPT-4oに送ると、画像の内容を理解して適切な返答をしてくれます。数式の解き方を教えてくれたり、描かれた絵について話し合ったりと、視覚情報を介したインタラクションが可能になりました。
GPT-4oは、異なる言語を話すユーザー同士の通訳としても機能します。デモでは、イタリア語と英語のやりとりを仲介し、スムーズな意思疎通をサポートしていました。
今回のアップデートで特筆すべきは、GPT-4oの一部機能が無料プランでも使えるようになったことです。API経由でのテキスト・画像入力など、これまで有料プランの特権だった機能の一部が解放されます。
より多くのユーザーがGPT-4oの恩恵を受けられるようになり、AIの民主化が一層進むことが期待されます。
ChatGPTの主要機能であるチャットに加えて、音声対話や画像入力など、マルチモーダルな対話を実現する新UIが導入されました。
また、PC向けにネイティブアプリの提供も開始。キーボードショートカットで素早く起動できるなど、利便性の高い設計になっています。
OpenAIの「Spring Update」イベントで発表されたChatGPTのアップデートは、GPT-4oという次世代モデルを軸に、AI技術の新たな地平を切り拓くものでした。
マルチモーダル対応による自然な対話、無料プランの機能拡充など、ユーザーにとって嬉しい変更が数多く盛り込まれています。音声対話APIのリリースにより、開発者の創造力を存分に発揮できる環境が整いつつあります。
GPT-4oは、私たちとAIの関わり方を根本から変える可能性を秘めています。ビジネスでの活用はもちろん、教育や医療、エンターテインメントなど、あらゆる場面での応用が期待されます。
技術の進歩とともに、プライバシーや倫理など、社会的な課題にも目を向ける必要があるでしょう。OpenAIは安全性を最優先に開発を進めると表明していますが、私たち一人ひとりがAIと賢く付き合っていくことが求められます。
皆さんもGPT-4oを使いこなし、これからのAI社会を一緒に切り拓いていきましょう!
スモールスタート開発支援、サーバーレス・NoSQLのことなら
ラーゲイトまでご相談ください
低コスト、サーバーレスの
モダナイズ開発をご検討なら
下請け対応可能
Sler企業様からの依頼も歓迎