AI のこれまでの 1 年: ChatGPT から Gemini までの最大のストーリーと今後の展開

公開: 2024-07-02

ここ数年の生成 AI の爆発的な勢いは、2024 年になっても衰えていません。大規模な言語モデルを採用した新製品が多数登場し、既存サービス向けの新機能やツールがほぼ毎日発表されています。

ChatGPT はさらに強力になり、新しい音声モードが追加され、Google Gemini は Gmail から Google ドライブまであらゆる場所に登場し、Apple さえもついに AI (または Apple Intelligence) の分野に参入しました。

さらに、Suno から Rabbit までのスタートアップ企業もあり、自社の AI モデルと市場の主力企業が構築した AI モデルの両方で革新的な方法を見つけており、今年の残りの期間にはさらに多くのことが予想されます。

2024 年もちょうど半分を迎えるにあたり、今年の最も印象的で、注目に値し、おそらく悪名高い AI リリースのいくつかを選択しましたので、今日から試してみてください。 その下には、まだリリースされていないものの、年末までに利用可能になるはずの AI イノベーションもいくつかピックアップしました...

2024 年の AI: 今年これまでで最も重要な発表は何ですか?

ラビット R1 レビュー

(画像クレジット:Future)

チャットGPT

ChatGPT は、大規模な言語モデルを使用する生成 AI 製品の波を表すデフォルトの用語です。 しかし、OpenAI は競合他社に先んじるためにそれに依存しておらず、今年 AI チャットボットとそのリンクされたサービスを定期的に強化しています。

2024 年、ChatGPT は、以前の対話に基づいて動作を調整できるメモリ機能に加えて、回答を 37 の言語と 5 つの音声でオーディオ パフォーマンスに変換する読み上げ機能を獲得しました。 カスタマイズは、1 月に開始された GPT ストアの中心でもあり、ユーザーは特定のタスクに焦点を当てた ChatGPT のカスタマイズされたバージョンを構築して遊ぶことができます。

あまり良いニュースではないが、OpenAI は、その「スカイ」の声が映画「Her」の女優の声と似ていることをめぐってスカーレット・ヨハンソンと公の場で口論になり、それ以来計画されていた音声モードのアップグレードを「秋」のいつかに延期せざるを得なくなった。 ChatGPT も 6 月にいくつかの大規模な障害が発生しました。

Google ジェミニ

今年の初め、Google Gemini は、Google が構築したモデルのファミリーについてのみ言及していました。 Google がそれまで使用していた Bard ブランドを捨て、すべての生成 AI プロジェクトを Gemini 傘下に収めたのは 2 月になってからでした。

これらの新機能や改善された機能の一部は、画像生成ツール (いくつかの奇妙な幻覚問題の後、一時的に削除されました) や、GPT ストアと同様にカスタム チャットボットを提供する Gems ストアなど、ChatGPT に追いつくことを目的としているようです。

それ以外の場合は、ここ数か月間使用した他のすべての Google 製品で Gemini が使用されているのを目にすることになるでしょう。メールの作成や写真への注釈の追加、Android スマートフォンのアシスタントとしての役割の引き継ぎなどです。

ラビットR1

Rabbit R1 は、ポケットサイズの 200 ドルの生成 AI デバイスが 1 月に発表され、CES 2024 を席巻しました。同社は、小型タッチスクリーン、360 度カメラ、Perplexity AI の大型センサーを搭載したアシスタントで何ができるかを披露して賞賛を集めました。リアルタイムの回答のための言語モデル。 月々の購読料がかからないため、よりアクセスしやすくなり、売上は圧倒的に伸びました。

しかし、Rabbit R1 の現実には、不安定なバッテリー寿命、時として遅いパフォーマンス、依然として限られた機能セットやその他の欠陥が含まれており、今後のハードウェアにとってはより警鐘となるかもしれませんが、依然として重要であり、正しい人のために購入する価値があるかもしれません。ユーザー。

人道的なAIピン

Rabbit R1 と同様に、Humane AI Pin は、CES 2024 で多くの注目を集めたウェアラブル デバイスです。常時稼働の生成 AI を搭載したアシスタントは、衣服にクリップで留められ、音声コマンドや記録を通じてリアルタイムの情報を提供することを約束します。一日中やり取りや会議を分析します。

明らかなように、騒音の多い環境での音声認識の信頼性の問題は言うまでもなく、その常時リスニング機能を考慮すると、当面のプライバシーに関する懸念が数多くありました。 こうした欠点にもかかわらず、急速に売れたが、ヒューメイン社は現在買い手を探していると伝えられている。

スノ

今年最大の AI ストーリーの 1 つは、最終的には Suno や Udio のような AI 音楽ジェネレーターになる可能性があります。 単純なテキストプロンプトから、歌詞、ボーカル、楽器演奏を備えたまずまずの曲をカサカサ音を立てて作り上げる素晴らしい能力を両者が持っているというだけでなく、現在、米国レコード協会(RIAA)業界が著作権侵害で両者を訴えているからだ。

この訴訟は、AI 音楽ジェネレーターと生成 AI 全体の両方に大きな影響を与える可能性があります。 著作権所有者と、膨大な量のデータに基づいて新しい AI ツールをトレーニングする新興企業との間で嵐が巻き起こっており、この法廷闘争の行方を見るのは興味深いものとなるだろう。 それによって規制の枠組みやそれを裏付ける付随する法律の制定が加速するかもしれないが、それまではスノとウディオは今のところAI生成曲の制作を続けることができる。

2024 年の AI: 今年の残りの期間にはどのような発表が予想されますか?

Apple の Craig Federighi 氏が 2024 Worldwide Developers Conference (WWDC) で Apple Intelligence について講演します。

(画像提供: Apple)

アップルインテリジェンス

Apple Intelligence は間違いなく、今年の残りの期間で最も期待されている AI 機能セットです。 Apple の WWDC 2024 イベントでは、この「パーソナル インテリジェンス」システムが iOS 18、iPadOS 18、macOS Sequoia に搭載されることが明らかになりました。 Apple 独自のモデルを ChatGPT やその他の AI プラットフォームと組み合わせることもあります (ユーザーの承認があれば) Apple Intelligence は、より適切なガイダンスとコンテキストの理解を備えたアシスタントとして Siri を強化します。

これは画面上の認識と組み合わされており、メッセージから連絡先カードへのアドレスの追加やその他何百ものアクションなど、画面上の情報に関連するアクションを実行できるようになります。 同じ AI は、電子メールやメッセージの作成、音声ファイルの要約、Image Playground 機能による画像の作成と編集を支援します。 源文字機能を使ってオリジナルの絵文字を作成することもできます。

米国で 2024 年後半に発売されるときにこれを使用するには、M シリーズの iPad または Mac、または iPhone 15 Pro または 15 Pro Max 以降が必要となるため、アップグレードが必要になる可能性があります。

アマゾンアレクサ

Amazon は生成 AI のエンタープライズ側で多忙を極めているが、長らく音声 AI アシスタントの代名詞であった Alexa は、ChatGPT などに関連する種類の AI アップグレードを断片的にしか行っていない。 今年は変更される可能性がありますが、追加料金がかかる可能性があります。

今年は「Remarkable Alexa」と呼ばれるものが登場するという噂がある。 生成 AI 機能を組み込んで、単一のコマンドから複数のタスクを処理し、食品配達の注文を行うこともできます。

展望

生成 AI は、特に消費者向けの製品に関しては、依然として発展途上の分野です。 来年にはより成熟した商用エコシステムが登場するかもしれないが、今のところ、レースは大手企業の新機能がすべてであり、他の企業は利用可能なモデルの新しい使用方法を模索している。 つまり、少なくとも現時点では、ソフトウェアのサブスクリプションと疑わしいハードウェアを意味します。