
2024年 年末のAI関連発表について

2024年の年末は、AIに関連する人々にとって非常に忙しい時期でした。
アメリカのホリデーシーズンに合わせて、各社が数多くの発表をしたのです。質量ともに
多岐にわたっており、「そもそもどんな発表があったのか」を把握することすら難しい
レベルだと感じています。
そこでこの記事では、特に重要と思われるOpenAIとGoogleの発表について、代表的な
ものをまとめて整理することにしました。
OpenAIの発表について
OpenAIは『12 Days of OpenAI』と題して、12月5日から16日まで連続で発表を
行いました。(公式サイト:12 Days of OpenAI )日本語では、ITmediaによる
まとめがあります。
▍OpenAIの「12 Days」まとめ
ITmedia NEWS
https://www.itmedia.co.jp/news/articles/2412/21/news083.html)
発表の概要は、それぞれ以下のようなものです。
Day | タイトル | 概要 | 種別 |
1 | o1 & ChatGPT Pro | Previewだったo1の正式発表と月200ドルのPro | 言語モデル |
2 | OpenAI's Reinforcement Fine-Tuning Research Program | 強化ファインチューニングの研究プログラム | 言語モデル |
3 | Sora | 動画生成サービスSoraの発表 | 動画 |
4 | Canvas | ChatGPT上のCanvas機能について | ChatGPTの新機能 |
5 | ChatGPT in Apple Intelligence | Apple IntelligenceでのChatGPT利用 | 他社との連携 |
6 | Advanced voice with video & Santa mode | ビデオ通話でChatGPTを利用、サンタモード | ChatGPTの新機能 |
7 | Projects in ChatGPT | ChatGPT上のProjectsという管理機能 | ChatGPTの新機能 |
8 | Search | ChatGPTの検索が無料ユーザーにも提供開始 | ChatGPTの新機能 |
9 | Holiday treats for developers | 開発者向けのプレゼント。Tier 5以上にAPIの o1リリース。Realtime APIの品質向上、GPT-4o realtimeの音声トークンの価格が60%値下げ | 開発者向け機能 |
10 | 1-800-CHATGPT | 電話やWhatsAppでChatGPTを使えるように | ChatGPTの新機能 |
11 | Work with apps | Mac版のChatGPTアプリをXcode、Notes、Notion、Quipと連携する。Windows板も近日 公開予定 | 他社との連携 |
12 | o3 preview & call for safety researchers | o3とo3-miniの発表。 o3-miniは2025年1月下旬にリリースの可能性 | 新しい言語モデル |
言語モデルだけではなく、画像や動画、ChatGPTの新機能、ChatGPTを他社アプリケーションや電話(!)から使えるようにするなど、ChatGPTの普及に向けて積極的に活動している
ことがうかがえます。
Googleの発表について
Googleの発表については、以下のURLを参考にしました。
▍Google AI announcements from December https://blog.google/technology/ai/google-ai-updates-december-2024/
発表内容は、概ね次のようになっています。
番号 | タイトル | 概要 | 種別 |
1 | Gemini 2.0 | エージェント時代の新しいモデル | 言語モデル |
2 | gemini-exp-1206 | 実験的なモデル | 言語モデル |
3 | Veo 2 | 最新の動画生成モデル | 動画生成 |
4 | Imagen 3 | 最新の画像生成モデル | 画像生成 |
5 | NotebookLMの アップグレード | UIが新しくなり、Audio Overviewの最中に会話に 参加することが可能となり、サブスクリプション プランのNotebookLM Plusが開始 | NotebookLMの新機能 |
6 | Android と Pixel に 新しい AI 機能を追加 | Geminiをパーソナライズするsaved info、字幕に感情表現を付与する Expressive Captions、通話画面で簡単に応答できるようなアップデートなど | スマホとの連携 |
7 | 2025 年の企業向け AI トレンドを5つ紹介 | 紹介されているのは以下の5つのトレンド。 1. マルチモーダルAI 2. AIエージェント3. エンタープライズ検索 4. AIを活用したカスタマー エクスペリエンス 5. AIによるセキュリティ強化 | トレンドの紹介 |
8 | Google Agentspace | AIエージェントとAI検索を企業にもたらす Google Agentspaceについて。特徴は次の3つ。 1. 企業データを活用するためのNotebookLM 2. 企業全体の情報発見 3. ビジネスを自動化する エキスパートエージェント | AIエージェントや RAGを活用したサービス |
9 | AI 気象モデル GenCast | 拡散モデルのGenCastで現状最高の最高のシス テムである欧州中期予報センター (ECMWF) ENS よりも優れた予報を提供。台風などの極端な気象も高精度で予測可能 | 天気予報 |
10 | 量子チップ Willow | 量子エラー訂正によるエラーの削減と、 スーパーコンピュータでも10の25乗年かかる ベンチマークを5分で処理 | 量子コンピュータ |
こちらも言語モデル、画像と動画の生成、既存のサービスの新機能などが発表された上で、企業向けのGoogle Agentspaceや量子コンピュータチップのWillowなど、今後有望と思われる領域の発表が含まれているようです。
それぞれの発表についての整理
両社ともに、大規模言語モデル、画像と動画の生成についての発表を行っています。
言語モデルはさらに高性能なものが提供され、画像や動画生成はこれまでよりも高品質な
ものが生成できるようになりました。それぞれ得意な領域や精度は違いますが、これらの
領域はこれからも各社が競って発展していくことが期待されます。
一方で、全体的な方針には差が見られます。
OpenAIは、 サービスとしてのChatGPTの機能と連携の強化に注力しているようです。ChatGPTは 最も有名なLLMで、他にも数多くのLLMが公開されている現在においても、「LLMといえばChatGPT」という地位を獲得しています。
この知名度を利用して、アプリや電話など様々なところからアクセス可能にして一般に
普及させることで、人々の生活の基盤となることを目指しているように見えます。
Googleは、AIエージェントに注力しているようです。
Gemini 2.0は "our new AI model for the agentic era" として紹介されていますし、
企業向けのGoogle Agentspaceも開始しています。
今後は単なる言語モデルではなく、AIエージェントとしての利用が増えるという考え
なのでしょう。また、量子コンピュータや気象モデルなど、新しい分野にも積極的に
取り組んでいるようです。
まとめ
この記事では、2024年末のOpenAIとGoogleの発表について簡単にまとめました。
どちらも非常に活発な開発研究を行っており、追いかけるだけでも大変になっています。
今年は更に増えるのでしょうか?一体どんな技術が発表されるのか、今後がとても楽しみ
です。

2007年に北海道大学大学院博士課程修了。 2020年より株式会社調和技研でシステム開発や人材育成事業に従事。 複雑ネットワークとしてのSNSの研究や、ニュース記事の分類システム、コンテンツの推薦システムの開発等を経験。現在は言語分野の研究開発を行うとともに、Sapporo AI Laboのプロジェクト「札幌AI道場」において技術指導とチームのメンターを担当している。
関連記事


OpenAI Canvas - AIと共同作業を加速する新たな作業空間 -
- 生成系AI
- ChatGPT
- 言語系AI

AI Agent Vol.3【Agent の 学習と評価】
- ChatGPT
- 生成系AI
- 言語系AI

Google のLLM「Gemini 2.0 Flash Thinking」を試してみる
- 生成系AI
- ChatGPT
- 言語系AI

【GroqCloud】 爆速回答!?GroqCloudの実力とは

【まとめ】GPT-4.5 登場!史上最強のAIモデルがリサーチプレビューを公開
- ChatGPT
- インタビュー
- 生成系AI
- 言語系AI

AI Agent Vol.2【Agent の 4つの要素】
- ChatGPT
- 生成系AI
- 言語系AI

Google のLLM「Gemini 2.0 Flash」を試してみる
- 生成系AI
- ChatGPT
- 言語系AI

OpenAIが公開したLLMの事実性を評価する指標「SimpleQA」でモデルを測定してみた
- 生成系AI
- 言語系AI
- ChatGPT

AI導入に必須!PoC(概念実証)を成功させる進め方とポイント

The AI Scientist:AIによる論文の自動生成|さまざまな研究テーマを提案させてみる
- 生成系AI
- ChatGPT
- 言語系AI

AI Agent Vol. 1【Single AgentとMulti Agent】
- ChatGPT
- 生成系AI
- 言語系AI

AI活用成功に導く「AI導入アセスメント」とは――数理最適化AI事例をもとにポイントを解説

Llama 3 の日本語継続事前学習モデル「Llama-3-ELYZA-JP-8B」を試してみる
- 生成系AI
- 言語系AI
- ChatGPT

「戻れない変化」を生み出し続ける。コンサルを通して見極める業界DX実現への道筋
- インタビュー
- 生成系AI
- ChatGPT

サステナビリティ領域で活躍するAI―SDGs×AI活用事例
- 数値系AI
- 画像系AI

MetaのオープンLLM「Llama3.2 3B-Instract」の精度を検証してみた|GPT4o-miniとの比較あり
- 生成系AI
- 言語系AI

OpenAIの軽量モデル「GPT-4o mini」を試してみる
- 生成系AI
- 言語系AI
- ChatGPT

Microsoft「GraphRAG」とLangchainの知識グラフを活用したRAGを比較
- ChatGPT
- 言語系AI
- 生成系AI

ChatGPTのAPI利用料金比較|最新モデルGPT-4o miniも検証
- ChatGPT
- 言語系AI
- 生成系AI

Langchain+Neo4j で「GraphRAG」を実装してみる
- ChatGPT
- 生成系AI
- 言語系AI

数理最適化ソルバー活用事例|組合せ最適化で社内交流会の班分けを自動化
- 数値系AI

GoogleのマルチモーダルLLM「Gemini.1.5 Flash」の精度を検証してみる
- ChatGPT
- 生成系AI
- 言語系AI

3次元点群データを用いた物体検出
- 画像系AI

GPT-4oを活用した画像検索システムの構築方法
- 画像系AI
- ChatGPT

Pythonコーディングを簡単に|LangChainで効率化【LLMことはじめ Vol.2】
- ChatGPT
- 言語系AI
- 生成系AI

Copilot for Microsoft 365で「PowerPoint」を使いこなす
- 生成系AI

Google のオープンLLM「Gemma」を試してみる|GPT-3.5 Turboとの比較あり
- ChatGPT
- 生成系AI
- 言語系AI

3次元点群データとAIを用いたオガ粉の体積計測
- 画像系AI

Llama 3 の日本語継続事前学習モデル「Llama 3 Youko 8B」を試してみる|他LLMとの比較あり
- ChatGPT
- 言語系AI
- 生成系AI

RAG(Retrieval Augmented Generation)を「Command R+」で試してみた|精度をGPT-4 Turboと比較
- ChatGPT
- 生成系AI
- 言語系AI

Wood Powder Volume Calculation using Point Cloud Data and AI
- 画像系AI

Dify(ディファイ)をGoogle Cloudにデプロイしてみた
- 生成系AI

“Azure OpenAI”で始めるPythonプログラミング【LLMことはじめ Vol.1】
- 生成系AI
- 言語系AI
- ChatGPT

Combating the Malicious Use of AI-Powered Image Editing: A Deep Technical Dive
- 生成系AI
- 画像系AI

最新版「GPT-4 Turbo」を試してみた|GPT-4oとの比較あり(5/14追記)
- ChatGPT

PrecisionとRecallを何度も調べ直さないために
- 言語系AI

Stable Diffusion+LoRAを使って異常画像データを生成できるか検証してみた
- 生成系AI
- 画像系AI

大規模言語モデルによるソースコード生成:GitHub CopilotからCopilot Xへの進化と未来
- 生成系AI
- 言語系AI

AI導入の前に知っておくべき基礎知識(後編)――効率的に自業務にAIを導入するための4ステップ
- 数値系AI
- 画像系AI
- 言語系AI

配達ルート最適化AIにより作業時間80%削減を実現。成功の鍵は“人とAIの調和”
- インタビュー
- 数値系AI

AI画像生成の法的リスク(後編):著作権侵害を回避するために
- 生成系AI
- 画像系AI

AI画像生成の法的リスク(前編):著作権法の基本を学ぼう
- 画像系AI
- 生成系AI

AIというツールを使い 「生命たらしめるもの」が何かを見つけたい【調和技研✖️AIの旗手 Vol.4】
- インタビュー

AI導入の前に知っておくべき基礎知識(前編)――AIのキホンと活用事例
- 数値系AI
- 画像系AI
- 言語系AI

AIアルゴリズムの構築には、 課題の本質を見極めることが重要 【調和技研✖️AIの旗手 Vol.3】
- インタビュー

CNNで浮世絵画風変換はできるのか――Ukiyolator開発ストーリー Vol.2
- 画像系AI
- 生成系AI

住宅写真という資産をAIで利活用し、工務店とお客様をつなぐ新たなビジネスを創造
- インタビュー
- 画像系AI
- ChatGPT

シフト最適化への応用が期待される強化学習を用いた組合せ最適化の解法
- 数値系AI

多彩なサービスと紐づく「交通」の課題解決で地域の活性化や住みやすさの向上を【調和技研×AIの旗手 Vol.2】
- インタビュー

AIプロダクトを開発する際に考えるべき品質保証のキホン
- 数値系AI
- 生成系AI
- 画像系AI
- 言語系AI

Microsoft GuidanceでのFunction Calling機能の使い方とその特徴
- ChatGPT
- 言語系AI

Segment Anything Model(SAM)を使いこなそう!パラメータ設定のポイントも徹底解説
- 画像系AI

Stable Diffusionを使って異常画像データを生成できるか検証してみた
- 画像系AI
- 生成系AI

基礎から解説!数値系異常検知の概要と代表的な手法
- 数値系AI

実践!ChatGPT×Slackの具体的な連携方法と日常業務での効果的な活用事例
- ChatGPT
- 言語系AI
- 生成系AI

最先端AI技術で浮世絵を現代に再現する――Ukiyolator開発ストーリー Vol.1
- 画像系AI
- 生成系AI

PaDiMとPatchCoreどちらを選ぶべき?異常検知モデルの選択肢を見極めるポイント
- 画像系AI

社内の暗黙知を可視化するナレッジネットワークでイノベーションが生まれやすい環境に
- インタビュー
- 言語系AI

人の幸せや社会の豊かさに、AIをいかに「調和」させるか【調和技研×AIの旗手 Vol.1】
- インタビュー