Titans – Googleが描く「長期記憶型AI」：Titans: Learning to Memorize at Test Time を斜め読み

2025.07.22

この記事を書いた人

柴田晃

(Akira Shibata)

"2019年に新潟県にある長岡技術科学大学情報経営システム工学専攻修士課程を修了。
半導体企業を経て、2024年より株式会社調和技研で従事。
Deep Learningを使用したテキスト解析やAIアクセラレータ開発、カメラ映像を使用した
画像処理などを経験。
現在はLLMを活用したシステム開発、言語系を中心とした研究開発に従事。"

Titans アーキテクチャの概要

Titansは、短期記憶と長期記憶の両方を組み合わせた新しいアーキテクチャです。
以下の3つのコンポーネントで構成されています。

1. Core（短期記憶）：従来のAttention機構を用いて、現在の文脈を処理
→パラメータは固定されるが、直近の入力に応じて動的に更新される

2. Contextual Memory（長期記憶）：過去の重要な情報を保存し、必要に応じて参照
→テスト時でも更新可能（＝記憶の上書き／追加ができる）
→コンテキストサイズを超える記憶保持が可能
→surprise metric（予期しない入力か否か）などに基づいて記憶内容を更新

3. President Memory（永続的記憶）：タスクに依存しない知識を保持し、モデルの一般化
　　　　　　　　　　　　　　　　　能力を向上
→コンテキストサイズを超える記憶保持が可能
→推論時は更新されない

この構造により、Titansは短期的な情報と長期的な情報の両方を実現します。

▍ 3つのコンポーネント、動き方のイメージ

入力が入ってきたとき、Persistent Memory（永続記憶）に格納されたタスク固有の
知識を参照し、文脈に応じた情報を取得。
次に、Core（短期記憶）モジュールが現在の文脈を処理しながら、Contextual Memory（長期記憶）に保存された過去の知識との関連性を評価。
surprise metric（予期しない入力か否か）などに基づいて、Contextual Memoryへ
新たな情報を追加（人間のように学習する）。
推論結果を出力。

▍Titansアーキテクチャの動作イメージデモ

Titansアーキテクチャの各記憶の動作イメージを分かりやすくするために、デモを作成
しました。
デモの流れは下記のようになっており、シナリオモードでは自動で下記を一通り実行し、
インタラクティブモードでは手入力で下記手順をなぞります。

1. 短期記憶をユーザが入力

2. 短期記憶が容量以上になったときは重要度に基づき長期記憶に情報を移動する

3. 短期記憶・長期記憶・永続的記憶（モデルがもともと持っている記憶）の内容を
　もとに結果を推論

【デモイメージ】

【デモ手順】

　1. 前提
　　　＜環境＞　
　　　　Ubuntu22.0
　　　　　　
　　　　Gemini（gemini-2.0-flash）

　　　＜構成＞
　　　　demo.py

.env（” 2.APIキーの設定ファイルの作成”で生成）

　2. APIキーの設定ファイル作成

# echo API_KEY='YOUR_GEMINI_API_KEY_HERE' >> .env

　3. 依存関係のインストール

# pip install google-generativeai matplotlib seaborn numpy python-dotenv

　4. 実行

# python demo.py

一般的なモデルのアーキテクチャとの違い

・Gemini
　超長文の入力を一度に処理できるよう設計された大規模Transformerベース。
　主に巨大なContext Windowによって長文理解を実現。

・Titans
　長期記憶（external memory）をテスト時に動的に更新できるアーキテクチャのため、
　Context Windowに依存しない学習型記憶アクセスで長期的な理解を実現。

観点	Transformerベースのモデル	Titans
長文処理の方法	巨大なContext Windowを使って、一度にすべての情報をAttentionで処理	長期記憶に外部ストレージを使い、重要情報を圧縮・蓄積して、必要時に参照
記憶の構造	一時的入力終了後は破棄される	永続的に蓄積・検索できる構造（動的記憶）を持つ
テスト時の学習	原則的に「推論のみ」テスト時には学習しない	テスト時にもメモリを動的に更新・最適化していく（「テスト時学習」）
主な利点	入力全体の一括理解が可能データの因果関係なども高精度に捉えやすい	文脈を超えて、断続的に出現する知識や概念を保持し、継続的に利用できる
主な課題	Contextが大きくなると計算量が急増	記憶管理が複雑。参照の精度や更新の妥当性に注意が必要