📄 帳票・フローチャート・財務諸表……AIが「見て」理解する!
みなさん、仕事で使う書類って、文字だけじゃないですよね?
見積書、フローチャート、グラフだらけの会議資料……情報の核心が「図や表」の中に閉じ込められているケースって、めちゃくちゃ多い。
これまでのAIは実はここが苦手でした😅 テキスト(文字情報)は得意でも、複雑な図表が混じった文書は「ただの記号の羅列」として処理してしまい、意味を読み取れなかったんです。
そんな壁をぶち壊しにきたのが、NTTが2026年5月19日に発表した **「tsuzumi 2 Visionモデル」** です!🎉
🤖 tsuzumi 2 Visionって何者?
NTTが独自開発してきた純国産LLM(大規模言語モデル)「tsuzumi 2」のアップデート版です。
**LLM(Large Language Model)** とは、大量のテキストデータを学習して言語を理解・生成できるAIのこと。ChatGPTなどもこの仲間ですね!
今回のアップデートの最大のポイントはズバリ、「**文書を画像として処理できるようになった**」こと。
– 📊 グラフ・チャート・表組みを含む日本語ビジネス文書を**画像のまま**読み込める
– 🔍 図表の中から重要情報を抽出してデータベース化
– 🔢 数値計算や論理的思考能力も同時に強化
– 🖥️ **1基のGPU**(NVIDIA A100相当)で動作する軽量設計をキープ!
この「1GPU動作」がポイントで、巨大なサーバーを用意しなくても、企業のオフィスの中にあるサーバー環境(いわゆる**オンプレミス**)で動かせるんです。
🔐 なぜ「純国産」にこだわるの?
機密情報を扱う金融・医療・行政の現場では、「データを外部のクラウドサービスに送れない」というケースが多々あります。
NTTはこの課題を業務DXを阻む **「ラストマイル」の障壁** と位置づけ、開発に取り組んできました。
tsuzumiシリーズは学習データから開発プロセスまで**完全に自社管理**。他社のモデルを「種」として使わず一から作る「フルスクラッチ開発」にこだわっており、著作権や情報漏洩リスクの面でも高い信頼性を確保しています。
こうした、自国の管理下で作られるAIのことを **「ソブリンAI」**(主権AI)と呼び、日本を含む世界各国で需要が急拡大中のトレンドです。
📈 性能はどのくらいすごいの?
今回の新モデル、軽量設計でありながら、独自のベンチマーク(性能評価テスト)では**MetaのLlama 4 ScoutやOpenAIのGPT-5.2といった最新の海外製モデルと同等水準**の読解性能を示したとのこと!
「小さいのに強い」——これがtsuzumiシリーズの真骨頂ですね💪
今後はNTTグループ各社を通じて順次サービスとして提供される予定。金融機関・医療機関・行政機関など、情報流出に敏感な領域での本格導入が見込まれています。
🌐 日本発AIの存在感が増してきた!
GPT・GeminiなどグローバルAIが市場を席巻する中、純国産AIが「日本語×ビジネス文書×セキュリティ」という特化領域で世界トップクラスに迫ってきたのは、国内のエンタープライズ(大企業)向けAI活用にとっても非常に大きな意味を持ちます。
NTTはさらに、複数の小型AIが連携して動く **「AIコンステレーション」** 構想も打ち出しており、tsuzumi 2はその日本語担当エキスパートとして活躍が期待されています🛰️
DXの「ラストマイル」を国産AIが突破する——その瞬間が、じわじわ近づいていますよ!
出典: https://k-tai.watch.impress.co.jp/docs/news/2109436.html
関連リンク
- NTT公式プレスリリース「tsuzumi 2 Visionモデル発表」
- NTT R&D「tsuzumi 2」技術詳細ページ
- NTTのLLM「tsuzumi 2」、図表付きの文書の読み取りに対応(AI Watch)
- NTTが国産LLM「tsuzumi 2 Visionモデル」を発表(Innovatopia)
