← 一覧へ戻る NI-WORK チャンネル

【危険!】その数値間違ってるかも?AIにおける計算・集計に気をつけることは?【Gemini/GAS】

📅 2026年2月15日 ⏱ 24:51
GeminiGAS

生成AIに大量データの集計をさせると平気で嘘をつく。集計はアプリ(GAS)、分析・洞察はGeminiに分離する“2段構え”を、社内アンケート500件のデモで実演解説。

丹羽さん×山口さんが「生成AIは数字の集計が苦手」をテーマに解説。500件の社内アンケートをそのままGeminiに分析させると、営業部80時間→64時間、開発部15時間→2位など平気で数値を捏造(ハルシネーション)する実例を提示。解決策は「集計はプログラム(アプリ/GAS)にやらせ、出来上がったグラフへの洞察・示唆だけをGeminiに任せる」という分業設計。Gemini Canvasで対話的にBIツール風アプリを生成し、さらにGASへ変換してスプレッドシート直結のリアルタイム集計ダッシュボードを構築する流れまで、画面操作付きで紹介する。

1 詳細トピック

今週のハイライト

キャッチアップすべき重要ポイント

  • 500件の社内アンケート集計をGeminiにそのまま依頼すると、営業部80時間→64時間、開発部15時間→2位など堂々と捏造する
  • 無償版Geminiのコンテキストウィンドウは3.2万トークン、有償版は100万トークンで、無償版ほどハルシネーションが起きやすい
  • 解決策は2ステップ:①集計はアプリ/プログラムにさせる ②そのグラフへの洞察・示唆だけをGeminiにやらせる
  • Gemini Canvasに「CSVをアップロードして分析するアプリを作って」と依頼するとBIツール風ダッシュボードが自動生成できる
  • いきなり作らせず、まず「どんな分析ができるか考えて」と要件定義させてから作らせると精度が大幅に上がる
  • Canvasで作ったプロトタイプはGASに変換するとスプレッドシート直結でリアルタイム集計+全社共有が可能になる
  • Geminiサイドパネルの集計精度はGemini 3で大幅に向上し、20種類のグラフ+洞察も実用レベルに到達した
  • それでもLLMである以上ハルシネーションのリスクはゼロにならないため、最終確認は人間が行う前提で使う
  • 凝ったプロンプトを自作するのが大変な人は、まじん式の無料配布BIツールから入るのも有効な選択肢

▼ 各トピックをクリックすると詳細が展開します

1. なぜ生成AIに数値を任せると危険なのか+

オープニングで丹羽さんが繰り返し強調するのは「生成AIは数字を扱うのが本質的に苦手」というメッセージ。ハヤカワ五味さん回でも触れた通り、生成AIはクリエイティブな領域では強力だが、処理しきれなかったデータは「それっぽい数字」を勝手に思いついて穴埋めしてしまう。

これを業務でそのまま信じると致命的で、生成AIが出した分析結果をベースに報告書を作ったり、部下のレポートを鵜呑みにしたり、全社に「AIでデータ分析しろ」と号令を出すと事故が起きる。今日の動画のメインメッセージは「あなたが今からやろうとしている分析方法、間違ってるかもしれませんよ」という警告である。

そのうえで、ただ「危ない」と言って終わるのではなく、企業現場で安全にAI分析を使うための具体的な設計パターンを最後まで実演で示していくのが本動画の構成。

  • 生成AIは処理しきれないデータをそれっぽく捏造(ハルシネーション)する性質がある
  • 数値の正確性が要求される集計とAIは本質的に相性が悪い
  • AI分析結果をそのまま報告書化・全社展開すると重大事故につながる
  • 本動画では「危ない」だけでなく具体的な設計パターンまで示す
生成AIハルシネーション数値
2. 500件アンケートで実演:Geminiが平気で嘘をつく+

山口さんが社内アンケート(残業時間・有給取得など)500件のスプレッドシートをGeminiに添付し、Canvas機能をONにしてダッシュボード生成を依頼。出力されたグラフでは「営業部が1位で残業多め、開発部が2位」というもっともらしい結果が返ってくる。

しかし、元データをピボットテーブルで集計し直すと、正解は「営業部80時間(1位)/開発部15時間(最下位)」。Geminiは営業部を64時間と過小評価し、2位はマーケティングで開発部は最下位という、グラフの形が全く違う結果を出していた。

この差が生まれた原因として、コンテキストウィンドウ(一度に処理できるトークン数)の上限が挙げられる。有償版Geminiは100万トークンあるが、無償版は3.2万トークンしかないため、500件規模になると処理しきれず、残りの数字をAIが想像で埋めてしまう。100件程度なら起きにくいが、データ量が増えるほど顕在化する。

怖いのは、グラフのデザインがちゃんとしていて見た目に違和感が出ない点。「営業部が一番」というユーザーの予想とも合致してしまい、誤りに気づきにくい構造になっている。

  • Geminiに500件CSVを直接渡すと、営業部の残業時間が80→64、開発部が最下位→2位に化ける
  • ピボットテーブル集計(プログラム集計)と突き合わせて初めて誤りに気づける
  • 原因はコンテキストウィンドウ上限。有償版100万トークン/無償版3.2万トークン
  • 見た目が綺麗なグラフで出てくるためユーザーの直感とも合致し、誤りに気づきにくい
GeminiハルシネーションSheets
3. 解決策の結論:集計はアプリ、分析はAIに分ける+

対処方法のコアメッセージは「もう生成AIに集計をさせない」。これまで「分析」と1単語で語られていた業務を、(A) 数字を正確に積み上げる集計プロセスと、(B) その結果から洞察・示唆を得る分析プロセスに分解する。

(A) の集計はプログラム/アプリケーション、つまりBIツールのような従来型システムに任せる。プログラムは何回実行しても同じ答えを返す=絶対に間違わないという性質があるためだ。一方 (B) の分析は生成AIの得意分野。出来上がったグラフを見て「次にどんなアクションを取るべきか」を考えさせる。

この考え方を持つだけで、AI活用の安全性は劇的に上がる。ただし現場の悩みとして「うちにBIツールなんてないよ」という声があるが、そこは安心していい。次の章で見るように、BIツール自体もGeminiに作ってもらえる時代になっている。

  • 結論:生成AIに集計をさせない、というルールを引く
  • 集計=プログラム/アプリ、分析・洞察=生成AI、と役割分担を明確化
  • プログラムは同じ入力なら同じ出力を返すので絶対に間違わない
  • BIツールが社内になくても、そのアプリ自体をGeminiに作らせれば良い
設計BIツール業務分解
4. GeminiでBIツール風アプリを自作する+

山口さんが先回りで作成したBIツール風アプリのデモから入る。先ほどと同じスプレッドシートをCSV書き出しし、Gemini Canvasで生成したアプリにアップロードすると、レコード500件のままダッシュボードが瞬時に表示される。

部署別の平均残業時間を見ると、営業部80時間・開発部15時間と正しい数値が並んでおり、これはGeminiが集計しているのではなくアプリ(プログラム)が集計しているためハルシネーションは起きない。さらにグラフの下には「データアナリティクス」エリアがあり、ここだけはGeminiが洞察・示唆を出してくれる。集計と分析が役割分担された理想形である。

作り方の流れは、Gemini AppでCSVを添付+Canvas機能ON、そしてプロンプトには「分析アプリを作りたいが、いきなり作らず、まずどんな分析ができるかを考えて」「初期画面はCSVアップロード画面」「グラフは○種類」「洞察も出力」など具体的な要件を入れる。山口さんはNI-WORKで一貫して「いきなり作らせるのではなく、要件定義を別ステップで考えさせる」設計手法を推奨しており、ここでも同じ思想が反映されている。

1回目は要件定義書とグラフ案20種類が出力されるので、修正したい部分を会話で詰める。問題なければ「アプリケーションを作成してください」と依頼すれば、コードとプレビューが表示されアプリが完成する。

  • Gemini Canvasで生成したアプリは集計を内部のプログラムで行うためハルシネーションが構造的に起きない
  • CSV添付+Canvas ONで「分析アプリ作って」と依頼するのが基本フロー
  • 「いきなり作らず要件定義から」の2段階指示で精度が大幅に上がる
  • 初期画面・グラフ種類数・洞察出力の有無など具体的に要件を伝える
  • プレビューが出ない場合は失敗しているので、出ているか必ず確認
GeminiCanvasアプリ生成
5. CanvasアプリをGASに昇格させて全社展開する+

Canvasで作ったアプリはプロトタイプとしては優秀だが、(1) Canvas右ペインで見るしかなく見にくい、(2) Google Workspace環境で他メンバーへ共有できない、(3) 毎回CSVを書き出してアップロードするのが面倒、という3つの実運用課題がある。

これを一気に解決するのがGAS(Google Apps Script)への変換。Geminiに「データソースをCSVではなくスプレッドシートを常に最新参照する形に変えて、GASに作り直して。Gemini APIも使えるように」と頼むと、必要なGASコード+導入手順をスプレッドシート形式で出力してくれる。

生成されたGAS版アプリのURLにアクセスし、ブラウザを更新すると、その瞬間にスプレッドシートの最新内容を取りに行ってグラフを再描画する。デモでは500行のうち3行だけ残してデータを削除し、再読み込みすると「レコード3件」のダッシュボードに即時更新される様子を見せた。CSVを書き出す手間がゼロになり、共有も普通のWebアプリのURLで完結する。

Gemini 3の登場でコード生成精度が上がっており、ノーコード/ローコードでこのレベルのアプリを作れるようになっている点もポイントとして紹介。

  • Canvasのアプリはプロトタイプ。共有・運用に難があるためGASへ変換する
  • 「CSVではなくスプレッドシート直参照に変えて、GAS化して」とプロンプトで指示
  • GAS版はURLアクセス+ブラウザ更新で最新データを常に反映
  • CSV書き出し作業が不要になり、全社共有も普通のWebアプリ並みに容易
  • Gemini 3でコード生成精度が向上、ノーコード気分で実用アプリが作れる時代に
GASGemini業務自動化
6. プロンプト試行錯誤がつらい人へ:まじん式BIツール+

ここまでの手順を自前のプロンプトでやろうとすると、エラーが出るたびにGeminiと何往復もやり取りする必要があり、慣れていないと挫折しやすい。動画で紹介されたプロンプトはあくまで簡易版という位置づけだ。

そこで紹介されるのが「まじんさん」の凝ったプロンプトを使う方法。スライド自動生成で話題になった「まじん式」を作っているまじんさんが、同じようなBIツール作成用プロンプトをかなり作り込んだ形で記事として公開しており、しかも無料配布されている。これを使えば本格的なBIツールを最小手数で生成できる。

「やりたいけど自分でプロンプトを書くのは難しそう」というユーザーは、まずまじんさんが配布しているテンプレートから入るのが現実的、というのが山口さん・丹羽さんからの推奨。動画の概要欄にリンクを貼ると案内している。

  • 簡易プロンプトだと試行錯誤が頻発し、エラー対応が大変
  • まじんさん(まじん式で著名)が同種のBIツール作成プロンプトを無料配布中
  • 凝ったプロンプトを使えば最小手数で本格的なBIツールが作れる
  • プロンプト初心者はまず配布テンプレートを試すのが現実的なスタート
まじん式プロンプトTips
7. Geminiサイドパネルの精度はGemini 3でどう変わったか+

最後のトピックは、Google Workspace有償版で使えるスプレッドシート右側のサイドパネル(Geminiの“コパイロット”枠)の検証。以前は分析させるとハルシネーション祭りで実用に耐えなかったが、Gemini 3で精度が上がったとの噂を受けて山口さんが再検証する。

同じ500件の社内アンケートデータで「詳細に分析して20種類のグラフを作って」と依頼。結果、ちゃんと20個のグラフを生成し、それぞれに洞察・示唆も付けてくれる。先ほどハルシネーションを起こした「部署別の平均残業時間」も、営業部80時間/開発部15時間と正しく出ており、サイドパネル単体でもかなり使えるレベルに到達していた。

ただしLLMである以上、集計の正確性は構造的に保証されない。サイドパネルは「軽く傾向を掴む」「ちょっとした集計を投げる」用途では非常に便利だが、意思決定に直結する数値は必ず人間が突き合わせ確認する。アプリ+GAS型の本格運用との使い分けが現実解になる。

  • Gemini 3でサイドパネルの集計・分析精度が大幅向上
  • 20種類のグラフと洞察を出させてもハルシネーションは起きていなかった
  • それでもLLMである以上、集計の正確性は構造的に保証されない
  • サイドパネルは「軽い分析」、本格運用は「アプリ+GAS」と使い分ける
GeminiサイドパネルWorkspace
8. まとめ:数値の集計と分析を明確に分けて運用する+

丹羽さんによる総括。生成AIは得意・不得意があり、特に数値の扱いには気をつける必要がある。プログラムは何度入力しても同じ答えを返すが、生成AIは出力が変わる可能性がある。これは企業の数値管理においては致命的だ。

だからこそ「事実を積み重ねる集計部分」は生成AIを使わず、専用のアプリケーション(これも生成AIに作らせて良い)に任せ、その結果に対して生成AIに洞察を求める。集計と分析を明確に分け、セットとして組み立てる――これが本動画の最大のテイクアウェイ。

この設計を業務に組み込めば、生成AIの強みを安全に引き出せる。逆にこの分離なしに「AIに分析させる」と全社展開するのは危険だ、と改めて警鐘を鳴らして締めくくる。

おまけ告知として、NI-WORKメンバーシップに加入すると、本動画で紹介したアプリ生成・GAS化のプロンプトもすべて公開予定とのこと。

  • 数値の扱いは生成AIの最大の弱点
  • 集計はプログラム、洞察は生成AIに分けてセット運用するのが正解
  • 分離設計なしに全社AI分析を進めると致命的事故につながる
  • メンバーシップでは本動画のプロンプト一式が公開される予定
まとめ業務設計AI活用

2 視聴者の学び

※本記事はAI自動要約による非公式まとめです。 YouTubeチャンネル「NI-WORK(@ni-work)」様の動画を、社内学習・社内共有を目的としてAIで自動要約したものです。 NI-WORK様による公式発信ではなく、要約に誤りや解釈違いを含む可能性があります。 正確な情報は必ず元動画をご視聴ください。