SB C&Sの最新技術情報 発信サイト

C&S ENGINEER VOICE

SB C&S

【第3回データ講義】

AI
2025.11.27

AIの回答精度は「ラベリング」で上がる!LLM×Excelでデータを磨く実践テクニック

こんにちは!SBC&S株式会社 AI推進室の津川です。
「AIを導入してみたものの、期待した結果が出ない...」
AI活用を推進する中で、私たちは社内外でこうした声を非常に多く耳にします。

実は、AIがその能力を十分に発揮できない原因の多くは、AIそのものではなく「読み込ませるデータ」にあります。
特に社内データを活用するRAG(Retrieval-Augmented Generation)などの仕組みでは、AIが参照するデータが整理されていないと、AIは情報の迷子になってしまいます。

今回は、「データ講義シリーズ 第3回」より、AIの精度を劇的に高めるための「ラベリング(アノテーション)」の手法と、使い慣れたExcelとLLMを組み合わせた超効率的な実践テクニックをご紹介します。

AIが迷わないための道標、「ラベリング」とは?

AIの回答精度を高めるために、なぜ「ラベリング」が必要なのでしょうか?

例えば、大量のアンケートデータやお問い合わせ履歴をそのままAIに渡しても、AIはどれが重要な情報で、どれがノイズなのか判断に迷ってしまいがちです。
そこで、データに「これは何についての情報か」「どんな感情が含まれているか」という意味(ラベル)を付与してあげるのです。

LLM は長いテキストでも読めますが、入力が複雑なほど推論負荷が増え、揺れ(ランダム性)が大きくなります

事前に:

  • ネガポジ判定

  • トピック分類

  • キーワード抽出

  • 感情スコア化(-1〜1)

  • カテゴリクラスタリング

などを行うことで、
LLM が最終タスク(要約・傾向分析など)に集中でき、出力が安定します

そこで、動画では実務でよくある2つのラベリング例を紹介しています。

  1. 感情ラベリング(アンケート分析など)

    • 「ポジティブ」「ネガティブ」「ニュートラル」といった感情タグを付けることで、AIは「ユーザーの不満点(ネガティブ)だけを抽出して」といった指示に的確に答えられるようになります。

  2. カテゴリラベリング(お問い合わせ対応など)

    • 「商品仕様」「配送」「アカウント」「クレーム」などの分類タグを付けることで、特定のトピックに関する回答精度が向上します。

現場で使える!「LLM×Excel」ラベリング実践 2ステップ

「数千件もあるデータに1つずつラベルを付けるなんて、日が暮れてしまう...」 そう思った方もご安心ください。
動画内でお伝えしているのは、AI(LLM)とExcelの得意分野を組み合わせた「楽をするためのテクニック」です。

Gemini_Generated_Image_g44x3zg44x3zg44x.png

【STEP 1】分類はAIにお任せ:LLMで自動ラベリング

まずは、手作業でやると大変な「分類作業」をChatGPTなどのLLMを使って1次処理させます。

やり方:

  1. Excelにあるテキストデータ(アンケートの回答など)をコピーします。

  2. ChatGPTに貼り付け、以下のようなプロンプト(指示)を投げます。

プロンプト例: 「以下のアンケート結果をポジティブ、ネガティブ、ニュートラルに分類して、表形式で出力してください」
(※お問い合わせデータの場合は、「商品」「配送」「アカウント」など予めこちらで用意したカテゴリに分類するよう指示)

これだけで、AIが文脈を読み取り、高速でラベル付けを行ってくれます。出力された結果は、Excelに貼り付けて元のデータと結合させましょう。(Xlookup関数などを使うとスムーズです。)

【STEP 2】チェックはExcelの出番:「フィルター機能」で高速検品

AIは非常に優秀ですが、100%完璧ではありません。時には間違ったラベルを付けることもあります。 そこで役立つのが、Excelの基本機能であるフィルター機能です。

やり方:

  1. Excelのヘッダー行で「フィルター」をオンにします。

  2. 特定のカテゴリ(例:「アカウント・ログイン」)だけで絞り込みます。

  3. 表示されたデータを順に確認しましょう。

ここがポイント! 同じカテゴリの文章が縦に並んでいると、異質なデータ(ノイズ)が混ざっていた時に一瞬で違和感に気づけます
例えば、「ログインできない」という問い合わせの中に、「商品が届かない」という文章が混ざっていたら、一目で「これは違う!」と分かりますよね。
これを1件ずつ精読してチェックするのは大変ですが、フィルター機能を使えば、スクロールするだけで効率的に品質チェックが可能になります。

まとめ:AIの真価は「良質なデータ」から

AI活用において、モデルの性能と同じくらい、あるいはそれ以上に重要なのが入力に使用する「データの品質」です。
AIを使ってデータの分析を行うシーンでは、ぜひ以下の手順でデータのラベリングを効率化してみてください。

  • LLMを活用して、手間のかかるラベリング(アノテーション)を効率化する

  • Excelのフィルター機能を使って、人間の目で効率的に最終チェックを行う

この「AI×人(Excel)」のハイブリッドなアプローチこそが、現時点での実務で使えるデータ整備の最適解です。
「AIの回答がいまいち...」と感じている方は、ぜひ今日から手元のデータの「ラベリング」を見直してみてください。
AIが見違えるように賢くなるはずです!

今回の動画で詳しく解説しておりますので、ぜひ動画の方もご視聴頂けますと幸いです!


👉 あなたの現場のExcelはAIに優しいデータになっていますか?
今後も「AIが喜ぶデータ活用術」を発信していきますので、ぜひチェックしてみてください。

著者紹介

SB C&S株式会社
ICT事業本部 技術本部 先端技術統括部 DXコンサルティング部 デジタルイノベーション課
津川 聡