20万件の対話データから得られた「人とAIの協働の成功戦略」:AIの能力・限界・最適な活用モデルとは?

 

生成AIによる職場環境の変革に関する議論は、しばしば二つの相反する見解の間で揺れ動いています。一方はAIによる生産性向上の可能性に焦点を当て、もう一方はAIが労働力を代替する可能性に懸念を抱いています。しかし、これらの議論には、大規模かつ実際の使用に基づいた実証データによる裏付けが十分ではないのが現状です。

 

こうした議論に実証的な根拠を与えるため、Microsoft Researchが画期的な研究を実施しました。20万件を超えるユーザーとAIアシスタント「Copilot」の匿名の対話データを詳細に分析したのです。この研究は、「どの仕事がAIに代替されるか」という表面的な問いに留まらず、人とAIが関わるあらゆる「業務活動」を深掘りしています。

この研究結果は、人間とAIの協働に関する示唆に富む洞察をもたらしました。ワークフローへのAIの統合を成功させるには、タスクの自動化だけでなく、テクノロジーと業務の連携が不可欠です。この協働プロセスにおいて、人間はタスクのゴール(本研究における「ユーザーのゴール」)を定義し、AIは高パフォーマンスなパートナーとして、特定の支援タスク(AIのアクション)を実行します。この構造化された対話モデルを理解し、最適化することこそが、企業が将来の競争力を構築するための鍵となります。

 

人間とAIの協働を定義する:役割の分解と構造の解明

この研究は、人とAIの協働の本質を理解する上で非常に示唆に富む核心的なフレームワークを提示しています。研究チームは、人とAIのあらゆる対話には、実際には二つの明確に異なるタスクが同時に存在していると指摘しているのです。

 

ユーザーのゴール

ユーザーがAIの支援を通じて最終的に達成したいゴールを指します。例えば、あるマーケティング担当者のゴールは「新製品のマーケティングコピーを書く」といったものかもしれません。

 

AIのアクション

ユーザーの指示に応じたAIの具体的なアクション。上記の例に対応するアクションとしては、「キーワードに基づいた原稿のたたき台の生成」「特定の段落のブラッシュアップ」「タイトルの代替案を10個提供」などが考えられます。

 

研究チームは、この違いをわかりやすい例で説明しています。例えば、ユーザーがドキュメントの印刷方法を知りたい場合、「ユーザーのゴール」はオフィス機器の操作ですが、「AIのアクション」はその操作方法を説明することです。この一見些細な違いが、極めて重要です。「AIは人間を代替するか」という抽象的な問いを、「業務フローにおいて、どの『AIのアクション』が『ユーザーのゴール』達成に最も貢献し得るか」という検証可能な問いへと変換するからです。

 

膨大な対話データの分析を通じ、研究者たちは驚くべき事実を発見しました。なんと40パーセントもの対話において、「ユーザーのゴール」と「AIのアクション」が属する業務活動のカテゴリーが全く一致していなかったのです。これは、人々が自分の仕事を単にAIに丸投げしているのではなく、自身の最終目標とは異なる一連の補助的なサブタスクをAIに任せていることを明確に示しています。人間は「何を」「なぜ」に集中し、AIは「どのように」という特定の側面をサポートしています。

 

研究者は、この「ユーザーのゴール」と「AIのアクション」の区別に基づき、大規模な実際の対話データの分析を通じて、以下の核心に迫る問いに体系的に答えることを目指しました。

 

最も一般的なAIの活用シーンは何か

ユーザーが最も頻繁にAIの支援を求める業務活動(ユーザーのゴール)は何か。また、AIが最も頻繁に実行している業務活動(AIのアクション)は何か。

 

AIが最も効果的に実行できるタスクは何か

最もユーザー満足度とタスク完了率が高い「AIのアクション」は何か。

 

AIはさまざまな職種にどの程度の影響を与えるか

AIが効果的に実行できる業務活動と、各職種に要求される活動を照合することで、AIの各職種への「AI適合度」をいかに定量化し、影響範囲を明確にするか。

 

本研究は、これらの問いに答えることで、理論的な予測を超え、現段階で実際に生成AIが労働市場に及ぼす影響を明らかにしました。

 

研究手法:各職種へのAIの影響をいかに定量化するか

研究チームが分析に使用したのは、2024年1月1日から9月30日までの9カ月間に、MicrosoftのCopilotの大規模言語モデルから収集された20万件の米国での匿名の対話データです。この膨大な対話を体系的に分析するため、分析手法の中核として、研究チームは米国労働省の職業情報ネットワーク(ONET)データベースを採用しました。ONETの特筆すべき点は、複雑な「職種」を具体的な「業務活動」へと階層的に分解する、その緻密な構造にあります。そのデータ構造は、以下の通りです。

  • 職種:「経済学者」など
  • タスク:その職業に含まれる具体的な職務。例:「市場トレンドを予測するためのデータの収集、分析、報告」
  • 詳細な業務活動(Detailed work activity, DWA):これは最も細分化された階層です。特定の「タスク」は、一連のDWAに対応づけられます。DWAは、異なる職務間で再利用・転用可能な、標準化された業務の構成要素に相当します。例えば、経済学者の場合のDWAは「政治、経済、または社会の動向の予測」といったものになります。
  • 中間的な業務活動(Intermediate work activity, IWA):IWAは、中間階層に属する活動を意味します。前述の詳細な業務活動は、それぞれこのIWAに分類されます。本論文の分析は、主にこのIWAレベル(例:市場または業界の状況分析)に焦点を当てています。
  • 一般的な業務活動(Generalized work activity, GWA):これは最も包括的な階層で、類似した業務活動を最も広範に分類します。すべての中間的な業務活動は、より抽象的なGWAに属します。 例えば、「市場または業界の状況を分析する」という中間的な業務活動は、「データまたは情報の分析」というGWAに分類されます。

研究チームは、「中間的な業務活動」(IWA)のレベルでの分析を選択しました。これは、IWAが十分に具体的でありながら、さまざまな職業間を横断できる汎用性を持ち、AIの能力の普遍性を明らかにするのに適しているためです。

AIの影響を包括的に評価するため、研究チームは多角的な評価のフレームワークを設計し、最終的に総合的な「AI適合度スコア」(AI Applicability Score)としてまとめました。このスコアが高いほど、その職種の業務内容と現在のAIの能力との適合性が高いことを意味します。スコアは、以下の三つの主要な指標に基づいて算出されます。

 

タスク完了率

「AIがユーザーの要求をどの程度達成できたか」研究チームは、大規模言語モデルを用いてユーザーとCopilotとの対話ごとの「タスク完了率」を分類しました。この分類結果を評価(「いいね」など)データと比較したところ、高い相関関係が認められ、この算出方法の有効性が実証されました。

 

  1. 影響範囲:タスクにおけるAIの貢献レベル(例:完全なレポートを作成したのか、単純な質問に答えただけか)を区別するため、研究チームはこの指標を導入しました。研究チームは、大規模言語モデルを用いて、Copilotが発揮した能力が対応するIWA(中核的な業務活動)のどの程度をカバーしているかを評価しました。AIの各アクションは、「皆無」から「完全にカバー」までの6段階の尺度で評価されています。

 

  1. 活動頻度:「その活動が実際の業務においてどれだけ頻繁に実行されているか」ユーザーが頻繁に求め、AIが効果的かつ高い完成度で完了できる活動のみが、その職種に実質的な影響をもたらします。

 

この研究では、これらの三つの側面を重み付けすることでONETで定義される各職業ごとに最終的な「AI適合度スコア」を算出し、実際の利用データに基づいた職種ごとのAIの影響度を可視化するマップを提供しています。

 

データが示すインサイト:AIの能力の限界と最適な活用シーン

徹底的なデータマイニングを通じて、現在の生成AIの能力マップが明確になるとともに、いくつかの意外な発見も明らかになりました。

 

1. AIが最も活躍する分野:知識労働の強力なアシスタント

調査の結果、AIの活用は知識労働の領域に強く集中していることが判明しました。最も一般的な「ユーザーのゴール」は、情報収集、コンテンツ作成(執筆・編集)、他者とのコミュニケーションという三つのカテゴリーに集約されます。

さらに重要な洞察は、「ユーザーのゴール」と「AIのアクション」における中核となる動詞に明確な違いがある点です。これは人間とAIの役割分担が明確であることを示しています。

  • 「ユーザーのゴール」を表す動詞は、能動的で目標指向的です。例えば、ユーザーは製品やサービスに関する情報を入手したい、ニュース記事や芸術的なコンテンツを制作したい、ビジネス文書を作成したい、特定の問題を調査したいなど、様々な目的を持ちます。これらの動詞は、ユーザーがタスクの主導権を握り、最終的な責任を負っていることを示しています。
  • 対照的に、「AIのアクション」を表す動詞はサービスとサポートの色を強く帯びています。例えば、AIの役割には、顧客からの問い合わせ対応、公開情報の提供、技術的な情報の提示、他者の支援などがあります。さらに多くの場合、AIはトレーニング、指導、助言などを実行し、サービスとサポートの役割を体現しています。

これらの調査結果は、人間が知識集約型タスクを遂行するために、AIを強力な情報処理およびコミュニケーションの補助ツールとして活用していることを明確に示しています。対照的に、人間とAIの対話において、肉体労働、物理的な機器の監視、対面での他者への指導を伴う業務活動はほとんど見られません。

 

2. AIの「得意領域」と「苦手領域」:AIのサポートへの満足度が示す真実

データは、ユーザーがAIのサポートに概ね満足していることを示しています。中でも、満足度が最も高かったのは以下の三つの活動です。

  • テキストの作成と編集(レポート作成、メールの修正など)
  • 情報の調査(法令調査、健康問題の理解など)
  • 製品の評価や購入(製品特性の比較など)

一方で、ユーザーからのフィードバックが最も悪かった領域は、データ分析とビジュアルデザインに集中しています。これは、AIが情報を処理できるとはいえ、深い論理分析、データの視覚化、あるいは独創性の高いビジュアルコンテンツが求められるタスクにおいては、まだユーザーの期待を完全に満たせていないことを示しています。つまり、AIには明確な得意領域と不得意領域が存在しているということです。これは、効果的なAI活用のためには、利用者が、AIの能力の限界点(パフォーマンスが低いタスク)と最大の能力(パフォーマンスが高いタスク)を正確に見極め、その強みを最大限に活かし、弱点を適切に補完することが不可欠であることを示唆しています。

 

3. 職業別AI影響度マップ:AI変革の最前線にある職種は?

調査の結果得られた「AI適合度スコア」は、AIの影響を最も受ける職業を明らかにしました。上位25位にランクインした職種のほぼ全てが、情報処理とコミュニケーションに関連するものです。通訳者翻訳者が最高位に位置し、その業務の98%がCopilotが頻繁に実行するタスクと重複していました。それに続いて、営業担当者、カスタマーサービス担当者、作家・編集者、広報担当者、市場調査アナリストなど、馴染みのある職種が続いています。

 

 

よりマクロな職種カテゴリーで見ると、営業、コンピューター・数学、行政サポート、地域・社会サービスなどの分野で「AI適合度スコア」が最も高くなっています。これらの職種の中核をなすのは、まさに本研究でAIが最も得意と判明した「AIのアクション」です。ユーザーへの情報提供、問い合わせ対応、一般的なサポートといった、AIの強力な情報伝達能力が、これらの職種の中核的なニーズと完全に一致しているのです。

逆に、AI適合度スコアが最も低い職種には、多大な肉体労働を必要とするもの(建設作業員や清掃員など)や、対人的な身体的接触や精密な操作に大きく依存するもの(看護助手、マッサージ師、外科医など)という二つの特徴があります。

 

実践の指針:組織の「AIリテラシー」を構築し、「AI活用」を次の段階へ

本研究は、企業の経営者と従業員の両方に対し、非常に価値ある実践的な指針を提供し、組織が「AIを使うべきか」という初期段階を超えて、「いかにAIを効果的に使いこなすか」という次の段階に進むのを助けます。

 

1.仕事観の転換:「役職」単位ではなく、「業務活動」単位でAIを考える

本研究の最も核心的な示唆は、AIが影響を与えるのは「職種」全体ではなく、職種を構成する「業務活動」であるという点です。ある職種の「AI適合度」が高くても、その職種が完全に代替されるわけではありません。むしろ、その中に含まれる多くの細分化された活動がAIによって効果的かつ大幅に強化されることを意味します。

このことは、企業の人材育成と職務設計に対し、新たな要求を突きつけています。マネージャーは、自身および部下の業務を対象に、チームを主導し「タスク分解」を行い、反復性が高く情報集約的な業務(AIの活用に適した業務)と、複雑な意思決定、戦略的思考、そして対人関係(人間の価値が発揮される領域)を必要とする業務を特定する必要があります。この業務分解によって、チームメンバーは人間とAIの協働の最適な役割分担を明確に把握し、ワークフローを再構築できます。その結果、最も価値の高い業務に人的資源を集中させることが可能となります。

 

2. 重要な能力の特定:AI時代に最も重要なスキルは「プロジェクトマネジメント力」

研究で示された「ユーザーのゴール」と「AIのアクション」の乖離を埋めるには、「プロジェクトマネジメント力」という新しい能力が必要です。これは、従業員が、戦略レベルのビジネス目標(ユーザーのゴール)を、AIが理解し実行できる一連の具体的なステップ(AIのアクション)へと的確に分解・翻訳できる能力を意味します。さらに、AIの出力内容を集約・検証し、その結果に責任を持つ能力も含まれます。この能力こそが、AIリテラシーの核となる部分です。これは、単にプロンプト(指示文)を書くスキルだけでなく、業務理解、論理的分解、そしてAIの能力の限界認識が一体となった統合的なマインドセットであると言えるでしょう。

 

3. 戦略的な能力開発:組織の「AIリテラシー」の構築

効果的な人間とAIの協働がユーザーの目標達成を目的とした相互作用である以上、AIの能力を正確に予測し、ビジネス目標を正確で実行可能な指示へと変換できる能力は、AIを効果的に活用するために不可欠なスキルとなります。従業員のAIリテラシーを育成するためには、企業は個人の自主的な学習に頼るだけでは不十分であり、体系的な研修とトップ主導の文化醸成が必要となります。これこそが、UMUが提唱する「AIリテラシー」の理念の真髄であり、これは個人の能力だけではなく、組織全体の能力も包含するものです。

組織レベルの「AIリテラシー」の構築には、学習の科学、ビジネスシナリオ、そしてAIテクノロジーを高度に統合したソリューションが求められます。従業員に必要なのは、汎用的な「AI入門コース」ではなく、実際の業務シナリオに即した能力開発なのです。

 

UMUが提供する『大規模言語モデル時代の「AIリテラシー」養成講座』のプログラムは、まさにこの理念に基づいて設計されています。
このプログラムは、まず従業員が自身の組織環境、役割、専門分野を深く理解し、タスクを分解し、優先順位を定め、分類する能力を習得できるよう支援します。次に、この深い業務理解を、大規模言語モデルの汎用能力の理解と予測(すなわち、基礎的なAIリテラシー)と統合します。
このアプローチにより、すべての従業員が「ユーザーのゴール」と「AIのアクション」の間の最適なポイントを的確に見つけ出すことができるようになります。

 

最終的に、組織の誰もがAIを効果的に活用して業務に貢献できるマインドセットを身につけたとき、AIの導入は個人の成長と組織の発展を推進する真に強力な原動力となるでしょう。

 

UMUコラム一覧に戻る
  • まずはコレから!

    学びが変わる。組織が変わる。
    生成AI時代に成果を生む、
    UMUのAIラーニング戦略と事例を公開

    UMU会社資料

    UMU(ユーム)は、2014年にシリコンバレーで誕生し、現在では世界203の国と地域で100万社以上、日本では28,000社以上に導入されているグローバルAIソリューションカンパニーです。AIを活用したオンライン学習プラットフォーム「UMU」を核に、学術的な根拠に基づいた実践型AIリテラシー学習プログラム「UMU AILIT(エーアイリット)」、プロンプト不要であらゆる業務を効率化する「UMU AI Tools」などの提供により、AI時代の企業や組織における学習文化の醸成とパフォーマンス向上を支援しています。従業員が自律的に学び、AIリテラシーを習得・活用することで業務を効率化し、より創造的で戦略的な仕事に集中できる時間や機会を創出。これにより、企業の人的資本の最大活用と加速度的な成長に貢献します。