ラーニングデザイン連載 第9回：学習効果の測定・評価体系の策定

2025.09.10

第9回：学習効果の測定・評価体系の策定

適切な学習目標の設定が学習や研修効果評価の基盤となることを前回までのコラムで確認をしていただきましたが、今回は、学習目標設定後の学習評価戦略や、研修効果測定体系を策定するためのポイントとそのフレームワークを見ていきます。

「この研修、結局どれくらい効果があったんだろう？」
研修や学習プログラムに関わる方なら、一度はこんな疑問を持ったことがあるのではないでしょうか。
学習目標をどう評価に連動すればよいのでしょうか？　ここで活用したいのが、カークパトリックの4段階評価モデルです。

🧭 評価の4レベル（カークパトリックモデル）

皆さんは、カークパトリックの4段階評価モデルというのをすでに聞いたことがあるかもしれません。ここに、改めてモデルと測定方法を表にまとめてみました。

レベル	内容	測定方法の例
レベル1：反応	参加者の満足度・関心	アンケート、NPS、コメント
レベル2：学習	知識・スキルの習得	テスト、ロールプレイ、実技評価
レベル3：行動	現場での行動変容	上司の観察、360度評価、行動チェックリスト
レベル4：成果	業績・組織への影響	KPI改善、業務効率、離職率低下など

このモデルを使うことで、研修の成果を多角的に捉えることができますが、実際に皆さんは、どのようなレベルの効果測定をどんな時に使っているでしょうか？

🧪 ケースで考える評価設計

事例でカークパトリックの4段階評価モデルをどのように適応していけば良いかを考えてみましょう。

ケース①：新入社員向けコミュニケーション研修

到達目標：「業務報告を5分以内に送信できる」
評価戦略：
- Level 1：満足度アンケート
- Level 2：ロールプレイで報告スキルを評価
- Level 3：上司による実務でのフィードバック
- Level 4：報告ミスの減少率

ケース②：管理職向けリーダーシップ研修

到達目標：「部下の育成計画を立案・実行できる」
評価戦略：
- Level 2：計画書の提出とレビュー
- Level 3：部下の行動変容の観察
- Level 4：チームのパフォーマンス向上

💡 評価設計のポイント

すべてのレベルを測定する必要はありません。
目的に応じて、どのレベルを重視するかを明確にしましょう。
定量評価（数値）と定性評価（観察・コメント）のバランスも重要です。
現場との連携が不可欠です。特にLevel 3以降は、上司やチームの協力が必要です。

📐評価設計（カークパトリック4レベル）: マネージャー研修の例

レベル	評価項目	測定方法	タイミング
レベル1：反応	研修満足度、講師の質、内容の有用性	研修後アンケート（5段階評価＋自由記述）	研修終了直後
レベル2：学習	組織方針の理解度、整合性の説明力	知識テスト＋プレゼン評価（ルーブリック）	研修中・最終発表時
レベル3：行動	部下への伝達実施、戦略の共有状況	研修1か月後のフォローアップ面談＋上司による観察シート	研修後1か月
レベル4：成果	部門内の目標整合率、部下の理解度	部門KPIの進捗＋部下アンケート	研修後3か月以降

🛠️ 評価ツール例

ルーブリック評価表：プレゼン内容（論理性・整合性・伝達力）を5段階で評価
フォローアップシート：行動変容の有無を上司が記録
KPI進捗レポート：部門目標の達成状況を定量的に確認
部下アンケート：戦略の理解度と納得感を測定

📊 Bloomのタクソノミーと評価設計との連動マップ

カークパトリック評価モデルのレベル２である学習結果の測定方法は、学習目標のBloomのタクソノミーレベルと直結しています。研修の効果測定を考える際には、学習目標設定の段階で、どのような評価ツールや方法を使うことが必要かを下記のような連動マップを参照しながら、計画してみましょう。

Bloomレベル	評価方法	評価ツール例
Remember	知識テスト	選択式・記述式テスト、クイズ
Understand	説明・要約	ケーススタディ説明、口頭発表
Apply	実演・ロールプレイ	SMART目標設定演習、模擬プレゼン
Analyze	分析レポート	行動分析ワークシート、観察記録
Evaluate	評価判断	フィードバック文作成、評価ルーブリック
Create	創造的成果物	コーチング質問設計、改善提案書

ポイントは：

各目標はBloomのタクソノミーとABCDモデルで構造化されており、測定可能な行動＋認知深度の両面をカバーすること。
評価設計では、Kirkpatrickモデルのレベル2〜3と連動させることによって、行動変容まで追跡可能な学習設計になります。

🎯目標（Objective）と 🏁成果（Outcome）の違い

学習の効果を測定する評価戦略を考えるにあたって、目標と成果の違いを明確にしておくことは、学習や教育の設計研修評価において、非常に重要な概念区別です。以下に、構造的かつ実務的な観点から整理してご説明します。

🎯 目標（Objective）とは？

定義：学習者が研修や教育活動を通じて「できるようになること」を事前に定義したもの。
特徴：
- 事前に設定される（設計段階）
- 指導・学習の焦点となる
- ABCDモデルやBloomのタクソノミーで構造化可能
- 測定可能な行動を含む（例：「説明できる」「実演できる」）
例：受講者は、ケーススタディを用いてSMART目標の枠組みを5分以内に説明できる。

一方、成果とは：

🏁 成果（Outcome）とは？

定義：学習者が研修後に実際に「達成したこと」や「行動に移したこと」を示す実績・結果。
特徴：
- 研修後に観察・測定される
- 実際の行動変容や業績改善に関係する
- Kirkpatrickモデルのレベル3・4と連動することが多い
- 定量・定性の両面で評価可能
例：
- 80%の受講者が研修後1か月以内に部下との1on1面談を実施し、フィードバック記録を提出した。
- 受講者の部門での目標達成率が研修前より15%向上した。

📊 目標（Objective） vs 成果（Outcome）比較表

項目	目標（Objective）	成果（Outcome）
タイミング	研修前に設定	研修後に測定
目的	学習内容の明確化	学習効果の確認
測定方法	テスト、ロールプレイ、評価表	行動観察、KPI、アンケート、面談
関連モデル	ABCDモデル、Bloomのタクソノミー	Kirkpatrickモデル、ROI分析
使用場面	教材設計、指導計画	効果測定、報告書、改善提案

Objectiveは設計者の意図、Outcomeは現場の実証と捉えると、研修評価の精度が高まるでしょう。

一見当たり前のことのようですが、学習を設計する際、意外にも学習のOutcomeつまり学習結果として成果を意識した研修の設計になっている場合は、あまり見かけません。研修のゴール、つまり学習による行動変容の結果として期待される「成果」を定義しておかなければ、学習を「成果」として見せることはできません。研修やe-ラーニングを含む学習コースを提供するときに、「研修の効果はなんですか？」という質問を受けたことはありませんか？　その時には、クライアントさんと一緒に「目標」と「成果」を整理してみましょう。

🎯 学習成果を評価するための基本的な視点

学習成果を評価するためには、明確な基準（Criteria）を設定することが重要です。評価基準は、学習者が「どの程度できるようになったか」を客観的に判断するためのものです。学習成果を評価する際の基本的な考え方をまとめてみましょう。

測定可能性（Measurability）
- 成果は、観察・測定できる行動や成果物である必要があります。
- 例：「理解した」ではなく「説明できる」「操作できる」など。
達成基準（Degree）
- どの程度できれば「達成」とみなすかを明確にします。
- 例：「80%以上の正確さで」「5分以内に」「3つ以上挙げられる」
一貫性（Alignment）
- 学習目標と評価内容が一致しているかを確認します。
- 例：目標が「プレゼンテーションスキルの習得」なら、評価もプレゼン実施であるべき。
多面的評価（Multiple Measures）
- 一つの方法だけでなく、複数の視点から評価することが望ましいです。
  - 知識：テスト、クイズ
  - スキル：実技、ロールプレイ
  - 態度：観察、自己評価、他者評価

🧪 具体的な評価基準の例

学習目標	評価方法	評価基準（Degree）
顧客対応の基本を説明できる	ロールプレイ	80%以上の項目を正確に説明できる
チームでの合意形成を行う	グループワーク	他メンバーと協力し、合意に達するまでのプロセスを完了できる
Excelで売上データをグラフ化する	実技課題	指定された形式で正確にグラフを作成できる
上司に業務報告を行う	実演＋フィードバック	5分以内に、要点を押さえた報告ができる

✅ 評価基準を作成する際の注意点

評価基準は組織のニーズや現状とのギャップの大きさなどによっても、その程度（基準となるバー）の設定や定義は違ってきますが、以下は、評価基準を作成する際の留意点です。

学習目標との整合性
- 評価基準は、設定した学習目標と一致している必要があります。
- 目標が「説明できる」であれば、評価も「説明する場面」で行うべきです。
- 目標と評価がずれていると、成果の妥当性が損なわれます。
測定可能な行動に基づく
- 「理解する」「気づく」などの抽象的な表現ではなく、観察可能な行動動詞を使いましょう。
- 例：「説明する」「比較する」「操作する」「判断する」など。
達成基準（Degree）の明確化
- どの程度できれば「達成」とみなすかを具体的に示す必要があります。
- 例：「80%以上の正確さ」「5分以内に」「3つ以上挙げられる」
公平性と一貫性
- 評価者によって判断がばらつかないよう、ルーブリックやチェックリストを活用すると効果的です。
- 評価基準は、すべての学習者に対して公平に適用される必要があります。
複数の評価方法の活用
- 知識・スキル・態度など、学習成果の種類に応じて適切な評価方法を選びましょう。
  - 知識：テスト、クイズ
  - スキル：実技、ロールプレイ
  - 態度：観察、自己評価、他者評価
現場での実行可能性
- 評価方法が現場で実施可能かどうかも重要です。
- 複雑すぎる評価は、実施者の負担になり、継続性が損なわれる可能性があります。

💡補足：ルーブリックを使うとどうなる？

ルーブリック（Rubric）とは、評価項目ごとに「できている／ややできている／できていない」などの段階を設定する方法です。これにより、定性的な評価を定量化し、評価の透明性と納得感を高めることができます。

学習の評価の仕方を目標や成果との関連で見てきましたが、これらの考え方は、学習評価に限らず、業務目標の設定場面においても、「行動」と「成果」を分ける考え方、何を持って評価をするのかという基準の定義などを設定する時にも応用が可能です。

第10回：AI × 構造的プロンプト“BRIDGE”モデルで実現する“設計”とは？