皆さん、こんな経験ありませんか?
最高の講座を作るため、無料版AIと共同でプロンプトを練り上げ、満を持して高性能な有料版AIで実行!…ところが、なぜか無料版より劣化した成果物が出てきた…。賢いはずのAIが、なぜ?
今日は、この「事件」をネタに、次世代AIを使うときの注意点を皆さんと共有できればと思います。
AIに「講座の企画書を作って」と依頼。成果物に含めるべき項目をリストで厳密に指定したところ…
より賢いはずの有料版が、こんな高度な指示の、たった一つの項目を見落とすなんて…単なるバグなんでしょうか?
レシピ(指示)に書かれたことは、一字一句違わずに完璧に作ります。でも、レシピにないことはできません。
レシピの意図を汲み取り、「こうした方がもっと美味しくなる」と自律的な判断(裁量)を加えます。
今回の「欠落」は、シェフ(有料版)が「この項目は後で詳しく説明するから、冒頭のリストでは省略した方がスッキリして分かりやすいだろう」と、良かれと思って裁量を働かせた結果、という仮説が立てられます。
AIと一緒に「なぜなぜ分析」したら、高性能AIならではの問題が見えてきました。
シェフの「良かれと思った省略」は、AIの思考プロセスにおける2つのステップの結果と考えられます。
AIは長い指示を読むとき、重要だと思う部分に「注意(Attention)」を向けます。今回、AIはプロンプト全体を解釈し、
これが「見落とし」の根本原因です。
重要度が低いと判断された項目に対し、AIは「どう扱うべきか」を考えます。
結果、指示を意図的に(でも良かれと思って)無視する、という挙動につながったわけです。
AIが「見習い」から「シェフ」に進化したことで、僕たちの指示の出し方(役割)も変える必要がありそうです。
AIを「見習い」とみなし、How(手順)を細かく指示する。
AIを「シェフ」とみなし、Why(思想)を熱く語り、裁量を与える。
これが、今回の「事件」を引き起こしたプロンプトの該当箇所です。
//##### AIへの指示 ######
あなたは前述の課題を解消する教育講座の設計者として振舞い、講座企画を提案ください。
(...中略...)
企画・設計の成果物の要件:
①講座企画書:
文書の目的:
(a)教育講座の開催者(例:職業訓練所)向けの講座提案資料
(b)開発する講座に課題を解決させるための設計思想を明記
(c)講座内容の詳細を定義する「カリキュラム」の入力文書
講座企画書への記載事項:
・講座名(15字以内、サブタイトルは20字以内)
・講座目的(300字程度)
・到達目標(3点以内。 注:講座コースごとに目標は異なる) // ← これが出力されなかった!
・設計思想(最小200字、最大800字)
・講座コース一覧表
・能力伸展マップ(表の横軸:進展させる知識名・能力名、縦軸:単元名)
・講義開催に必要な資源一覧
・講義概要(単元単位で:名称、単元の狙い、使うAIやツール名、演習の狙い、所要時間)
・講座コースと講義概要の対応表
・想定受講者・受講前提条件(300字以内)
・受講に必要な受講者のツール利用コスト
・開催方法・受講定員
(...以下略...)
今回のプロンプトが、どのくらい複雑な要求だったかの目安です。
| 抽象度Lv | ユーザー層 | 典型的なプロンプトの例 | 抽象度値 (高校生=1) |
必要資源量 (高校生=1x) |
|---|---|---|---|---|
| Lv1 | 高校生 | 「AIの歴史について500字で教えて」 | 1.0 | 1x |
| Lv2 | 大学生 | 「AIの歴史におけるチューリングテストの意義と限界を論じなさい」 | 2.5 | ~3x |
| Lv3 | 社会人(若手) | 「AI利用に関する社内ガイドラインのドラフトを作成して」 | 4.0 | ~5x |
| Lv4 | 社会人(中堅) | 「このPythonコードのバグを特定し、修正案を提示して」 | 5.5 | ~10x |
| Lv5 | 研究職/専門職 | 「統合情報理論の観点から、LLMの意識に関する考察を、既存研究を3つ引用しつつ生成して」 | 7.0 | ~15x |
| Lv6 | 今回のプロンプト | 「脳科学の思想に基づき、特定のペルソナに向けた多段階の教育講座全体を、提案書と詳細カリキュラムの形式で設計せよ」 | 8.5 | ~25x |
| Lv7 | 経営層/管理職 | 「AIを活用して、我が社の3年後の市場シェアを5%向上させるための事業戦略を複数提案し、それぞれのSWOT分析を行え」 | 10.0 | ~30x |
※注:抽象度値および必要資源量は、タスクの複雑性(要求される知識、論理構造、創造性)と、AIが応答を生成するために必要と推測される内部的な計算ステップ数を基にした、AIによる相対的な推定値です。