毎週この時間が来ると、つい気が重くなります。「またテスト作りか」——授業の準備を終えたあとに、英語・数学・国語・理科・社会の問題を一から組み立てる。教える仕事とは別腹で積み上がるこの作業に、毎週まとまった時間を取られている方は少なくありません。1セットに何分かかっているかを数える余裕もないまま、気づけば夜が更けている。これは、定期的な「問題づくり」を抱える現場に共通する負担です。
この記事では、生成AI(ChatGPTやClaude)でテスト問題の下書きにかかる時間をどこまで圧縮できるのか、AIに任せてよい範囲と人が必ず担う範囲の線引き、5教科それぞれのプロンプト例、そしてつまずきやすいポイントまで含めて解説します。
- テスト作成で時間を食うのは問題のネタ出しより「難易度調整」と「重複チェック」。ここを生成AIで効率化する
- AIに丸投げせず、過去テストをデータとして蓄積し、そこから条件指定で引き出す仕組みが最も実戦的
- プロンプトには教科・単元・難易度・出力形式・禁止事項の5条件を毎回セットで入れる
目次
テスト作成に時間がかかりすぎる本当の理由
本記事のテーマに関連するサービスとして、BoostXでは教育業界の支援を提供しています。
【結論】テスト作成で時間を奪うのは「問題を思いつく」工程ではなく、「難易度を整える」「前回と重複しないか確認する」工程です。生成AIで効率化すべきは、まさにここです。
テスト問題づくりは、対象のレベルを分け始めると一気に膨らみます。基礎向け、標準向け、応用・受験対策向け。5教科それぞれに難易度を分ければ、1週間で用意する問題セットは相当な数になります。大きな組織なら本部が問題を供給してくれることもありますが、小規模な体制では一人でまかなうしかありません。
時間を食うのは「ネタ出し」より「調整」
ここは意外と見落とされがちなポイントです。問題を「思いつく」作業より、「難易度のバランスを整える」「前回と重複しないか確認する」「出題範囲に漏れがないかチェックする」工程のほうが、はるかに時間がかかります。
つまり、問題のネタ出しだけをAIに任せれば済む話ではありません。調整の土台となる「過去のテストデータ」が手元に整理されていないと、毎回ゼロから考える羽目になります。ここが本質的なボトルネックです。
「AIに丸投げ」がうまくいかない理由
ネット上では「プロンプトを入れるだけでテスト問題が完成」といった情報も目立ちますが、実際の感覚とは少し違います。ゼロからAIに生成させると、出題範囲がぶれたり、前回と似た問題が出たりして、結局チェックと修正に時間がかかります。
効率を上げる本質は、AIの使い方そのものより「過去のテストをデータとして蓄積し、そこから条件に合う問題を引き出す仕組み」をつくれるかどうかにあります。テストをつくるたびに、問題文・正答・出題範囲・難易度を1行ずつ記録しておくだけでも、半年で相当な資産になります。こうした仕組み化の設計は、自前で進めると手が止まりやすい部分でもあるため、後述するように外部の知見を借りる選択肢もあります。
生成AIでテスト問題を作る基本の流れ|4ステップ

【結論】AIの役割は「下書き生成」、人の役割は「編集・検証・最終判断」。この分担を崩すと、使い物にならない問題が量産されます。
ゴール:AIは下書きマシン、人は編集長
最初にはっきりさせておきたいのは、AIに「完成品」を求めてはいけないということです。AIが得意なのは、条件に合った問題を大量に下書きすること。一方で、その問題が対象の到達度に合っているか、前回のテストとの接続が自然か、解く人のモチベーションを下げない難易度か——こうした判断は、相手の様子を見ている人にしかできません。
「AIが7割つくって、人が3割仕上げる」。このバランスが、時短と品質を両立させるコツです。
準備:過去テストをデータ化しておく
ゼロからAIに問題を作らせるより、過去のテストをWordやスプレッドシートに残しておき、そこから条件に合う問題を引っ張り出すほうが、精度も速度も安定します。過去データこそ、いちばんの資産です。
過去のテストをデータ化しておけば、AIにはこう指示できます。「過去問のデータを参考に、同じ出題範囲で難易度をひとつ上げた問題を5問つくって」。ゼロから生成するより、ブレが格段に少なくなります。やり方はシンプルで、テストをつくるたびに問題文・正答・出題範囲・難易度を1行ずつ追記するだけです。
実行:プロンプトに5つの条件を入れる
AIに問題を作らせるとき、漠然と「中学2年の英語の問題を出して」と指示しても、的外れな出力が返ってきます。以下の5つの条件を、毎回セットで伝えてください。
| 条件 | 入力例 | なぜ必要か |
|---|---|---|
| 教科・単元 | 中2英語・不定詞(to+動詞の原形) | 出題範囲のブレを防ぐ |
| 難易度 | 基礎(定期テスト60点レベル) | 対象に合わない問題を排除 |
| 出力形式 | 4択10問 | 解答用紙の形式を統一 |
| 解答・解説の有無 | 正答と解説を問題の後に出力 | 解答チェックの手間を減らす |
| 禁止事項 | 過去3回のテストと同じ英文は使わない | 出題の重複を防ぐ |
この5つが揃っていれば、1回目の出力から「そのまま使える」レベルに近い下書きが返ってきます。逆に言えば、この条件設計が甘いと修正に時間がかかり、せっかくの時短効果が打ち消されてしまいます。条件を組み立てる段階でつまずきやすい方は、ここを誰かと一緒に設計するだけでも、出力の安定感が大きく変わります。
検収:解答を自分で解き直す
ここが一番大事なステップです。AIが出した解答は、必ず自分で解き直してください。とくに数学は注意が必要です。AIは計算ミスをします。連立方程式の途中式が飛んでいたり、符号が逆転していたり。「解答が合っている前提」で配ると、信頼を一度で損ないかねません。
注意
数学と理科の計算問題は、AI生成の解答をそのまま信用しないこと。手を動かして検算する工程を省くと、かえってトラブルが増えます。
5教科別プロンプト例|書き換えてすぐ使える
【結論】5教科それぞれに最適化したプロンプトの型を用意しました。【 】内を自分の条件に書き換えるだけで使えます。
以下のプロンプトは、ChatGPTやClaudeなど一般的な生成AIで使える型です。【 】内を自分の条件に書き換えて使ってください。出力後は、前のステップで触れた「自分で解き直す」工程を必ず挟みます。
英語
あなたは中学生向けの英語テスト作成のプロです。以下の条件で問題を作成してください。 ・対象:【中学2年生】 ・単元:【不定詞(to+動詞の原形)の名詞的用法・副詞的用法】 ・難易度:【標準(定期テスト70点レベル)】 ・出題形式:【4択問題5問+英作文2問】 ・解答・解説:問題の後にまとめて出力 ・注意事項:教科書の例文をそのまま使わないこと
数学
あなたは中学生向けの数学テスト作成のプロです。以下の条件で問題を作成してください。 ・対象:【中学3年生】 ・単元:【二次方程式(因数分解・解の公式)】 ・難易度:【基礎(計算中心・文章題1問のみ)】 ・出題形式:【計算問題8問+文章題1問=計9問】 ・解答・解説:途中式を含めて出力 ・注意事項:解の公式を使う問題を最低2問含めること
国語
あなたは中学生向けの国語テスト作成のプロです。以下の条件で問題を作成してください。 ・対象:【中学1年生】 ・単元:【文法(品詞の分類・用言の活用)】 ・難易度:【標準】 ・出題形式:【穴埋め問題5問+記述問題2問】 ・解答・解説:模範解答と採点基準を出力 ・注意事項:記述問題には「部分点の基準」も示すこと
理科
あなたは中学生向けの理科テスト作成のプロです。以下の条件で問題を作成してください。 ・対象:【中学2年生】 ・単元:【電流と回路(オームの法則)】 ・難易度:【応用(実験データの読み取りを含む)】 ・出題形式:【選択問題4問+計算問題3問+記述1問=計8問】 ・解答・解説:計算問題は途中式を含む ・注意事項:回路図が必要な問題は「回路図を別途用意」と明記すること
社会
あなたは中学生向けの社会テスト作成のプロです。以下の条件で問題を作成してください。 ・対象:【中学3年生】 ・単元:【公民・日本国憲法(基本的人権)】 ・難易度:【基礎〜標準】 ・出題形式:【一問一答10問+記述問題2問】 ・解答・解説:記述問題は模範解答+別解を出力 ・注意事項:用語の表記は教科書に合わせること
これらの型はあくまで出発点です。同じ単元でも、対象の到達度や前回の出題範囲によって最適な条件は変わります。自分の業務全体で生成AIをどこまで活かせるかを整理したい方は、生成AIコンサルティングのページも参考にしてみてください。
基礎・標準・応用|難易度3段階の指定テクニック
【結論】「難易度:中くらい」では伝わりません。点数帯・問題タイプ・正答率の3軸で定義すると、AIの出力のブレが一気に減ります。
プロンプトに「難易度:標準」と書いても、AIがイメージする「標準」と自分がイメージする「標準」はずれます。次の3軸で定義すると、出力のブレが一気に減ります。
| レベル | 点数帯の目安 | 問題タイプの特徴 | 想定正答率の目安 |
|---|---|---|---|
| 基礎 | 定期テスト60点以下の層向け | 計算のみ・一問一答・選択式中心 | 70〜90% |
| 標準 | 定期テスト60〜80点の層向け | 文章題あり・穴埋め+記述の混合 | 50〜70% |
| 応用 | 定期テスト80点以上・受験対策 | 複合問題・条件変更・記述比率高め | 30〜50% |
正答率はあくまで設計上の目安です。プロンプトにはこう書きます。
難易度:基礎レベル ・定期テスト60点以下の生徒が正答率70%以上を取れる水準 ・計算問題と一問一答が中心 ・文章題は出さない
こうすれば「基礎」の認識が、AIと自分でぴたりと揃います。「標準で」「応用で」と一言で済ませるより、最初のひと手間が結果的に修正時間を減らします。さらに出力形式(マークシート・記述式・穴埋め式)もセットで指定すると、レイアウト調整の後工程がぐっと軽くなります。
AIが苦手な問題タイプと、人が手を入れる境界線
【結論】図形問題・複雑な計算・読解の選択肢設計は、人のほうが速くて正確です。苦手分野を知っておくと、ムダな試行錯誤を防げます。
ここを知らずに全問AIに任せると、修正に余計な時間がかかって逆効果になります。AIに任せる範囲と、人が手を入れる範囲の境界線を引いておきましょう。
図形問題・作図問題
AIは文字ベースのツールなので、図そのものを正確に描くのは苦手です。「三角形ABCの面積を求めよ」という問題文は生成できても、添付すべき図形はAIの守備範囲外です。図形問題は手書きするか、GeoGebraなどの作図ツールを使うのが現実的です。
複雑な計算・証明
二次方程式くらいなら正答率は高めですが、連立方程式の応用問題や図形の証明になると、途中式のミスが目立ちます。生成AIの計算精度は「信頼しすぎない」が鉄則です。対処法はシンプルで、AIには問題文だけ作らせて、解答は自分で解く。問題文の生成と解答の作成を分離するだけで、リスクは大幅に下がります。
長文読解の選択肢設計
国語や英語の読解問題では、「正答以外の選択肢が明らかにおかしい」パターンをAIはよく出します。4択のうち3つが的外れだと、消去法で一瞬で解けてしまいます。「紛らわしい誤答選択肢」をつくるのは、つまずきパターンを知っている人のほうが得意です。読解の選択肢設計は、人が手を入れる前提で進めましょう。
時間配分のコツ
AIが苦手な分野に時間を割くのは本末転倒です。基礎・標準の定型問題をAIで量産し、応用問題や選択肢の微調整に人の時間を集中させる。この配分が、いちばんうまくいくパターンです。
ビフォーアフター:手作業からAI下書き+人の編集へ
これまでは、問題のネタ出しから入力、難易度調整、解答作成までを一人で抱え、テスト1セットにまとまった時間。これが毎週・複数パターン積み上がり、夜の時間を確実に削っていく——これがビフォーの状態です。アフターは、AIが条件に沿って下書きを一気に出し、人は「対象に合っているか」「前回と重複していないか」の調整と検算に集中する状態。同じ品質のテストを、より短い時間で仕上げられるようになります。なお「時間が半分になる」といった目安は、過去データの整い方や条件設計の精度で変わるため、あくまで一般的な見込みとして捉えてください。
差が生まれるのは、AIそのものの性能ではなく「過去データの蓄積」と「条件設計・人の確認」という運用の仕組みです。ここを自前で組み上げるのが難しいと感じる場合は、業務に合わせた進め方を外部の視点で整理する選択肢もあります。生成AIの導入で迷ったときは、BoostXが選ばれる理由もあわせてご覧ください。
よくある質問
Q. AIが作った問題の著作権は大丈夫ですか?
A. 自分たちの内部で使う問題として活用するぶんには、実務上問題になるケースは多くありません。ただし、市販の問題集をそのままAIに読み込ませて類似問題を生成させる行為は、著作権侵害のリスクがあります。あくまで「条件を指定して新規生成する」使い方にとどめましょう。著作権の判断に迷う場合は、最新の情報をもとに専門家へ確認することをおすすめします。
Q. 応用・難関レベルの問題も作れますか?
A. 基本的な応用問題であれば、十分に使えるレベルです。とはいえ、高度な思考力を問う問題になると、AIの出力はまだ粗くなります。おすすめの使い分けは、基礎〜標準をAIで高速に量産し、浮いた時間で応用問題を自分で練り上げること。時間の配分を変えるだけで、テスト全体の質が上がります。
Q. 解く側がAIで答えを調べてしまわないか心配です。
A. 対策は2つあります。ひとつは、プロンプトに独自の条件(オリジナルの設定・架空の人物名・自分たちでつくった文章)を加えること。ネット検索しても同じ問題が出てこなくなります。もうひとつは、テスト後に類似問題を出すこと。答えを知っていても解法を理解していないと解けない構成にすれば、調べるメリットが薄れます。
Q. 無料のAIツールでも十分使えますか?
A. ChatGPTの無料版でも、基本的な問題生成はできます。ただ、回数制限や応答速度を考えると、有料プランのほうがストレスなく使える場面が多いです。Claude(Anthropic社)やGemini(Google社)も選択肢に入るので、無料の範囲で比較してから決めるとよいでしょう。料金やプランは変更されることがあるため、最新は各公式サイトで確認してください。
この記事のまとめ
- テスト作成で時間を食うのは問題のネタ出しより「難易度調整」と「重複チェック」。ここを生成AIで効率化する
- AIに丸投げせず、過去テストをデータとして蓄積し、そこから条件指定で引き出す仕組みが最も実戦的
- プロンプトには教科・単元・難易度・出力形式・禁止事項の5条件を毎回セットで入れる
- 数学の計算問題と理科の途中式はAIの解答を信用せず、必ず人が検算する。基礎〜標準をAIで量産し、応用や選択肢設計に人の時間を集中させる
公開日:2026年6月
読んで終わりにしないために
「自社の場合は、どうすれば?」
その答えを、30分で持ち帰る。
記事で分かるのは、一般論まで。現役の生成AI伴走顧問が、貴社の業務に当てはめて“次の一手”だけを一緒に整理します。
この30分で持ち帰れるもの
- 01
自社業務に当てはめたAI活用マップ
- 02
投資対効果(ROI)のシミュレーション
- 03
いまの悩み・疑問への、その場の個別回答