テスト問題AI作成｜塾講師の作問時間を半減する5手順

「土日のどっちかは、ほぼ作問で終わっています」——塾講師や予備校講師の方から、私が生成AI伴走顧問として最も多く受けるご相談がこれです。新学期の単元別問題、定期テスト対策、模試・直前期の演習プリント。難易度別に揃えるとなると、1単元で20〜30問は欲しい。だから家に持ち帰り、夜中や週末を作問と解答作成に使っている塾講師の方が、私の支援先には決して少なくありません。

本記事では、テスト問題作成をChatGPTやClaudeなどの生成AIに肩代わりさせ、難易度別に量産するための5手順を、塾講師・予備校講師・教材開発担当の方に向けて解説します。

なぜ今、テスト問題AI作成が必要なのか — 塾講師の現場の限界

本記事のテーマに関連するサービスとして、BoostXでは教育業界の支援を提供しています。

テスト問題AI作成を語る前に、なぜ塾・予備校・学校の作問業務が「夜と週末の仕事」になり続けているのかを構造で押さえる必要があります。講師の能力やモチベーションの問題ではなく、要求される問題数と難易度の幅、そして1問あたりの工程が積み重なって生まれている問題だからです。

1単元あたりの作問量は想像より多い

中学・高校の主要5科目を扱う塾の場合、1単元につき難易度A・B・Cで各5〜10問、合計15〜30問は欲しいというのが私が支援した教室での標準感です。これを年間20単元用意するとなると、年間で400〜600問の作問が必要になります。問題本体だけでなく、解答・解説・誤答選択肢（記号問題の場合）・採点基準まで揃えてようやく授業で使えるため、1問あたり10〜20分は素直にかかります。授業準備時間として確保できる枠を、ほぼまるごと作問で食い尽くしている塾講師の方が私の支援先では珍しくありません。

難易度別に揃えるのが一番きつい

テスト問題AI作成のニーズで一番多いのが「難易度別の量産」です。クラス分けやレベル別演習をしている教室では、同じ単元で基礎・標準・応用の3レベルを並行で用意しなくてはいけません。さらに公立入試レベル・難関私立レベル・難関国公立レベルといった志望校別の難易度幅まで加わると、1単元の作問本数は一気に増えます。問題集や過去問の流用で済む部分もありますが、教室独自のテキストとして整える場合は、自前で量産せざるを得ないのが現場の実情です。

AIで何が変わるか — 量産と難易度調整の速度が決定的に変わる

テスト問題AI作成を導入すると変わるのは「問題の独自性」よりも、まず「量産と難易度調整の速度」です。半日かかっていた1単元の作問が、AIに整形済みの単元×難易度マトリクスを渡すだけで1〜2時間レベルに圧縮されます。ChatGPTやClaudeも2025年以降、図表入りの問題生成や数式組版（KaTeX・LaTeX）への対応が進み、教育コンテンツでの活用余地が広がりました。ただし標準機能としては便利でも、自塾のカリキュラム・指導方針・志望校レベルに合わせた難易度の作り込みや、解答・解説の論理整合性まで踏み込むには、ChatGPTやClaudeをハブにした独自設計が必要になります。

テスト問題AI作成で難易度別に量産する5手順全体像

テスト問題AI作成で難易度別に量産する5手順（単元×難易度マトリクス設計→既存問題集から型抽出→作問プロンプト4要素→解答解説の同時生成→校正と蓄積運用）の全体構造図 — テスト問題AI作成で難易度別に量産する5手順の全体像。マトリクス設計→型抽出→AIプロンプト→解答解説生成→運用蓄積までを一本の流れで設計する。

テスト問題AI作成をAIに任せきりにすると、必ず難易度や論理がぶれます。私が塾・予備校の現場で運用設計してきた中で再現性が高いのは、「人が握る部分」と「AIに任せる部分」を5手順に切り分ける設計です。順番が崩れると、出力された問題が現場で使われずに死にます。

STEP1 単元×難易度マトリクスを設計する（人が決める）

縦軸に単元（例：中3数学なら「平方根」「二次方程式」「相似」など）、横軸に難易度（基礎・標準・応用・入試レベル）を取り、各セルに必要な問題数と1問あたりの想定難易度（正答率の目安など）を書き込みます。このマトリクスを最初に作らないと、AIに渡す指示が曖昧になり、出てくる問題のレベルが毎回ぶれます。私の支援先では、ここに2〜3時間かける塾講師ほど、その後の作問が劇的に楽になっています。

STEP2 既存問題集・過去問から「型」を抽出する（半自動）

教室で長く使われてきた問題集や過去問を見直し、「この単元の難易度Aは、こういう問い方をしている」「応用は条件をひとつ追加している」といった出題パターンを言語化します。AIに白紙から作問させるとオリジナリティに振れすぎるため、既存の良問の型をテキストで渡し、その型に沿って数値・固有名詞・場面設定を変えさせる方が、教室の指導方針からブレない問題が安定して出ます。

STEP3 ChatGPT・Claudeへの作問プロンプト4要素

AIに渡すプロンプトは、①対象学年・教科・単元・指導要領上の位置づけ、②STEP2で抽出した出題パターンの型、③難易度の具体的定義（基礎は教科書例題レベル、標準は章末問題レベル、応用は入試標準レベルなど）、④出力フォーマット指定（問題文・図表の有無・解答・解説・予想正答率の表）の4要素で構成します。ここを曖昧にすると、もっともらしいが現場で使えない問題が大量に出ます。

STEP4 解答・解説まで一気通貫で生成させる

テスト問題AI作成で見落とされやすいのが、解答・解説の同時生成です。問題だけ作って解答を後で人間が作ると、結局1問あたりの時間が大して縮みません。プロンプトの段階で「解答と解説（生徒が独学で読んでも理解できる粒度）と、よくある誤答パターン3つを必ずセットで出力」と指示し、問題・解答・解説・誤答分析を一度に出させます。これによって1問あたりの工数が体感で半分以下になります。

STEP5 校正→蓄積→翌期再利用の運用に乗せる

AIが出した問題は、講師が必ず1回は目を通して校正します。校正のポイントは「難易度がずれていないか」「解答の論理に飛躍がないか」「教室の指導方針と矛盾していないか」の3点に絞り、文末表現の細かい修正に時間を使わない運用にします。校正済みの問題はGoogleスプレッドシートやNotionに「単元×難易度×出題年度」で蓄積し、翌年度・翌期に8割そのまま再利用できる教材ストックに育てます。ここまでセットで初めて、テスト問題AI作成は「夜と週末の作問」を消す現実的な打ち手になります。

5手順の詳解 — 単元マトリクスから解答整合性チェックまで

5手順の輪郭を押さえたところで、特に塾講師・教材開発担当の方が躓きやすい3つのステップを実装レベルで深掘りします。教室の規模や扱う学年に関係なく、ここを丁寧にやるかどうかで運用に乗るかどうかが決まります。

単元マトリクスで外せない3つの粒度

第一に単元名は教科書・問題集の章立てではなく、自塾の指導順序に合わせて再定義する。第二に難易度は「正答率の目安」と「問われる思考ステップ数」の2軸で言語化する。第三に必要問題数は「定期テスト用」「演習プリント用」「直前期過去問代用」と用途別に分ける。この3粒度を最初に固めておくと、AIに毎回同じ指示を与えられて出題のブレが減ります。私が支援してきた教室では、このマトリクスをExcel1枚に収めて講師全員で共有することを必ずお勧めしています。

出題パターンの「型」を抽出する具体的な進め方

既存の良問を10〜20問選び、AIに「以下の問題群に共通する出題の型を5パターン抽出してください」と頼みます。出てきた5パターンを講師が見て、自塾の指導方針に合うものだけ採用します。型として残ったパターンは、以降の作問プロンプトに「この型に沿って」と添えて使い回せます。

ChatGPT・Claudeへの作問プロンプトの骨格

プロンプトは「あなたは中学3年生の数学を教える塾講師です。以下の前提と出題の型に沿って、平方根の応用問題を3問作成してください。出力は問題文・図の有無・解答・解説（生徒が独学で読める粒度）・予想正答率・よくある誤答パターン3つを必ず含めてください」が骨格。ここに自塾の前提・抽出済みの型・難易度定義を順番に貼り付けます。出力の信頼性は、貼り付ける型と難易度定義の解像度に比例します。

解答・解説の論理整合性チェックで詰むポイント

数学・理科・英語の文法問題では、AIが出した解答の論理にしばしば飛躍や誤りが混ざります。私の経験では、1問あたり1〜2分の目視チェックで論理エラーの大半は拾えます。校正の優先順位は、(1)解答の正誤、(2)解説の論理の通り、(3)難易度の妥当性、(4)文末表現の自然さ、の順で見て、上位2項目に時間を集中させるのが現場で続くやり方です。文末を整える作業に時間を取られると、AI化のメリットが薄れます。

翌期再利用の運用設計で気をつけること

作った問題は、必ず「単元・難易度・使用年度・使用クラス・正答率実績」のメタ情報をセットでスプレッドシートに残します。翌年度に同じ単元で問題を出す際、過去の正答率データを見て難易度の微調整ができるようになります。テスト問題AI作成で最も価値があるのは、量産そのものよりも、教材ストックが教室の資産として蓄積していくことです。「作って終わり」にしないこと、誰がいつ何を担当するかを月初に決めること。この運用ルールを決めずに導入すると、3ヶ月で講師の手元に戻り、AI化が消えます。

自分でやる vs プロに頼む — 教育現場が踏むべき判断軸

ここまで読んで「ChatGPTが得意な講師が校内にいるからまずやってみよう」と思う方も多いはずです。私もそれを否定しません。ただ、教室・学校で内製するときに必ず詰む3つのポイントを先に共有しておきます。

自分で組むときに必ず詰む3つのポイント

第一に著作権と教材の出典管理。市販問題集や過去問を「型抽出」のためにAIに渡すこと自体は内部利用の範囲ですが、生成された問題を外部に販売・配布する場合は、出典が混入していないかのチェックが必要です。第二に難易度の主観ぶれ。担当講師が変わるとプロンプトの解釈もずれ、同じ単元の「応用」が教室によって難しすぎたり易しすぎたりします。第三に解答・解説の論理整合性。数学・理科は特にAIの誤答が混ざるため、教科専門の講師による1次校正の体制を必ず設計しないと、生徒に誤った解説が届くリスクが残ります。この3つを自塾だけで抱え込むコストを甘く見ると、結局講師の手作業に戻ります。

業務自動化として外注する場合の費用感

BoostXの業務自動化ツール開発では、テスト問題AI作成の初期構築は330,000円〜1,100,000円（税込）レンジ、運用保守は月額33,000円〜110,000円（税込）レンジが目安です。初期は教科数・学年数・教材ストックの規模で幅があり、月額は更新頻度（毎週／毎月）と関係する講師人数で決まります。最低契約期間は3ヶ月で、その後は月単位で柔軟に調整可能です。教室独自のテスト問題AI作成ツールとしてGAS・スプレッドシート・ChatGPT APIをつないだ環境を構築し、講師がボタン1つで難易度別の問題を量産できる形まで運用に乗せます。

AI伴走顧問で並走する場合の進め方

校内にAI推進担当を育てたい「自分でも作問プロンプトを触れるようになりたい」という塾長・教務責任者の方には、生成AI伴走顧問のベーシック契約での並走をお勧めしています。月1テーマずつ2〜4週間で実装・定着させていく形で、初月で単元マトリクスと作問プロンプトの型を固め、翌月で解答・解説の同時生成、3ヶ月目で教材ストックの蓄積運用、というように積み上がっていきます。AIの出力はあくまで作問補助で、最終的な指導判断は講師が握る運用設計を一緒に作るのが私のスタンスです。

ビフォーアフター：テスト作問がここまで変わる

Before：現状の苦しい1週間

月曜から金曜は授業と保護者対応で1日が終わる。週末は来週分の単元別問題と難易度別演習プリントを作るために、土曜の夜と日曜の半日を使う。難関校志望クラス用の応用問題は特に時間がかかり、月曜の朝に間に合わず、結局直前にコピー&貼り付けで急場をしのぐ週もある。教材の質を上げたいと頭では思っていても、量産で精一杯。教室の改善や生徒個別フォローに使える時間が、ほぼ残らない状態が続きます。

After：導入後の楽な1週間

月曜の朝、単元マトリクスを見ながら作問プロンプトをChatGPTに投げ、難易度別に30問・解答解説・予想正答率まで一気に出させる。火曜の空き時間で講師が校正し、問題ストックに追加。週末は授業準備と生徒個別フォローに集中できるようになる。難関校志望クラス用の応用問題も、過去問の型をプロンプトに組み込んでおけば、同じ枠で量産できる。教室全体としては、講師の作問時間が半減し、その分を生徒対応や教材改善に投資できる経営に変わります。

違いを生んでいるのはツールではなく運用設計

私の経験では、ChatGPTやClaudeを導入するだけでこの差は生まれません。差を生んでいるのは、単元マトリクスの設計・出題パターンの型抽出・解答整合性チェックの体制という3つの運用設計です。ツールは入れ替え可能で、設計が肝。「うちはまだBefore寄り」と感じた方は、次のセクションで具体的な相談導線をご案内します。

テスト問題AI作成を教室の標準オペレーションに乗せたい塾・予備校・学校の方へ

BoostXが、御教室専用のテスト問題AI作成環境を設計・運用まで伴走します

単元マトリクス設計・出題パターンの型抽出・難易度の言語化・解答整合性チェックの体制まで、御教室の指導方針に合わせて一気通貫で設計します。土日が作問で潰れるBefore状態から、平日の空き時間で難易度別に量産できるAfter状態まで、4〜8週間で立ち上げ、そこから3ヶ月で校内に定着させていく進め方です。「自分でまず触ってみたい」方には生成AI伴走顧問、「設計から運用までまとめて任せたい」方には業務自動化ツール開発をご案内します。

生成AI伴走顧問の詳細を見る → 無料相談の流れを見る →

よくある質問

QChatGPTで作った問題を、教室の有料テキストとしてそのまま配布しても大丈夫ですか？

A用途と入力データの管理が前提です。市販問題集や過去問を型抽出のために入力データとしてAIに渡した場合、生成された問題に出典の表現が混入していないかを必ず校正で確認します。配布前に講師が1度目を通す体制を作っておけば、教室テキストとしての配布は実務上多くの教室で行われています。ライセンス上の懸念がある場合は、初期設計の段階で出典管理ルールを御教室向けに設計します。

Q数学や理科の解答に誤りが混ざるリスクは、現実的にどのくらいありますか？

A2025年以降のChatGPT・Claudeでは中学レベルの計算誤りは大きく減りましたが、高校数学の応用問題や物理の論証問題では、解答ロジックに飛躍が残るケースがいまもあります。実務的には、教科専門の講師が1問1〜2分目を通す1次校正の体制を組むことで、誤答の大半は拾えます。AIの出力を「下書き」と位置づけ、最終チェックを必ず人間に残す運用設計が前提です。

Q個別指導塾と集団指導塾で、テスト問題AI作成の効果に違いはありますか？

A集団指導は同じ問題を複数クラスで使い回すため、量産そのものよりも難易度別バリエーションの整備が利きます。個別指導は生徒ごとに難易度を細かく調整したいニーズが強く、AIに「この生徒の正答率実績だとこのレベルで」と毎回指示を変えられる点が大きな価値になります。どちらの形態でも、単元マトリクスと出題パターンの型を整える初期設計を丁寧にやることで、運用初月から作問時間の削減を実感しやすくなります。

まとめ

テスト問題AI作成で変わるのは独自性より量産と難易度調整の速度。半日かかっていた1単元の作問が1〜2時間レベルになる
5手順は「単元×難易度マトリクス設計→出題パターンの型抽出→作問プロンプト→解答解説の同時生成→校正と蓄積運用」で、人が握る部分とAIに任せる部分を切り分ける
内製で詰むのは著作権管理・難易度の主観ぶれ・解答論理整合性の3点。外注または伴走顧問で運用までセット設計するのが現実的
Beforeは土日の半分以上が作問で潰れる週。Afterは平日の空き時間で難易度別に量産でき、生徒対応や教材改善に時間を投資できる教室に変わる
違いを生むのはツールではなく運用設計。「うちはBefore寄り」と感じたら、まずは無料相談で現状の作問フローから整理しましょう

吉元大輝（よしもとひろき）

株式会社BoostX 代表取締役社長

中小企業の生成AI導入を支援する「生成AI伴走顧問」サービスを提供。業務可視化から定着支援まで、一気通貫で企業のAI活用を推進している。

公開日：2026年5月

テスト問題AI作成｜塾講師の作問時間を半減する5手順