教育・学習塾・スクール

国語読解問題AI作成|題材から問題を自動生成する5ステップ

国語読解問題AI作成で題材から自動生成する5ステップの運用設計を示したアイキャッチ(教育・塾講師向け)

「漢字や語彙の問題ならまだいい。心情把握と要約の設問を量産するのが、本当にしんどい」——国語の教材開発を任されている塾講師や教科書副教材の制作担当者から、私が生成AI伴走顧問として何度も受けてきたご相談がこれです。国語読解は科目特性として、題材の選定・設問の質・解答の幅・採点基準のすべてを人が握らないと教室で使えません。だから他教科に比べて、AI化が一番遅れたまま講師の手作業に残り続けているのが現場の実情です。

本記事では、国語読解問題AI作成で題材から設問を自動生成するための5ステップを、塾講師・教材開発担当・国語専科の教材制作者向けに、ChatGPTやClaudeを使った運用設計込みで解説します。

なぜ国語読解だけ作問のAI化が遅れているのか

本記事のテーマに関連するサービスとして、BoostXでは教育業界の支援を提供しています。

国語読解問題AI作成を語る前に、なぜ国語の作問だけが他教科より講師の手作業に残り続けているのかを構造で押さえる必要があります。理由は3つあります。題材を1次資料として用意しなければならないこと、設問の答えが幅を持つこと、採点基準の言語化が他教科より重いこと。この3点が、ChatGPTやClaudeの能力に関係なく、国語の作問を「夜と週末の仕事」として残してきました。

国語の作問は「題材を読む時間」がそのまま乗ってくる

数学や英語は単元と難易度を決めればAIに作問を任せられる側面が大きいのに対し、国語読解は題材となる文章を講師が事前に1本ずつ読み込まなければ設問を作れません。中学・高校の主要塾でよく扱う説明文・物語文・随筆・古文・漢文を網羅しようとすると、1本あたり800〜2,500字の文章を10〜20分かけて精読し、設問構成を考え、設問を作り、解答と採点基準を整える流れになります。1題材につき60〜90分が標準で、定期テスト直前や模試対策時期には講師1人あたり週10〜15題材を抱える教室も珍しくありません。

設問は「答えが幅を持つ」科目特性がある

国語読解の設問は、漢字・語彙・接続詞といった一意な答えがある問題と、心情把握・主題理解・要約・記述といった答えが幅を持つ問題が混在します。前者はAIで量産しやすい一方、後者はAIに任せきりにすると「もっともらしいが教室の指導方針と合わない解答」が量産されます。記述問題で許容される答えの幅をどこまで広く取るか、模範解答とは別に部分点採点の基準をどう設けるか。この設計は教室ごとに違い、ChatGPTやClaudeの標準機能だけでは作りきれません。

AIで何が変わるか — 「題材を読む」以降は劇的に速くなる

国語読解問題AI作成を導入して変わるのは、題材を読む時間そのものではなく、題材を読んだ後の工程です。設問構成の設計、漢字・語彙問題の量産、記述問題の模範解答と採点基準の下書き、誤答パターンの想定、解説の言語化。この一連が、講師がプロンプトに題材と意図を貼り付けるだけで、1〜2時間レベルから20〜30分レベルに圧縮されます。ChatGPTやClaudeも2025年以降、長文の読解と論理一貫性が大きく強化され、国語の作問補助としての精度が実用域に入りました。ただし標準機能のままで教室に乗せると、設問の難易度や採点基準が教室の指導方針からずれます。そこを揃えるのに、独自設計の作問プロンプトと運用ルールが必要になります。

国語読解問題AI作成で題材から自動生成する5ステップ 全体像

国語読解問題AI作成で題材から自動生成する5ステップ(題材選定基準の設計→設問パターンの型抽出→作問プロンプト4要素→模範解答と採点基準の同時生成→校正と教材ストックの蓄積運用)の全体構造図
国語読解問題AI作成で題材から自動生成する5ステップの全体像。題材選定→型抽出→AIプロンプト→模範解答と採点基準→運用蓄積までを一本の流れで設計する。

国語読解問題AI作成をAIに丸投げすると、必ず設問の難易度や採点基準がぶれます。私が国語専科の教材開発・塾の現場で運用設計してきた中で再現性が高いのは、「人が握る部分」と「AIに任せる部分」を5ステップに切り分ける設計です。1ステップでも飛ばすと、出力された問題が現場で使われずに死にます。

STEP1 題材選定基準を設計する(人が決める)

国語読解問題AI作成は、題材の選び方で8割が決まります。文章ジャンル(説明文・物語文・随筆・論説・古典)、想定文字数(800〜1,200字/1,500〜2,000字/2,000〜3,000字)、難易度レンジ(中1〜中3、共通テストレベル、難関私大レベルなど)、テーマの偏り(理系トピック・人間関係・社会問題などのバランス)の4軸を、教室の指導方針に合わせて基準書にまとめます。著作権上扱える題材(青空文庫・教科書傍用・自作題材・出典明記の引用)の範囲も、ここで先に決めておく必要があります。

STEP2 設問パターンの「型」を抽出する(半自動)

教室で長く使われてきた問題集や過去問から、「漢字・語彙の出題形式」「接続詞・指示語の出題形式」「内容把握の選択問題の聞き方」「心情把握の記述問題のパターン」「要約・主題の問い方」「表現技法の確認問題」を、設問パターンの型として言語化します。これをテキストでまとめておくと、以降AIに渡す作問プロンプトの精度が安定します。型を抽出せずに白紙からAIに作問させると、出題の癖が毎回変わり、教室の指導方針からブレた問題が量産されます。

STEP3 ChatGPT・Claudeへの作問プロンプト4要素

AIに渡すプロンプトは、①対象学年・教科書準拠の有無・指導要領上の位置づけ、②題材本文(800〜2,500字を直接貼り付け)、③STEP2で抽出した設問パターンの型と必要設問数、④出力フォーマット指定(漢字・語彙・接続詞・内容把握選択・記述・要約のそれぞれを表形式で)の4要素で構成します。題材本文を貼り付けるパートが他教科と決定的に違い、ここを丁寧に設計するほど、出題された問題の精度が上がります。

STEP4 模範解答と採点基準を一気通貫で生成させる

国語読解問題AI作成で見落とされやすいのが、模範解答と採点基準の同時生成です。設問だけ作って解答を後で人間が書くと、結局1題材あたりの工数が大して縮みません。プロンプトの段階で「記述問題には模範解答に加えて、要素別の配点と部分点の基準を提示する」「内容把握の選択問題には正答とともに、各誤答選択肢が誤りである理由を明記する」と指示し、設問・模範解答・採点基準・誤答分析を一度に出させます。これによって1題材あたりの工数が体感で半分以下になります。

STEP5 校正→蓄積→翌期再利用の運用に乗せる

AIが出した問題は、講師が必ず1度は目を通して校正します。校正のポイントは「題材の解釈に飛躍がないか」「記述問題の採点基準が教室の指導方針と整合しているか」「漢字・語彙の難易度が学年レベルと合っているか」の3点に絞り、文末表現の細かい修正に時間を使わない運用にします。校正済みの問題は、Googleスプレッドシートや教材管理ツールに「題材タイトル・ジャンル・学年・出題形式・使用クラス・出題年度」のメタ情報セットで蓄積し、翌年度・翌期に8割そのまま再利用できる教材ストックに育てます。ここまでセットで初めて、国語読解問題AI作成は「夜と週末の作問」を消す現実的な打ち手になります。

5ステップの詳解 — 題材選定から採点基準まで

5ステップの輪郭を押さえたところで、特に塾講師・教材開発担当の方が躓きやすい4つのポイントを実装レベルで深掘りします。教室の規模や扱う学年に関係なく、ここを丁寧にやるかどうかで運用に乗るかどうかが決まります。

題材選定基準で外せない4つの粒度

第一にジャンル別の必要本数を決める。説明文4本・物語文4本・随筆2本・論説2本・古典2本のように、年間で扱う題材の構成比を最初に決めます。第二に文字数レンジを学年と難易度で固定する。中1なら800〜1,200字、中3・高校なら1,500〜2,500字といった目安を持つと、AIに題材を要約・抜粋させるときの指示が明確になります。第三に著作権上の扱いを基準化する。青空文庫・教科書傍用・自作題材・出典明記の引用のどれを使うかを、教室の有料テキストか校内利用かで分けて決めておきます。第四にテーマの偏り防止。理系トピック・社会問題・人間関係・自然描写などをバランスよく入れる方針を、年間カリキュラム単位で明文化します。私の経験では、ここを2〜3時間かけて整える教室ほど、その後のAI作問の安定度が劇的に上がります。

設問パターンの「型」抽出の具体的な進め方

既存の良問を10〜20題材分選び、設問だけを抜き出して並べます。AIに「以下の設問群に共通する出題の型を、漢字・語彙・接続詞・指示語・内容把握・心情把握・要約・表現技法の各カテゴリで抽出してください」と頼むと、教室で実際に使われてきた出題の型が言語化されて返ってきます。これを講師が見て、教室の指導方針と合うものだけ採用します。残った型は、以降の作問プロンプトに「この型に沿って」と添えて使い回せます。

ChatGPT・Claudeへの作問プロンプトの骨格

プロンプトは「あなたは中学3年生の国語を担当する塾講師です。以下の題材本文に対して、定期テスト相当の難易度で、漢字3問・語彙2問・接続詞補充1問・内容把握選択2問・心情把握記述1問・要約記述1問を作成してください。各設問には模範解答・採点基準(記述は要素別配点)・予想正答率・誤答パターンを必ず添えてください」が骨格です。ここに題材本文・抽出済みの型・採点方針を順番に貼り付けます。出力の信頼性は、貼り付ける題材の質と採点方針の解像度に比例します。

心情把握・記述問題の採点基準で詰むポイント

国語読解問題AI作成で最も難しいのが、記述問題の採点基準の設計です。模範解答1パターンだけだと、生徒の答案にどこまで点を与えるかが講師判断に揺れます。私の経験では、模範解答に対して「必須要素3つ・準必須要素2つ・任意要素2つ」のように構造分解し、必須要素を欠いたら半分以下、準必須まで含めば満点に近づく、というルールで採点基準を作るのが現場で続くやり方です。AIに「この設問の採点基準を、必須要素・準必須要素・任意要素の3段階で構造化してください」と指示しておくと、講師がそのまま採点に使える粒度で返ってきます。

解説の論理整合性チェックで時間を取られない運用

AIが出した解説は、講師が1問1〜2分の目視チェックを通します。校正の優先順位は、(1)題材本文との対応関係の正確性、(2)模範解答と採点基準の整合性、(3)選択肢誤答理由の妥当性、(4)文末表現の自然さ、の順で見て、上位3項目に時間を集中させるのが現場で続くやり方です。文末を整える作業に時間を取られると、AI化のメリットが薄れます。校正済みの題材は、講師同士でダブルチェックする体制を組むと品質が安定します。

自分でやる vs プロに頼む — 国語教材制作の判断軸

ここまで読んで「ChatGPTが得意な国語講師が校内にいるからまずやってみよう」と思う方も多いはずです。私もそれを否定しません。ただ、教室・学校で内製するときに必ず詰む3つのポイントを先に共有しておきます。

自分で組むときに必ず詰む3つのポイント

第一に著作権と題材の出典管理。著作権が切れていない現代文の小説・評論を題材としてAIに丸ごと入力し、生成された問題を有料テキストとして配布する場合は、引用要件を満たしているかの確認が必要です。青空文庫の作品・出典明記の引用・教科書傍用・自作題材を中心に運用するルールを最初に決めておかないと、後から教材回収のリスクが残ります。第二に採点基準の主観ぶれ。記述問題の部分点基準は、担当講師ごとに揺れます。教室全体で同じ基準で採点できるよう、設問ごとの採点ルーブリックを構造化しておくことが必要です。第三に題材の難易度ぶれ。AIが出した題材抜粋や設問の難易度は、プロンプトの指示が同じでもセッションごとに揺れるため、難易度の検証フローを設計しないと教室の標準教材として使えません。この3つを自塾だけで抱え込むコストを甘く見ると、結局講師の手作業に戻ります。

業務自動化として外注する場合の費用感

BoostXの業務自動化ツール開発では、国語読解問題AI作成の初期構築は330,000円〜1,100,000円(税込)レンジ、運用保守は月額33,000円〜110,000円(税込)レンジが目安です。初期は扱う学年数・ジャンル数・題材ストックの規模で幅があり、月額は更新頻度(毎週/毎月)と関係する講師人数で決まります。最低契約期間は3ヶ月で、その後は月単位で柔軟に調整可能です。教室独自の国語読解問題AI作成ツールとしてGAS・スプレッドシート・ChatGPT APIをつないだ環境を構築し、講師がボタン1つで題材から設問・模範解答・採点基準まで一気通貫で量産できる形まで運用に乗せます。

AI伴走顧問で並走する場合の進め方

校内にAI推進担当を育てたい「自分でも作問プロンプトを触れるようになりたい」という塾長・教務責任者の方には、生成AI伴走顧問のベーシック契約での並走をお勧めしています。月1テーマずつ2〜4週間で実装・定着させていく形で、初月で題材選定基準と作問プロンプトの型を固め、翌月で記述問題の採点基準ルーブリック化、3ヶ月目で教材ストックの蓄積運用、というように積み上がっていきます。AIの出力はあくまで作問補助で、最終的な指導判断は講師が握る運用設計を一緒に作るのが私のスタンスです。

ビフォーアフター:国語の作問がここまで変わる

Before:現状の苦しい1週間

月曜から金曜は授業と保護者対応で1日が終わる。週末は来週分の国語題材を1本ずつ精読し、漢字・語彙・記述問題を作るために、土曜の半日と日曜の夜を使う。心情把握の記述問題は特に時間がかかり、模範解答と採点基準を整えるところで力尽きて、結局月曜の朝に妥協版を印刷して授業に出す週もある。題材の質を上げたいと頭では思っていても、量産で精一杯。教室の改善や生徒個別フォローに使える時間が、ほぼ残らない状態が続きます。

After:導入後の楽な1週間

月曜の朝、選定基準に沿って今週分の題材を3〜5本AIにピックアップさせ、設問・模範解答・採点基準・誤答分析まで一気に出させる。火曜と水曜の空き時間で講師が校正し、題材ストックに追加。週末は授業準備と生徒個別フォローに集中できるようになる。記述問題の採点基準も構造化されているため、副担当の講師が代行採点しても基準がぶれない。教室全体としては、講師の作問時間が半減し、その分を生徒対応や教材改善に投資できる経営に変わります。

違いを生んでいるのはツールではなく運用設計

私の経験では、ChatGPTやClaudeを導入するだけでこの差は生まれません。差を生んでいるのは、題材選定基準の言語化・設問パターンの型抽出・記述問題の採点ルーブリック化という3つの運用設計です。ツールは入れ替え可能で、設計が肝。「うちはまだBefore寄り」と感じた方は、次のセクションで具体的な相談導線をご案内します。

よくある質問

Q著作権が切れていない現代の小説や評論を、題材としてAIに入れて問題を作ってもいいのですか?

A校内利用と外部配布で扱いが変わります。校内の授業用としてAIへ入力すること自体は内部利用の範囲ですが、生成された問題を有料テキストや模試として外部配布する場合は、著作権法上の引用要件(公表されている著作物・引用の必然性・主従関係・出典明記など)を満たす必要があります。実務上は、青空文庫の作品・教科書傍用題材・出典明記の引用・自作題材を中心に運用ルールを組んでおくのが安全です。配布前の題材使用範囲のチェック体制まで含めて設計します。

Q記述問題の採点をAIに任せられますか?それとも採点は人間が必ずやるべきですか?

A採点の判断は人間に残すのが現実的な運用です。AIには「採点基準の下書き」と「生徒答案の要素分解(必須要素が含まれているか、準必須要素が含まれているか)」を任せ、最終的な部分点の判定は講師が確認する形を私の支援先ではお勧めしています。記述問題で許容される答えの幅は教室の指導方針によって異なるため、AIの採点を100%自動化すると教室の判断軸とずれます。設問ごとの採点ルーブリックを構造化しておけば、講師の確認は1問あたり30秒〜1分で済むようになります。

Q古文や漢文の作問にもAIは使えますか?現代文と扱いを変える必要がありますか?

A2025年以降のChatGPT・Claudeでは古文・漢文の文法解釈や現代語訳の精度がかなり上がっており、古文単語・文法・現代語訳・内容把握の設問は実用域で量産できます。ただし古典の解釈には複数学説がある箇所も多く、講師の校正は現代文より丁寧に行う運用が前提です。私の支援先では、古文・漢文は教材ストックに「解釈の選択肢が分かれる箇所はその旨を併記する」というメタ情報を加えて蓄積する運用にしています。

まとめ

  • 国語読解は題材を読む時間・答えの幅・採点基準の重さで他教科よりAI化が遅れてきた科目。題材を読んだ後の工程は劇的に速くなる
  • 5ステップは「題材選定基準→設問パターンの型抽出→作問プロンプト→模範解答と採点基準の同時生成→校正と蓄積運用」で、人が握る部分とAIに任せる部分を切り分ける
  • 内製で詰むのは著作権と題材出典管理・採点基準の主観ぶれ・題材難易度のセッションごとの揺れの3点。外注または伴走顧問で運用までセット設計するのが現実的
  • Beforeは週末の半分以上が国語の作問で潰れる週。Afterは平日の空き時間で題材から設問と採点基準まで量産でき、生徒対応や教材改善に時間を投資できる教室に変わる
  • 違いを生むのはツールではなく運用設計。「うちはBefore寄り」と感じたら、まずは無料相談で現状の作問フローから整理しましょう

吉元大輝(よしもとひろき)

株式会社BoostX 代表取締役社長

中小企業の生成AI導入を支援する「生成AI伴走顧問」サービスを提供。業務可視化から定着支援まで、一気通貫で企業のAI活用を推進している。

公開日:2026年5月

SNSで共有する
無料個別相談

貴社の業務に、 AIという確かな選択肢を。

「何から始めればいいか分からない」という段階でも構いません。現状の課題を伺い、最適な導入計画をプロと一緒に整理します。

\ 専門家による30分のヒアリング /

無料相談を予約する

オンライン対応可能・強引な勧誘なし

まずは資料で情報収集したい方へ

サービス概要・料金・導入事例をまとめた資料を無料でお送りします。

資料をダウンロード
A