英語学習におけるAIの種類と活用パターン
今回は、発展目覚ましいAI技術を英語教育に組み込む検討をする際に必須のAIの「種類」と、種類ごとの活用パターンをおさらいしていきます。
1. 音声認識AI
音声認識は、任意の音声を読み取り、対応する単語・文に変換するいわゆる「文字起こし」のことを言います。技術の歴史は思いのほか長く、IBMが1961年に開発成功したShoeboxを発端とし、2000年前後の高級車への音声コマンド導入、2010年前後のスマートフォンへの普及と、低コスト化と高性能化が進んできました。
英語学習においては、主に発話・対話学習において、話し手の音声を英文として処理可能にするために使われます。後述する「音声評価」の簡易的なバージョンとして用いることも可能です。
フィードバック付きの音読学習、AIとの対話学習などに必要な技術です。スピーキングを含む言語活動を通してリスニング能力を鍛える、シャドーイングのような学習形式にも応用可能です。
いわゆる認識精度は、エンジンそのものの性能と同様、使用する機器のマイクの品質や部屋の音響、周囲のノイズ量などにも影響を受けます。稀に、使用している機器との対応が微妙に取れていないカバーを使うことでマイクを隠してしまうケースがあります。特に世代間でサイズが変わらないiPadでよく見られます。音声認識でトラブルがあった際は、ハードウェアを調べることを忘れないでください。
2. 音声評価AI
音声評価は、学術的な定義は定まっていないものの、発音やイントネーション、流暢さなどをネイティブスピーカーのおよその平均(ノルム)と比較するものが、2010年代半ばから普及しています。
音声評価に使われる要素技術は音声認識=文字起こしと共通点も多いものの、ゴールが大きく異なります。端的に言えば、訛りや流暢さに難があっても文字起こしに成功するのが良い音声認識エンジンであるのに対し、訛りや流暢さの違いを判別できるのが良い音声評価エンジン、ということになります。
留学等でのイマージョン学習ができない生徒にとって「伝わったか」「伝わっていないか」のフィードバックが端的に受けられる教育的価値は極めて高いです。サービスに組み込む上では、発話が伝わらなかった場合に、伝わる発話になるよう生徒を導くための設計が肝になります。フォニックス、発音記号などの技法も数多く開発されています。いずれにせよ、授業や家庭学習、それぞれの現場での指導法や、生徒の到達度に見合ったものを選択する必要があるでしょう。
音声認識・音声評価に共通するネットワーク・インフラ面での留意点として「WebSocketの許可」と「帯域」があります。WebSocketは、平たく言うと、端末・サーバー間での双方向通信を行うための通信方式です。2010年代初頭に標準化され普及が進んでいますが、官公庁向けのセキュリティフィルタの中に、WebSocketを遮断してしまう(かつ仕様上回避できない)製品が存在します。そのため、現場の環境で使えるかどうかは事前チェックを行うことが望ましいでしょう。
上記は当社が提供する「TerraTalk」内での音声評価AIの活用例。お手本を意識して生徒が読み上げた音声に対して、文 -> 単語 -> 音素 と段階的に粒度を上げてフィードバックを提示します。まじめな生徒ほど完璧を目指し、結果特定の文のみ繰り返しやり直してしまうケースがみられるため、詳細なフィードバックは最後にまとめて提示するようにしています。特に授業で使う際には「所定の時間で終えやすい」体験設計が重要となります。
3. 学習経路・出題最適化AI
「個別最適化」の文脈でよく語られるAIはこれのことです。製品・サービスにより最適化の問題定義が大きく異なるため、ひょっとすると比較評価が一番難しいカテゴリかもしれません。
忘却曲線の数理モデルに従って同じ学習時間で得られる知識の記憶定着率=暗記効率を上げる製品が一番歴史が古く、これを実現するソフトウェアは1980年頃には出現しています。
こうした個別最適化AIにおいて一番重要なのは学習者の「意欲」や「心理」をどの程度アルゴリズムやサービスデザインに組み込んでいるかです。多くの個別最適化アルゴリズムや学習形式は、そのメソッドを学習者が「正しいやり方で」「所定の分量を」行った際の学習成果のベースラインとの有意差を評価され出来上がったもので、ここに落とし穴があります。
生徒が「正しいやり方で」「所定の分量を」必ず行うことを前提に設計された手法が極めて脆い可能性があることは、想像が容易いのではないかと思います。特に、学習活動の大半を個別最適ドリルに任せ、教員がコーチに徹する、といったやり方は、これまでの集団授業とは教員に求められるスキルセットが全く異なるため、基盤となるプラットフォームとコンテンツが盤石でなければ、一時的な習得不全を起こしかねません。
履修主義か習得主義かといった教育制度上のパラダイムの問題だけでなく、個別最適化学習を実際の現場に落とし込んだ時の有効性は、専門家の知恵を借りながら評価することが望ましいでしょう。
4. 言語生成AI
2021年ごろから急速に発展・応用が進むのがこの「生成AI」です。2020年以前から、機械翻訳や音声合成など、範囲を絞った生成技術の開発は進展し広く普及していました。直近の技術革新の違う点は、AIが内包する知識の幅広さと、実際に担えるタスクの幅広さにあります。登場からわずか数年で言語を扱うあらゆる産業のあらゆる業務に影響を与えつつあり、2020年代で最も文明へのインパクトが大きな発明になる可能性があります。
見た目の「性能」「賢さ」が向上するだけでなく、同じ性能を出すのにサーバーが行う計算量=エネルギー量=電気代=コストについては、わずか1年で1/10になるペースで向上するなど、目まぐるしい速度で発展しています。
今この瞬間に高単価の営利事業でしか活用できない価格のAIが、1年後には誰でも利用できる価格帯に下がってくることになります。技術を活用する側にとっては素晴らしい時代です。一方、地方自治体等の組織における調達を考える上では、単価の引き下がり可能性を念頭に置くべきでしょう。同様に「生成AI=高価」という先入観を突く形で、高いマージンを乗せている製品も出てきているため、特に公益性が高い事業の場合は、調達に一層の注意が必要です。
生成AI周辺については、外交・政治的なマターになる傾向もあり、現時点でのサービス仕様はもとより継続的な発展と法規制の対応力に焦点を置くのが妥当と言えます。また、応用範囲が広い分、そのままでは使い手側に大きな裁量とリテラシーが求められるため、応用範囲やAIの入出力フォーマットを適切に狭めて、単機能ごとに応用するサービスの方が現場への浸透は早くなるでしょう。
生成AIの英語学習への応用可能性は幅広く、網羅することは難しいですが、現場へのインパクトが大きそうな例をいくつか挙げて、この記事の結びとします。
1. 教科書外教材コンテンツの迅速作成・翻案(教務)
- 概要: 生成AIを用いて、既存の教科書単元を補強するためのオリジナル英文読解資料、リスニングスクリプト、ロールプレイ用ダイアログ、文化紹介コンテンツなどを短時間で作成・編集。
- 効果: 素材探しやオリジナル教材の作成時間を大幅削減し、授業準備負担を軽減。多様なレベルや興味に応じた差別化教材が容易に生み出せる。
2. 定期テスト用問題作成支援・バリエーション生成(教務)
- 概要: テスト問題作成時、同一の文章題や語彙問題などを、異なる表現で複数パターン生成し、出題ミスや類似問題の漏れをチェックする。また、難易度調整や形式変更も容易。
- 効果: 評価問題準備の労力削減、問題の多様化、品質向上。テスト出題ミスや不適切表現のチェックにも利用可能。
3. 保護者向け通信・お便りの英文化支援(校務)
- 概要: 学校行事の案内、クラス便りなどを簡易な日本語ドラフトから自然な英文メッセージに変換し、帰国子女や外国籍家庭に配布。
- 効果: 国際化対応や多文化コミュニケーションが円滑に行える。翻訳にかかる時間・コスト削減。
4. 校内指導計画書やカリキュラム文章の英語版作成(校務)
- 概要: 学年配当表や年間計画書、教材リストなど、校内文書を英文化して共有する際の下書きを作成。ALTや外国籍スタッフとの情報共有を促進。
- 効果: 国際理解教育を推進する上での資料作成時間を短縮。
いずれのケースにおいても、AIの持つ高い推論能力を最大限に活用するためには、日々の現場での校務・教務における業務マニュアルや学習データ、いわばAIにとっての文脈となるデータを蓄積していくことが最初のステップです。その次に、蓄積したデータとAIを繋ぐ部分をいかに品質高く行うか、また各ユーザーの「センス」によらずに最低品質を担保するかが組織で応用する上でのポイントです。この観点で、業務上のタッチポイントを多く持つ業務特化型製品とAIの統合が正攻法ということができるでしょう。
高リテラシー層の創造性を解き放つChatGPTのような汎用製品と、各産業・職種の業務を非AIソフトウェアを含めて縦に統合し、組織的な効率化を実現する産業特化製品は、実質的に別カテゴリの製品として検討することが事業設計上の要です。