AIによる議事録自動生成を試してみた-成功と失敗から学ぶ業務改善の壁

カバー

はじめに

議事録の課題と自動生成への期待

「また議事録作成の担当になった……」とうんざりしていませんか?

会議、打ち合わせ、ミーティング……。組織を運営し、業務を遂行していくうえで、様々なレベルで意思決定や意識合わせのための会合が行われます。それらの記録を残すことは組織運営において重要です。しかし、議事録を作成するには議事録作成者の労力がかかります。会合のレベルや議事録に求める品質によっては、1時間の会合をまとめるのに1時間以上を費やす場合もあるでしょう。
また、必要な情報が抜け落ちる可能性があります。書記が発言を聞き逃したり、重要でないと判断して議事録に残さないことがあります。あるいは、ある会合について議事録を作るまでもないと判断することがあります。これらに重要な情報が含まれていることが、会合からしばらくたって判明した経験はありませんか? このように、議事録の作成には労力と網羅性の2つの点で課題があります。

これらの課題を解決するのに、文字起こしツールと生成AIが使えるのではなかろうか?と考えました。議事録を自動的に作れるようになれば、議事録作成にかけていた時間を本来の業務にあてられるだけでなく、会合から得られた情報も漏れなく活用できるようになるはずです。

この記事では、実際に文字起こしツールと生成AIを組み合わせて議事録を生成するツールを作成し、生成した議事録をチーム内に提供した体験を共有します。また、試してみて感じた自動化の可能性や具体的な課題、その対処案を示していきます。

なお以下のセクションでは、組織のポリシーによりTeamsのような会議システムが利用できないことを想定しています。会議システムには録音や文字起こし、要約といった機能が統合されているものもあります。それらの機能が利用できる場合はよりスムーズに議事録を作成できるでしょう。それでも、それらの機能をどう活用するかという点で、本記事の知見は参考になるはずです。

利用したツールやプロセス

実験対象はチームの朝の進捗報告会としました。ミーティングの長さは15分前後です。 ミーティングの録音から議事録の提供までを以下の図の流れでおこないました。

議事録自動生成の流れ

録音

会議室中央にマイクを置き、参加者全員の声を拾えるようにしました。アプリはWindowsにプリインストールされている「サウンドレコーダー」を用いました。録音が完了するとオーディオファイルがM4A形式で保存されます。

文字起こし

文字起こしにはAzure OpenAI Service の文字起こしAPI(Whisper)を用いました。Whisperは、OpenAIが文字起こしサービスとして公開した音声認識モデルです。

Powershellで以下のコマンドを実行することで、文字起こしされたテキストファイルを取得できます。

Terminal window
curl.exe https://your-endpoint.azure-api.net/openai/deployments/whisper/audio/transcriptions?api-version=2024-10-21 `
-H "Content-Type: multipart/form-data" `
-H "api-key: your-api-key" `
-F file=@./recording_morning_1.m4a > text_raw_morning_1.txt

議事録として整形

テキストファイルを議事録として整形するために、ChatGPTにて以下のプロンプトを実行しました。モデルはo1-miniを使用しました。

以下のテキストは、朝の進捗報告ミーティングを文字起こししたものです。報告をした人それぞれについて、報告者と内容を箇条書きで整理してください。その後、各報告者からの報告のほかに、要点があれば箇条書きで整理してください。
(テキストファイルの内容をペースト)

チームに共有

生成した議事録は、チーム全員が閲覧できるチャットに貼り付けて共有しました。会議終了から最短5分で生成した議事録を提供できました。

実験結果とうまくいった点

上記のプロセスで生成した議事録の出力例です。一部誤記がありますが、出力結果をそのまま掲載します。個人名は掲載にあたり置き換えています。


報告者ごとの報告内容

Aさん

  • 予備集計
    • 企業の9月および10月のデータに誤りがあったため修正。
    • 原因や内容の確認を依頼し、誤りがあった点の追記を希望。

Bさん

  • 相手統制作業の継続
    • 引き続き、相手統制作業を進める。

Cさん

  • 相手統制の進捗
    • 確認を完了し、午後にBさんにクロチェックを依頼。
  • 代表決済の状況
    • 2件は代表決済を取得できず、今日中に解凍予定。

Dさん

  • コース金額対応に関する進捗
    • Eさんの修正待機の案件が2件。

その他の要点

  • 生成AIセミナーの詳細共有
    • 無料セミナー情報を社員に周知。
  • 共有端末の適切な使用方法
    • 共有端末使用後のシャットダウンを徹底するよう再度周知。

上記のような議事録を生成できました。ミーティング終了後、メンバーの記憶が鮮明なうちに議事録を生成できる点が優れています。ミーティングの内容を過不足なくまとめられているとの評判でした。

気になる点として、以下をメンバーに指摘されました。

  • わかりやすい誤字がある(代表決済→代表決裁、解凍→回答)
  • 業務名にあたる部分を誤認識しやすい(相手統制→IT統制、コース金額→工数金額)

とはいえ今回の実験対象である進捗報告においては、読者がチームメンバーであるため誤字や誤認識について補完でき、問題なく伝わります。

作業時間の比較

また、今回の手法での作業時間は5分でした。人力で議事録を作成する場合、15分のミーティングをまとめるのに約20分かかっていたので、議事録生成ごとに約15分の工数を削減できる見通しです。

課題と学び

この記事で構築したプロセスを用いて、チーム内ミーティングの議事録自動生成を継続しようとしましたが、わずか2日しか続きませんでした……。継続できなかった要因として、以下のように分析しました。

  • 技術的な壁
    • 文字起こしAPIのファイルサイズ制限
    • 個人名の誤認識
  • プロセス的な壁
    • 録音忘れ
    • ファイル操作の手間
  • 文化的な壁
    • 人力で議事録作成することのメリット

技術的な壁

文字起こしAPIのファイルサイズ制限

今回の文字起こしに使用した音声テキスト変換API(Whisper)には、25MBまでのファイルサイズ制限があります。 サウンドレコーダーで録音すると約25分でこのファイルサイズを超えるため、25分を超えたミーティングの録音ファイルはそのままでは文字起こしができません。

  • 25分を超えないように、ミーティング中に録音の停止と再開を行う
  • ミーティング終了後に、25MB以下になるようにファイルを分割する

などの運用対処が考えられますが、手間がかかり実行には至っていません。

個人名の誤認識

生成した議事録のサンプルイメージを一部再掲します。


Dさん

  • コース金額対応に関する進捗
    • Eさんの修正待機の案件が2件。

個人名を置き換えているので詳細には伝えにくいのですが、実は出席者の名前の大半が誤認識され、チームにいない人の名前が出力されます。「加藤さん」が「佐藤さん」に誤認識されるようなイメージです。誤認識される名前のパターンは毎回異なり、中には「ガラスさん」など名前として想像しにくい誤認識もありました。AIによって生成された文書といえども、毎日名前を間違えられるのは気持ちのいいものではありません。

プロセス的な壁

録音忘れ

いざ議事録を生成しようとして、ミーティングの録音ができていない事に気づくことがありました。録音の開始はミーティングの主催者が手動で行うので、ミーティングの準備が慌ただしいと忘れてしまうことがありました。このため、必要な時に議事録を生成することができませんでした。

ファイル操作の手間

無事にミーティングを録音できたら、あとはコマンドを実行して音声ファイルをAPIに渡し、応答をGPTのチャットウィンドウにペーストするだけ。簡単なお仕事だったはずなのですが、録音したミーティングが終わるたびに手作業で継続するのは地味ながら負担に感じました。ファイルサイズの制約も相まって、文字起こしされていない音声ファイルがフォルダにたまってしまいました……。

文化的な壁

人力で議事録作成することのメリット

本記事のフローを検証していた時期に、ミーティングの録音はせず、私が書記となって議事録を作成する機会がありました。ミーティング中に議論の要点やそこに至る背景、理由などを書きながら整理することになるので、議題への理解が深まりました。また、発言者ごとの考え方の違いにも気づきました。 議事録を人の手で書くことで、業務やチームについてさらに理解することができます。議事録を自動で生成できるようになっても、教育のために必要なときは人力で作成するのがよいでしょう。

課題の解決案

今回の検証を通して見つかった様々な壁に対して、次のような対応をしていこうとしています。

技術的な改善

文字起こしAPIのファイルサイズ制限のため長時間のミーティングに対応できない問題については、長時間のミーティングに対応できる他の文字起こしAPIツールを検証してみます。そうすることで、議事録自動生成を活用できるミーティングの範囲を広げられます。

個人名の誤認識については、議事録を整形する際に使用するプロンプトに、参加者の名前を以下のように与えることで改善できました。

以下のテキストは、朝の進捗報告ミーティングを文字起こししたものです。報告をした人それぞれについて、報告者と内容を箇条書きで整理してください。その後、各報告者からの報告のほかに、要点があれば箇条書きで整理してください。
メンバーの名前は○○、○○、……です。 # <= この行を追加
(テキストファイルの内容をペースト)

プロセスの改善

録音忘れへの対策は、すぐできる対策と根本的な対策に分かれます。すぐできる対策は、サウンドレコーダーをスタートアッププログラムに設定することです。これにより、会議室のPCを起動したときにサウンドレコーダーが自動起動し、会議の主催者が1クリックで録音を始められます。録音ボタンが必ず目に入ることで、録音忘れの大半が防止できると考えられます。
根本的な対策は、自動的に録音を開始および終了し、所定のフォルダに音声ファイルを保存する仕組みを構築することです。こちらは仕様検討や実現方法の調査を要するため、将来的に取り組みたいです。

ファイル操作の手間への対策は、音声ファイルが保存されると自動で文字起こしや議事録生成が行われる仕組みを構築することです。実装方法は以下のようなイメージです。

  • フォルダの監視:Python の watchdog モジュールなどを活用する
  • 文字起こし:本記事の検証ですでにコードとして実装済み
  • 議事録生成:ChatGPTへのリクエストをAPI経由で送信するように変更する

文化面での取り組み

ここまでに挙げた改善によって議事録の自動生成が継続できるようになっても、必要に応じて人力での議事録作成は続けるのがよいと考えています。書記を決めて人の手で議事録を作成することは、書記が業務やチームを理解する助けになります。よって、教育やトレーニングのために役立つ場面では、書記担当を割り当てて作成してもらうのがメンバー育成の面で有効であると考えられます。

改善で期待される効果

技術面、プロセス面の改善によって、議事録作成にかかる労力をさらに削減できます。これにより、議事録作成に費やしていた時間を本来の業務にあてられるようになります。また、「議事録が作成されない」という問題が解消され、情報が漏れなく記録されるようになります。これにより、意識合わせの内容が文書として明確に共有され、チームの意思決定の質が上がることが期待されます。

AI導入を成功させるための学び

今回の実験を通して学んだことは主に次の3つです。

適切なツール選定

AI導入の初期段階では、目的に合ったツールやサービスを選定することが重要です。今回使用したAzure OpenAI Service API(Whisper)は高度な文字起こし能力を持っていましたが、ファイルサイズ制限のため、活用できるミーティングの範囲が制限されてしまいました。複数のツールを比較検討し、実際の業務フローに適合するかを事前にテストすることで、将来的な問題の発生を抑えられます。

プロセスの自動化と効率化

AI導入の検証段階では、手動で行うプロセスを積極的に自動化していくべきです。たとえ5分の作業であっても、自動化することをためらわないでください。音声ファイルの監視や自動文字起こし、議事録生成のプロセスをスクリプトや自動化ツールで一元管理することにより、運用が容易になります。これにより、継続的なフィードバックを受け取る仕組みを構築できます。

フィードバックと改善

「生成物に誤りが多く、この段階で共有する意義があるだろうか?」と感じる段階でも、生成物をメンバーに公開してフィードバックをもらうことは効果的です。技術者として「誤りはすべて正すべき」と思い込み、生成物の精度向上に固執してしまうことがあります。しかし、生成物に誤りが含まれていても、必ずしも運用上の問題になるとは限りません。生成物の精度の期待値を早期に把握し、期待値に応じた開発を進めることが重要です。

まとめ

この記事では、AIを活用した議事録自動生成の試みを通じて、成功点と課題点を踏まえた業務改善の手法について考察しました。実験では、文字起こしツールと生成AIを組み合わせることで、議事録作成に要する工数を大幅に削減することに成功しました。しかし技術的な制約やプロセス上の障壁により、継続的な取り組みとして組織運用に根付かせるには至りませんでした。また、人力の議事録作成に伴う文化的な価値といった気づきも得られました。

技術面やプロセス面の改善を進めていき、議事録自動生成を継続的に運用できれば、議事録作成に関する工数と網羅性の課題を解決できるはずです。この記事で共有した経験と知見が、同様の課題に直面している他のチームや組織にとって、有益な参考となれば幸いです。


TOP
アルファロゴ 株式会社アルファシステムズは、ITサービス事業を展開しています。このブログでは、技術的な取り組みを紹介しています。X(旧Twitter)で更新通知をしています。