STERFIELD

chatGPTとmakeで議事録要約ツール試作版を作ってみた

chatGPTとmakeで議事録要約ツール試作版を作ってみた

はじめに

これは非エンジニアがノーコードツールを使って、試行錯誤している様子をブログにしたものです。

ツッコミどころ満載かと思いますが、ご容赦ください。

Chat GPTの可能性を模索

鮮烈なデビューとともにその勢いは衰えることなく怒涛のリリースを行うChat GPT。業務効率改善に営業畑の人間が取り組むことにしました。

参考にさせて頂いた情報

【革命的!】ChatGPT+ノーコードで、Web会議後の議事録化が自動で作成&通知可能に!?

まさにChatGPTに求めていたような使い方をされていて、かつノーコードで行えるということで自分も試してみることにしました。

Make&ChatGPT&ちょこっとDeepL

今回の肝がこのmakeというサービスで私のような非エンジニアでもコードを書く必要がなく(ノーコード)APIを叩いたり、そのデータを別のサービスに連携させてたりといったことができるiPaaSサービスです。

iPaaSをChatGPTに聞いた答えも引用で貼っておきます。

iPaaSは、Integration Platform as a Service(統合プラットフォーム・アズ・ア・サービス)の略称で、クラウド上で提供されるアプリケーション間の統合を支援するプラットフォームです。iPaaSは、データやアプリケーション、システムなどを簡単かつ効率的に統合するためのツールを提供し、APIやデータストレージ、メッセージング、アプリケーション接続、エンタープライズ・サービス・バス(ESB)などの機能を含みます。iPaaSは、企業がビジネスプロセスの自動化、データの統合、クラウドベースのアプリケーションの管理などを行うためのシームレスな方法を提供し、デジタルトランスフォーメーションを支援する重要な役割を果たしています。

初めて使ったのですが、Make✖️AI(chatGPTやDeep L)にとてつもない可能性を感じ、あれこれ試行錯誤してる瞬間がとても楽しかったです。

テキストを要約してもらって通知

実現させたのはテキストを要約してもらって通知という非常にシンプルなものです。

参考にさせて頂いた平岡さんは、

  1. Zoomをクラウドに録画
  2. それを読みに行って文字起こし
  3. そのテキストをChatGPTに要約
  4. Googleドキュメント作成
  5. Slackに通知

というところまで行われています。

私は、普段使っているサービスにアレンジしつつ、シンプルにできるところまでやってみました。

  1. 文字起こしまでをGoogleドキュメントの音声入力で会議中に文字起こし
  2. そのテキストをChatGPTに要約
  3. Chatworkに通知

という3行程です。

makeでは、下記のようにサービスを並べます。

APIキーの取得や詳細の使い方は割愛させていただきますが、Chatworkへの通知まで成功に至りました。

今回はツールの理解に時間を使い試作版ということで3行程レベルですが、様々なサービスの連携がイメージできました。

工夫ポイント

DeepLを介してトークン数の削減

ちょうど4000文字強のとある会議の音声入力データで試していたところ、一度に送信できるトークン数が4097という制限があり、トークンのカウントは簡単にいうと単語の区切りと言われておりますが、日本語の場合、ほぼ文字数に近い数字がトークン数となり、上述のドキュメントでは以下の通り、4212トークンでエラーがでしまいました。

 

そこで、英語に翻訳すると精度が上がり、トークン数も削減できるいうこと情報を覚えていたので、間にDeep Lを噛ませることにしました。

そうすることで、4212トークンが、1567トークンまで圧縮され、理論上は、さらに倍の日本語文字数でも耐えられることが分かりました。

ただし、日本語の精度が落ちてしまっている感は否めず、現状だとそのままオフィシャルに議事録として扱うというよりは、自分のメモ書きの代わり程度に留めておくのが良さそうな具合だという結論になりました。

処理時間

課題

1時間前後の会議に対応できるか

現在APIの制約として、4097トークン上限があり、おおよそ時間にすると10〜15分程度の会議のテキスト量に相当しますので、少なくともこの5倍程度は受け入れられなければ実用に耐えられないと思います。

それを解消するために、一度Deep Lを介して、英語に翻訳しトークン数を下げるという試みをしましたが、日本語の精度が落ちてしまう点とそれでも上限トークン数の制約にはとても足りないので、テキストを分割するといった更なる工夫の必要。

議事録のテキスト化の方法

今回は、Googleドキュメントの音声入力をを利用して、そのドキュメントからテキストを抽出しましたが、ここもなるべく自動化したいですね。音声データから文字起こしですとここでもファイル容量の上限もあり、まだまだ、1時間レベルの会議に耐えるものではないので、試行錯誤いたします。

まとめ

議事録ツールを完成させる方向性もありますが、もっともっといろいろなことができるのではと、ワクワクしました。

Author Profile

著者近影

YUJI MEZAKI代表取締役副社長

代表取締役副社長をやっています。 越境ECとWebマーケの営業担当しています。 なんでもカリカリにチューニングして生産性あげるのが好きで勉強したビジネスフレームワークの記事多め。 趣味はPC自作で会社のWindowsデスクトップはほぼ自分が組みました。 1985年生/2008年早大卒/

SHARE

合わせて読みたい