プロのインターネット中毒者 • ゲーム愛好家 • 技術クリエイター
プロのインターネット中毒者 • ゲーム愛好家 • 技術クリエイター

ライブ配信にリアルタイムのオープンキャプション(字幕)を追加する

OBS Studio向けの、シンプルで無料のオフラインリアルタイム文字起こしツールです。オープンキャプションにも対応しています。
このページは、皆様の便宜を図るため、熱意あふれるAIインターン生が英語から翻訳しました。彼らはまだ学習中なので、多少の誤りがあるかもしれません。正確な情報については、英語版をご覧ください。
ツール 無料のオフライン文字起こしツール(オープンキャプション/字幕対応)

このツールを維持するためにご協力ください

私はこのツールを、Amazon Web Services のコーヒーとワッフルで稼働する自分の小さなサーバーでホストしているので、このツールを継続的に無料で稼働させ続けるために、ぜひサポートをご検討ください。

このツールを無料で維持するために協力したい

この文字起こしツール(オープンキャプション)は、オープンソース技術を使って構築されており、完全にご自身のパソコン上で動作します。

オフラインで動作し、クラウド処理に依存しないため、精度は強力なオンラインサービスが達成できるレベルには及びません。特にリアルタイムで作業している場合にはなおさらです。その結果、誤りを犯すことがあります。時にはかなり多くの誤りが生じることもあります。

ライブ配信向けにシンプルでオフラインのオープンキャプションが必要な場合は、このツールをお使いください。最高の精度を求めるなら、ポストプロダクションで字幕を追加するのが、常に最良の結果を生み出します。

ビデオを見る

このガイドを読みたくない場合は、動画をご覧ください。

ダウンロード

最新バージョンはここからダウンロードできます。特定のバージョンをご希望の場合は、お気軽にご連絡ください。

ファイルは初期設定で必要なものがすべて含まれているため、かなり大きくなっています。ご注意ください。

バージョン 言語 ファイルサイズ リンク
3 英語 - 高品質 2.5 GB ダウンロード
3 フランス語 - 高品質 1.7 GB ダウンロード
3 スペイン語 - 基本品質 280 MB ダウンロード
3 スペイン語 - 高品質 1.6 GB ダウンロード
3 ドイツ製・高品質 2.1 GB ダウンロード
3 ポルトガル語 - 基本品質 270 MB ダウンロード
2 基礎英語、ドイツ語、スペイン語、ポルトガル語、フランス語、スウェーデン語 750 MB ダウンロード

クイックガイド

Simple Transcriber ツールの使い方を、手順を追って分かりやすく解説する、シンプルなクイックガイドです。

ステップ1 - ダウンロードして解凍

希望のバージョンをダウンロードしたら、それを右クリックして「すべて展開」を選択します。

ZIPアーカイブで「すべて抽出」と表示されているポップアップのスクリーンショット

展開後、フォルダ構成はこのようになります。

抽出されたすべてのファイルのスクリーンショット

ステップ2 - 選択した言語でサーバーを起動します

ダウンロードが完了したら、start_transcriber.bat ファイルをダブルクリックして、文字起こしサーバーを起動してください。

言語別に、すべてのバッチファイルのスクリーンショットを撮る

これを実行すると、トランスクリバー・サーバーが起動し、デフォルトのマイクからの入力を自動的に受け付け始めます。

ローカルの WebSocket サーバーも起動します。ブラウザ側のソースがそのサーバーに接続します。

実行中の Transcribe サーバーのスクリーンショット

ステップ3 - ブラウザソースを OBS Studio にドラッグ&ドロップ

同じフォルダには、OBS Studioでブラウザソースとして使用できるHTMLファイルがいくつかあります。

各HTMLファイルは、独自のオープンキャプションデザインを提供します。

すべて試してみてください。後で自分だけのオープンキャプションのスタイルを作成することもできます。

HTMLファイルをOBS Studioのシーンにドラッグするだけです。

OBS Studio で HTML ファイルをブラウザソースとしてドラッグ&ドロップしている様子のスクリーンショット

これを有効にすると、ストリームにオープンキャプションがすぐに表示されます。

キャプションボックスを自由に動かして、位置とサイズを調整できます。

OBS Studio のオープンキャプションのスクリーンショット

これで準備完了です!

追加設定

展開したルートフォルダには、追加の設定オプションを編集できる settings.json ファイルがあります。

各設定の概要を簡単にご紹介します。

キー サンプル値 説明
port 8123 WebSocket サーバーが使用するポート番号です。この値を変更した場合は、src/main.js でも更新する必要があります。
onlyFinal false / true 書き起こしが最終テキストのみを出力するか、途中経過のテキストも出力するかを指定します。
verbose false / true サーバーを詳細モードで動作させるかどうかを制御します。詳細モードでは、デバッグ情報を含む追加の情報が出力されます。
sendConnectionMessage false / true 接続時にブラウザーソースへ歓迎メッセージを送信します。
textsToIgnore ["huh"] 無視すべきテキストエントリの配列です。ノイズや無音の影響で自動生成されたテキストを除外するために使用できます。

他の言語の追加とカスタムモデルの使用

ダウンロード可能な ZIP アーカイブには、最も一般的な軽量言語モデルのみを同梱しています。

ただし、利用可能なモデルはまだ多くあります。その中には、精度が大幅に高いものも含まれています。

内部では、書き起こしツールは VOSK の音声認識ツールキットを使用しています。

これにより、任意の VOSK モデルをダウンロードして、すぐに使えるようになります。

こちらがクイックガイドです。

ステップ1 - 新しいモデルをダウンロード

まずは公式のダウンロードページから、試してみたいVOSKモデルを見つけてダウンロードしましょう。

ダウンロード可能なすべてのVOSKモデルを表示するには、ここをクリックしてください。

モデルをダウンロードして解凍したら、こんな感じになるはずです。

展開済みのVOSKモデルのスクリーンショット

ステップ2 - ファイルをコピー

次に、VOSKのモデルファイルを model という名前のフォルダにコピーします。

展開済みのVOSKモデルのスクリーンショット

ステップ2 - トランスクリバーを起動する

VOSKファイルを model フォルダーに配置したら、start_transcriber.bat を起動するだけです。

起動すべきバッチファイルのスクリーンショット

利用規約

私が作成したツールやサービスを使用することにより、利用規約に従うことに同意したことになりますのでご了承ください。

📺 Squeakyの最新動画をチェック!

ライブ配信にリアルタイム字幕を簡単に追加する方法