はじめに
Whisper Webはブラウザ内で完全に動作します。アカウント不要、アップロード制限なし、サーバーサイド処理ゼロ。
- モデルを選択: ほとんどのユーザーにとって、デフォルトの標準(
Base)モデルが速度と精度のバランスが最適です。遅いデバイスの場合は軽量(Tiny)に切り替えてください。 - 音声を読み込む:
.mp3、.wav、または.m4aファイルをドラッグアンドドロップします。.mp4などの動画ファイルもサポートしています。 - 書き起こし: 「開始」をクリックします。初回実行時は、AIモデル(約75MB)をブラウザキャッシュに読み込むために少し時間がかかる場合があります。
プライバシーとセキュリティ
データ転送ゼロ保証
あなたの音声ファイルと書き起こしがデバイスから出ることはありません。すべての処理はWebAssemblyを介してローカルで行われます。サイトの読み込み後にWi-Fiをオフにしてこれを確認することもできます。
私たちはデータを保存しないため、失われた書き起こしを復元することはできません。タブを閉じる前に必ず作業内容をエクスポートしてください。
精度の最適化
Whisperは強力ですが、入力品質が重要です。以下のヒントに従って、ほぼ完璧な結果を得てください:
クリアな音声
指向性マイクまたはヘッドセットを使用してください。
一人の話者
会話の重複を避けてください。
静かな部屋
バックグラウンドノイズやファンの音を最小限に抑えてください。
標準的なアクセント
はっきりと効率的に話してください。
字幕のエクスポート
Whisper Webは、YouTube、Premiere Pro、および標準的なビデオプレーヤーと互換性のある標準形式をサポートしています。
TXT (プレーンテキスト)
メモ、ブログ、記事に最適です。
SRT (SubRip)
YouTubeやFacebookの字幕の標準です。
VTT (WebVTT)
HTML5ウェブプレーヤーに最適です。