Người nghiện Internet chuyên nghiệp • Người đam mê trò chơi • Người sáng tạo công nghệ
Người nghiện Internet chuyên nghiệp • Người đam mê trò chơi • Người sáng tạo công nghệ

Thêm phụ đề mở thời gian thực cho phát trực tiếp của bạn

Đây là một công cụ chuyển tự phụ đề mở miễn phí, ngoại tuyến và thời gian thực dành cho OBS Studio.
Trang này đã được các thực tập sinh AI đầy nhiệt huyết của tôi dịch từ tiếng Anh để thuận tiện cho bạn. Các bạn vẫn đang trong quá trình học hỏi, nên có thể còn một vài lỗi nhỏ. Để có thông tin chính xác nhất, vui lòng tham khảo phiên bản tiếng Anh.
Trang chủ Công cụ Công cụ chuyển tự ngoại tuyến miễn phí (phụ đề mở / phụ đề)

Xin hãy cân nhắc giúp duy trì công cụ này

Vì tôi đang lưu trữ công cụ này trên máy chủ nhỏ của mình chạy bằng cà phê và bánh quế tại Amazon Web Services, vui lòng cân nhắc hỗ trợ tôi để giúp công cụ này tiếp tục hoạt động và miễn phí!

Tôi muốn giúp giữ công cụ này miễn phí

Công cụ phiên âm (phụ đề mở) này được xây dựng bằng các công nghệ nguồn mở và chạy hoàn toàn trên chính máy tính của bạn.

Vì nó hoạt động ngoại tuyến và không dựa vào xử lý trên đám mây, độ chính xác sẽ không thể so sánh với các dịch vụ trực tuyến mạnh mẽ, đặc biệt khi làm việc theo thời gian thực. Vì vậy, nó có thể mắc sai sót — thậm chí là rất nhiều.

Sử dụng công cụ này nếu bạn cần phụ đề mở đơn giản và ngoại tuyến cho phát trực tiếp. Để đạt độ chính xác cao nhất, thêm phụ đề trong quá trình hậu kỳ sẽ luôn mang lại kết quả tốt nhất.

Xem Video

Nếu bạn không muốn đọc hướng dẫn bằng văn bản này, bạn có thể xem video.

Tải xuống

Tải xuống các phiên bản mới nhất ở đây. Nếu bạn muốn một phiên bản cụ thể, hãy liên hệ với tôi.

Xin lưu ý rằng các tập tin khá lớn vì chúng đi kèm đầy đủ mọi thứ bạn cần ngay từ đầu.

Phiên bản Ngôn ngữ Kích thước tệp Liên kết
3 Tiếng Anh - Chất lượng cao 2.5 GB Tải xuống
3 Tiếng Pháp - Chất lượng cao 1.7 GB Tải xuống
3 Tiếng Tây Ban Nha - Chất lượng cơ bản 280 MB Tải xuống
3 Tiếng Tây Ban Nha - Chất lượng cao 1.6 GB Tải xuống
3 Tiếng Đức - Chất lượng cao 2.1 GB Tải xuống
3 Tiếng Bồ Đào Nha - Chất lượng cơ bản 270 MB Tải xuống
2 Tiếng Anh cơ bản, Tiếng Đức, Tiếng Tây Ban Nha, Tiếng Bồ Đào Nha, Tiếng Pháp và Tiếng Thụy Điển 750 MB Tải xuống

Hướng dẫn nhanh

Dưới đây là một hướng dẫn nhanh theo từng bước về cách sử dụng công cụ Simple Transcriber.

Bước 1 - Tải xuống và giải nén

Sau khi tải xuống phiên bản bạn muốn, hãy nhấp chuột phải vào nó và chọn "Giải nén tất cả".

ảnh chụp màn hình hộp thoại hiển thị tuỳ chọn 'Giải nén tất cả' trên tệp ZIP

Sau khi giải nén, cấu trúc thư mục sẽ trông như thế này.

ảnh chụp màn hình toàn bộ các tệp đã giải nén

Bước 2 - Khởi động máy chủ với ngôn ngữ được chọn

Sau khi tải xuống, hãy nhấp đúp vào tệp start_transcriber.bat để khởi động máy chủ phiên âm.

Chụp màn hình tất cả các tệp .bat cho từng ngôn ngữ

Điều này sẽ khởi động máy chủ phiên âm và tự động bắt đầu nghe micrô mặc định của bạn.

Nó cũng sẽ khởi động một máy chủ WebSocket cục bộ để trình duyệt có thể kết nối tới.

ảnh chụp màn hình của máy chủ Transcribe đang chạy

Bước 3 - Kéo và thả nguồn trình duyệt vào OBS Studio.

Trong cùng một thư mục, bạn cũng sẽ tìm thấy một số tệp HTML có thể dùng làm nguồn trình duyệt trong OBS Studio.

Mỗi tệp HTML mang đến một thiết kế phụ đề mở độc đáo.

Bạn cứ thoải mái thử tất cả chúng — và về sau bạn có thể tự tạo phong cách phụ đề mở cho riêng mình.

Chỉ cần kéo thả một tệp HTML vào một cảnh trong OBS Studio.

ảnh chụp màn hình cho thao tác kéo và thả các tệp HTML làm nguồn trình duyệt trong OBS Studio

Điều này sẽ ngay lập tức bắt đầu hiển thị phụ đề mở trên luồng của bạn.

Bây giờ bạn có thể di chuyển và căn chỉnh hộp chú thích theo ý thích của mình.

ảnh chụp màn hình phụ đề mở trong OBS Studio

Vậy là xong rồi — bạn đã sẵn sàng!

Cài đặt bổ sung

Trong thư mục gốc đã được giải nén, bạn sẽ tìm thấy một tệp settings.json mà bạn có thể chỉnh sửa để cấu hình thêm các tuỳ chọn.

Đây là tổng quan nhanh về từng thiết lập.

Chìa khóa Các giá trị ví dụ Mô tả
port 8123 Số cổng mà máy chủ WebSocket nên sử dụng. Nếu bạn thay đổi giá trị này, bạn cũng cần cập nhật nó trong src/main.js.
onlyFinal false / true Xác định xem trình phiên âm có nên chỉ xuất văn bản cuối cùng hay cũng bao gồm văn bản ở giai đoạn đang tiến hành.
verbose false / true Điều khiển xem máy chủ có chạy ở chế độ chi tiết hay không; chế độ này sẽ hiển thị thêm các chi tiết, bao gồm thông tin gỡ lỗi.
sendConnectionMessage false / true Gửi lời chào mừng tới nguồn trình duyệt khi nó kết nối.
textsToIgnore ["huh"] Một mảng các mục văn bản nên bỏ qua. Điều này có thể được dùng để lọc bỏ văn bản tự động được sinh ra do nhiễu hoặc im lặng.

Thêm các ngôn ngữ khác và sử dụng mô hình tùy chỉnh

Tôi chỉ đóng gói những mô hình ngôn ngữ nhẹ phổ biến nhất vào tệp ZIP có thể tải xuống.

Tuy nhiên, còn có nhiều mô hình khác có sẵn - bao gồm cả những mô hình có độ chính xác cao hơn đáng kể.

Đằng sau công cụ phiên âm này là việc nó sử dụng bộ công cụ nhận diện giọng nói VOSK.

Điều này có nghĩa là bạn có thể tải xuống bất kỳ mô hình VOSK nào và tích hợp nó.

Dưới đây là một hướng dẫn nhanh.

Bước 1 - Tải xuống một mô hình mới

Hãy bắt đầu bằng cách tìm và tải xuống một mô hình VOSK mà bạn muốn thử từ trang tải xuống của họ.

Nhấn vào đây để xem tất cả các mô hình VOSK có sẵn để tải xuống

Sau khi bạn tải xuống và giải nén một mô hình, nó sẽ trông giống như thế này.

ảnh chụp màn hình của mô hình VOSK đã được giải nén

Bước 2 - Sao chép các tệp tin

Sau đó sao chép các tệp mô hình VOSK vào thư mục có tên model.

ảnh chụp màn hình của mô hình VOSK đã được giải nén

Bước 2 - Bắt đầu phiên âm

Khi các tệp VOSK được đặt trong thư mục model, chỉ cần chạy start_transcriber.bat.

ảnh chụp màn hình của file .bat cần chạy

Điều khoản dịch vụ

Xin lưu ý rằng khi sử dụng bất kỳ công cụ hoặc dịch vụ nào tôi đã xây dựng, bạn đồng ý tuân theo Điều khoản dịch vụ.

📺 Xem video mới nhất của Squeaky!

Cách thêm phụ đề thời gian thực cho phát trực tiếp của bạn một cách đơn giản