Việc ‘xả băng’ ghi âm hay tổng hợp nội dung họp là điều rất phiền toái cho mọi nhân viên văn phòng, nay đã có thể xử lý nhanh bằng một ứng dụng miễn phí từ Google hỗ trợ nhiều ngôn ngữ bao gồm tiếng Việt. Ứng dụng còn giúp người điếc giao tiếp nhanh chóng, hiệu quả hơn rất nhiều.
Google Tạo phụ đề trực tiếp (Google Live Transcribe) là ứng dụng di động miễn phí được các kỹ sư Google tạo ra nhằm hỗ trợ người khiếm thính có thể giao tiếp tốt hơn. Cụ thể, ứng dụng Tạo phụ đề trực tiếp chuyển giọng nói thành văn bản theo thời gian thực, nhờ đó, người khiếm thính có thể dễ dàng tham gia các cuộc trò chuyện hàng ngày chỉ với chiếc điện thoại Android. Người đối diện nói bất cứ điều gì, ứng dụng cũng đều chuyển lời nói đó thành văn bản trên màn hình điện thoại để người dùng xem và phản hồi.
Thế giới sẽ có 900 triệu người giảm thính lực vào năm 2055, theo Tổ chức Y tế Thế giới (WHO)
Bên cạnh đó, một công dụng phụ thú vị mà hầu như các nhân viên văn phòng hoặc báo chí truyền thông thường gặp phải đó là ‘xả băng’ ghi âm cuộc họp. Người dùng thường mất nhiều thời gian để nghe lại một bản ghi âm cuộc họp hay trao đổi, rồi gõ lại thành văn bản. Tuy nhiên, với ứng dụng Tạo phụ đề trực tiếp (Live Transcribe), bản ghi âm và chuyển thành văn bản được thực hiện ngay lúc cuộc họp đang diễn ra.
Sử dụng công nghệ nhận dạng lời nói tự động tiên tiến của Google, ứng dụng Tạo phụ đề trực tiếp hiển thị lời nói và âm thanh ở dạng văn bản trên màn hình, hỗ trợ đến hơn 80 ngôn ngữ và phương ngữ, bao gồm tiếng Việt. Nhờ vậy, người khiếm thính hay bị suy giảm thính lực có thể dễ dàng tham gia các cuộc trò chuyện đang diễn ra quanh mình hơn. Họ có thể nhập câu trả lời trên màn hình, nhận thông báo rung khi tên bạn được nhắc và tìm kiếm nội dung trong bản chép lời đó.
Ứng dụng cho phép bạn chọn nhanh hai ngôn ngữ thường được dùng nhất trong phần Thiết lập. Ví dụ có thể chọn tiếng Việt và tiếng Anh, đặc biệt hơn, ứng dụng cho phép phân loại các giọng phát âm để có thể nhận diện giọng nói tốt hơn như Tiếng Anh (giọng Mỹ), tiếng Anh (giọng Ấn)… Điều này cho phép ứng dụng ghi nhận giọng nói và chuyển thành văn bản chính xác hơn, nắm bắt chính xác các sắc thái của cách sử dụng từ trong ngữ cảnh.
Một số tính năng phụ mà bạn có thể thiết lập:
- Thêm các từ tùy chỉnh mà bạn thường dùng, như tên hoặc vật dụng trong nhà
- Xem các sự kiện âm thanh trong môi trường xung quanh bạn, như tiếng chó sủa, tiếng vỗ tay hoặc tiếng huýt sáo
- Nhập nội dung trả lời trong cuộc trò chuyện của bạn. Hiển thị bàn phím điện thoại và nhập nội dung để trò chuyện liên tục. Bản chép lời nói sẽ vẫn hiển thị khi bạn nhập
- Xem âm lượng giọng nói của người nói so với độ ồn trong môi trường của bạn. Bạn có thể dùng chỉ báo âm thanh này để điều chỉnh âm lượng của mình khi nói
Khi đã hoàn thành bản chuyển giọng nói thành văn bản, tạm gọi là bản chép lời, người dùng có thể chọn xem lại bản này trong 3 ngày (mặc định không được lưu lại) để chuyển chúng sang các ‘đám mây lưu trữ’ như Google Drive hoặc sao chép nhanh nội dung qua Google Docs.
Ứng dụng Tạo phụ đề trực tiếp (Live Transcribe) là sản phẩm hợp tác giữa Google và Đại học Gallaudet, trường đại học hàng đầu Hoa Kỳ dành cho người khiếm thính và người bị suy giảm thính lực, hỗ trợ điện thoại Android 5.0 (Lollipop) trở lên, tải miễn phí trên Google Play, theo đó, người dùng các điện thoại Android giá phổ thông vẫn có thể sử dụng.
Công nghệ nhận diện giọng nói và chuyển thành văn bản trong thời gian thực dùng cho Tạo phụ đề trực tiếp được Google chia sẻ trên mạng phát triển mở GitHub, nơi các nhà phát triển có thể khai thác để ứng dụng hay sáng tạo cho các sản phẩm của mình.
Mẹo dùng gia tăng độ chính xác
- Dùng micro gắn ngoài đi kèm tai nghe có dây, tai nghe Bluetooth để tiếp nhận âm thanh tốt hơn
- Kiểm tra chỉ báo âm lượng và tiếng ồn (biểu tượng màu xanh góc phải trên màn hình) để tìm hiểu xem môi trường xung quanh bạn có phù hợp để tạo bản chép lời không.