Công nghệ nhận diện giọng nói Trint: Không chỉ ghi chép lời thoại mà còn phân biệt được ai đang nói

Công nghệ mới Trint giúp ghi chép và nhận diện được người nói

Với chức năng nhận diện được người nói, Trint là bước ngoạt mới cho loại hình truyền thông ko chữ.
Nếu Google Talk và Siri chỉ dừng ở việc ghi chép hội thoại thông thường thì Trint còn có tính năng phân biệt được ai là người cất giọng. Chính CEO của Trint, Jeff Kofman đã phải gật đầu việc dành hàng nghìn giờ ngồi chép lại các bài nói chuyện, hội thảo, phỏng vấn,… trong suốt hơn ba thập kỉ làm báo đã khích lệ anh thiết kế công cụ tự động hóa này.

cong nghe nhan dien giong noi trint

Công nghệ chuyển giọng nói thành văn bản được rất nhiều người mong muốn nhưng chưa công cụ nào thỏa mã. Các hãng truyền thông liên tục sản xuất nội dung video nhưng chưa được tối ưu hóa để công cụ tìm kiếm có thể tìm ra. Do đó, Trint có thể được coi là mở ra kỉ nguyên mới cho các loại hình truyền thông ko chữ như video hay podcast.
Nếu ko có điều kiện theo dõi buổi hội thảo, phỏng vấn kéo dài hàng tiếng đồng hồ, khán giả có thể đọc lướt transcript của video hay podcast. Còn các phóng viên cũng tiết kiệm được vô số thời gian và rảnh tay khi phải ghi chép các buổi nói chuyện.
Trint có khả năng giải quyết các đoạn text ngay trên màn hình soạn thảo trong trình duyệt, cùng với việc gắn luôn phần chữ đang viết với đoạn audio đang nhắc đến trong file ghi âm. Độ chính xác chưa được 100% nhưng ứng dụng vẫn cung cấp được một đoạn text đầy đủ, gãy gọn để có thể tìm và chỉnh sửa lại. Không những thế, Trint còn có mức giá hấp dẫn hơn nhiều so với 3Play hay Casting Words, chỉ 15 USD/giờ.

Mai Hoàng