Giọng Việt máy đã hay hơn

Đó là trải nghiệm cá nhân khi nghe máy đọc một đoạn văn ngẫu nhiên, có 3 từ tiếng Anh, tại địa chỉ https://fptsmartcloud.vn/uPgZM với hai giọng đọc là Ban Mai (nữ, giọng Bắc) và Minh Quang (nam, giọng Nam).

Giọng Việt máy đã hay hơn… Ảnh: A.T

Tại địa chỉ trên, muốn trải nghiệm giọng đọc tiếng Việt, khách hàng chỉ cần sao chép đoạn văn, sau đó chọn giọng đọc (có 15 giọng đọc với nhiều âm giọng khác nhau theo các vùng miền của nước Việt), rồi nhấn vào nút “tạo file”, chờ chừng 3 – 5 giây, đoạn văn đó sẽ được phát. Giọng đọc hay, dễ nghe, có ngưng – nghỉ khi gặp những dấu hiệu ngữ pháp trong đoạn văn trên… Nếu không quá khó tính, giọng đọc máy tại địa chỉ trên “lôi cuốn” người nghe hơn cả giọng đọc của con người thực!

Hiện trên thị trường, trong cuộc đua chuyển đổi số, nhiều doanh nghiệp đã và đang đầu tư vào công nghệ “giọng máy” để “robot hóa” nguồn nhân sự trong những phần việc liên quan đến giao tiếp, chăm sóc, tư vấn khách hàng; cộng đồng người khiếm thị, những người mất khả năng đọc, sách nói, các bài giảng điện tử…

Mới đây, cuối tháng 10.2021, FPT.AI ra mắt công nghệ giọng máy AceSound. Đại diện doanh nghiệp cho rằng, “đây là bước tiến trong việc tổng hợp giọng máy từ ngôn ngữ tự nhiên của con người để có giọng máy hay, dễ nghe, dễ hiểu, rõ ràng hơn”.

AceSound vận dụng những công nghệ tiên tiến nhất về tổng hợp giọng nói, khai thác triệt để công nghệ học sâu (deep learning). Do đó, mô hình máy tính có thể học được hàng nghìn đặc trưng về âm học trong giọng nói tự nhiên của người Việt ở nhiều vùng miền khác nhau. Kiến trúc mô hình học sâu được tinh chỉnh riêng để tối ưu cho từng giọng nói theo giới tính, vùng miền. Để giọng máy hoàn thiện và tự nhiên như người thật, nhón chuyên gia của FPT.AI đã thực hiện hàng nghìn thí nghiệm phân tích mẫu, liên tục cải tiến chất lượng âm học của giọng máy.

FPT.AI nói rằng công nghệ Acesound sẽ làm giọng máy hay hơn! Ảnh: FPT.AI

Với chất giọng hay hơn, đại diện FPT.AI cho biết, công cụ voicebot sẽ được sử dụng nhiều hơn trong giao tiếp hai chiều với con người theo thời gian thực với các câu phản hồi có giọng nói biểu cảm, ngữ điệu, mang lại sắc thái tự nhiên cho cuộc hội thoại.

Hiện giọng máy của FPT.AI đã được tích hợp vào “trợ lý ảo” của các trung tâm tổng đài chăm sóc khách hàng tại nhiều doanh nghiệp như Home Credit, ngân hàng VIB, công ty dược Boston Pharma…

Thịnh An

Có thể bạn quan tâm: