Công nghệ Krisp giúp người dùng Ấn Độ chuyển đổi giọng nói sang giọng Mỹ, tăng hiệu quả bán hàng lên 26,1%.
Krisp, công ty khởi nghiệp trong lĩnh vực công nghệ âm thanh, vừa công bố tính năng chuyển đổi giọng nói bằng AI, cho phép người dùng chuyển giọng Anh-Ấn sang giọng Anh-Mỹ trong các cuộc gọi trực tuyến. Đây là bước đi đáng chú ý trên thị trường công nghệ âm thanh, hứa hẹn tạo ra những thay đổi đáng kể trong lĩnh vực truyền thông toàn cầu.
Theo thông báo chính thức từ Krisp vào hôm thứ Tư, công nghệ này được thiết kế để giữ nguyên đặc điểm giọng nói cá nhân của người dùng, chỉ điều chỉnh phần ngữ âm để phù hợp với cách phát âm của người Mỹ. Hiện tại, tính năng đang ở giai đoạn beta và đã được tích hợp vào ứng dụng máy tính để bàn của công ty, cho phép người dùng kích hoạt tùy chọn này bất cứ lúc nào trong quá trình gọi.
Động lực phát triển và tiềm năng thương mại
Arto Minasyan, đồng sáng lập Krisp, chia sẻ rằng ý tưởng này xuất phát từ trải nghiệm cá nhân: “Nhiều người không hiểu giọng nói của tôi mặc dù tôi nói tiếng Anh tốt. Chúng tôi nghĩ rằng việc thay đổi giọng nói có thể giúp mọi người hiểu nhau tốt hơn nhiều.”
Kết quả thử nghiệm trong môi trường doanh nghiệp cho thấy những con số ấn tượng: tỷ lệ chuyển đổi bán hàng tăng 26,1% và doanh thu trên mỗi lượt đặt hàng tăng 14,8%. Những số liệu này minh chứng cho tiềm năng thương mại đáng kể của công nghệ, đặc biệt là trong các ngành dịch vụ khách hàng và bán hàng qua điện thoại.
Mặc dù vẫn còn những hạn chế trong giai đoạn beta – như giọng nói sau xử lý đôi khi không tự nhiên và bỏ sót một số từ – Krisp khẳng định rằng mô hình sẽ được cải thiện theo thời gian. Công ty đã đào tạo mô hình trên hàng nghìn mẫu giọng nói đa dạng, đồng thời sử dụng dữ liệu từ trợ lý cuộc họp của mình sau khi nhận được sự đồng ý của người dùng.
Một ưu điểm quan trọng của công nghệ này là khả năng hoạt động theo thời gian thực mà không cần quá trình đào tạo trước về giọng nói của người dùng, giúp tăng tính linh hoạt và khả năng áp dụng rộng rãi.
Krisp không phải là công ty duy nhất trong lĩnh vực này. Sanas, một startup được GV (Google Ventures) hỗ trợ, cũng đã triển khai công nghệ tương tự trong các trung tâm cuộc gọi quy mô lớn. Tuy nhiên, Krisp đang tập trung vào việc mở rộng phạm vi ứng dụng với kế hoạch phát triển ứng dụng di động iOS và Android, cùng với tiện ích mở rộng Chrome để tích hợp tốt hơn với Google Meet.
Lựa chọn tập trung vào giọng Ấn Độ như một điểm khởi đầu không phải ngẫu nhiên. Theo Krisp, người Ấn Độ chiếm phần lớn lực lượng lao động toàn cầu trong các lĩnh vực STEM, và công ty đã lên kế hoạch mở rộng hỗ trợ cho nhiều giọng nói khác, bao gồm cả giọng Filipino.