OpenVoice – Dự án nhân bản giọng nói AI mã nguồn mở miễn phí.
OpenVoice – Dự án nhân bản giọng nói AI mã nguồn mở miễn phí. logo

OpenVoice – Dự án nhân bản giọng nói AI mã nguồn mở miễn phí.

OpenVoice là một dự án nhân bản giọng nói miễn phí và mã nguồn mở do MyShell phát triển. So với các công nghệ nhân bản giọng nói khác, ưu điểm của OpenVoice là chỉ cần một đoạn âm thanh ngắn, có thể tái tạo giọng nói của người nói với độ chính xác đáng kinh ngạc, tạo ra giọng nói tự nhiên khiến người nghe tin tưởng. Ngoài việc sao chép và tham khảo giọng nói của người nói, OpenVoice còn có thể kiểm soát phong cách giọng nói một cách tinh vi, bao gồm những biến đổi cảm xúc tinh tế, sự khác biệt về giọng điệu và nhịp điệu, tốc độ nói nhanh hay chậm và sự lên xuống của ngữ điệu.

Đặc điểm nổi bật của OpenVoice

  • Nhân bản giọng nói chính xác. OpenVoice có khả năng nắm bắt và nhân bản giọng nói tham khảo một cách chính xác, bất kể ngôn ngữ hay giọng điệu nào, đều có thể tạo ra giọng nói tương ứng, giúp giao tiếp xuyên ngôn ngữ trở nên tự nhiên và trôi chảy hơn bao giờ hết.
  • Kiểm soát phong cách giọng nói linh hoạt. OpenVoice mang đến cho người dùng quyền kiểm soát toàn diện về phong cách giọng nói, từ việc thể hiện cảm xúc đến việc bắt chước giọng điệu, hay kiểm soát nhịp điệu, sắp xếp ngắt quãng và thay đổi ngữ điệu, tất cả đều có thể được điều chỉnh theo ý tưởng của người dùng.
  • Nhân bản giọng nói xuyên ngôn ngữ không cần mẫu. Thuật toán tiên tiến của OpenVoice hỗ trợ học không mẫu, ngay cả khi không có tập dữ liệu đa ngôn ngữ lớn từ nhiều người nói, vẫn có thể thực hiện nhân bản giọng nói cho bất kỳ ngôn ngữ nào.

Địa chỉ trang web chính thức của OpenVoice

Cách sử dụng và chạy OpenVoice

Các nhà phát triển có thể cài đặt và chạy OpenVoice tại địa chỉ dự án GitHub theo mô tả và hướng dẫn sử dụng, hoặc có thể trải nghiệm Demo OpenVoice trực tuyến qua Lepton AI, MyShell hoặc HuggingFace: