“Meta Voicebox AI – Thiết bị phát âm giả lập giọng nói đa dạng cho chỉnh sửa âm thanh”

Meta đã cho ra mắt công cụ Voicebox AI mới nhất, được xem là cách tốt nhất để tạo âm thanh từ văn bản hoặc lời nói, cũng như chỉnh sửa âm thanh cho mọi nhu cầu. Voicebox AI được xem là công cụ tạo giọng nói “linh hoạt” nhất trong ngành, cho phép mọi người tạo hoặc mô phỏng âm thanh chỉ bằng một nút bấm. Công nghệ này có nhiều ứng dụng cho internet và ngành công nghệ, bao gồm tạo nội dung hoặc chỉ đơn giản là tạo video gia đình với âm thanh tốt hơn và loại bỏ tiếng ồn xung quanh không mong muốn.
Sự phát triển mới nhất từ Meta cung cấp Voicebox AI được cho là giúp tạo âm thanh từ văn bản hoặc lời nói, cũng như hoạt động như một công cụ chỉnh sửa âm thanh cho mọi nhu cầu. Meta tự hào là công cụ tạo giọng nói “linh hoạt” nhất trong ngành, cho phép mọi người tạo hoặc mô phỏng âm thanh chỉ bằng một nút bấm.
Nó mang đến nhiều ứng dụng cho internet và ngành công nghệ, bao gồm cả việc tạo nội dung đó hoặc chỉ đơn giản là tạo video gia đình yêu cầu lấp đầy âm thanh hoặc loại bỏ tiếng ồn xung quanh không mong muốn.
Meta Voicebox AI là Công cụ chỉnh sửa âm thanh, tạo giọng nói
(Ảnh: Meta)
Meta giới thiệu các công cụ mới tập trung vào tạo giọng nói và chỉnh sửa âm thanh, với Voicebox AI thể hiện bước đột phá của công ty trong phát triển AI tổng quát. Nó tuyên bố là công cụ linh hoạt nhất cho bài phát biểu tổng quát hiện có trong ngành, với các tính năng và chức năng mạnh mẽ cho nhiều nhu cầu khác nhau.
Voicebox AI có thể hỗ trợ tạo nội dung được sử dụng trên các nền tảng truyền thông xã hội của nó để giúp nâng cao âm thanh của nó, chẳng hạn như loại bỏ tiếng chó sủa hoặc tiếng còi xe trong nền.
Ngoài ra, công nghệ này cũng có thể mang lại giọng nói do AI tạo ra từ lời nhắc văn bản chỉ bằng một nút bấm và cung cấp đầu ra tức thì, như ChatGPT của OpenAI hoặc DALL-E.
Đọc thêm: Meta cho phép trẻ em từ 10 tuổi sử dụng tai nghe Quest VR nhưng có điều kiện
Meta Advanced Voice Box cũng có thể mô phỏng giọng nói của mọi người
Mô hình AI cơ bản cũng được thiết kế để mang cùng một tín hiệu âm thanh từ một nguồn nhất định, nghĩa là nó có thể bắt chước giọng nói của một người miễn là nó có một mẫu ngắn nhất là hai giây.
Meta cũng hứa hẹn rằng việc lấy mẫu và tạo âm thanh của nó sẽ giống như người thật chứ không giống giọng nói của AI hay robot, với tính năng đa ngôn ngữ có thể dịch nó sang sáu ngôn ngữ bao gồm tiếng Anh, tiếng Pháp, tiếng Đức, tiếng Ba Lan, tiếng Bồ Đào Nha hoặc tiếng Tây Ban Nha .
Phát triển và đổi mới Meta AI
Meta là một công ty làm tất cả và đây là bài hát mà nó hoàn toàn cam kết thực hiện khi đổi tên khỏi Facebook, rời xa nguồn gốc truyền thông xã hội của nó. Trước đây, Mark Zuckerberg, Giám đốc điều hành của Meta, đã nói rằng công ty sẽ mở rộng phát triển AI của mình bắt đầu với một nhóm mới thành lập nền tảng truyền thông xã hội.
Đã có những bản phát hành mang tính biểu tượng trước đây của công ty giúp mở rộng sự phát triển AI của công ty ra thế giới.
Zuckerberg và Meta trước đây đã giới thiệu một mô hình ngôn ngữ lớn mà anh ấy đã phát triển trước đó và nó cho phép công chúng và các nhà phát triển truy cập miễn phí. Công ty gọi nó là Open Pretraining Transformer (OPT-175B), tận dụng 175 tỷ tham số cho mô hình ngôn ngữ của mình, tất cả đều có sẵn theo giấy phép phi thương mại cho mục đích nghiên cứu.
Trong khi chiến đấu với những gã khổng lồ AI như OpenAI, Midjourney, Adobe, Google, Microsoft, v.v., Meta vẫn cam kết giới thiệu những phát triển AI mang lại những tiến bộ đáng kể cho công nghệ của mình. AI Voicebox cung cấp nhiều khả năng cho nền tảng truyền thông xã hội Meta, đặc biệt là để tạo nội dung, với sự phát triển linh hoạt có tính năng tạo giọng nói.
Những bài viết liên quan: Giám đốc điều hành Meta Mark Zuckerberg tiết lộ kế hoạch kết hợp AI sáng tạo vào mọi sản phẩm
