Google đã sẵn sàng tạo nên làn sóng trong thế giới chuyển văn bản thành hình ảnh với sự phát triển mới nhất của mình, StyleDrop.

Trong một bài báo được phát hành trên máy chủ in sẵn arXiv vào ngày 1 tháng 6, Google đã phác thảo các khả năng của StyleDrop, một công cụ mạnh mẽ cho phép người dùng mô tả các đối tượng và chỉ định một phong cách nghệ thuật để kết hợp vào kết quả đầu ra.

Google StyleDrop: Cách mạng hóa việc tạo văn bản thành hình ảnh

Nhiều công ty công nghệ đã cung cấp tính năng tạo văn bản thành hình ảnh dựa trên AI.

Tuy nhiên, Google cho chúng tôi biết rằng điều làm nên sự khác biệt của StyleDrop là khả năng nắm bắt các sắc thái và chi tiết của các kiểu do người dùng cung cấp, chẳng hạn như cách phối màu, đổ bóng, mẫu thiết kế cũng như các hiệu ứng cục bộ và toàn cầu.

Kết quả là một mảng hình ảnh trực quan tuyệt đẹp phản ánh thông số kỹ thuật của người dùng.

Tạo hình ảnh theo bất kỳ phong cách nào

StyleDrop cũng giới thiệu một mức độ tích hợp mới giữa kiểu chữ và hình ảnh.

Giờ đây, người dùng có thể đề xuất một hình ảnh và chỉ định kiểu vẽ, có thể là “vẽ màu nước”, “kết xuất 3D”, “vẽ đường thẳng” hoặc bất kỳ kiểu ưa thích nào khác.

StyleDrop sau đó tạo ra các kết xuất đối tượng tuyệt đẹp kết hợp phong cách mong muốn, thậm chí mở rộng sang kiểu chữ phản ánh chính xác các đặc điểm nghệ thuật của hình ảnh.

Cách Google phát triển công cụ

Để đạt được mức độ tạo hình ảnh đáng kinh ngạc này, StyleDrop tận dụng Muse của Google, một chuyển đổi tầm nhìn tổng quát đã xuất hiện vào đầu năm nay.

TechXplore báo cáo rằng Muse đã được đào tạo trên 3 tỷ thông số ấn tượng, đảm bảo khả năng tạo hình ảnh chất lượng cao của nó.

Các nhà phát triển của StyleDrop đánh giá kết quả đầu ra của nó bằng cách sử dụng tính năng chấm điểm kiểu và văn bản CLIP theo tiêu chuẩn ngành, cũng như phản hồi của người dùng.

Các đánh giá cho thấy một cách thuyết phục rằng StyleDrop vượt trội so với các phương pháp tạo hình ảnh và văn bản hàng đầu, bao gồm DreamBooth, Imagen và Stable Diffusion.

Điều này là dành cho các nghệ sĩ

StyleDrop của Google có tiềm năng to lớn đối với các nghệ sĩ và nhà thiết kế, cung cấp cho họ một công cụ vô giá để tạo ra hình ảnh chân thực phù hợp với tầm nhìn nghệ thuật của họ.

Cũng đọc: Ứng dụng Google Meet ra mắt tính năng ‘On-the-Go’ dành cho người dùng khi đang đi bộ trong cuộc họp

Cho dù thiết kế một chiến dịch sản phẩm mới hay trực quan hóa một chủ đề, StyleDrop cho phép các nhà thiết kế nhanh chóng đưa ý tưởng của họ vào cuộc sống. Điều này về cơ bản cho phép người dùng vẽ trí tưởng tượng của họ ngay lập tức, không còn yêu cầu bản phác thảo hoặc bản nháp.

TechXplore lưu ý rằng việc tích hợp văn bản và hình ảnh cho phép các nhà thiết kế tạo ra mức độ gần gũi và kết nối cao hơn trong công việc của họ.

Quan tâm, Bảo vệ bản quyền

Mặc dù StyleDrop đại diện cho một tiến bộ đáng kể trong việc tạo văn bản thành hình ảnh, nhưng Google thừa nhận những cạm bẫy tiềm ẩn và những lo ngại về bảo vệ bản quyền.

Khả năng sao chép phong cách của từng nghệ sĩ mà không có sự đồng ý của công nghệ gây ra những lo ngại chính đáng trong cộng đồng sáng tạo.

Trong báo cáo của mình, Google nhấn mạnh tầm quan trọng của việc sử dụng công nghệ có trách nhiệm và kêu gọi người dùng tôn trọng bản quyền và quyền sở hữu trí tuệ.

Điều quan trọng đối với Google và các bên liên quan khác là thiết lập các nguyên tắc và thực tiễn đạo đức rõ ràng để đảm bảo rằng StyleDrop và các công nghệ tương tự được sử dụng một cách có trách nhiệm. Điều này là để tránh các vấn đề pháp lý như công cụ tạo hình ảnh Ổn định AI gặp phải.

Cân bằng giữa đổi mới và sáng tạo với sự tôn trọng quyền của nghệ sĩ sẽ rất quan trọng trong việc tiếp tục phát triển và sử dụng các công cụ tạo văn bản thành hình ảnh.

Công cụ này vẫn chưa được phát hành công khai.

Vẫn được đăng ở đây tại Tech Times.

Các bài viết liên quan: Ra mắt Chatbot Bard AI của Google tại EU bị trì hoãn do những lo ngại về quyền riêng tư; Ngày ra mắt mới là gì?