Trí tuệ nhân tạo đã có thể biến lời nói thành hình ảnh


Hoàng Tình   –  
Chủ nhật, 19/06/2022 20 : 00 ( GMT + 7 )

Trí tuệ nhân tạo ( AI ) có tên DALL-E có thể biến những mô tả của người dùng thành những hình ảnh phù hợp.

Bạn đang đọc: Trí tuệ nhân tạo đã có thể biến lời nói thành hình ảnh

Trí tuệ nhân tạo đã có thể biến lời nói thành hình ảnh
OpenAI – công ty phát triển mô hình trí tuệ nhân tạo mới có thể tạo ra hình ảnh dựa trên văn bản. Ảnh chụp màn hình

Theo CNBC, DALL-E là một công nghệ tiên tiến được cho phép người dùng tạo hình ảnh kỹ thuật số chỉ đơn thuần bằng cách miêu tả những gì mình mong ước nhìn thấy trải qua những quy mô trí tuệ nhân tạo .DALL-E 2 là thành quả được tăng trưởng của OpenAI – một công ty khởi nghiệp được tương hỗ bởi gã khổng lồ công nghệ tiên tiến Microsoft. Trên website của mình, OpenAI gọi DALL-E 2 là “ một mạng lưới hệ thống AI mới hoàn toàn có thể tạo ra hình ảnh và nghệ thuật và thẩm mỹ thực tiễn từ một diễn đạt bằng ngôn từ tự nhiên ” .Trên thực tiễn, chỉ một nhóm tương đối nhỏ những người dùng được thưởng thức việc san sẻ những hình ảnh được tạo ra từ văn bản vì cho đến thời gian hiện tại, OpenAI vẫn chưa phát hành mạng lưới hệ thống trên đến với công chúng .

Trong một bài đăng trên trang web của công ty, Joanne Jang của OpenAI cho biết: “Chúng tôi đang làm việc chăm chỉ để tăng tốc độ truy cập, nhưng có thể sẽ mất một khoảng thời gian cho đến khi đến được với tất cả mọi người; kể từ ngày 15 tháng 6, chúng tôi đã mời 10,217 người dùng thử DALL-E”.

Trước đó, một mạng lưới hệ thống đã được công bố thoáng đãng có tên là DALL – E Mini, tuy nhiên mạng lưới hệ thống trên liên tục bị quá tải do nhu yếu sử dụng quá lớn. Người dùng liên tục được nghênh đón bằng một hộp thoại với nội dung “ Quá nhiều lưu lượng truy vấn, sung sướng thử lại ” .Các dịch vụ chuyển văn bản thành hình ảnh rất phức tạp khi phải xác lập những phần quan trọng nhất trong văn bản của người dùng sau đó tìm cách để minh họa những thuật ngữ đó. Google đã giảng dạy quy mô Imagen của mình với hàng trăm chip AI nội bộ trên 460 triệu cặp văn bản hình ảnh bên trong, ngoài tài liệu bên ngoài .

Các giao diện của hệ thống khá đơn giản. Nói chung có một hộp văn bản, một nút để bắt đầu quá trình tạo và một khu vực bên dưới để hiển thị hình ảnh. Để chỉ ra nguồn, Google và OpenAI thêm hình mờ ở góc dưới cùng bên phải của hình ảnh từ DALL-E 2 và Imagen.

Tuy nhiên, OpenAI nhận ra năng lực gây hại hoàn toàn có thể đến từ việc công nghệ tiên tiến này sẽ thuận tiện tạo ra những thông tin xô lệch và khiến mọi người hoài nghi về toàn bộ những gì mình thấy trên Internet. Để xử lý rủi ro đáng tiếc, những nhà tăng trưởng đã xóa nội dung đấm đá bạo lực khỏi tài liệu và có những bộ lọc ngăn DALL-E 2 tạo hình ảnh nếu người dùng gửi lời nhắc hoàn toàn có thể vi phạm chủ trương của công ty về nội dung người lớn, đấm đá bạo lực, hoặc yếu tố chính trị .Prafulla Dhariwal, một nhà khoa học nghiên cứu và điều tra OpenAI cho biết : “ Có một quy trình đang diễn ra để cải thiện sự bảo đảm an toàn của những mạng lưới hệ thống này ” .

Bất chấp rủi ro đáng tiếc, OpenAI rất hào hứng với những thứ mà công nghệ tiên tiến hoàn toàn có thể kích hoạt. Dhariwal cho biết công nghệ tiên tiến trên hoàn toàn có thể mở ra thời cơ phát minh sáng tạo cho những cá thể và hoàn toàn có thể giúp ứng dụng thương mại cho những website phong cách thiết kế nội thất bên trong hoặc trang điểm. Hiện tại, mạng lưới hệ thống sẽ liên tục được cải tổ trong thời hạn tới.

Source: https://vvc.vn
Category : Công nghệ

BẠN CÓ THỂ QUAN TÂM

Alternate Text Gọi ngay
Liên kết:SXMB