Hunyuan: Siêu Mô Hình Video AI Nguồn Mở Thách Thức Runway và Sora! #AI #VideoAI #Hunyuan #Tencent #NguồnMở #CôngNghệ #TríTuệNhânTạo #Innovation

## Hunyuan: Siêu Mô Hình Video AI Nguồn Mở Thách Thức Runway và Sora! #AI #VideoAI #Hunyuan #Tencent #NguồnMở #CôngNghệ #TríTuệNhânTạo #Innovation

Mỗi tuần trôi qua, cộng đồng công nghệ lại được chứng kiến sự ra đời của một mô hình AI video mới. Và lần này, gã khổng lồ công nghệ Trung Quốc Tencent đã chính thức gia nhập cuộc đua với Hunyuan – một mô hình video AI nguồn mở đầy tiềm năng, hứa hẹn sẽ tạo nên cuộc cạnh tranh gay gắt với những tên tuổi hàng đầu như Runway và Sora.

Sự xuất hiện của Hunyuan đánh dấu một bước tiến đáng kể trong lĩnh vực AI video. Khác với nhiều mô hình khác thường bị hạn chế về tính khả dụng hoặc chi phí sử dụng, Hunyuan được phát hành dưới dạng nguồn mở, cho phép các nhà phát triển, nhà nghiên cứu và thậm chí cả những người đam mê công nghệ tiếp cận và tận dụng sức mạnh của nó một cách tự do. Điều này mở ra cơ hội cho sự phát triển và đổi mới mạnh mẽ trong cộng đồng, thúc đẩy sự tiến bộ của công nghệ AI video nói chung.

Mặc dù chi tiết kỹ thuật về Hunyuan vẫn chưa được Tencent công bố đầy đủ, nhưng những thông tin ban đầu đã cho thấy tiềm năng to lớn của mô hình này. Khả năng tạo video chất lượng cao, tốc độ xử lý nhanh và sự linh hoạt trong việc tùy chỉnh là những điểm nổi bật được kỳ vọng. Việc Hunyuan được thiết kế với tính mở sẽ giúp cộng đồng cải thiện và mở rộng các tính năng của nó, tạo ra một hệ sinh thái năng động và phong phú.

Cuộc cạnh tranh giữa Hunyuan, Runway và Sora hứa hẹn sẽ mang lại nhiều đột phá trong công nghệ AI video. Việc có thêm một đối thủ mạnh mẽ, đặc biệt là một mô hình nguồn mở, sẽ thúc đẩy sự đổi mới, giúp giảm chi phí và tăng khả năng tiếp cận công nghệ AI video cho nhiều người hơn. Đây là một tín hiệu tích cực cho sự phát triển của ngành công nghiệp và sẽ mang lại nhiều ứng dụng thú vị trong tương lai, từ sản xuất phim ảnh, quảng cáo đến giáo dục và giải trí.

Sự ra mắt của Hunyuan không chỉ là một sự kiện quan trọng trong lĩnh vực công nghệ mà còn là một minh chứng cho sự cạnh tranh khốc liệt và tốc độ phát triển chóng mặt của trí tuệ nhân tạo. Hãy cùng chờ đón những bước tiến tiếp theo của Hunyuan và sự phát triển bùng nổ của công nghệ AI video trong thời gian tới.

Gặp Hunyuan – mô hình video AI nguồn mở mới cạnh tranh với Runway và Sora

Viết lại bài dài đầy đủ và chuyên nghiệp kèm hashtag bằng tiếng Việt kèm hashtag nhằm kích thích người đọc vào xem Gặp Hunyuan – mô hình video AI nguồn mở mới cạnh tranh với Runway và Sora MỘT mô hình video AI mới dường như xuất hiện hàng tuần và mới nhất, từ gã khổng lồ công nghệ Trung Quốc Tencent, là một vấn đề lớn. ưu đãi Hunyuan video hiện đại chất lượng và chuyển động đồng thời hoàn toàn là nguồn mở.Video Hunyuan là mô hình biến áp khuếch tán 13 tỷ tham số, có thể nhận một lời nhắc văn bản đơn giản và biến nó thành video 5 giây có độ phân giải cao. Hiện tại, không có nhiều nơi để thử nó bên ngoài Trung Quốc, nhưng vì đây là nguồn mở nên điều này sẽ thay đổi. Một dịch vụ, FAL.aiđã tạo một phiên bản mà bạn có thể chơi cùng.Video demo trông rất ấn tượng, với các chuỗi ngắn, mỗi chuỗi cung cấp cái nhìn thoáng qua về chuyển động trông tự nhiên của con người và động vật theo phong cách quang học. Ngoài ra còn có các clip thể hiện các phong cách hoạt hình khác nhau.Việc triển khai hiện tại tôi đã thử mất tối đa 15 phút để tạo 5 giây video, vì vậy không có nhiều thời gian cho thử nghiệm nhưng các thử nghiệm của tôi cho thấy nó gần tương đương với Đường băng Gen-3 và Luma Labs Dream Machine ở đầu ra nhưng việc tuân thủ nhanh chóng (ít nhất là bằng tiếng Anh) không tốt bằng.Hunyuan hoạt động như thế nào(Tín dụng hình ảnh: Hunyuan AI)Hunyuan là mô hình video AI mã nguồn mở với 13 tỷ thông số. Điều này làm cho nó lớn hơn nhiều so với các mẫu nguồn mở tương tự, bao gồm cả Mochi-1 ấn tượng của Genmo. Tuy nhiên, không phải tất cả các tham số đều được tạo ra như nhau, vì vậy điều này có thể phức tạp hơn hiệu suất — cần phải thử nghiệm nhiều hơn để biết được.Nó hoạt động giống như bất kỳ mô hình video AI nào khác ở chỗ bạn cung cấp cho nó văn bản hoặc hình ảnh, nó sẽ cung cấp cho bạn video dựa trên thông tin đầu vào của bạn. Nó có sẵn dưới dạng tải xuống nhưng phiên bản hiện tại yêu cầu ít nhất 60GB bộ nhớ GPU — vì vậy bạn đang xem xét ít nhất một Nvidia H800/H20.Đây là nguồn mở và giống như Mochi-1, có thể sẽ có một số tinh chỉnh để giảm yêu cầu để bạn có thể chạy nó trên thứ gì đó như RTX4090.Tencent cho biết trong quá trình thử nghiệm, nó có thể đạt được chất lượng hình ảnh cao, tính đa dạng chuyển động và độ ổn định của thế hệ với những đánh giá của con người khiến nó ngang bằng với tất cả các mô hình thương mại lớn. Việc trở thành nguồn mở mang lại lợi thế cho nó, trong đó toàn bộ cộng đồng có thể bổ sung các tính năng và cải thiện mô hình.Công ty cho biết trong tài liệu rằng “điều này sẽ trao quyền cho mọi người trong cộng đồng thử nghiệm ý tưởng của họ, thúc đẩy một hệ sinh thái tạo video năng động và sôi động hơn”.Hunyuan hoạt động tốt như thế nào?(Tín dụng hình ảnh: Hunyuan/AI được tạo ra trong tương lai)Tôi đã dùng thử nó trên FAL.ai và nhận thấy rằng khả năng tuân thủ nhanh chóng và hiểu biết theo ngữ cảnh về vật lý của nó không tốt như đã hứa trong tài liệu cũng như không tốt bằng Runway, Kling hay Hailuo.Ví dụ: tôi đưa ra lời nhắc kiểm tra truyền thống của mình: “Một con chó trên tàu”. Điều này kiểm tra cách nó xử lý một lời nhắc ít mang tính mô tả hơn và một lời nhắc đòi hỏi sự hiểu biết về chuyển động và tốc độ.Nó hoạt động tốt nhưng đầu ra của nó quá đơn giản. Khi tôi thử lời nhắc tương tự với các mẫu xe khác, tôi nhận được chuyển động nhanh bên ngoài, nội thất xe lửa trong suốt và một chú chó dễ thương đang ngồi trên ghế. Hunyuan tặng tôi một con chó nhưng nó trông giống phòng chờ của bác sĩ.Mochi-1 đạt được sản lượng tương đương với Runway và Kling từ cùng một lời nhắc. Có thể đó chỉ là một thế hệ tồi từ Hunyuan và thử lại sẽ cho kết quả tốt hơn, nhưng với 15 phút cho mỗi lần thử, tôi không có thời gian.Thông tin khác từ Hướng dẫn của Tom

MỘT mô hình video AI mới dường như xuất hiện hàng tuần và mới nhất, từ gã khổng lồ công nghệ Trung Quốc Tencent, là một vấn đề lớn. ưu đãi Hunyuan video hiện đại chất lượng và chuyển động đồng thời hoàn toàn là nguồn mở.

Video Hunyuan là mô hình biến áp khuếch tán 13 tỷ tham số, có thể nhận một lời nhắc văn bản đơn giản và biến nó thành video 5 giây có độ phân giải cao. Hiện tại, không có nhiều nơi để thử nó bên ngoài Trung Quốc, nhưng vì đây là nguồn mở nên điều này sẽ thay đổi. Một dịch vụ, FAL.aiđã tạo một phiên bản mà bạn có thể chơi cùng.

Đường băng Gen-3 và Luma Labs Dream Machine ở đầu ra nhưng việc tuân thủ nhanh chóng (ít nhất là bằng tiếng Anh) không tốt bằng.

Hunyuan hoạt động như thế nào

Hồn Nguyên

(Tín dụng hình ảnh: Hunyuan AI)

Hunyuan là mô hình video AI mã nguồn mở với 13 tỷ thông số. Điều này làm cho nó lớn hơn nhiều so với các mẫu nguồn mở tương tự, bao gồm cả Mochi-1 ấn tượng của Genmo. Tuy nhiên, không phải tất cả các tham số đều được tạo ra như nhau, vì vậy điều này có thể phức tạp hơn hiệu suất — cần phải thử nghiệm nhiều hơn để biết được.

Nó hoạt động giống như bất kỳ mô hình video AI nào khác ở chỗ bạn cung cấp cho nó văn bản hoặc hình ảnh, nó sẽ cung cấp cho bạn video dựa trên thông tin đầu vào của bạn. Nó có sẵn dưới dạng tải xuống nhưng phiên bản hiện tại yêu cầu ít nhất 60GB bộ nhớ GPU — vì vậy bạn đang xem xét ít nhất một Nvidia H800/H20.

Đây là nguồn mở và giống như Mochi-1, có thể sẽ có một số tinh chỉnh để giảm yêu cầu để bạn có thể chạy nó trên thứ gì đó như RTX4090.

Tencent cho biết trong quá trình thử nghiệm, nó có thể đạt được chất lượng hình ảnh cao, tính đa dạng chuyển động và độ ổn định của thế hệ với những đánh giá của con người khiến nó ngang bằng với tất cả các mô hình thương mại lớn. Việc trở thành nguồn mở mang lại lợi thế cho nó, trong đó toàn bộ cộng đồng có thể bổ sung các tính năng và cải thiện mô hình.

Công ty cho biết trong tài liệu rằng “điều này sẽ trao quyền cho mọi người trong cộng đồng thử nghiệm ý tưởng của họ, thúc đẩy một hệ sinh thái tạo video năng động và sôi động hơn”.

Hunyuan hoạt động tốt như thế nào?

Hồn Nguyên

(Tín dụng hình ảnh: Hunyuan/AI được tạo ra trong tương lai)

Tôi đã dùng thử nó trên FAL.ai và nhận thấy rằng khả năng tuân thủ nhanh chóng và hiểu biết theo ngữ cảnh về vật lý của nó không tốt như đã hứa trong tài liệu cũng như không tốt bằng Runway, Kling hay Hailuo.

Ví dụ: tôi đưa ra lời nhắc kiểm tra truyền thống của mình: “Một con chó trên tàu”. Điều này kiểm tra cách nó xử lý một lời nhắc ít mang tính mô tả hơn và một lời nhắc đòi hỏi sự hiểu biết về chuyển động và tốc độ.

Nó hoạt động tốt nhưng đầu ra của nó quá đơn giản. Khi tôi thử lời nhắc tương tự với các mẫu xe khác, tôi nhận được chuyển động nhanh bên ngoài, nội thất xe lửa trong suốt và một chú chó dễ thương đang ngồi trên ghế. Hunyuan tặng tôi một con chó nhưng nó trông giống phòng chờ của bác sĩ.

Mochi-1 đạt được sản lượng tương đương với Runway và Kling từ cùng một lời nhắc. Có thể đó chỉ là một thế hệ tồi từ Hunyuan và thử lại sẽ cho kết quả tốt hơn, nhưng với 15 phút cho mỗi lần thử, tôi không có thời gian.

Thông tin khác từ Hướng dẫn của Tom

Liên hệ đặt mua sản phẩm tại bài viết tại Viễn Đông Mobile

Viễn Đông Mobile là cửa hàng chuyên kinh doanh các sản phẩm điện tử phục vụ nhu cầu chơi game, bao gồm:

  • Gaming phone: Điện thoại cấu hình mạnh, tối ưu cho việc chơi game.
  • Máy tính bảng chuyên gaming: Màn hình lớn, hiệu năng cao, trải nghiệm game tốt hơn.
  • Phụ kiện cao cấp: Tai nghe, bàn phím, chuột,… hỗ trợ game thủ.

Thông tin liên hệ:

  • Địa chỉ: 211 đường 3/2, phường 10, quận 10, TP.HCM
  • Điện thoại: 0777600020
  • Email: [email protected]

Bản đồ chỉ đường
xin chào

Gửi phản hồi