QuinTech
LatestTechnologyAINvidia

Nvidia ra mắt bản thiết kế cho các AI Agent có thể phân tích video

08-01-2025·02:11 AM
nvidia ai gpu
Nvidia Ai Gpu

Nvidia ra mắt bản thiết kế AI Agent phân tích video tại CES 2025


Tại sự kiện CES 2025, trong bài phát biểu khai mạc của CEO Jensen Huang, Nvidia đã chính thức công bố bản thiết kế dành cho các AI Agent có khả năng phân tích video.

Bản thiết kế này, được hỗ trợ bởi nền tảng Nvidia Metropolis, giúp các tổ chức và cá nhân tăng cường hiệu suất làm việc và đảm bảo an toàn. Thậm chí, nó có thể hỗ trợ CEO của Nvidia cải thiện kỹ năng ném bóng chày của mình.


Bước ngoặt mới trong AI phân tích video


Hiện nay, hơn 1,5 tỷ camera công nghiệp trên toàn cầu đang tạo ra khoảng 7 nghìn tỷ giờ video mỗi năm, nhưng chỉ một phần nhỏ trong số đó được phân tích. Chỉ có chưa đến 1% video từ các camera công nghiệp được con người theo dõi trực tiếp, dẫn đến nhiều sự cố quan trọng bị bỏ qua.

Điều này gây ra tổn thất lớn, chẳng hạn như các nhà sản xuất mất hàng nghìn tỷ USD mỗi năm do chất lượng sản phẩm kém hoặc lỗi sản xuất mà đáng lẽ có thể được phát hiện sớm nhờ AI.

Các AI Agent với khả năng nhận thức hình ảnh sẽ hoạt động như một nhà phân tích video luôn sẵn sàng, giúp nhà máy vận hành hiệu quả hơn, cải thiện an toàn lao động và đảm bảo mọi thứ diễn ra suôn sẻ.


Tăng tốc phát triển AI Agent


Để thúc đẩy việc tạo ra các AI Agent phân tích video, Nvidia đã giới thiệu phiên bản mới của bản thiết kế này, cung cấp quyền truy cập sớm cho các nhà phát triển. Xây dựng trên nền tảng Nvidia Metropolis và được tăng cường bởi các mô hình ngôn ngữ mạnh mẽ như Nvidia Cosmos Nemotron (VLM), Nvidia Llama Nemotron (LLM) và Nvidia NeMo Retriever, bản thiết kế cung cấp công cụ để tạo và triển khai các AI Agent xử lý khối lượng lớn video và hình ảnh.


Nền tảng Nvidia AI Enterprise tích hợp microservices dành cho VLM, LLM và các framework AI tiên tiến, giúp xử lý video hàng loạt nhanh hơn gấp 30 lần so với thời gian thực.

Bản thiết kế cũng bao gồm các tính năng như lập luận chuỗi ý tưởng, lập kế hoạch nhiệm vụ và gọi công cụ, giúp nhà phát triển dễ dàng tạo ra các AI Agent mạnh mẽ và đa năng để giải quyết nhiều vấn đề khác nhau.


Ứng dụng trong công nghiệp và hơn thế nữa


1. Tăng năng suất và giảm lãng phí:

AI Agent giúp đảm bảo các quy trình sản xuất phức tạp được thực hiện đúng chuẩn, đồng thời theo dõi các hành động tinh vi và thứ tự thực hiện chúng.

2. Tăng cường quản lý tài sản:

Tối ưu hóa việc lưu trữ hàng hóa trong kho bằng cách ước tính khối lượng 3D và tổng hợp dữ liệu từ nhiều luồng camera.

3. Cải thiện an toàn lao động:

Tự động tạo báo cáo và tóm tắt sự cố, đảm bảo công nhân tuân thủ quy định an toàn.

4. Ngăn ngừa tai nạn và sự cố sản xuất:

Phát hiện hoạt động bất thường để giảm thiểu rủi ro về an toàn và vận hành trong nhà máy, sân bay hoặc giao lộ đô thị.

5. Học từ dữ liệu quá khứ:

Tìm kiếm dữ liệu video cũ để giải quyết vấn đề và cải thiện quy trình mới.


Tiềm năng trong thể thao và giải trí


Trong lĩnh vực thể thao, các AI Agent có thể phân tích video để giúp các đội bóng, huấn luyện viên và vận động viên cải thiện hiệu suất, tăng cường an toàn và tối ưu hóa trải nghiệm cho người hâm mộ. Nvidia đã trình diễn một AI Agent phân tích cú ném bóng nhanh của một người chơi nghiệp dư, so sánh với vận động viên chuyên nghiệp để đưa ra lời khuyên cải thiện.

Trong ngành công nghiệp truyền thông trị giá 3 nghìn tỷ USD, các AI Agent sẽ giúp tạo ra nội dung thông minh, cá nhân hóa và hấp dẫn hơn thông qua sáng kiến Nvidia Media2.

Sẵn sàng áp dụng toàn cầu

Các đối tác như Accenture, Infosys, TATA Consultancy Services và nhiều công ty khác đã tích hợp bản thiết kế này vào quy trình phát triển của họ, mang đến tiềm năng ứng dụng rộng rãi trên toàn cầu.

Thẻ / Từ khoá