QuinTech
TechnologyAIHugging Face

Hugging Face giới thiệu ‘Pi-Zero’ cho LeRobot, giúp xây dựng và triển khai robot tích hợp AI dễ dàng hơn

08-02-2025·02:32 AM

Hugging Face và Physical Intelligence đã âm thầm ra mắt Pi0 (Pi-Zero) vào tuần này, mô hình nền tảng đầu tiên dành cho robot có khả năng dịch các lệnh ngôn ngữ tự nhiên trực tiếp thành hành động vật lý.


“Pi0 là mô hình ngôn ngữ thị giác hành động tiên tiến nhất,” Remi Cadene, nhà khoa học nghiên cứu chính tại Hugging Face, tuyên bố trong một bài đăng trên X nhanh chóng thu hút sự chú ý của cộng đồng AI. “Nó nhận các lệnh ngôn ngữ tự nhiên làm đầu vào và trực tiếp đưa ra hành vi tự động.”


Sự kiện này đánh dấu một bước ngoặt quan trọng trong lĩnh vực robot: Lần đầu tiên một mô hình nền tảng dành cho robot được phổ biến rộng rãi thông qua một nền tảng mã nguồn mở. Giống như ChatGPT đã cách mạng hóa việc tạo văn bản, Pi0 hướng tới việc thay đổi cách robot học và thực hiện các nhiệm vụ.


Cách Pi0 mang lại khả năng học kiểu ChatGPT cho robot, mở khóa các nhiệm vụ phức tạp


Mô hình này, ban đầu được phát triển bởi Physical Intelligence và hiện đã được tích hợp vào nền tảng LeRobot của Hugging Face, có thể thực hiện các nhiệm vụ phức tạp như gấp quần áo, dọn bàn và đóng gói hàng hóa – những hoạt động mà trước đây robot rất khó thực hiện.


“Các robot ngày nay là những chuyên gia hẹp, được lập trình cho các chuyển động lặp đi lặp lại trong môi trường được sắp đặt sẵn,” nhóm nghiên cứu Physical Intelligence viết trong bài đăng công bố. “Pi0 thay đổi điều đó, cho phép robot học và làm theo hướng dẫn của người dùng, biến việc lập trình trở nên đơn giản như việc bạn nói với robot những gì bạn muốn nó làm.”


Công nghệ đằng sau Pi0 đại diện cho một thành tựu kỹ thuật đáng kể. Mô hình này được huấn luyện trên dữ liệu từ bảy nền tảng robot khác nhau và 68 nhiệm vụ độc đáo, cho phép nó xử lý mọi thứ từ các thao tác tinh tế đến các quy trình nhiều bước phức tạp. Nó sử dụng một kỹ thuật mới gọi là flow matching để tạo ra các quỹ đạo hành động mượt mà, thời gian thực ở tần suất 50Hz, giúp nó trở nên cực kỳ chính xác và linh hoạt cho việc triển khai trong thế giới thực.


Công nghệ FAST mới giúp tăng tốc huấn luyện robot lên 5 lần, mở rộng tiềm năng của AI


Trên nền tảng này, nhóm nghiên cứu cũng giới thiệu “Pi0-FAST,” một phiên bản nâng cao của mô hình tích hợp một phương pháp token hóa mới gọi là token hóa chuỗi hành động trong không gian tần số (FAST). Phiên bản này huấn luyện nhanh hơn năm lần so với phiên bản trước và cho thấy khả năng tổng quát hóa tốt hơn trên các môi trường và loại robot khác nhau.


Những tác động đối với ngành công nghiệp là rất lớn. Các cơ sở sản xuất có thể lập trình lại robot cho các nhiệm vụ mới thông qua các hướng dẫn bằng lời nói đơn giản thay vì mã hóa phức tạp. Các kho hàng có thể triển khai các hệ thống tự động hóa linh hoạt hơn, thích ứng với nhu cầu thay đổi. Ngay cả các doanh nghiệp nhỏ cũng có thể tiếp cận robot dễ dàng hơn, vì rào cản về lập trình và triển khai đã giảm đáng kể.


Tuy nhiên, vẫn còn những thách thức. Mặc dù Pi0 đại diện cho một bước tiến lớn, nó vẫn có những hạn chế. Mô hình đôi khi gặp khó khăn với các nhiệm vụ rất phức tạp và yêu cầu nguồn tài nguyên tính toán đáng kể. Cũng có những câu hỏi về độ tin cậy và an toàn trong môi trường công nghiệp.


Sự ra mắt này diễn ra vào thời điểm quan trọng trong quá trình phát triển của ngành AI. Khi các công ty đua nhau phát triển và triển khai trí tuệ nhân tạo tổng quát (AGI), Pi0 đại diện cho một trong những nỗ lực đầu tiên thành công trong việc thu hẹp khoảng cách giữa các mô hình ngôn ngữ và tương tác với thế giới vật lý.


Công nghệ này hiện đã có sẵn trên nền tảng của Hugging Face, nơi các nhà phát triển có thể tải xuống và sử dụng chính sách đã được huấn luyện chỉ với vài dòng mã:

python

policy = Pi0Policy.from_pretrained("lerobot/pi0")


Đối với người dùng doanh nghiệp, khả năng tiếp cận này có thể thúc đẩy việc áp dụng robot tiên tiến trên nhiều ngành công nghiệp. Các công ty giờ đây có thể tinh chỉnh mô hình cho các trường hợp sử dụng cụ thể, giảm thiểu thời gian và chi phí liên quan đến việc triển khai các giải pháp robot.


Nhóm phát triển cũng đã công bố tài liệu hướng dẫn và tài liệu đào tạo toàn diện, giúp công nghệ này trở nên dễ tiếp cận hơn với nhiều người dùng hơn. Sự dân chủ hóa công nghệ robot này có thể dẫn đến các ứng dụng đổi mới trong nhiều lĩnh vực, từ chăm sóc sức khỏe đến bán lẻ.


Khi công nghệ này phát triển, nó có thể định hình lại cách chúng ta nghĩ về tự động hóa và tương tác giữa con người và robot. Khả năng điều khiển robot thông qua ngôn ngữ tự nhiên có thể làm cho sự hỗ trợ của robot trở nên dễ tiếp cận hơn trong gia đình, bệnh viện và các doanh nghiệp nhỏ – những lĩnh vực mà robot truyền thống gặp khó khăn trong việc tiếp cận do sự phức tạp của lập trình.


Với sự ra mắt này, tương lai của robot ngày càng trở nên giao tiếp, thích ứng và dễ tiếp cận hơn. Mặc dù vẫn còn nhiều việc phải làm, Pi0 đại diện cho một bước tiến quan trọng hướng tới việc biến những robot thông minh, linh hoạt trở thành hiện thực thay vì chỉ là một giấc mơ khoa học viễn tưởng.

Michael Nuñez
VentureBeat
Source by: VentureBeat

Thẻ / Từ khoá