QuinTech
LatestTechnologyAIMicrosoft

Microsoft công bố mô hình Phi-4 mạnh mẽ hoàn toàn mã nguồn mở trên Hugging Face.

09-01-2025·01:43 AM

Microsoft công bố mô hình Phi-4 mạnh mẽ, hoàn toàn mã nguồn mở trên Hugging Face


Dù đối tác chiến lược OpenAI đang liên tục ra mắt các mô hình lập luận mạnh mẽ như dòng o3 mới nhất, Microsoft không hề đứng ngoài cuộc. Hãng đã và đang phát triển những mô hình nhỏ gọn nhưng mạnh mẽ, được phát hành dưới thương hiệu của riêng mình.


Theo thông báo từ các nhà nghiên cứu và chuyên gia AI của Microsoft trên mạng xã hội X, Microsoft đã chính thức phát hành mô hình Phi-4 dưới dạng mã nguồn mở hoàn toàn, với trọng số có thể tải xuống trên nền tảng Hugging Face – cộng đồng chia sẻ mã AI.


Mở ra cánh cửa mới cho cộng đồng AI


Kỹ sư nghiên cứu chính Shital Shah của Microsoft chia sẻ: “Chúng tôi thực sự bất ngờ trước sự đón nhận của cộng đồng đối với việc ra mắt Phi-4. Nhiều người đã yêu cầu chúng tôi công bố trọng số, thậm chí một số còn tự tải lên các phiên bản không chính thức trên Hugging Face. Giờ đây, các bạn không cần chờ đợi nữa, mô hình Phi-4 chính thức đã được phát hành với giấy phép MIT!”


Trong học máy, trọng số (weights) là những giá trị số xác định cách một mô hình AI xử lý ngôn ngữ và dữ liệu. Đây là yếu tố cốt lõi được thiết lập qua quá trình huấn luyện mô hình, thường là học sâu không giám sát, giúp mô hình học cách đưa ra phản hồi phù hợp dựa trên dữ liệu đầu vào. Công bố trọng số là điều kiện cần để một mô hình thực sự được coi là mã nguồn mở, cho phép các nhà nghiên cứu và nhà phát triển tùy chỉnh hoặc áp dụng mô hình vào các dự án riêng.


Ban đầu, Phi-4 chỉ được sử dụng trên nền tảng Azure AI Foundry của Microsoft với giấy phép nghiên cứu. Tuy nhiên, giờ đây, mô hình này đã được cung cấp rộng rãi trên Hugging Face với giấy phép MIT, cho phép cả các ứng dụng thương mại.


Điểm nổi bật của Phi-4


Phi-4 nhanh chóng gây chú ý nhờ khả năng vượt trội so với nhiều mô hình lớn hơn trong các lĩnh vực như lập luận toán học và hiểu ngôn ngữ đa nhiệm, nhưng lại yêu cầu ít tài nguyên tính toán hơn. Mô hình được thiết kế với kiến trúc gọn nhẹ, tập trung vào lập luận và logic, đáp ứng nhu cầu hiệu suất cao trong các môi trường hạn chế về tài nguyên.


Một số điểm nổi bật:

  • Vượt trội trong các bài kiểm tra toán học và logic, đạt hơn 80% ở các chuẩn như MATH và MGSM, vượt qua các mô hình lớn như Google Gemini Pro và GPT-4o-mini.
  • Hiệu suất xuất sắc trong lập luận toán học, phù hợp cho các ngành như tài chính, kỹ thuật và nghiên cứu khoa học.
  • Tạo mã lập trình chính xác, đạt điểm cao trong bài đánh giá HumanEval.


Phi-4 sử dụng kiến trúc transformer với 14 tỷ tham số, được huấn luyện trên 9,8 nghìn tỷ token từ các tập dữ liệu chất lượng cao, bao gồm tài liệu công khai, dữ liệu tổng hợp liên quan đến toán học, lập trình, và các câu hỏi/trả lời chuyên sâu.


Tương lai của AI mã nguồn mở


Với việc công bố Phi-4 cùng trọng số và giấy phép MIT, Microsoft tạo cơ hội cho các doanh nghiệp sử dụng mô hình này trong các dự án thương mại. Cộng đồng nhà phát triển có thể tùy chỉnh hoặc tinh chỉnh mô hình cho các ứng dụng cụ thể mà không cần đầu tư tài nguyên lớn hay phải xin phép Microsoft.


Phi-4 đánh dấu một sự thay đổi trong ngành AI, chứng minh rằng các mô hình nhỏ nhưng được thiết kế tốt có thể mang lại kết quả tương đương hoặc vượt trội so với các mô hình lớn. Điều này không chỉ tiết kiệm chi phí mà còn giảm mức tiêu thụ năng lượng, giúp các tổ chức và doanh nghiệp vừa và nhỏ tiếp cận được các công nghệ AI tiên tiến.


Microsoft cũng nhấn mạnh rằng Phi-4 đã trải qua các quy trình đánh giá an toàn nghiêm ngặt, nhằm giảm thiểu rủi ro như thiên vị, nội dung gây hại, hay thông tin sai lệch, đồng thời khuyến khích các nhà phát triển áp dụng biện pháp bảo vệ bổ sung khi triển khai trong các ứng dụng nhạy cảm.


Việc phát hành Phi-4 là một bước tiến lớn trong việc thúc đẩy tính minh bạch và sáng tạo trong ngành công nghệ AI, mở ra những cơ hội mới cho cộng đồng nhà nghiên cứu và các doanh nghiệp trên toàn cầu.

Carl Franzen
VentureBeat
Source by: VentureBeat

Thẻ / Từ khoá