QuinTech
AIMachine LearningMLDeep Learning

4 câu chuyện AI nổi bật nhất năm 2024 và một dự đoán quan trọng cho 2025

24-12-2024·09:49 AM
A robot wearing top hat and tuxedo with bow tie gazes at a crystal ball reading 2025.
Nguồn: VentureBeat/ChatGPT

Nhìn chung, 2024 đúng là năm bùng nổ nhất của AI - ít nhất là về mặt thương mại hóa công nghệ này.


Làn sóng các mô hình ngôn ngữ lớn (LLM) được thúc đẩy bởi sự ra mắt của ChatGPT cuối năm 2022 vẫn chưa có dấu hiệu chậm lại. Không chỉ có OpenAI và các ông lớn công nghệ như Microsoft, Meta và Google, mà còn có vô số startup và dev độc lập tham gia phát triển các LLM mới.


Những báo cáo về việc nghiên cứu AI chậm lại có vẻ không đúng, hoặc ít nhất là bị phóng đại quá mức.


Ngoài ra, các công nghệ mới ngoài kiến trúc Transformer (cái mà hầu hết các LLM lớn đang dùng) bắt đầu xuất hiện, ví dụ như Liquid Foundation Models của Liquid AI.


Cuối cùng, các công ty bắt đầu full on theo hướng tiếp cận "agentic" cho AI - phát triển các bot, ứng dụng và workflow được tăng cường AI có khả năng làm việc độc lập trên các vấn đề cụ thể, hoặc cần ít sự can thiệp của con người hơn so với kiểu tương tác qua lại thông thường của chatbot LLM.


Thu gọn các tin tức trong năm thành top 14, chứ đừng nói gì top 10 hay top 4, là một thử thách khó. Nhưng mình sẽ cố gắng, dù có hơi gian lận một chút bằng cách gộp một số tin thành các chủ đề lớn hơn. Theo góc nhìn của mình, đây là những gì sẽ tạo impact lớn nhất từ năm nay:


OpenAI mở rộng vượt xa khỏi ChatGPT


Công ty được coi là người châm ngòi cho kỷ nguyên AI sinh thành không chậm chân chút nào trong năm nay, bất chấp sự cạnh tranh gay gắt từ cả người mới và các "ông lớn" công nghệ, thậm chí cả từ Microsoft - nhà đầu tư và đối tác của họ.


o1 Model: OpenAI tung ra dòng mô hình đa mục đích lớn đầu tiên ngoài series GPT, đó là series "suy luận" o1, phân bổ thêm thời gian để xử lý các prompt phức tạp, cho độ chính xác cao hơn. Nó đặc biệt hiệu quả trong các task về khoa học, coding và suy luận.


o3 Model: Sau model o1 từ tháng 9, họ tiếp tục gây bất ngờ với thông báo cuối năm về model o3 còn cao cấp hơn. Mặc dù nó sẽ chưa được public hoặc thậm chí cho bên thứ ba nào sử dụng cho đến đầu 2025, nhưng điều này cho thấy OpenAI không ngủ quên trên chiến thắng.


ChatGPT Search: Tính năng này, ban đầu được ra mắt như một sản phẩm độc lập có tên SearchGPT chỉ dành cho người được mời, trước khi được tích hợp vào ChatGPT, cho phép truy xuất thông tin web theo thời gian thực trong ChatGPT và cách trình bày kết quả tìm kiếm được tinh chỉnh, nâng cao tính hữu ích cho các truy vấn cập nhật và cạnh tranh trực tiếp với Google, Bing và tân binh Perplexity.


Canvas: Ra mắt tháng 10, Canvas mở rộng giao diện ChatGPT không chỉ là kiểu hội thoại mà thành một panel kiểu workstation có thể cập nhật nội dung động theo yêu cầu của người dùng, như chỉnh sửa tài liệu hay dự án coding. Tất nhiên, khó không thấy đây là phản ứng với, hoặc ít nhất là một tính năng tương tự với, Artifacts của Anthropic được công bố vài tháng trước.


Sora: Sau gần một năm "nhá hàng" với model tạo video được giữ kín, OpenAI cuối cùng đã tung Sora ra công chúng vào đầu tháng 12, nhanh chóng thu hút nhiều phản ứng khác nhau khi họ cố gắng tạo sự khác biệt trong không gian AI video cạnh tranh gay gắt với giao diện độc đáo và tính năng storyboard được thiết kế công phu.


AI mã nguồn mở bùng nổ


Llama 3 và 3.1: Meta giới thiệu Llama 3 vào tháng 4, thiết lập một tiêu chuẩn mới về hiệu suất trong AI mã nguồn mở, sau đó nhanh chóng ra mắt Llama 3.1 vào tháng 7 với 405 tỷ tham số. Các phiên bản của Llama 3.1 được dùng để cung cấp năng lượng cho Meta AI, trợ lý được tích hợp trên các nền tảng như WhatsApp, Messenger, Instagram và Facebook, với mục tiêu trở thành trợ lý AI được sử dụng rộng rãi nhất.


Llama 3.3: Ra mắt vào tháng 12/2024, Llama 3.3 mang lại hiệu suất tương đương với các model lớn hơn nhưng với chi phí tính toán chỉ bằng một phần nhỏ, giúp nó dễ tiếp cận hơn cho các ứng dụng doanh nghiệp.


Trong khi đó, các model Trung Quốc như họ Qwen-2.5 của Alibaba và DeepSeek với V2.5 và R1-Lite Preview mới như từ trên trời rơi xuống để dẫn đầu một số bảng xếp hạng benchmark, và chính Nvidia cũng không chỉ cung cấp card đồ họa và kiến trúc phần mềm mà còn tung ra model Nemotron-70B mã nguồn mở mạnh mẽ của riêng mình.


Nous Research, một startup nhỏ ở San Francisco nhằm cung cấp các model AI mã nguồn mở được cá nhân hóa hơn và ít hạn chế hơn, cũng giới thiệu một số ý tưởng cool mới.

Và đừng quên Mistral của Pháp, đã nhanh chóng mở rộng các giải pháp AI mã nguồn mở và độc quyền của họ.


Series Gemini của Google trở thành đối thủ nặng ký cho vị trí tốt nhất


Trong câu chuyện comeback của năm, series model AI Gemini của Google từng bị chế giễu vì tạo hình ảnh kỳ lạ và bị chỉ trích vì quá "woke" đã trở lại mạnh mẽ với các phiên bản mới mạnh hơn, hiện đang dẫn đầu các bảng xếp hạng hiệu suất của bên thứ ba và ngày càng hấp dẫn các developer và doanh nghiệp.


Google giới thiệu Gemini 2.0 Flash, một model AI đa phương thức hỗ trợ phân tích video streaming và có thể thấy và hướng dẫn những gì bạn đang làm trên màn hình, và tiếp theo là Gemini 2.0 Flash Thinking cạnh tranh với các model suy luận o1 và o3 của OpenAI.


AI tác nhân (Agentic AI) chiếm lĩnh doanh nghiệp


Khi năm trôi qua, AI "agentic" từ một buzzword đã trở thành một loạt sản phẩm và sáng kiến lớn được công bố bởi các nhà cung cấp phần mềm doanh nghiệp hàng đầu. Ví dụ:


Agentforce 2.0 của Salesforce: Salesforce vừa ra mắt Agentforce 2.0 cách đây vài ngày, một chương trình AI agent cao cấp để nâng cao các tính năng suy luận, tích hợp và tùy chỉnh trong các giải pháp CRM và bán hàng của họ, cũng như Slack, cải thiện đáng kể các công cụ năng suất doanh nghiệp.


Joule của SAP: SAP chuyển đổi chatbot Joule thành một AI agent được cung cấp năng lượng bởi các model ngôn ngữ lớn mã nguồn mở (LLMs), thúc đẩy đổi mới và hiệu quả trong môi trường doanh nghiệp.


Project Astra của Google: Như một phần của sáng kiến Gemini 2.0, Google ra mắt Project Astra, một trợ lý AI được thiết kế để cung cấp phản hồi theo ngữ cảnh thời gian thực bằng cách tận dụng bộ dịch vụ của Google, nhằm nâng cao năng suất và việc ra quyết định của người dùng.


Dự đoán lớn của mình cho 2025: Nội dung được tạo bởi AI sẽ thống trị


Dựa trên những tiến bộ này, 2025 sẽ chứng kiến sự phổ biến của nội dung được tạo bởi AI trong các lĩnh vực kinh doanh và tiêu dùng, đặc biệt khi tất cả mọi người từ OpenAI đến Meta, Google, Microsoft, Apple, và thậm chí xAI của Elon Musk giờ đều có các công cụ tạo hình ảnh tích hợp trong các giải pháp của họ.


Sự mở rộng này sẽ giúp việc tạo nội dung trở nên đơn giản hơn, tăng cường cá nhân hóa, và thúc đẩy hiệu quả trong nhiều lĩnh vực.


Ngoài ra, chúng ta dự đoán sẽ có những triển khai quy mô lớn đầu tiên của các model ngôn ngữ lớn (LLMs) và robot được cung cấp năng lượng bởi AI sinh thành trong cả môi trường thương mại và tiêu dùng, cách mạng hóa tự động hóa và tương tác người-robot.


Đó là tất cả trong bản tin #AIBeat cuối cùng của 2024. Cảm ơn anh em đã đọc, viết, đăng ký, chia sẻ, bình luận và đồng hành cùng chúng tôi. Mong được chia sẻ thêm và nghe thêm từ tất cả anh em trong 2025.


Chúc anh em và người thân có kỳ nghỉ lễ và Năm mới vui vẻ từ tất cả chúng tôi tại VentureBeat.

Carl Franzen
VentureBeat
Source by: VentureBeat

Thẻ / Từ khoá