LlamaIndex vượt xa RAG để giúp các agent đưa ra quyết định phức tạp

LlamaIndex ra mắt kiến trúc Agent Document Workflow (ADW), vượt xa RAG và nâng cao năng suất cho agent
LlamaIndex, một framework phổ biến trong lĩnh vực điều phối AI, đã giới thiệu Agent Document Workflow (ADW) – một kiến trúc mới mà công ty cho biết vượt qua quy trình Truy xuất và Tạo nội dung (RAG - Retrieval-Augmented Generation), giúp tăng năng suất và khả năng ra quyết định của các agent.
Khi các framework điều phối AI ngày càng phát triển, phương pháp này hứa hẹn mang đến cho các tổ chức một lựa chọn để nâng cao năng lực ra quyết định của các agent.
Theo LlamaIndex, ADW có thể giúp các agent xử lý “quy trình phức tạp vượt xa việc trích xuất hay đối chiếu đơn thuần.”
Hiện nay, nhiều framework agentic dựa trên hệ thống RAG, vốn cung cấp thông tin cần thiết để agent hoàn thành nhiệm vụ. Tuy nhiên, RAG không cho phép các agent đưa ra quyết định dựa trên thông tin đó.
LlamaIndex đã chia sẻ một số ví dụ thực tế về cách ADW hoạt động:
Trong quy trình đánh giá hợp đồng, các nhà phân tích thường phải trích xuất thông tin chính, đối chiếu với yêu cầu pháp lý, xác định rủi ro tiềm ẩn và đưa ra khuyến nghị. Với ADW, các agent AI có thể theo dõi toàn bộ quy trình này, đưa ra quyết định dựa trên tài liệu họ phân tích và thông tin từ các nguồn liên quan khác.
“ADW giải quyết các thách thức này bằng cách xem tài liệu như một phần của quy trình kinh doanh tổng thể,” LlamaIndex giải thích trên blog. “Hệ thống ADW có thể duy trì trạng thái qua từng bước, áp dụng các quy tắc kinh doanh, phối hợp các thành phần khác nhau và thực hiện hành động dựa trên nội dung tài liệu – không chỉ dừng lại ở việc phân tích.”
Hạn chế của RAG và sự vượt trội của ADW
LlamaIndex trước đây đã chỉ ra rằng, mặc dù RAG là một kỹ thuật quan trọng, nó vẫn còn sơ khai, đặc biệt đối với các doanh nghiệp mong muốn AI hỗ trợ khả năng ra quyết định mạnh mẽ hơn.
Hiểu ngữ cảnh để ra quyết định
LlamaIndex đã phát triển các kiến trúc tham chiếu kết hợp khả năng phân tích tài liệu của LlamaCloud với các agent, giúp xây dựng hệ thống có khả năng “hiểu ngữ cảnh, duy trì trạng thái và thực hiện quy trình đa bước.”
Trong mỗi quy trình, một tài liệu đóng vai trò như bộ điều phối chính, hướng dẫn các agent sử dụng LlamaParse để trích xuất thông tin, duy trì trạng thái ngữ cảnh và xử lý tài liệu. Sau đó, tài liệu tham chiếu từ một cơ sở tri thức khác có thể được truy xuất. Từ đó, các agent bắt đầu đưa ra khuyến nghị hoặc các quyết định hành động phù hợp với từng tình huống cụ thể, chẳng hạn như trong quy trình đánh giá hợp đồng.
“Bằng cách duy trì trạng thái xuyên suốt quy trình, các agent có thể xử lý các workflow phức tạp, vượt xa việc trích xuất hay đối chiếu đơn thuần,” LlamaIndex cho biết. “Cách tiếp cận này giúp xây dựng bối cảnh sâu sắc về tài liệu đang xử lý đồng thời phối hợp giữa các thành phần trong hệ thống.”
Sự khác biệt giữa các framework agent
Điều phối agent là một lĩnh vực đang phát triển và nhiều tổ chức vẫn đang thử nghiệm cách sử dụng một hoặc nhiều agent. Năm nay, việc điều phối agent và ứng dụng AI có thể trở thành chủ đề được quan tâm khi các hệ thống chuyển từ đơn lẻ sang hệ sinh thái đa agent.
AI agent được coi là một phần mở rộng của RAG, không chỉ tìm kiếm thông tin dựa trên tri thức của doanh nghiệp mà còn hỗ trợ xử lý nhiều tác vụ phức tạp giống như con người.
Đối với các trường hợp sử dụng phức tạp hơn, RAG thông thường không đủ. Một cách tiếp cận tiên tiến là agentic RAG, mở rộng tri thức của agent. Các mô hình có thể quyết định liệu có cần tìm thêm thông tin hay không, sử dụng công cụ nào để tìm, và kiểm tra ngữ cảnh vừa tìm thấy có liên quan không trước khi đưa ra kết quả cuối cùng.