LLava - Đối thủ mới nhất của GPT-4V (vision) mã nguồn mở, hoàn toàn miễn phí
GPT-4V hay còn gọi là GPT-4 with vision được Open AI giới thiệu và tích hợp gần đây vào gói chatgpt plus.
Tuy vậy, các nhà nghiên cứu tại Stanford, UW-Madison và Columbia mới giới thiệu LLava free hoàn toàn, mã nguồn mở, có bản demo để trải nghiệm.
Đánh giá thì mình thấy model này khá giống với GPT-4V, một số hình ảnh khó và rất chi tiết nhưng model vẫn chỉ ra được. Các ảnh có text tiếng anh nó vẫn hiểu và mô tả khá chuẩn.
ACE có thể download và trải nghiệm free tại đây https://llava-vl.github.io/
Hướng dẫn nhanh:
1. Bên khung trái có 1 biểu tượng để upload hình bạn muốn phân tích
2. Nhập prompt (VD What is unusual about this image?; What are the things I should be cautious about when I visit here?...