Gemini được xây dựng theo hướng đa phương thức có thể khái quát, vận hành và kết hợp nhiều thông tin khác nhau gồm văn bản, code, âm thanh, hình ảnh và video.
Đêm ngày 6/12 (theo giờ Việt Nam), Google đã chính thức giới thiệu Gemini - mô hình Trí tuệ nhân tạo được cho là lớn nhất và tối ưu nhất của hãng, được đánh giá có khả năng cạnh tranh với GPT-4 của Open AI.
Theo bà Sissie Hsiao - Phó chủ tịch sản phẩm Google, phụ trách Bard (Công cụ AI đàm thoại của Google mới được ra mắt vào tháng 3-2023) cho biết: "Gemini có khả năng suy luận đa phương thức phức tạp. Với thiết kế linh hoạt, Gemini được tối ưu hóa với ba kích cỡ khác nhau: Ultra, Pro và Nano để có thể hoạt động trên mọi thứ, từ Trung tâm Dữ liệu đến thiết bị di động."
Sự ra mắt của Gemini- AI được xem là nỗ lực nghiêm túc nhất của Google vốn được cho là chậm chân hơn so với các đối thủ.
Gemini sắp được tích hợp vào Bard trong bản nâng cấp lớn nhất từ trước đến nay. Gemini sẽ được triển khai cho Bard theo hai giai đoạn. Bắt đầu từ hôm nay, Bard sẽ sử dụng phiên bản Gemini Pro được điều chỉnh cụ thể bằng tiếng Anh để có thể lập luận nâng cao, lên kế hoạch, hiểu và hơn thế nữa. Vào đầu năm sau, chúng tôi sẽ giới thiệu Bard Advanced, phiên bản cho phép bạn truy cập đầu tiên vào các mô hình với khả năng tân tiến nhất của chúng tôi, bắt đầu với Gemini Ultra.
Trước đó, hãng đã cho vận hành Gemini Pro thông qua một số điểm chuẩn tiêu chuẩn ngành. Trong 6 trên 8 tiêu chuẩn, Gemini Pro hoạt động tốt hơn GPT 3.5, bao gồm tiêu chuẩn MMLU (Massive Multitask Language Understanding; tạm dịch: Hiểu ngôn ngữ đa nhiệm lớn), là một trong những tiêu chuẩn hàng đầu để đo lường các mô hình AI lớn, và cả tiêu chuẩn GSM8K dùng để đo lường khả năng tư duy toán học ở cấp độ phổ thông.
Bên cạnh đó, Google cũng điều chỉnh Gemini Pro trong Bard để có khả năng ưu việt hơn trong việc hiểu, tóm tắt, lý luận, lập trình và lập kế hoạch. Hiện, người dùng có thể bắt đầu dùng thử phiên bản Bard tích hợp Gemini Pro với các prompt tạo văn bản, các phương thức khác sẽ sớm được hỗ trợ. Nó sẽ có trong tiếng Anh ở hơn 170 quốc gia và vùng lãnh thổ, trong tương lai gần sẽ bổ sung thêm trong nhiều ngôn ngữ và địa điểm hơn, chẳng hạn như châu Âu.
Gemini hiện đang trong giai đoạn thử nghiệm, nhưng Google có kế hoạch phát hành nó cho công chúng vào năm 2024 với nhiều ngôn ngữ sẽ được tích hợp tren Bard.
Gemini là mô hình AI đa phương thức do bộ phận Google DeepMind nghiên cứu và phát triển, được đề cập lần đầu hồi tháng 5 tại sự kiện Google I/O 2023. Đây được xem là "nỗ lực nghiêm túc nhất" của Google trong cơn sốt AI tạo sinh. Dự án Gemini là dự án đầy tham vọng của Google và hoạt động tương tự mô hình GPT-4 hiện có trên ChatGPT. Với Gemini, Google đang tiến một bước gần hơn tới viễn cảnh khiến Bard trở thành cộng sự AI đắc lực nhất thế giới.