Google Luncurkan AI Gemini, Siap Kalahkan ChatGPT?

banner 468x60

REPUBLIKA.CO.ID, JAKARTA – Gemini adalah model kecerdasan buatan Google yang baru dan canggih yang tidak hanya dapat memahami teks tetapi juga gambar, video, dan audio. Sebagai model multimodal, Gemini digambarkan mampu menyelesaikan tugas-tugas kompleks di bidang matematika, fisika, dan bidang lainnya, serta memahami dan menghasilkan kode berkualitas tinggi dalam berbagai bahasa pemrograman.

Gemini saat ini tersedia melalui integrasi dengan Google Bard dan Google Pixel 8, dan secara bertahap akan berintegrasi dengan layanan Google lainnya. “Gemini adalah hasil upaya kolaborasi skala besar antara tim Google, termasuk kolega kami di Google Research,” kata CEO dan salah satu pendiri Google DeepMind Dennis Hassabis, seperti dilansir ZDNet, Jumat (12/08/2023). ).

Bacaan Lainnya
banner 300x250

Gemini diciptakan oleh Google dan Alphabet, perusahaan induk Google, dan diluncurkan sebagai model kecerdasan buatan Google yang paling canggih hingga saat ini. Google DeepMind juga memberikan kontribusi signifikan terhadap pengembangan Gemini.

Google menggambarkan Gemini sebagai model fleksibel yang dapat berjalan di segala hal mulai dari pusat data Google hingga perangkat seluler. Untuk mencapai skalabilitas ini, Gemini dirilis dalam tiga ukuran: Gemini Nano, Gemini Pro dan Gemini Ultra.

• Kembar kerdil

Ukuran model Gemini Nano dirancang untuk berjalan di smartphone, khususnya Google Pixel 8. Model ini dibuat untuk melakukan tugas pada perangkat yang memerlukan pemrosesan AI yang efisien tanpa terhubung ke server eksternal, seperti menyarankan balasan dalam aplikasi obrolan atau meringkas teks .

• Gemini Pro

Berjalan di pusat data Google, Gemini Pro dirancang untuk menjalankan versi terbaru chatbot AI perusahaan, Google Bard. Mampu memberikan waktu respons yang cepat dan memahami pertanyaan yang kompleks.

• Gemini Ultra

Meskipun belum tersedia untuk penggunaan umum, Google menggambarkan Gemini Ultra sebagai model dengan kinerja tertinggi, mengungguli hasil canggih dalam 30 dari 32 tolok ukur akademik yang banyak digunakan dalam penelitian dan pengembangan pemodelan bahasa besar (LLM). Ini ditujukan untuk tugas-tugas yang sangat kompleks dan akan dirilis setelah tahap pengujian saat ini selesai.

Google berencana untuk mengintegrasikan Gemini dengan pencarian, periklanan, Chrome, dan layanan lainnya seiring berjalannya waktu. Pengembang dan pelanggan perusahaan akan dapat mengakses Gemini Pro melalui Gemini API di Google AI Studio dan Google Cloud Vertex AI mulai 13 Desember. Pengembang Android akan memiliki akses ke Gemini Nano melalui AICore, yang akan tersedia dalam pratinjau awal.

Gemini tampaknya menjadi salah satu model kecerdasan buatan terbesar dan tercanggih hingga saat ini. Dibandingkan dengan model populer lainnya yang mendukung chatbot AI saat ini, Gemini menonjol karena fitur multimodal aslinya, sementara model lain seperti GPT-4 mengandalkan plugin dan integrasi agar benar-benar multimodal.

Dibandingkan dengan GPT-4, model yang sebagian besar berbasis teks, Gemini dengan mudah melakukan tugas multimodal secara native. Meskipun GPT-4 unggul dalam tugas-tugas terkait bahasa seperti pembuatan konten dan penguraian teks yang kompleks, GPT-4 menggunakan plugin OpenAI untuk penguraian gambar dan akses internet, serta mengandalkan DALL-E 3 dan Whisper untuk pembuatan gambar dan pengeditan audio.

Gemini juga tampaknya lebih fokus pada produk dibandingkan model lain yang tersedia saat ini. Ini terintegrasi ke dalam ekosistem perusahaan atau dimaksudkan untuk diintegrasikan ke dalam ekosistem perusahaan karena mendukung perangkat Bard dan Pixel 8. Sementara model lain seperti GPT-4 dan Meta’s Llama lebih berorientasi layanan dan tersedia untuk berbagai pengembang pihak ketiga aplikasi, alat, dan layanan.

banner 300x250

Pos terkait

banner 468x60

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *