Model Gemma: Model LLM Baru yang Ringan dan “Terbuka”

Model Gemma: Ringan dan Diklaim “Terdepan”

Hanya seminggu setelah iterasi terbaru model Gemini mereka, Google baru saja mengumumkan Gemma, keluarga baru model LLM (Large Language Model) yang ringan dan “terbuka”. Model Gemma 2B dan 7B terinspirasi oleh Gemini dan tersedia untuk penggunaan komersial dan penelitian.

Meskipun Google belum memberikan perbandingan terperinci dengan model serupa dari Meta dan Mistral, mereka mengklaim keduanya “berteknologi terdepan”. Model Gemma menggunakan arsitektur decoder-only yang padat, sama seperti model Gemini dan PaLM sebelumnya. Benchmark akan tersedia di papan peringkat Hugging Face dalam waktu dekat.

Aksesibilitas dan Penggunaan Model Gemma

Pengembang dapat menggunakan Gemma melalui notebook Colab dan Kaggle yang siap pakai, serta integrasi dengan Hugging Face, MaxText, dan Nvidia’s NeMo. Setelah dilatih dan disetel, model ini dapat dijalankan di berbagai platform.

Meskipun Google menyebut Gemma sebagai model “terbuka”, perlu dicatat bahwa model ini bukan open source. Dalam konferensi pers, Jeanine Banks dari Google menekankan komitmen perusahaan terhadap open source, tetapi juga menjelaskan bahwa mereka menggunakan istilah “terbuka” secara hati-hati.

Menurutnya, istilah “model terbuka” kini umum digunakan, tetapi seringkali mengacu pada model dengan bobot terbuka, di mana developer dan peneliti dapat menyesuaikan dan menyempurnakan model. Namun, persyaratan penggunaan, seperti redistribusi dan kepemilikan varian yang dikembangkan, dapat berbeda-beda berdasarkan ketentuan khusus model tersebut.

Google memilih istilah “terbuka” karena developer dapat menggunakan model untuk inferensi dan penyempurnaan bebas. Tim Google berpendapat bahwa ukuran model ini cocok untuk berbagai kasus penggunaan.

Keunggulan dan Potensi Model Gemma

Tris Warkentin, Direktur Manajemen Produk Google DeepMind, mengatakan, “Kualitas pembuatan telah meningkat secara signifikan dalam setahun terakhir. Hal-hal yang sebelumnya hanya mungkin dilakukan dengan model yang sangat besar, kini dapat dilakukan dengan model kecil berteknologi terdepan. Ini membuka cara baru yang menarik untuk mengembangkan aplikasi AI, termasuk menjalankan inferensi dan penyetelan pada desktop atau laptop developer lokal dengan GPU RTX mereka, atau pada single host di GCP dengan Cloud TPU.”

Dampak Peluncuran

Peluncuran model Gemma oleh Google dapat membawa beberapa dampak, antara lain:

1. Mempercepat Adopsi LLM: Model Gemma yang ringan dan “terbuka” dapat mendorong lebih banyak developer dan perusahaan untuk mengadopsi LLM dalam berbagai aplikasi. Hal ini dapat mempercepat perkembangan dan penggunaan teknologi AI di berbagai bidang.

2. Meningkatkan Persaingan di Bidang LLM: Masuknya Google ke dalam pasar LLM “terbuka” dapat meningkatkan persaingan dengan perusahaan lain seperti Meta dan Mistral. Persaingan ini dapat mendorong inovasi dan pengembangan model LLM yang lebih baik dan lebih murah.

3. Memperkuat Keamanan dan Tanggung Jawab AI: Toolkit AI generatif yang bertanggung jawab yang diluncurkan bersama Gemma dapat membantu developer membangun aplikasi AI yang lebih aman dan bertanggung jawab. Hal ini dapat meningkatkan kepercayaan publik terhadap teknologi AI.

4. Membuka Peluang Baru untuk AI: Dapat membuka peluang baru untuk aplikasi AI di berbagai bidang, seperti:

  • Pendidikan: Untuk mengembangkan platform pembelajaran yang lebih personal dan adaptif.
  • Kesehatan: Membantu dokter dalam mendiagnosis penyakit dan mengembangkan rencana perawatan yang lebih personal.
  • Keuangan: Untuk mendeteksi penipuan dan mengembangkan strategi investasi yang lebih efektif.
  • Manufaktur: Membantu dalam meningkatkan efisiensi dan produktivitas manufaktur.

5. Memperkuat Posisi Google dalam AI: Peluncuran model Gemma dapat memperkuat posisi Google sebagai pemimpin dalam teknologi AI. Hal ini dapat membantu Google menarik talenta terbaik dan meningkatkan pangsa pasarnya di bidang AI.

Baca juga: Asisten AI Baru dari Adobe untuk Membaca PDF