Informasi

Bebaskan diri Anda dari tagihan langganan API berbayar dengan menjalankan LLM tingkat dunia langsung dari laptop Anda.

Oleh Dimas Julianto TUKANG JALANKAN LLAMA LOKAL

Masa depan kecerdasan buatan tidak lagi didominasi secara eksklusif oleh perusahaan-perusahaan teknologi raksasa di balik pintu tertutup. Ketika Meta meluncurkan model bahasa berskala besar (Large Language Model atau LLM) mereka, yakni Llama 3, hal tersebut membuka pintu gerbang revolusi kecerdasan buatan yang bersifat sumber terbuka (open source).

Banyak pengembang merasa ragu untuk bereksperimen dengan kecerdasan buatan karena takut data dan source code sensitif perusahaan terekspos ke peladen publik. Selain itu, kecepatan internet dan latensi sering kali menjadi kendala saat membuat agen kecerdasan buatan responsif. Solusinya? Jalankan model tersebut langsung di dalam mesin lokal Anda tanpa perlu koneksi internet sama sekali!

Di sinilah Ollama masuk sebagai pahlawan. Dahulu, menjalankan LLM di komputer lokal membutuhkan pemahaman mendalam tentang skrip Python, manajemen pustaka CUDA, hingga kompilasi pustaka C++. Ollama meniadakan semua rintangan tersebut dengan membungkus kompleksitas ke dalam satu baris perintah sederhana layaknya kita menggunakan NPM atau Docker.

Persyaratan Perangkat Keras

Meskipun Ollama mempermudah proses instalasi, menjalankan jaringan saraf tiruan (neural network) bernilai miliaran parameter tetap membutuhkan sumber daya komputasi yang mumpuni.

Untuk menjalankan varian Llama 3 dengan parameter 8B (8 Miliar Parameter) secara mulus, Anda membutuhkan:

  1. Kapasitas RAM memori minimal 8 GB (disarankan 16 GB).
  2. Ruang kosong pada SSD minimal 10 GB.
  3. Prosesor Apple Silicon (M1/M2/M3) ATAU kartu grafis (GPU) Nvidia dengan memori video minimal 6 GB.

Jika komputer Anda memenuhinya, Llama 3 8B akan memberikan respons teks yang sangat cepat, seringkali melampaui kecepatan membaca manusia biasa.

Instalasi Ollama di Sistem Anda

Tahap 1: Unduh File Installer

Kunjungi situs web resmi ollama.com. Situs tersebut akan secara otomatis mendeteksi sistem operasi yang Anda gunakan (Windows, Mac, atau Linux). Klik tombol unduh dan jalankan berkas instalasinya.

Tahap 2: Buka Command Prompt

Setelah proses pemasangan berhasil diselesaikan oleh asisten installer, buka aplikasi Terminal (di macOS/Linux) atau PowerShell/Command Prompt (di Windows).

Tahap 3: Tarik Model Llama 3

Ketik perintah di bawah ini dan tekan enter. Ollama akan mengunduh bobot (weights) Llama 3 sebesar ~4.7 GB langsung ke dalam ruang penyimpanan lokal Anda.
Perintah Unduh Model Llama 3
ollama run llama3

Saat perintah tersebut dieksekusi untuk pertama kalinya, proses ini akan memakan waktu tergantung pada kecepatan pita lebar (bandwidth) internet Anda. Jangan menutup terminal selama proses indikator pengunduhan masih berjalan.

Disclaimer

Hanya untuk edukasi. Performa Llama 3 lokal sangat bergantung pada performa GPU dan suhu laptop Anda.

Uji Coba Chatbot Llama 3

Setelah pengunduhan sukses 100%, tampilan terminal Anda akan berubah seketika menjadi seperti antarmuka obrolan kosong yang ditandai dengan tanda >>>.

Ketikkan pertanyaan apa pun. Anda bisa mencoba: “Tuliskan program sederhana menggunakan bahasa Python untuk membuat kalkulator matematika dasar.”

Dalam sepersekian detik, kipas perangkat keras komputer Anda akan mulai berputar dan teks balasan akan dicetak sebaris demi sebaris di dalam terminal. Sangat luar biasa melihat sebuah kecerdasan buatan berpikir secara lokal tanpa adanya transmisi paket data melalui jaringan Wi-Fi Anda.

Metode Chat Ollama Llama 3 Lokal ChatGPT Web
Koneksi Internet Tidak Diperlukan (Offline) Wajib Terhubung Terus-Menerus
Privasi Data 100% Aman di PC Anda Dikirim ke Server OpenAI
Kecepatan Respon Tergantung Spek PC Sangat Cepat & Stabil
Biaya Langganan Gratis Selamanya Berbayar untuk Model Premium

Mengintegrasikan Llama 3 Dengan Aplikasi Node JS

Keunggulan Ollama tidak hanya sebatas chatbot berbasis teks di terminal. Saat Ollama berjalan, secara tidak kasat mata ia menyalakan layanan REST API lokal pada alamat http://localhost:11434. Anda bisa memanfaatkan titik akhir (endpoint) tersebut layaknya menggunakan API dari OpenAI.

Mari kita buat sebuah script contoh menggunakan JavaScript untuk memanggil peladen lokal Ollama tersebut.

test-ollama.js
javascript
const axios = require('axios');

async function tanyaLlama() {
  const url = "http://localhost:11434/api/generate";
  const payload = {
    model: "llama3",
    prompt: "Apa perbedaan paling mendasar antara let dan const di JavaScript?",
    stream: false // Set false agar respon utuh sekaligus
  };

  try {
    console.log("Menunggu balasan dari Llama 3 lokal...");
    const response = await axios.post(url, payload);
    console.log("Jawaban:");
    console.log(response.data.response);
  } catch (error) {
    console.error("Gagal terhubung ke Ollama:", error.message);
  }
}

tanyaLlama();

Jalankan perintah npm install axios dan kemudian node test-ollama.js. Kode ini sangat bermanfaat jika Anda ingin membangun alat otomasi tingkat lanjut tanpa menguras rekening bank Anda untuk membayar layanan pihak ketiga.

Kelebihan
  • Kebebasan penuh mengatur parameter suhu (temperature) tanpa biaya.
  • Mampu membaca dokumen korporat rahasia (RAG lokal) tanpa melanggar NDA.
Kekurangan
  • Model 8B masih sering berhalusinasi pada bahasa Indonesia yang kompleks (lebih cerdas berbahasa Inggris).
  • Proses komputasi menguras daya baterai laptop dengan sangat cepat.

Penutup

Ollama dan Llama 3 adalah pasangan yang sangat cocok bagi pengembang independen. Saat model dasar open-source semakin berevolusi mendekati kemampuan kognitif tingkat lanjut, menguasai alur penyebaran (deployment) lokal seperti ini akan menjadi keterampilan berharga yang diincar banyak perusahaan teknologi di masa depan.

Apakah Ollama mematikan PC jika modelnya terlalu berat? +

Biasanya tidak mematikan PC, melainkan aplikasi akan mengalami *Crash/Out of Memory* jika RAM tidak cukup.

Bisakah saya menjalankan dua model berbeda sekaligus? +

Tentu bisa, asalkan VRAM GPU Anda cukup untuk menampung kedua model secara bersamaan.

Sekarang saatnya Anda bereksperimen lebih jauh. Cobalah memberi tugas merangkum dokumen lokal kepada Llama 3 dan lihat betapa responsif asisten baru di komputer Anda ini!

Bongkar Rahasia AI Lainnya

Lanjutkan eksplorasi teknologi *AI Open Source* dalam artikel tutorial Sitemas selanjutnya.

Dimas Julianto, S.Kom.

Dimas Julianto, S.Kom.

@dimasjulianto

TECH ENTHUSIAST & DIGITAL CREATOR

Lihat Profil

Membangun ekosistem digital yang edukatif melalui Sitemas. Berfokus pada inovasi teknologi, AI, dan pengembangan konten kreatif yang berdampak.

Komentar

Memuat komentar...