Panduan Lengkap Menjalankan Llama 3 Lokal Menggunakan Ollama

Informasi

Bebaskan diri Anda dari tagihan langganan API berbayar dengan menjalankan LLM tingkat dunia langsung dari laptop Anda.

Masa depan kecerdasan buatan tidak lagi didominasi secara eksklusif oleh perusahaan-perusahaan teknologi raksasa di balik pintu tertutup. Ketika Meta meluncurkan model bahasa berskala besar (Large Language Model atau LLM) mereka, yakni Llama 3, hal tersebut membuka pintu gerbang revolusi kecerdasan buatan yang bersifat sumber terbuka (open source).

Banyak pengembang merasa ragu untuk bereksperimen dengan kecerdasan buatan karena takut data dan source code sensitif perusahaan terekspos ke peladen publik. Selain itu, kecepatan internet dan latensi sering kali menjadi kendala saat membuat agen kecerdasan buatan responsif. Solusinya? Jalankan model tersebut langsung di dalam mesin lokal Anda tanpa perlu koneksi internet sama sekali!

Di sinilah Ollama masuk sebagai pahlawan. Dahulu, menjalankan LLM di komputer lokal membutuhkan pemahaman mendalam tentang skrip Python, manajemen pustaka CUDA, hingga kompilasi pustaka C++. Ollama meniadakan semua rintangan tersebut dengan membungkus kompleksitas ke dalam satu baris perintah sederhana layaknya kita menggunakan NPM atau Docker.

Persyaratan Perangkat Keras

Meskipun Ollama mempermudah proses instalasi, menjalankan jaringan saraf tiruan (neural network) bernilai miliaran parameter tetap membutuhkan sumber daya komputasi yang mumpuni.

Untuk menjalankan varian Llama 3 dengan parameter 8B (8 Miliar Parameter) secara mulus, Anda membutuhkan:

Kapasitas RAM memori minimal 8 GB (disarankan 16 GB).
Ruang kosong pada SSD minimal 10 GB.
Prosesor Apple Silicon (M1/M2/M3) ATAU kartu grafis (GPU) Nvidia dengan memori video minimal 6 GB.

Jika komputer Anda memenuhinya, Llama 3 8B akan memberikan respons teks yang sangat cepat, seringkali melampaui kecepatan membaca manusia biasa.

Instalasi Ollama di Sistem Anda

Tahap 1: Unduh File Installer

Kunjungi situs web resmi ollama.com. Situs tersebut akan secara otomatis mendeteksi sistem operasi yang Anda gunakan (Windows, Mac, atau Linux). Klik tombol unduh dan jalankan berkas instalasinya.

Tahap 2: Buka Command Prompt

Setelah proses pemasangan berhasil diselesaikan oleh asisten installer, buka aplikasi Terminal (di macOS/Linux) atau PowerShell/Command Prompt (di Windows).

Tahap 3: Tarik Model Llama 3

Ketik perintah di bawah ini dan tekan enter. Ollama akan mengunduh bobot (weights) Llama 3 sebesar ~4.7 GB langsung ke dalam ruang penyimpanan lokal Anda.

Perintah Unduh Model Llama 3

ollama run llama3

Saat perintah tersebut dieksekusi untuk pertama kalinya, proses ini akan memakan waktu tergantung pada kecepatan pita lebar (bandwidth) internet Anda. Jangan menutup terminal selama proses indikator pengunduhan masih berjalan.

Disclaimer

Hanya untuk edukasi. Performa Llama 3 lokal sangat bergantung pada performa GPU dan suhu laptop Anda.

Uji Coba Chatbot Llama 3

Setelah pengunduhan sukses 100%, tampilan terminal Anda akan berubah seketika menjadi seperti antarmuka obrolan kosong yang ditandai dengan tanda >>>.

Ketikkan pertanyaan apa pun. Anda bisa mencoba: “Tuliskan program sederhana menggunakan bahasa Python untuk membuat kalkulator matematika dasar.”

Dalam sepersekian detik, kipas perangkat keras komputer Anda akan mulai berputar dan teks balasan akan dicetak sebaris demi sebaris di dalam terminal. Sangat luar biasa melihat sebuah kecerdasan buatan berpikir secara lokal tanpa adanya transmisi paket data melalui jaringan Wi-Fi Anda.

Metode Chat	Ollama Llama 3 Lokal	ChatGPT Web
Koneksi Internet	Tidak Diperlukan (Offline)	Wajib Terhubung Terus-Menerus
Privasi Data	100% Aman di PC Anda	Dikirim ke Server OpenAI
Kecepatan Respon	Tergantung Spek PC	Sangat Cepat & Stabil
Biaya Langganan	Gratis Selamanya	Berbayar untuk Model Premium

Mengintegrasikan Llama 3 Dengan Aplikasi Node JS

Keunggulan Ollama tidak hanya sebatas chatbot berbasis teks di terminal. Saat Ollama berjalan, secara tidak kasat mata ia menyalakan layanan REST API lokal pada alamat http://localhost:11434. Anda bisa memanfaatkan titik akhir (endpoint) tersebut layaknya menggunakan API dari OpenAI.

Mari kita buat sebuah script contoh menggunakan JavaScript untuk memanggil peladen lokal Ollama tersebut.

      test-ollama.js 
 javascript  
 const axios = require('axios');

async function tanyaLlama() {
  const url = "http://localhost:11434/api/generate";
  const payload = {
    model: "llama3",
    prompt: "Apa perbedaan paling mendasar antara let dan const di JavaScript?",
    stream: false // Set false agar respon utuh sekaligus
  };

  try {
    console.log("Menunggu balasan dari Llama 3 lokal...");
    const response = await axios.post(url, payload);
    console.log("Jawaban:");
    console.log(response.data.response);
  } catch (error) {
    console.error("Gagal terhubung ke Ollama:", error.message);
  }
}

tanyaLlama(); 

Jalankan perintah npm install axios dan kemudian node test-ollama.js. Kode ini sangat bermanfaat jika Anda ingin membangun alat otomasi tingkat lanjut tanpa menguras rekening bank Anda untuk membayar layanan pihak ketiga.

Kelebihan

Kebebasan penuh mengatur parameter suhu (temperature) tanpa biaya.
Mampu membaca dokumen korporat rahasia (RAG lokal) tanpa melanggar NDA.

Kekurangan

Model 8B masih sering berhalusinasi pada bahasa Indonesia yang kompleks (lebih cerdas berbahasa Inggris).
Proses komputasi menguras daya baterai laptop dengan sangat cepat.

Penutup

Ollama dan Llama 3 adalah pasangan yang sangat cocok bagi pengembang independen. Saat model dasar open-source semakin berevolusi mendekati kemampuan kognitif tingkat lanjut, menguasai alur penyebaran (deployment) lokal seperti ini akan menjadi keterampilan berharga yang diincar banyak perusahaan teknologi di masa depan.

Apakah Ollama mematikan PC jika modelnya terlalu berat? +

Biasanya tidak mematikan PC, melainkan aplikasi akan mengalami *Crash/Out of Memory* jika RAM tidak cukup.

Bisakah saya menjalankan dua model berbeda sekaligus? +

Tentu bisa, asalkan VRAM GPU Anda cukup untuk menampung kedua model secara bersamaan.

Sekarang saatnya Anda bereksperimen lebih jauh. Cobalah memberi tugas merangkum dokumen lokal kepada Llama 3 dan lihat betapa responsif asisten baru di komputer Anda ini!

Bongkar Rahasia AI Lainnya

Lanjutkan eksplorasi teknologi *AI Open Source* dalam artikel tutorial Sitemas selanjutnya.

Lihat Tutorial AI Lain

Komentar

Memuat komentar...

Panduan Lengkap Menjalankan Llama 3 Lokal Menggunakan Ollama

Persyaratan Perangkat Keras

Instalasi Ollama di Sistem Anda

Tahap 1: Unduh File Installer

Tahap 2: Buka Command Prompt

Tahap 3: Tarik Model Llama 3

Uji Coba Chatbot Llama 3

Mengintegrasikan Llama 3 Dengan Aplikasi Node JS

Penutup

Bongkar Rahasia AI Lainnya

Dimas Julianto, S.Kom.

Komentar

Terkait

Cara Membuat Workflow AI Perangkum Video YouTube

5 Cara Akses Grok AI Video Lewat Pihak Ketiga

Terbaru

Cara Dapat Domain COM Murah di Spaceship

AI Agent Browser Mulai Berguna untuk Kerja Harian

Cara Membuat Workflow AI Perangkum Video YouTube

Cara Pakai AI untuk Riset Keyword Blog

Kategori

Dokumentasi

Tutorial

Insight

Tips

Panduan Lengkap Menjalankan Llama 3 Lokal Menggunakan Ollama

Persyaratan Perangkat Keras

Instalasi Ollama di Sistem Anda

Tahap 1: Unduh File Installer

Tahap 2: Buka Command Prompt

Tahap 3: Tarik Model Llama 3

Uji Coba Chatbot Llama 3

Mengintegrasikan Llama 3 Dengan Aplikasi Node JS

Penutup

Bongkar Rahasia AI Lainnya

Dimas Julianto, S.Kom.

Dapatkan update terbaru

Komentar

Terkait

Cara Membuat Workflow AI Perangkum Video YouTube

5 Cara Akses Grok AI Video Lewat Pihak Ketiga

Terbaru

Cara Dapat Domain COM Murah di Spaceship

AI Agent Browser Mulai Berguna untuk Kerja Harian

Cara Membuat Workflow AI Perangkum Video YouTube

Cara Pakai AI untuk Riset Keyword Blog

Kategori