Gemma 4 — هوش مصنوعی Local روی لپ‌تاپ خودت

شاید فکر کنی برای استفاده از AI، حتماً باید به اینترنت وصل باشی، اکانت OpenAI یا Anthropic داشته باشی، و هر ماه پول بدی. واقعیت اینه که می‌تونی مدل‌های قدرتمند هوش مصنوعی رو روی لپ‌تاپ خودت اجرا کنی — رایگان، آفلاین، بدون اکانت. توی این پست می‌رم سراغ Gemma 4 (مدل Google) و نشون می‌دم چطور همین امروز روی سیستمت اجراش کنی.

چرا مدل Local؟ — چهار دلیل واقعی

۱. هیچ پولی نمی‌دی

مدل‌های Cloud (Claude، GPT، Gemini API) پولی‌ان. وقتی Gemma رو Local اجرا می‌کنی، یه‌بار دانلود می‌کنی و تا هر وقت بخوای استفاده می‌کنی. صفر دلار به ازای هر کوئری.

۲. آفلاین کار می‌کنه

برق رفته؟ اینترنت قطع شده؟ مهم نیست. مدل روی هارد توئه — همینجا اجرا می‌شه.

۳. حریم خصوصی کامل

داده‌هات هیچ‌جا نمی‌رن. هیچ شرکتی پرامپتت رو نمی‌بینه، هیچ سرور خارجی‌ای داده‌ت رو ذخیره نمی‌کنه. برای کارهایی که حساس‌ان (مدارک پزشکی، اطلاعات شرکتی، کد proprietary)، Local تنها راه امنه.

۴. ایران

این برای ما (ایرانی‌ها) خیلی مهمه. تحریم‌ها، VPN، کارت ارز، گاهی اصلاً دسترسی به OpenAI/Anthropic ممکن نیست. Gemma Local از همه‌ی این‌ها فرار می‌کنه.

Gemma 4 چیه؟

Gemma خانواده‌ای از مدل‌های زبانی متن‌بازِ Google هست — هم‌تیمی Gemini ولی رایگان و قابل دانلود. نسخه‌ی ۴ آخرین ورژنه و توی benchmarkهای زیادی به مدل‌های پولی نزدیک می‌شه.

اندازه‌های مختلف

Gemma 4 در چند سایز ارائه می‌شه:

مدل	حافظه	کاربرد
Gemma 4 2B	~۲ GB	لپ‌تاپ معمولی، چت ساده
Gemma 4 9B	~۶ GB	لپ‌تاپ خوب، کارای روزمره
Gemma 4 27B	~۱۵ GB	سیستم قوی، تسک‌های سنگین
Gemma 4 35B+	~۲۲ GB	فقط کامپیوترهای high-end

انتخاب من برای اکثر کاربردها: Gemma 4 9B — بالانس خوبی بین کیفیت و سرعت.

نرم‌افزار لازم: انتخاب ابزار

برای اجرای مدل Local، یه نرم‌افزار wrapper لازم داری که مدل رو download کنه، توی RAM/GPU بارگذاری کنه، و باهاش chat رو فعال کنه. سه گزینه‌ی اصلی:

۱. Ollama (پیشنهاد من برای شروع)

ollama.com — ساده‌ترین راه. ترمینال‌محور.

# نصب (Mac/Linux)
curl -fsSL https://ollama.com/install.sh | sh

# دانلود و اجرای Gemma 4
ollama run gemma2:9b

این دستور Gemma 4 9B رو دانلود می‌کنه و یه prompt برات باز می‌کنه. شروع کن به چت.

۲. LM Studio (برای کسایی که UI می‌خوان)

lmstudio.ai — یه اپلیکیشن گرافیکی. مدل رو از کاتالوگ انتخاب می‌کنی، دانلود می‌شه، با یه chat interface قشنگ شروع می‌کنی.

بهترین انتخاب اگه ترمینال دوست نداری.

۳. Open WebUI (وقتی می‌خوای ChatGPT-style باشه)

openwebui.com — یه UI وب کامل، شبیه ChatGPT. روی Ollama سوار می‌شه. اگه می‌خوای خانواده / دوست‌هات هم بتونن از مدلت استفاده کنن (روی یه سرور خانگی)، Open WebUI انتخاب بهترینه.

دموی واقعی: چت با Gemma 4

بعد از نصب Ollama:

ollama run gemma2:9b
>>> Hi
Hello! How can I help you today?

>>> یه شعر کوتاه فارسی بساز
[Gemma یه شعر تولید می‌کنه]

نکته: Gemma فارسی رو ساپورت می‌کنه ولی به اندازه‌ی Claude/GPT خوب نیست. برای انگلیسی، تقریباً همون کیفیت رو می‌گیری. برای فارسی، یا انگلیسی بنویس یا از مدل بزرگ‌تر (35B+) استفاده کن.

یه قابلیت خاص: خروجی JSON ساختاریافته

یکی از کاربردهای جالب مدل‌های Local: خروجی structured. می‌تونی به Gemma بگی «این متن رو بخون و به این فرمت JSON تبدیل کن»:

استخراج کن:
- اسم
- ایمیل
- تلفن

از این متن:
"سلام، من علی هستم، ali@example.com، شماره: 09123456789"

Gemma یه JSON برمی‌گردونه که می‌تونی direct تو کدت parse کنی. این برای automation عالیه. بدون اینکه پول به OpenAI بدی، می‌تونی متن‌ها رو پردازش کنی.

مدل‌های تخصصی

Gemma فقط یکی از مدل‌های Local هست. در Ollama می‌تونی صدها مدل دیگه پیدا کنی، از جمله مدل‌های specialized:

MedLlama — مدل پزشکی، برای سوالات کلینیکی
CodeGemma — نسخه‌ی Gemma که فقط برای کد آموزش دیده
Llama Vision — مدل که می‌تونه عکس هم ببینه
Whisper — مدل تبدیل صوت به متن (Local نسخه‌ی OpenAI)

اگه تخصصت چیز خاصیه، احتمالاً یه مدل تخصصی براش هست.

نیازمندی‌های سخت‌افزاری

این یه چالش واقعیه. برای اجرای روان:

مدل	حداقل RAM	پیشنهاد
2B	8 GB	لپ‌تاپ هر
9B	16 GB	لپ‌تاپ خوب
27B	32 GB + GPU	حرفه‌ای
35B+	64 GB + GPU قوی	workstation

اگه Mac داری (M1+) — خوش‌شانسی. سیستم Mac برای اجرای مدل‌های Local فوق‌العاده‌ست (به‌خاطر Unified Memory).

اگه ویندوز / لینوکس داری — GPU NVIDIA کمک می‌کنه ولی الزامی نیست. CPU هم می‌تونه اجرا کنه، فقط آهسته‌تر.

اگه سیستمت ضعیفه — Gemma 2B رو امتحان کن. کیفیت کمتر، ولی روی هر لپ‌تاپی اجرا می‌شه.

مقایسه با Claude/GPT — صادقانه

Gemma Local، با همه‌ی مزایاش، به کیفیت Claude Opus یا GPT-5 نمی‌رسه. این رو واضح بگم:

	Local (Gemma 9B)	Cloud (Claude Opus)
کیفیت پاسخ‌ها	خوب	عالی
سرعت	بسته به سیستم	همیشه سریع
هزینه	صفر	$100/ماه
خصوصی	کامل	داده می‌ره سرور
آفلاین	بله	نه
زبان فارسی	ضعیف	خوب

کِی Local؟ برای automation، privacy، آفلاین، یادگیری، تست ایده‌ها، یا وقتی نمی‌تونی پول بدی.

کِی Cloud؟ برای کارهای جدی، production، کد production-quality، یا فارسی.

من خودم هر دو رو دارم. Cloud (Claude Code) برای کار جدی. Local (Gemma + Whisper) برای پردازش متن خصوصی و آفلاین.

جمع‌بندی

Gemma 4 = مدل متن‌باز Google، رایگان، Local
Ollama = ساده‌ترین راه نصب (یه دستور ترمینال)
LM Studio = جایگزین گرافیکی
حداقل ۱۶ گیگ RAM برای کیفیت قابل قبول
برای ایرانی‌ها: راه فرار از تحریم و VPN، با حریم خصوصی کامل
همراه Cloud، نه جایگزینش

بعدی چیه؟

تو پست‌های بعدی این سری:

آموزش ست‌آپ کامل Ollama + Open WebUI روی سرور خانگی
مقایسه‌ی detailed مدل‌های Local (Gemma vs Llama vs Mistral vs Qwen)
استفاده‌ی Local AI تو پروژه‌های واقعی (automation، خلاصه‌سازی، translate)

سوال داری؟ تو کامنت بپرس — مخصوصاً اگه از ایران هستی و یه challenge خاصی داری.

iAct

Act on Ai