شاید فکر کنی برای استفاده از AI، حتماً باید به اینترنت وصل باشی، اکانت OpenAI یا Anthropic داشته باشی، و هر ماه پول بدی. واقعیت اینه که میتونی مدلهای قدرتمند هوش مصنوعی رو روی لپتاپ خودت اجرا کنی — رایگان، آفلاین، بدون اکانت. توی این پست میرم سراغ Gemma 4 (مدل Google) و نشون میدم چطور همین امروز روی سیستمت اجراش کنی.
چرا مدل Local؟ — چهار دلیل واقعی
۱. هیچ پولی نمیدی
مدلهای Cloud (Claude، GPT، Gemini API) پولیان. وقتی Gemma رو Local اجرا میکنی، یهبار دانلود میکنی و تا هر وقت بخوای استفاده میکنی. صفر دلار به ازای هر کوئری.
۲. آفلاین کار میکنه
برق رفته؟ اینترنت قطع شده؟ مهم نیست. مدل روی هارد توئه — همینجا اجرا میشه.
۳. حریم خصوصی کامل
دادههات هیچجا نمیرن. هیچ شرکتی پرامپتت رو نمیبینه، هیچ سرور خارجیای دادهت رو ذخیره نمیکنه. برای کارهایی که حساسان (مدارک پزشکی، اطلاعات شرکتی، کد proprietary)، Local تنها راه امنه.
۴. ایران
این برای ما (ایرانیها) خیلی مهمه. تحریمها، VPN، کارت ارز، گاهی اصلاً دسترسی به OpenAI/Anthropic ممکن نیست. Gemma Local از همهی اینها فرار میکنه.
Gemma 4 چیه؟
Gemma خانوادهای از مدلهای زبانی متنبازِ Google هست — همتیمی Gemini ولی رایگان و قابل دانلود. نسخهی ۴ آخرین ورژنه و توی benchmarkهای زیادی به مدلهای پولی نزدیک میشه.
اندازههای مختلف
Gemma 4 در چند سایز ارائه میشه:
| مدل | حافظه | کاربرد |
|---|---|---|
| Gemma 4 2B | ~۲ GB | لپتاپ معمولی، چت ساده |
| Gemma 4 9B | ~۶ GB | لپتاپ خوب، کارای روزمره |
| Gemma 4 27B | ~۱۵ GB | سیستم قوی، تسکهای سنگین |
| Gemma 4 35B+ | ~۲۲ GB | فقط کامپیوترهای high-end |
انتخاب من برای اکثر کاربردها: Gemma 4 9B — بالانس خوبی بین کیفیت و سرعت.
نرمافزار لازم: انتخاب ابزار
برای اجرای مدل Local، یه نرمافزار wrapper لازم داری که مدل رو download کنه، توی RAM/GPU بارگذاری کنه، و باهاش chat رو فعال کنه. سه گزینهی اصلی:
۱. Ollama (پیشنهاد من برای شروع)
ollama.com — سادهترین راه. ترمینالمحور.
# نصب (Mac/Linux)
curl -fsSL https://ollama.com/install.sh | sh
# دانلود و اجرای Gemma 4
ollama run gemma2:9b
این دستور Gemma 4 9B رو دانلود میکنه و یه prompt برات باز میکنه. شروع کن به چت.
۲. LM Studio (برای کسایی که UI میخوان)
lmstudio.ai — یه اپلیکیشن گرافیکی. مدل رو از کاتالوگ انتخاب میکنی، دانلود میشه، با یه chat interface قشنگ شروع میکنی.
بهترین انتخاب اگه ترمینال دوست نداری.
۳. Open WebUI (وقتی میخوای ChatGPT-style باشه)
openwebui.com — یه UI وب کامل، شبیه ChatGPT. روی Ollama سوار میشه. اگه میخوای خانواده / دوستهات هم بتونن از مدلت استفاده کنن (روی یه سرور خانگی)، Open WebUI انتخاب بهترینه.
دموی واقعی: چت با Gemma 4
بعد از نصب Ollama:
ollama run gemma2:9b
>>> Hi
Hello! How can I help you today?
>>> یه شعر کوتاه فارسی بساز
[Gemma یه شعر تولید میکنه]
نکته: Gemma فارسی رو ساپورت میکنه ولی به اندازهی Claude/GPT خوب نیست. برای انگلیسی، تقریباً همون کیفیت رو میگیری. برای فارسی، یا انگلیسی بنویس یا از مدل بزرگتر (35B+) استفاده کن.
یه قابلیت خاص: خروجی JSON ساختاریافته
یکی از کاربردهای جالب مدلهای Local: خروجی structured. میتونی به Gemma بگی «این متن رو بخون و به این فرمت JSON تبدیل کن»:
استخراج کن:
- اسم
- ایمیل
- تلفن
از این متن:
"سلام، من علی هستم، ali@example.com، شماره: 09123456789"
Gemma یه JSON برمیگردونه که میتونی direct تو کدت parse کنی. این برای automation عالیه. بدون اینکه پول به OpenAI بدی، میتونی متنها رو پردازش کنی.
مدلهای تخصصی
Gemma فقط یکی از مدلهای Local هست. در Ollama میتونی صدها مدل دیگه پیدا کنی، از جمله مدلهای specialized:
- MedLlama — مدل پزشکی، برای سوالات کلینیکی
- CodeGemma — نسخهی Gemma که فقط برای کد آموزش دیده
- Llama Vision — مدل که میتونه عکس هم ببینه
- Whisper — مدل تبدیل صوت به متن (Local نسخهی OpenAI)
اگه تخصصت چیز خاصیه، احتمالاً یه مدل تخصصی براش هست.
نیازمندیهای سختافزاری
این یه چالش واقعیه. برای اجرای روان:
| مدل | حداقل RAM | پیشنهاد |
|---|---|---|
| 2B | 8 GB | لپتاپ هر |
| 9B | 16 GB | لپتاپ خوب |
| 27B | 32 GB + GPU | حرفهای |
| 35B+ | 64 GB + GPU قوی | workstation |
اگه Mac داری (M1+) — خوششانسی. سیستم Mac برای اجرای مدلهای Local فوقالعادهست (بهخاطر Unified Memory).
اگه ویندوز / لینوکس داری — GPU NVIDIA کمک میکنه ولی الزامی نیست. CPU هم میتونه اجرا کنه، فقط آهستهتر.
اگه سیستمت ضعیفه — Gemma 2B رو امتحان کن. کیفیت کمتر، ولی روی هر لپتاپی اجرا میشه.
مقایسه با Claude/GPT — صادقانه
Gemma Local، با همهی مزایاش، به کیفیت Claude Opus یا GPT-5 نمیرسه. این رو واضح بگم:
| Local (Gemma 9B) | Cloud (Claude Opus) | |
|---|---|---|
| کیفیت پاسخها | خوب | عالی |
| سرعت | بسته به سیستم | همیشه سریع |
| هزینه | صفر | $100/ماه |
| خصوصی | کامل | داده میره سرور |
| آفلاین | بله | نه |
| زبان فارسی | ضعیف | خوب |
کِی Local؟ برای automation، privacy، آفلاین، یادگیری، تست ایدهها، یا وقتی نمیتونی پول بدی.
کِی Cloud؟ برای کارهای جدی، production، کد production-quality، یا فارسی.
من خودم هر دو رو دارم. Cloud (Claude Code) برای کار جدی. Local (Gemma + Whisper) برای پردازش متن خصوصی و آفلاین.
جمعبندی
- Gemma 4 = مدل متنباز Google، رایگان، Local
- Ollama = سادهترین راه نصب (یه دستور ترمینال)
- LM Studio = جایگزین گرافیکی
- حداقل ۱۶ گیگ RAM برای کیفیت قابل قبول
- برای ایرانیها: راه فرار از تحریم و VPN، با حریم خصوصی کامل
- همراه Cloud، نه جایگزینش
بعدی چیه؟
تو پستهای بعدی این سری:
- آموزش ستآپ کامل Ollama + Open WebUI روی سرور خانگی
- مقایسهی detailed مدلهای Local (Gemma vs Llama vs Mistral vs Qwen)
- استفادهی Local AI تو پروژههای واقعی (automation، خلاصهسازی، translate)
سوال داری؟ تو کامنت بپرس — مخصوصاً اگه از ایران هستی و یه challenge خاصی داری.


دیدگاهتان را بنویسید