هوش مصنوعی رایگان با Free LLM API؛ ۱.۷ میلیارد توکن در ماه و وایب کدینگِ مجانی

تصور کن ماهی حدودِ ۱.۷ میلیارد توکنِ رایگان داشته باشی و بتونی باهاش مجانی وایب کدینگ کنی. این چیزیه که با پروژه‌ی Free LLM API ممکن می‌شه — ابزاری که همه‌ی مدل‌های هوش مصنوعیِ رایگانِ پروایدرهای مختلف رو یک‌جا جمع می‌کنه و از طریقِ یه آدرسِ واحد در اختیارت می‌ذاره. این مقاله توضیح می‌ده دقیقاً چیه، چطور نصبش کنی، و کِی واقعاً به‌دردت می‌خوره.

اول یه حرفِ صادقانه

من خیلی طرفدارِ «رایگان» نیستم. وقتی یه چیزی رایگانه، معمولاً خودت محصولی. اگه توانِ پرداخت داری — مخصوصاً اگه خارج از ایرانی — پیشنهادم اینه که هزینه کن؛ هم از محصولِ خوب حمایت می‌کنی، هم روی رشدِ خودت سرمایه‌گذاری می‌کنی. ولی واقعیت اینه که پرداختِ دلاری و حتی دسترسی از ایران سخته، و برای همین این راه‌حل ارزشِ نشون‌دادن داره.

Free LLM API دقیقاً چیه؟

خودش بهت هوش مصنوعیِ رایگان نمی‌ده؛ بلکه کلیدهای رایگانی که از پروایدرهای مختلف می‌گیری رو یک‌جا جمع می‌کنه و یه endpointِ واحدِ سازگار با OpenAI بهت می‌ده. مهم‌ترین قابلیتش روتینگِ خودکاره: اگه یه مدل یا پروایدر جواب نداد یا به سقفِ رایگانش رسید، خودش می‌ره سراغِ بعدی. یعنی به‌جای اینکه توی هر ابزار دونه‌دونه کلید بذاری و مدیریت کنی، یه آدرس داری که پشتش ده‌ها مدلِ رایگانه.

نصب با Docker

ساده‌ترین راه Docker ئه. اگه نمی‌دونی چیه: نرم‌افزاریه که پروژه رو داخلِ یه «کانتینر» آماده اجرا می‌کنه؛ رایگانه و فقط یه‌کم RAM می‌گیره. مراحل:

ایمیج رو docker pull کن (داکر یه نسخه‌ی کاملِ پکیج‌شده‌ی پروژه رو دانلود می‌کنه).
فایلِ .env.example رو به .env تغییرِ نام بده. این همون فایلیه که کلیدها و تنظیماتِ حساس (environment variables) توش می‌ره — هیچ‌وقت داخلِ کد یا گیت نمی‌ذاریمش.
توی .env یه Encryption Key با ۶۴ کاراکترِ hex بساز (مثلاً با openssl rand -hex 32 یا node). این کلید برای رمزگذاریِ کلیدهای پروایدرهاست.
docker compose up رو بزن. سرویس روی localhost:3001 بالا میاد و یه اکانتِ محلی برای خودت می‌سازی.

گرفتنِ کلیدِ پروایدرهای رایگان

حالا باید از هر پروایدر یه API keyِ رایگان بگیری و اضافه کنی. چندتاش که توی این کار به‌کار میان:

Groq — دقت کن، این گراکِ ایلان ماسک نیست؛ یه زیرساختِ inference با تیرِ رایگانه.
Cerebras — فوق‌العاده سریع (حدودِ ۱۰۰۰ توکن در ثانیه)؛ همون زیرساختیه که پشتِ بعضی مدل‌های «fast» مثلِ نسخه‌های سریعِ کدنویسی هم هست.
OpenRouter، Mistral، NVIDIA (Nemotron)، Z.AI، Kilo Code و چند تای دیگه.

یه نکته: بعضی پروایدرها به VPN حساسن یا برای ثبت‌نام شماره‌ی موبایلِ تأیید می‌خوان (که از ایران ممکنه دردسر باشه؛ من با شماره‌ی خارج وریفای کردم). ولی انقدر پروایدر هست که اگه یکی نشد، از بقیه استفاده کنی.

استفاده در عمل

توی پلی‌گراندِ پنل می‌تونی مدل‌ها رو تست کنی؛ هر کدوم سهمیه‌ی رایگانِ خودشو داره. حالتِ جذابش روتینگه: می‌تونی بگی «سریع‌ترین» مدل رو بده، یا «باهوش‌ترین»، و اگه یکی fail شد خودش fallback می‌کنه به بعدی.

چون endpoint سازگار با OpenAI ئه، می‌تونی همین localhost:3001/v1 رو به‌عنوان Base URL توی ابزارهای کدنویسی بذاری: توی VS Code با اکستنشنِ Roo Code (یا Cline)، یا توی Claude Code / OpenCode. کافیه پروایدر رو روی «OpenAI-Compatible» بذاری، Base URL رو همون لوکال‌هاست بدی، و مدل رو روی حالتِ Auto بذاری (یا اسمِ دقیقِ مدل مثلِ zai/glm-4... یا nvidia/nemotron...). آنالیتیکسش هم نشون می‌ده هر پروایدر چقدر سهمیه برات مونده — و اگه همه رو جمع کنی، ماهی حدودِ ۱.۷ میلیارد توکن می‌شه که برای وایب کدینگ عملاً دستت بازه.

نظرِ صادقانه

برای دسترسیِ رایگان — مخصوصاً از ایران و وقتی نمی‌خوای/نمی‌تونی پول بدی — خیلی کاربردیه و fallbackِ خودکارش عالیه. ولی دو تا «اما» داره: اول اینکه کیفیت قابل‌اعتماد نیست و دقیق نمی‌دونی پشتِ هر جواب کدوم مدل بوده (و هر مدل اخلاقِ خودشو داره). دوم اینکه یه‌کم نگهداری می‌خواد؛ چون پروژه مدام تغییر می‌کنه، هرچند وقت یه‌بار Docker رو آپدیت کن و پروایدرهای از کارافتاده رو بردار و جدیدها رو اضافه کن. ولی در مجموع، همین که «یه چیزی رایگان کار کنه» می‌تونه خیلی به‌دردت بخوره.

ویدئوی کاملش رو از پایین ببین.

iAct

Act on Ai