تصور کن ماهی حدودِ ۱.۷ میلیارد توکنِ رایگان داشته باشی و بتونی باهاش مجانی وایب کدینگ کنی. این چیزیه که با پروژهی Free LLM API ممکن میشه — ابزاری که همهی مدلهای هوش مصنوعیِ رایگانِ پروایدرهای مختلف رو یکجا جمع میکنه و از طریقِ یه آدرسِ واحد در اختیارت میذاره. این مقاله توضیح میده دقیقاً چیه، چطور نصبش کنی، و کِی واقعاً بهدردت میخوره.
اول یه حرفِ صادقانه
من خیلی طرفدارِ «رایگان» نیستم. وقتی یه چیزی رایگانه، معمولاً خودت محصولی. اگه توانِ پرداخت داری — مخصوصاً اگه خارج از ایرانی — پیشنهادم اینه که هزینه کن؛ هم از محصولِ خوب حمایت میکنی، هم روی رشدِ خودت سرمایهگذاری میکنی. ولی واقعیت اینه که پرداختِ دلاری و حتی دسترسی از ایران سخته، و برای همین این راهحل ارزشِ نشوندادن داره.
Free LLM API دقیقاً چیه؟
خودش بهت هوش مصنوعیِ رایگان نمیده؛ بلکه کلیدهای رایگانی که از پروایدرهای مختلف میگیری رو یکجا جمع میکنه و یه endpointِ واحدِ سازگار با OpenAI بهت میده. مهمترین قابلیتش روتینگِ خودکاره: اگه یه مدل یا پروایدر جواب نداد یا به سقفِ رایگانش رسید، خودش میره سراغِ بعدی. یعنی بهجای اینکه توی هر ابزار دونهدونه کلید بذاری و مدیریت کنی، یه آدرس داری که پشتش دهها مدلِ رایگانه.
نصب با Docker
سادهترین راه Docker ئه. اگه نمیدونی چیه: نرمافزاریه که پروژه رو داخلِ یه «کانتینر» آماده اجرا میکنه؛ رایگانه و فقط یهکم RAM میگیره. مراحل:
- ایمیج رو
docker pullکن (داکر یه نسخهی کاملِ پکیجشدهی پروژه رو دانلود میکنه). - فایلِ
.env.exampleرو به.envتغییرِ نام بده. این همون فایلیه که کلیدها و تنظیماتِ حساس (environment variables) توش میره — هیچوقت داخلِ کد یا گیت نمیذاریمش. - توی
.envیه Encryption Key با ۶۴ کاراکترِ hex بساز (مثلاً باopenssl rand -hex 32یاnode). این کلید برای رمزگذاریِ کلیدهای پروایدرهاست. docker compose upرو بزن. سرویس رویlocalhost:3001بالا میاد و یه اکانتِ محلی برای خودت میسازی.
گرفتنِ کلیدِ پروایدرهای رایگان
حالا باید از هر پروایدر یه API keyِ رایگان بگیری و اضافه کنی. چندتاش که توی این کار بهکار میان:
- Groq — دقت کن، این گراکِ ایلان ماسک نیست؛ یه زیرساختِ inference با تیرِ رایگانه.
- Cerebras — فوقالعاده سریع (حدودِ ۱۰۰۰ توکن در ثانیه)؛ همون زیرساختیه که پشتِ بعضی مدلهای «fast» مثلِ نسخههای سریعِ کدنویسی هم هست.
- OpenRouter، Mistral، NVIDIA (Nemotron)، Z.AI، Kilo Code و چند تای دیگه.
یه نکته: بعضی پروایدرها به VPN حساسن یا برای ثبتنام شمارهی موبایلِ تأیید میخوان (که از ایران ممکنه دردسر باشه؛ من با شمارهی خارج وریفای کردم). ولی انقدر پروایدر هست که اگه یکی نشد، از بقیه استفاده کنی.
استفاده در عمل
توی پلیگراندِ پنل میتونی مدلها رو تست کنی؛ هر کدوم سهمیهی رایگانِ خودشو داره. حالتِ جذابش روتینگه: میتونی بگی «سریعترین» مدل رو بده، یا «باهوشترین»، و اگه یکی fail شد خودش fallback میکنه به بعدی.
چون endpoint سازگار با OpenAI ئه، میتونی همین localhost:3001/v1 رو بهعنوان Base URL توی ابزارهای کدنویسی بذاری: توی VS Code با اکستنشنِ Roo Code (یا Cline)، یا توی Claude Code / OpenCode. کافیه پروایدر رو روی «OpenAI-Compatible» بذاری، Base URL رو همون لوکالهاست بدی، و مدل رو روی حالتِ Auto بذاری (یا اسمِ دقیقِ مدل مثلِ zai/glm-4... یا nvidia/nemotron...). آنالیتیکسش هم نشون میده هر پروایدر چقدر سهمیه برات مونده — و اگه همه رو جمع کنی، ماهی حدودِ ۱.۷ میلیارد توکن میشه که برای وایب کدینگ عملاً دستت بازه.
نظرِ صادقانه
برای دسترسیِ رایگان — مخصوصاً از ایران و وقتی نمیخوای/نمیتونی پول بدی — خیلی کاربردیه و fallbackِ خودکارش عالیه. ولی دو تا «اما» داره: اول اینکه کیفیت قابلاعتماد نیست و دقیق نمیدونی پشتِ هر جواب کدوم مدل بوده (و هر مدل اخلاقِ خودشو داره). دوم اینکه یهکم نگهداری میخواد؛ چون پروژه مدام تغییر میکنه، هرچند وقت یهبار Docker رو آپدیت کن و پروایدرهای از کارافتاده رو بردار و جدیدها رو اضافه کن. ولی در مجموع، همین که «یه چیزی رایگان کار کنه» میتونه خیلی بهدردت بخوره.
ویدئوی کاملش رو از پایین ببین.


دیدگاهتان را بنویسید