چت جی‌پی‌تی چطور کار می‌کنه؟

توی این پست می‌خوام تا حد ممکن ساده توضیح بدم که هوش مصنوعی مثل چت جی‌پی‌تی چطور کار می‌کنه، بدون اینکه بخوایم وارد مفاهیم خیلی تخصصی بشیم.

هوش مصنوعی مثل چت جی‌پی‌تی دقیقاً چیه؟

اگر بخوام خیلی خلاصه بگم، چت جی‌پی‌تی در اصل یه تکمیل‌کننده‌ی متن هست (Auto Completion). یعنی چی؟ یعنی فقط تلاش می‌کنه کلمه‌ی بعدی جمله‌ای که بهش دادی رو حدس بزنه.

یه مثال ساده:

جمله‌ی کامل ما اینه:

«پایتخت کشور فرانسه پاریس می‌باشد»

حالا اگه فقط بهش بدیم:

«پایتخت کشور فرانسه»

هوش مصنوعی با توجه به آموزش‌هایی که دیده سعی می‌کنه ادامه جمله رو حدس بزنه:
اول می‌نویسه: پاریس
بعد: می‌باشد

و همین‌طور جمله رو کلمه‌به‌کلمه کامل می‌کنه.
اگه دقت کرده باشی وقتی از چت جی‌پی‌تی یه سوال می‌پرسی، کلمات رو یکی‌یکی می‌نویسه. این فقط برای زیبایی نیست، این همون روش فکر کردنشه! هر کلمه، پایه‌ایه برای حدس زدن کلمه‌ی بعدی.

چطور این کارو انجام می‌ده؟

خب اول باید بدونیم چطور ساخته شده.

چطور هوش مصنوعی مثل چت جی‌پی‌تی ساخته میشه؟

برای ساختنش، اول یه دنیای عظیم از اطلاعات نیاز داریم. بیشتر این اطلاعات از اینترنت جمع می‌شن: کتاب‌ها، سایت‌ها، مقالات، گفتگوها و…

بعد باید این اطلاعات رو آماده کنیم تا قابل آموزش دادن باشن.
این کار با شکستن جمله‌ها به قطعات کوچیک به اسم توکن انجام میشه. (توکن می‌تونه یک کلمه، بخشی از یک کلمه یا حتی یک علامت باشه.)

مثال:

جمله:

«پایتخت کشور فرانسه پاریس می‌باشد»

توکن‌ها (برای سادگی فرض کنیم هر کلمه یک توکنه):

پایتخت
کشور
فرانسه
پاریس
می‌باشد

🔹 (در واقع توکن‌ها پیچیده‌ترن. مثلاً “می‌باشد” ممکنه خودش چند توکن باشه. تو این سایت می‌تونی ببینی که دقیقاً هر کلمه برای چه مدلی چطور توکنیزه میشه: https://tiktokenizer.vercel.app/?model=gpt2)

حالا نوبت ریاضی می‌رسه!

چون کامپیوتر با متن کار نمی‌کنه، باید این توکن‌ها به عدد تبدیل بشن. برای مثال:

کلمه	عدد متناظر
پایتخت	223
کشور	22
فرانسه	53
پاریس	86
می‌باشد	657

پس جمله‌ی ما تبدیل میشه به:

223, 22, 53, 86, 657

اگه فقط جمله‌ی ناقص «پایتخت کشور فرانسه» رو بدیم (یعنی 223,22,53)، هوش مصنوعی باید حدس بزنه عدد بعدی چیه (که در این مثال 86 یعنی «پاریس» هست).

چطور می‌فهمه که باید بنویسه «پاریس»؟

اینجاست که قدرت اصلی هوش مصنوعی وارد میشه.
اون سعی می‌کنه روابط بین کلمات رو توی میلیون‌ها جمله‌ای که قبلاً دیده پیدا کنه. اگه بارها دیده باشه که بعد از «پایتخت کشور فرانسه» کلمه‌ی «پاریس» اومده، احتمال اون رو بیشتر در نظر می‌گیره.

ولی موضوع فقط کلمه‌ی قبل نیست؛
اگه جمله در مورد فوتبال باشه و نوشته شده باشه:

«تیم ملی فرانسه…»
اون موقع دیگه انتظار داریم کلمه‌ی بعدی «پاریس» نباشه، بلکه شاید بشه: «در جام جهانی»، یا «بازی خوبی داشت» و…

یعنی هم کلمات قبلی، هم موضوع کلی، هم لحن، هم حتی فاصله‌ی کلمات روی پیش‌بینی تأثیر می‌ذارن. هوش مصنوعی وزن و اهمیت هر کلمه رو در جمله مشخص می‌کنه و حتی جایگاه اون رو هم درک می‌کنه.

آموزش دادن هوش مصنوعی

اینا رو با حجم عظیمی از متن آموزش می‌دن.
و در نهایت، هوش مصنوعی یک ساختار پیچیده از شبکه‌های عصبی می‌سازه که یاد گرفته کدوم توکن‌ها معمولاً کنار هم میان و می‌تونه جمله‌ها رو بر اساس اون‌ها کامل کنه.

📺 اگه دوست داری بدونی دقیقاً چطور آموزش داده میشه، این ویدیو بهترین شروعه:
https://www.youtube.com/watch?v=kCc8FmEb1nY

چرا باید بدونیم چت جی‌پی‌تی چطور فکر می‌کنه؟

چون اگه بدونی چطور کار می‌کنه، می‌تونی درخواست‌های بهتری بنویسی، نتایج دقیق‌تری بگیری و کمتر گیجش کنی!

مثلاً:

هر بار که یه چت جدید باز می‌کنی، اون هیچ خاطره‌ای از قبل نداره.
اگه سوالی بی‌ربط به سوال قبلی بپرسی، ممکنه گیج بشه.
اگه قبل از سوال دادن، یه مقدمه‌ی خوب براش بنویسی، نتیجه بهتر میشه.

پرامپت دادن چیه و چرا مهمه؟

اگه بخوای کمک بیشتری بگیری، بهتره به هوش مصنوعی نقش بدی. مثلاً:

تو یک برنامه‌نویس با تجربه‌ی Java هستی.

حالا هر چیزی که بعد از این بپرسی، براساس اون نقش جواب می‌ده. چون کلمه‌ی “Java” ذهنش رو متمرکز می‌کنه روی اون حوزه.

یک مثال واقعی مقایسۀ شیوۀ «فکر کردن» در هوش مصنوعی

حالا یک سؤال: به نظر شما کدام پاسخِ هوش مصنوعی در این مثال بهتر است؟

سؤال: حاصل‌ضرب ۳ × ۲ چند می‌شود؟

جواب ۱

جواب ۲

در پاسخ به سؤالِ ضربِ عددِ ۳ در ۲ می‌توان در نظر گرفت که این به‌معنای آن است که عددِ ۲ به‌اندازۀ ۳ بار با خودش جمع می‌شود؛ معادلِ ۲ + ۲ + ۲ که می‌شود ۶.
پس جواب درست ۶ است.

خوب، اگر تا اینجا حدس زدی جواب صحیح ۶ است، یعنی مفهوم این پست را فهمیدی!

جوابی که ما دوست داریم از هوش مصنوعی بگیریم جواب شماره ۲ است!
چرا؟

درست است که جواب ۱ کوتاه‌تر است و ظاهراً ما را راضی می‌کند، امّا در عمل می‌خواهیم هوش مصنوعی (چت جی‌پی‌تی) بیشتر فکر کند و محتوای بیشتری را پردازش کند.
در مثال‌های ساده احتمالاً هر دو جواب درست‌اند؛ امّا در مسائل پیچیده احتمال اشتباه در جوابِ ۱ (پاسخ تک‌کلمه‌ای) خیلی بیشتر است، چون تنها یک‌بار «حدس» زده و تمام.

مثال ۱ (پاسخ کوتاه)

ورودی: حاصل ضرب ۳ ضربدر ۲ چند می‌شود؟
خروجی: حاصل ضرب ۳ ضربدر ۲ چند می‌شود؟ ۶

مثال ۲ (پاسخ تفصیلی)

ورودی: حاصل ضرب ۳ ضربدر ۲ چند می‌شود؟
خروجی (روند خط‌به‌خط تولید متن):

حاصل ضرب ۳ ضربدر ۲ چند می‌شود؟ در
حاصل ضرب ۳ ضربدر ۲ چند می‌شود؟ در جواب
حاصل ضرب ۳ ضربدر ۲ چند می‌شود؟ در جواب به
حاصل ضرب ۳ ضربدر ۲ چند می‌شود؟ در جواب به سؤال
حاصل ضرب ۳ ضربدر ۲ چند می‌شود؟ در جواب به سؤال ضرب
…
حاصل ضرب ۳ ضربدر ۲ چند می‌شود؟ در جواب به سؤال ضرب عدد ۳ در ۲ می‌توان در نظر گرفت که این به‌معنی آن است که عدد ۲ به‌اندازۀ ۳ بار با خودش جمع می‌شود؛ معادل ۲ + ۲ + ۲ که می‌شود
حاصل ضرب ۳ ضربدر ۲ چند می‌شود؟ در جواب به سؤال ضرب عدد ۳ در ۲ می‌توان در نظر گرفت که این به‌معنی آن است که عدد ۲ به‌اندازۀ ۳ بار با خودش جمع می‌شود؛ معادل ۲ + ۲ + ۲ که می‌شود ۶

در این مثال ۳۹ بار درخواست به هوش مصنوعی ارسال و پاسخ دریافت شده تا به نتیجۀ دقیق‌تر برسیم.

به همین دلیل است که هوش مصنوعی‌هایی که «فکر کردنِ چندمرحله‌ای» دارند بهتر عمل می‌کنند: قبل از این‌که سریع پاسخ دهند، از خودشان سؤال می‌پرسند، اطلاعات بیشتری تولید می‌کنند و چندبار تلاش می‌کنند.

چطور کاری کنیم که هوش مصنوعی جوابِ سریع و سطحی ندهد؟

از او بخواهید از شما سؤال بپرسد. پیش از آن‌که کاری انجام دهد، بپرسد تا مطمئن شوید درخواست را درست فهمیده است. این کار هم محتوای بیشتری به چت می‌افزاید، هم جواب متمرکزتر و دقیق‌تر می‌شود.

قبل از سؤال اصلی، با او صحبت کنید. محتوای ذهنیِ هوش مصنوعی را آماده کنید. تصور کنید با دوستی حرف می‌زنید که هیچ پیش‌زمینه‌ای ندارد؛ اول زمینه‌چینی می‌کنید، بعد سؤال را مطرح می‌کنید.

چطور کاری کنیم که هوش مصنوعی “عمیق‌تر” فکر کنه؟

✅ قبل از اینکه سوال اصلی رو بپرسی، مقدمه بده
✅ بهش نقش بده (مثل کارشناس، مشاور، برنامه‌نویس…)
✅ ازش بخواه اول سوال بپرسه
✅ محتوای ذهنی‌اش رو آماده کن، انگار داری به یه دوست تازه‌وارد موضوع رو توضیح می‌دی

امیدوارم این مطلب برات مفید بوده باشه 🌱
اگه سوالی داشتی توی کامنت بپرس یا برام بفرست، خوشحال می‌شم کمک کنم.

iAct

Act on Ai