توی این پست میخوام تا حد ممکن ساده توضیح بدم که هوش مصنوعی مثل چت جیپیتی چطور کار میکنه، بدون اینکه بخوایم وارد مفاهیم خیلی تخصصی بشیم.
هوش مصنوعی مثل چت جیپیتی دقیقاً چیه؟
اگر بخوام خیلی خلاصه بگم، چت جیپیتی در اصل یه تکمیلکنندهی متن هست (Auto Completion). یعنی چی؟ یعنی فقط تلاش میکنه کلمهی بعدی جملهای که بهش دادی رو حدس بزنه.
یه مثال ساده:
جملهی کامل ما اینه:
«پایتخت کشور فرانسه پاریس میباشد»
حالا اگه فقط بهش بدیم:
«پایتخت کشور فرانسه»
هوش مصنوعی با توجه به آموزشهایی که دیده سعی میکنه ادامه جمله رو حدس بزنه:
اول مینویسه: پاریس
بعد: میباشد
و همینطور جمله رو کلمهبهکلمه کامل میکنه.
اگه دقت کرده باشی وقتی از چت جیپیتی یه سوال میپرسی، کلمات رو یکییکی مینویسه. این فقط برای زیبایی نیست، این همون روش فکر کردنشه! هر کلمه، پایهایه برای حدس زدن کلمهی بعدی.
چطور این کارو انجام میده؟
خب اول باید بدونیم چطور ساخته شده.
چطور هوش مصنوعی مثل چت جیپیتی ساخته میشه؟
برای ساختنش، اول یه دنیای عظیم از اطلاعات نیاز داریم. بیشتر این اطلاعات از اینترنت جمع میشن: کتابها، سایتها، مقالات، گفتگوها و…
بعد باید این اطلاعات رو آماده کنیم تا قابل آموزش دادن باشن.
این کار با شکستن جملهها به قطعات کوچیک به اسم توکن انجام میشه. (توکن میتونه یک کلمه، بخشی از یک کلمه یا حتی یک علامت باشه.)
مثال:
جمله:
«پایتخت کشور فرانسه پاریس میباشد»
توکنها (برای سادگی فرض کنیم هر کلمه یک توکنه):
- پایتخت
- کشور
- فرانسه
- پاریس
- میباشد
🔹 (در واقع توکنها پیچیدهترن. مثلاً “میباشد” ممکنه خودش چند توکن باشه. تو این سایت میتونی ببینی که دقیقاً هر کلمه برای چه مدلی چطور توکنیزه میشه: https://tiktokenizer.vercel.app/?model=gpt2)
حالا نوبت ریاضی میرسه!
چون کامپیوتر با متن کار نمیکنه، باید این توکنها به عدد تبدیل بشن. برای مثال:
کلمه | عدد متناظر |
---|---|
پایتخت | 223 |
کشور | 22 |
فرانسه | 53 |
پاریس | 86 |
میباشد | 657 |
پس جملهی ما تبدیل میشه به:
223, 22, 53, 86, 657
اگه فقط جملهی ناقص «پایتخت کشور فرانسه» رو بدیم (یعنی 223,22,53)، هوش مصنوعی باید حدس بزنه عدد بعدی چیه (که در این مثال 86 یعنی «پاریس» هست).
چطور میفهمه که باید بنویسه «پاریس»؟
اینجاست که قدرت اصلی هوش مصنوعی وارد میشه.
اون سعی میکنه روابط بین کلمات رو توی میلیونها جملهای که قبلاً دیده پیدا کنه. اگه بارها دیده باشه که بعد از «پایتخت کشور فرانسه» کلمهی «پاریس» اومده، احتمال اون رو بیشتر در نظر میگیره.
ولی موضوع فقط کلمهی قبل نیست؛
اگه جمله در مورد فوتبال باشه و نوشته شده باشه:
«تیم ملی فرانسه…»
اون موقع دیگه انتظار داریم کلمهی بعدی «پاریس» نباشه، بلکه شاید بشه: «در جام جهانی»، یا «بازی خوبی داشت» و…
یعنی هم کلمات قبلی، هم موضوع کلی، هم لحن، هم حتی فاصلهی کلمات روی پیشبینی تأثیر میذارن. هوش مصنوعی وزن و اهمیت هر کلمه رو در جمله مشخص میکنه و حتی جایگاه اون رو هم درک میکنه.
آموزش دادن هوش مصنوعی
اینا رو با حجم عظیمی از متن آموزش میدن.
و در نهایت، هوش مصنوعی یک ساختار پیچیده از شبکههای عصبی میسازه که یاد گرفته کدوم توکنها معمولاً کنار هم میان و میتونه جملهها رو بر اساس اونها کامل کنه.
📺 اگه دوست داری بدونی دقیقاً چطور آموزش داده میشه، این ویدیو بهترین شروعه:
https://www.youtube.com/watch?v=kCc8FmEb1nY
چرا باید بدونیم چت جیپیتی چطور فکر میکنه؟
چون اگه بدونی چطور کار میکنه، میتونی درخواستهای بهتری بنویسی، نتایج دقیقتری بگیری و کمتر گیجش کنی!
مثلاً:
- هر بار که یه چت جدید باز میکنی، اون هیچ خاطرهای از قبل نداره.
- اگه سوالی بیربط به سوال قبلی بپرسی، ممکنه گیج بشه.
- اگه قبل از سوال دادن، یه مقدمهی خوب براش بنویسی، نتیجه بهتر میشه.
پرامپت دادن چیه و چرا مهمه؟
اگه بخوای کمک بیشتری بگیری، بهتره به هوش مصنوعی نقش بدی. مثلاً:
تو یک برنامهنویس با تجربهی Java هستی.
حالا هر چیزی که بعد از این بپرسی، براساس اون نقش جواب میده. چون کلمهی “Java” ذهنش رو متمرکز میکنه روی اون حوزه.
یک مثال واقعی مقایسۀ شیوۀ «فکر کردن» در هوش مصنوعی
حالا یک سؤال: به نظر شما کدام پاسخِ هوش مصنوعی در این مثال بهتر است؟
سؤال: حاصلضرب ۳ × ۲ چند میشود؟
جواب ۱
۶
جواب ۲
در پاسخ به سؤالِ ضربِ عددِ ۳ در ۲ میتوان در نظر گرفت که این بهمعنای آن است که عددِ ۲ بهاندازۀ ۳ بار با خودش جمع میشود؛ معادلِ ۲ + ۲ + ۲ که میشود ۶.
پس جواب درست ۶ است.
خوب، اگر تا اینجا حدس زدی جواب صحیح ۶ است، یعنی مفهوم این پست را فهمیدی!
جوابی که ما دوست داریم از هوش مصنوعی بگیریم جواب شماره ۲ است!
چرا؟
- درست است که جواب ۱ کوتاهتر است و ظاهراً ما را راضی میکند، امّا در عمل میخواهیم هوش مصنوعی (چت جیپیتی) بیشتر فکر کند و محتوای بیشتری را پردازش کند.
- در مثالهای ساده احتمالاً هر دو جواب درستاند؛ امّا در مسائل پیچیده احتمال اشتباه در جوابِ ۱ (پاسخ تککلمهای) خیلی بیشتر است، چون تنها یکبار «حدس» زده و تمام.
مثال ۱ (پاسخ کوتاه)
ورودی: حاصل ضرب ۳ ضربدر ۲ چند میشود؟
خروجی: حاصل ضرب ۳ ضربدر ۲ چند میشود؟ ۶
مثال ۲ (پاسخ تفصیلی)
ورودی: حاصل ضرب ۳ ضربدر ۲ چند میشود؟
خروجی (روند خطبهخط تولید متن):
- حاصل ضرب ۳ ضربدر ۲ چند میشود؟ در
- حاصل ضرب ۳ ضربدر ۲ چند میشود؟ در جواب
- حاصل ضرب ۳ ضربدر ۲ چند میشود؟ در جواب به
- حاصل ضرب ۳ ضربدر ۲ چند میشود؟ در جواب به سؤال
- حاصل ضرب ۳ ضربدر ۲ چند میشود؟ در جواب به سؤال ضرب
… - حاصل ضرب ۳ ضربدر ۲ چند میشود؟ در جواب به سؤال ضرب عدد ۳ در ۲ میتوان در نظر گرفت که این بهمعنی آن است که عدد ۲ بهاندازۀ ۳ بار با خودش جمع میشود؛ معادل ۲ + ۲ + ۲ که میشود
- حاصل ضرب ۳ ضربدر ۲ چند میشود؟ در جواب به سؤال ضرب عدد ۳ در ۲ میتوان در نظر گرفت که این بهمعنی آن است که عدد ۲ بهاندازۀ ۳ بار با خودش جمع میشود؛ معادل ۲ + ۲ + ۲ که میشود ۶
در این مثال ۳۹ بار درخواست به هوش مصنوعی ارسال و پاسخ دریافت شده تا به نتیجۀ دقیقتر برسیم.
به همین دلیل است که هوش مصنوعیهایی که «فکر کردنِ چندمرحلهای» دارند بهتر عمل میکنند: قبل از اینکه سریع پاسخ دهند، از خودشان سؤال میپرسند، اطلاعات بیشتری تولید میکنند و چندبار تلاش میکنند.
چطور کاری کنیم که هوش مصنوعی جوابِ سریع و سطحی ندهد؟
از او بخواهید از شما سؤال بپرسد. پیش از آنکه کاری انجام دهد، بپرسد تا مطمئن شوید درخواست را درست فهمیده است. این کار هم محتوای بیشتری به چت میافزاید، هم جواب متمرکزتر و دقیقتر میشود.
قبل از سؤال اصلی، با او صحبت کنید. محتوای ذهنیِ هوش مصنوعی را آماده کنید. تصور کنید با دوستی حرف میزنید که هیچ پیشزمینهای ندارد؛ اول زمینهچینی میکنید، بعد سؤال را مطرح میکنید.
چطور کاری کنیم که هوش مصنوعی “عمیقتر” فکر کنه؟
✅ قبل از اینکه سوال اصلی رو بپرسی، مقدمه بده
✅ بهش نقش بده (مثل کارشناس، مشاور، برنامهنویس…)
✅ ازش بخواه اول سوال بپرسه
✅ محتوای ذهنیاش رو آماده کن، انگار داری به یه دوست تازهوارد موضوع رو توضیح میدی
امیدوارم این مطلب برات مفید بوده باشه 🌱
اگه سوالی داشتی توی کامنت بپرس یا برام بفرست، خوشحال میشم کمک کنم.
دیدگاهتان را بنویسید