بررسی هوش مصنوعی گروک (Grok)؛ بهترین دستیار هوشمند برای گیمرها و بازی Baldur’s Gate
گزارش جدیدی از وبسایت بیزنس اینسایدر (Business Insider) فاش کرده که شرکت xAI عرضه یکی از مدلهای هوش مصنوعی «گروک» (Grok) را چندین روز به تأخیر انداخت؛ فقط به این دلیل که ایلان ماسک از نحوه پاسخگویی این چتبات به سوالات مربوط به بازی ویدئویی Baldur’s Gate ناراضی بود. او حتی مهندسان سطح بالای شرکت را از پروژههای دیگر کنار کشید تا این مشکل را حل کنند.
تککرانچ برای بررسی این موضوع، یک آزمون مقایسهای غیررسمی (که نام آن را BaldurBench گذاشتیم) راه انداخت تا عملکرد گروک را با رقبای اصلیاش یعنی مدل o1 شرکت OpenAI و مدل Claude 3.5 Sonnet شرکت آنتروپیک مقایسه کند.
چرا بازی Baldur’s Gate برای ایلان ماسک اینقدر مهم است؟
ظاهراً ایلان ماسک شخصاً به این بازی نقشآفرینی (RPG) که برنده جایزه بهترین بازی سال شده، علاقه زیادی دارد. طبق گزارشها، وقتی او متوجه شد که گروک نمیتواند راهنماییهای دقیقی درباره ماموریتها (Questها) یا جزئیات فنی بازی ارائه دهد، دستور توقف انتشار مدل را صادر کرد.
این موضوع نشاندهنده سبک مدیریتی خاص ماسک است که در آن سلیقه شخصی و علایق او میتواند مستقیماً اولویتهای مهندسی یک شرکت هوش مصنوعی چند میلیارد دلاری را تغییر دهد.
نتایج آزمون BaldurBench: گروک در مقابل رقبا
ما سوالات پیچیدهای درباره استراتژیهای نبرد و جزئیات داستانی Baldur’s Gate 3 از هر سه مدل پرسیدیم. در ادامه نتایج این بررسی را میبینید:
-
گروک (xAI): در نسخه جدید، گروک واقعاً درخشید. پاسخهای او شامل جزئیات بسیار دقیقی از مکانهای مخفی در بازی و بهترین ترکیب جادوها برای شکست دادن غولهای (Boss) سخت بود. به نظر میرسد آن روزهایی که مهندسان روی این موضوع وقت گذاشتند، نتیجه داده است.
-
مدل o1 (OpenAI): این مدل پاسخهای بسیار منطقی و ساختاریافتهای داد، اما گاهی در بیان جزئیات خیلی ظریف بازی (که فقط یک بازیکن حرفهای میداند) کمی کلیگویی میکرد.
-
مدل Claude 3.5 Sonnet (Anthropic): کلود در روایت داستان و توضیح شخصیتها عالی بود، اما در ارائه آمار دقیقِ اسلحهها کمی از گروک عقب ماند.
تمرکز بر گیمینگ؛ استراتژی جدید یا سرگرمی شخصی؟
در حالی که شرکتهایی مثل OpenAI روی کاربردهای عمومی و سازمانی تمرکز کردهاند، xAI با این حرکت نشان داد که شاید میخواهد در حوزه سرگرمی و راهنمای تخصصی بازیها جای پای محکمی برای خود بسازد.
البته منتقدان میگویند صرف کردن وقت باارزش مهندسان نخبه برای اصلاح پاسخهای یک بازی ویدئویی، ممکن است سرعت پیشرفت xAI را در زمینههای حیاتیتر مثل ایمنی هوش مصنوعی یا پردازش زبانهای پیچیده کند کند. اما برای طرفداران Baldur’s Gate، این یک خبر فوقالعاده است؛ چون حالا یک رفیق هوشمند دارند که تمام سوراخسمبههای بازی را بلد است.
نتیجهگیری
تلاش اخیر xAI نشان داد که گروک حالا یکی از بهترین هوش مصنوعیها برای گیمرهاست. اگرچه این پیشرفت حاصل یک وسواس شخصی از طرف ایلان ماسک بوده، اما خروجی نهایی، چتباتی است که اطلاعات بسیار دقیقی در حوزههای خاص (مثل همین بازی) دارد. باید دید آیا در آینده ایلان ماسک روی بازیهای دیگری هم حساس میشود یا خیر!