کدوم مدل زبانی برای فارسی بهتره؟ همانطور که برای انجام هر کاری ابزار مناسب آن وجود دارد، در دنیای هوش مصنوعی نیز با دو دسته اصلی از مدلهای زبانی روبرو هستیم: مدلهای پولی (تجاری) که توسط شرکتهای بزرگ ارائه میشوند و مدلهای متنباز (Open-Source) که رایگان هستند و میتوان آنها را به صورت محلی اجرا کرد.
هدف این راهنما، کمک به درک تفاوتهای کلیدی این دو رویکرد است، بهویژه در عملکرد آنها برای زبان فارسی. در این مسیر، از مدلهایی مانند «کلاد» (Claude) به عنوان نماینده مدلهای پولی و «درنا» (Dorna) به عنوان نماینده مدلهای متنباز استفاده خواهیم کرد تا مقایسهای ملموس داشته باشیم.
بیایید ابتدا با دسته اول، یعنی مدلهای قدرتمند پولی و تجاری، آشنا شویم که برای زبان فارسی بهتر عمل میکنند.
آشنایی با مدلهای پولی (تجاری) برای زبان فارسی
مدلهای پولی یا تجاری، سرویسهای هوش مصنوعی پیشرفتهای هستند که توسط شرکتهای بزرگ فناوری توسعه داده شدهاند. این مدلها معمولاً از طریق اینترنت و با استفاده از یک رابط برنامهنویسی کاربردی (API) در دسترس قرار میگیرند و برای استفاده از قابلیتهای کامل آنها نیاز به پرداخت هزینه است.
بر اساس متن منبع، سه مدل اصلی که برای زبان فارسی مورد آزمایش قرار گرفتهاند عبارتند از:
• Claude 3.5 Sonnet (محصول شرکت Anthropic)
• ChatGPT (GPT-4) (محصول شرکت OpenAI، در نسخه رایگان تستشده)
• Gemini 1.5 Pro (محصول شرکت Google)
بر اساس نتایج تستهای انجام شده، Claude 3.5 Sonnet در وظایف نیازمند به دقت بالا، مانند شمارش دقیق کلمات و حروف، بهترین عملکرد را از خود نشان داد. از سوی دیگر، ChatGPT با قابلیت دسترسی زنده به اینترنت برای دریافت اطلاعات بهروز، از رقبای خود متمایز شد.
اما دنیای هوش مصنوعی تنها به این سرویسهای تجاری محدود نمیشود. رویکرد دیگری نیز وجود دارد که قدرت را مستقیماً در دستان کاربران قرار میدهد: مدلهای متنباز.
قدرت در دستان شما: مدلهای متنباز (Open-Source) برای زبان فارسی
مدلهای متنباز (Open-Source) فلسفه متفاوتی دارند. کد و ساختار این مدلها به صورت عمومی در دسترس است و هر کسی میتواند از آنها استفاده، آنها را ویرایش یا بر اساس نیاز خود سفارشیسازی کند. بر اساس متن منبع، دو مزیت کلیدی آنها عبارتند از:
• رایگان بودن: این مدلها بدون نیاز به پرداخت هزینه اشتراک یا API قابل استفاده هستند.
• استفاده محلی (Local): مهمترین ویژگی این مدلها، قابلیت اجرای آنها روی کامپیوتر شخصی است. این ویژگی به معنای عدم نیاز به اینترنت پایدار و API است که برای کاربران ایرانی یک مزیت بزرگ محسوب میشود.
در تستهای انجام شده، چندین مدل متنباز مطرح مانند Gemma و Qwen ارزیابی شدند، اما تمرکز ما بر روی یک نمونه برجسته ایرانی یعنی مدل «درنا» (Dorna) خواهد بود. این مدل که توسط «مرکز تحقیقات هوش مصنوعی پارت» توسعه یافته، به طور خاص برای زبان فارسی و بر پایه مدل قدرتمند Llama 3.1 آموزش دیده است. نامگذاری جالب مدلهای این شرکت (مانند درنا و توکا که نام پرندگان ایرانی هستند) نیز نشان از توجه و خلاقیت تیم سازنده دارد.
حال که با هر دو دسته آشنا شدیم، زمان آن رسیده که آنها را در یک آزمون عملی رو در روی یکدیگر قرار دهیم.
مقایسه رو در رو: کدام مدل در زبان فارسی بهتر عمل میکند؟
برای ارزیابی عملکرد این دو دسته، نتایج تستهای انجام شده در منبع را در جدول زیر خلاصه کردهایم:
| معیار تست | عملکرد مدلهای پولی (مانند Claude) | عملکرد مدلهای متنباز تستشده (Dorna و دیگران) |
| درک ضربالمثل فارسی | معنی ضربالمثل را به طور دقیق و عمیق، همراه با مثالهای کاربردی توضیح دادند. | مدل Dorna درک کاملی از مفهوم ضربالمثل نداشت و توضیحات آن سطحی بود. |
| خلاقیت (شعر به سبک فردوسی) | توانستند سبک شعری فردوسی را با مفهوم مدرن «استارتآپ» به خوبی تلفیق کرده و شعری خلاقانه بسرایند. | عملکرد بسیار ضعیفی داشتند، هرچند مدل Qwen تلاشی نسبتاً بهتر (اما همچنان ناموفق) در ایجاد قافیه و ساختار داشت. |
| دقت و منطق (شمارش کلمات و معمای پیراهنها) | مدل Claude با شمارش دقیق ۱۸۳ از ۱۸۳ کلمه، عملکردی بینقص داشت، در حالی که GPT-4 با شمارش ۱۵۳ کلمه، خطای قابل توجهی نشان داد. هر سه مدل معمای منطقی را به درستی حل کردند. | تمام مدلهای متنباز در شمارش کلمات اشتباه کردند. در معمای منطقی، مدل Dorna شکست خورد و پاسخ کاملاً اشتباهی ارائه داد، اما مدلهای دیگر مانند Qwen و Gemma آن را به درستی حل کردند. |
| دسترسی و هزینه | نیازمند اتصال به اینترنت، استفاده از API و پرداخت هزینه هستند. | کاملاً رایگان هستند و میتوانند به صورت محلی (بدون اینترنت) روی کامپیوتر شخصی اجرا شوند. |
نتایج این مقایسه به وضوح نشان میدهد که هر دسته از مدلها نقاط قوت و ضعف خاص خود را دارند. این تفاوتها ما را به جمعبندی نهایی میرساند.
نتیجهگیری: کدام هوش مصنوعی برای شما مناسب است؟
انتخاب بین مدلهای پولی و متنباز به نیاز و هدف شما بستگی دارد. بر اساس تحلیل انجام شده، میتوان دو سناریوی اصلی را در نظر گرفت:
1. برای بالاترین کیفیت و دقت: اگر به دنبال بالاترین سطح از دقت، درک عمیق زبان فارسی، خلاقیت و توانایی حل مسائل پیچیده هستید، در حال حاضر مدلهای پولی بهترین گزینه هستند. در میان آنها، Claude 3.5 Sonnet عملکردی برجسته از خود به نمایش گذاشته است.
2. برای یادگیری، آزمایش و استفاده محلی: مدلهای متنباز مانند Dorna گزینههای عالی برای دانشجویان، محققان و توسعهدهندگانی هستند که میخواهند بدون هزینه و نیاز به اینترنت با هوش مصنوعی کار کنند. اگرچه عملکرد آنها هنوز به سطح مدلهای تجاری نرسیده، اما برای یادگیری، آزمایش و پروژههایی که حریم خصوصی و دسترسی محلی در اولویت است، انتخابی ایدهآل به شمار میروند.
مهم است به یاد داشته باشیم که حوزه هوش مصنوعی فارسی با سرعت فوقالعادهای در حال پیشرفت است. پروژههایی مانند «درنا» قدمهای بسیار مهم و امیدوارکنندهای در این مسیر هستند و نشان میدهند که آینده روشنی در انتظار مدلهای بومی و متنباز فارسی است.