مایکروسافت فی-3 به عنوان کوچکترین مدل هوش مصنوعی منبع باز این شرکت تا به امروز معرفی شده است
به گزارش مجله نجم
مایکروسافت روز سه شنبه Phi-3، کوچکترین مدل هوش مصنوعی زبانی (AI) خود را تا به امروز منتشر کرد. مدلهای کوچکتر هوش مصنوعی مهم هستند زیرا قابلیت اجرا بر روی گوشیهای هوشمند را دارند. آخرین مدل هوش مصنوعی جانشین Phi-2 است که در دسامبر 2023 منتشر شد و دارای پایگاه داده آموزشی بالاتر و پارامترهای بزرگتر است. افزایش پارامترها به مدل هوش مصنوعی کمک می کند تا سوالات پیچیده تری را نسبت به مدل قبلی خود درک کند و به آنها پاسخ دهد. همچنین ادعا می شود که با مدل هایی که بیش از 10 برابر تعداد پارامترهای استفاده شده در Phi-3 آموزش داده شده اند، برابری می کند.
یک مقاله پیش چاپ که جزئیات مدل زبان کوچک (SLM) را نشان می دهد در arXiv منتشر شده است. با این حال، از آنجایی که arXiv بررسی های همتا را انجام نمی دهد، ادعاها هنوز تأیید نشده اند. علاقه مندان به هوش مصنوعی می توانند مدل هوش مصنوعی را از طریق Azure و Ollama آزمایش کنند. کاتالوگ Hugging Face نیز برای Phi-3-mini ایجاد شده است اما وزنهای آن هنوز منتشر نشده است.
phi-3 اینجاست، و … خوب است :-).
من یک نسخه ی نمایشی کوتاه و سریع ساخته ام تا به شما ایده بدهم که Phi-3-mini (3.8B) چه کاری می تواند انجام دهد. منتظر وزنه های باز و اطلاعیه های بیشتر فردا صبح باشید!
(و این بدون جدول استانداردهای معمول کامل نخواهد بود!) pic.twitter.com/AWA7Km59rp
– سباستین بابک (@Sebastian Bobek) 23 آوریل 2024
از نظر عملکرد، مدل هوش مصنوعی بر روی 3.3 تریلیون نشانه آموزش داده می شود – واحدهای داده ای که شامل کلمات، عبارات یا زیربخشی از کلمات است که برای آموزش مدل هوش مصنوعی به سیستم داده می شود. همچنین شامل 3.8 میلیارد پارامتر است که سطح پیچیدگی قابل درک یک ربات چت را برجسته می کند. آنها اساساً اتصالات عصبی هستند که در آن هر نقطه دانشی در مورد یک موضوع خاص است و به بسیاری از نقاط دیگر که حاوی اطلاعات متنی برای نقطه اصلی هستند متصل است.
مایکروسافت – بر اساس معیارهای داخلی – ادعا می کند که این ربات با مدل هایی مانند Mixtral 8x7B و GPT-3.5 که بسیار بزرگتر از SML هستند رقابت می کند. هوش مصنوعی با قالب چت تراز شده است، به این معنی که می تواند به درخواست های چت پاسخ دهد. ما همچنین برخی از نتایج اولیه را برای اندازهگیری پارامترها با مدلهای 7B و 14B ارائه میدهیم که بر روی کدهای 4.8T آموزش داده شدهاند، به نامهای phi-3-small و phi-3-medium، که هر دو بسیار توانمندتر از Phi-3-mini هستند. غول فناوری می گوید.
رویترز گزارش می دهد که مدل هوش مصنوعی که برای انجام کارهای ساده تر طراحی شده است، در Microsoft Azure و Olama نیز میزبانی می شود. این شرکت هنوز جزئیاتی در مورد مجوز منبع باز Phi-3-mini به اشتراک نمی گذارد. نکته قابل توجه، مجوز آپاچی 2.0 که اخیرا توسط Grok AI منتشر شده است، امکان استفاده آکادمیک و تجاری را فراهم می کند.