تکنولوژی و فناوری

XAI ایلان ماسک از Grok 1.5 Vision AI در پیش نمایش برای رقابت با GPT-4 Vision و Gemini Pro 1.5 رونمایی کرد.

به گزارش مجله نجم

شرکت هوش مصنوعی (AI) ایلان ماسک از یک مدل هوش مصنوعی جدید با نام Grok 1.5 Vision رونمایی کرده است. این مدل زبان بزرگ (LLM) یک نسخه بهبود یافته از مدل اخیراً منتشر شده Grok 1.5 است. با این ارتقا، مدل AI اکنون مجهز به بینایی کامپیوتری شده است و باعث می شود رسانه های بصری را به عنوان ورودی بپذیرد. می تواند تصاویر را پردازش کند و به سوالات مربوط به آنها پاسخ دهد. شایان ذکر است، این اعلامیه چند روز پس از معرفی مدل بینایی کامپیوتری GPT-4 OpenAI منتشر شد.

این اعلامیه از طریق حساب رسمی X (که قبلاً توییتر نامیده می شد) برای xAI اعلام شد. این شرکت یک پست وبلاگی با جزئیات مدل جدید هوش مصنوعی به اشتراک گذاشت و برخی از نتایج معیار آن را به اشتراک گذاشت. از زمان اضافه شدن قابلیت‌های بینایی به مدل جدید Grok 1.5 که اخیراً معرفی شده است، بیشتر جزئیات ثابت مانده‌اند. این پنجره زمینه یکسانی با 128000 کاراکتر دارد و نتایج معیار کلی نیز احتمالاً ثابت باقی خواهند ماند.

xAI همچنین نتایج بنچمارک Grok 1.5 Vision را که در مقایسه با معیارهای توسعه یافته توسط این شرکت آزمایش شده است، به اشتراک گذاشت. شرکت هوش مصنوعی آن را RealWorldQA می نامد و “درک فضایی دنیای واقعی” را اندازه گیری می کند. این مدل همچنین در بسیاری از معیارهای دیگر مانند MMMU، Mathvista، ChartQA و غیره آزمایش شده است. در حالی که Grok در RealWorldQA از OpenAI’s GPT-4 با Vision و Gemini 1.5 Pro بهتر عمل کرد، در MMMU و ChartQA امتیاز کمتری گرفت.

بینایی کامپیوتر شاخه‌ای از علوم رایانه است که با تجهیز رایانه‌ها (و مدل‌های هوش مصنوعی) به توانایی شناسایی و درک اشیاء در دنیای واقعی با استفاده از تصاویر و ویدیوها سروکار دارد. این برای کمک به کامپیوترها طراحی شده است که سیگنال های بصری را به روشی که انسان انجام می دهد، ببیند و پردازش کند. با ظهور مدل‌های هوش مصنوعی چندوجهی، بسیاری از شرکت‌ها اکنون بر روی توسعه مدل‌های متمرکز بر بینایی تمرکز کرده‌اند. Google Gemini 1.5 Pro و OpenAI’s GPT-4 with Vision هر دو این قابلیت را دارند.

این فناوری همچنین طیف گسترده ای از کاربردها را ارائه می دهد. پلتفرم ردیابی کالری و بازخورد تغذیه هندی Healthify اخیراً یک ویژگی به نام Snap اضافه کرده است که در آن کاربران می‌توانند روی عکس یک غذا یا غذا کلیک کنند، و GPT-4 با چت ربات مبتنی بر هوش مصنوعی خود نشان می‌دهد که چگونه می‌توان یک دستور غذا را سالم‌تر کرد. و چقدر خوب کار خواهد کرد ورزش هایی که فرد باید انجام دهد تا کالری اضافی بسوزاند. در آینده، مدل‌های هوش مصنوعی با بینایی کامپیوتری می‌توانند به تشخیص بیماری‌ها، ساخت خودروهای خودران و موارد دیگر کمک کنند.


پیوندهای وابسته ممکن است به طور خودکار ایجاد شوند – برای جزئیات به بیانیه اخلاقی ما مراجعه کنید.

نظرات

برای آخرین اخبار و بررسی‌های فنی، Gadgets 360 را دنبال کنید ایکسفیس بوک، واتس اپ، موضوعات و اخبار گوگل. برای آخرین ویدیوها در مورد ابزارها و فناوری، در کانال YouTube ما مشترک شوید. اگر می خواهید همه چیز را در مورد تأثیرگذاران برتر بدانید، Who’sThat360 داخلی ما را در اینستاگرام و یوتیوب دنبال کنید.

Square Enix قصد دارد تا سال 2027 سومین بازی از این سه گانه را با نام Final Fantasy 7 Remake منتشر کند.


طبق گزارش IDC، اپل در حال از دست دادن جایگاه خود به عنوان بهترین سازنده گوشی در برابر سامسونگ است، زیرا عرضه آیفون کاهش می یابد

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا