XAI ایلان ماسک از Grok 1.5 Vision AI در پیش نمایش برای رقابت با GPT-4 Vision و Gemini Pro 1.5 رونمایی کرد.
به گزارش مجله نجم
شرکت هوش مصنوعی (AI) ایلان ماسک از یک مدل هوش مصنوعی جدید با نام Grok 1.5 Vision رونمایی کرده است. این مدل زبان بزرگ (LLM) یک نسخه بهبود یافته از مدل اخیراً منتشر شده Grok 1.5 است. با این ارتقا، مدل AI اکنون مجهز به بینایی کامپیوتری شده است و باعث می شود رسانه های بصری را به عنوان ورودی بپذیرد. می تواند تصاویر را پردازش کند و به سوالات مربوط به آنها پاسخ دهد. شایان ذکر است، این اعلامیه چند روز پس از معرفی مدل بینایی کامپیوتری GPT-4 OpenAI منتشر شد.
این اعلامیه از طریق حساب رسمی X (که قبلاً توییتر نامیده می شد) برای xAI اعلام شد. این شرکت یک پست وبلاگی با جزئیات مدل جدید هوش مصنوعی به اشتراک گذاشت و برخی از نتایج معیار آن را به اشتراک گذاشت. از زمان اضافه شدن قابلیتهای بینایی به مدل جدید Grok 1.5 که اخیراً معرفی شده است، بیشتر جزئیات ثابت ماندهاند. این پنجره زمینه یکسانی با 128000 کاراکتر دارد و نتایج معیار کلی نیز احتمالاً ثابت باقی خواهند ماند.
xAI همچنین نتایج بنچمارک Grok 1.5 Vision را که در مقایسه با معیارهای توسعه یافته توسط این شرکت آزمایش شده است، به اشتراک گذاشت. شرکت هوش مصنوعی آن را RealWorldQA می نامد و “درک فضایی دنیای واقعی” را اندازه گیری می کند. این مدل همچنین در بسیاری از معیارهای دیگر مانند MMMU، Mathvista، ChartQA و غیره آزمایش شده است. در حالی که Grok در RealWorldQA از OpenAI’s GPT-4 با Vision و Gemini 1.5 Pro بهتر عمل کرد، در MMMU و ChartQA امتیاز کمتری گرفت.
بینایی کامپیوتر شاخهای از علوم رایانه است که با تجهیز رایانهها (و مدلهای هوش مصنوعی) به توانایی شناسایی و درک اشیاء در دنیای واقعی با استفاده از تصاویر و ویدیوها سروکار دارد. این برای کمک به کامپیوترها طراحی شده است که سیگنال های بصری را به روشی که انسان انجام می دهد، ببیند و پردازش کند. با ظهور مدلهای هوش مصنوعی چندوجهی، بسیاری از شرکتها اکنون بر روی توسعه مدلهای متمرکز بر بینایی تمرکز کردهاند. Google Gemini 1.5 Pro و OpenAI’s GPT-4 with Vision هر دو این قابلیت را دارند.
این فناوری همچنین طیف گسترده ای از کاربردها را ارائه می دهد. پلتفرم ردیابی کالری و بازخورد تغذیه هندی Healthify اخیراً یک ویژگی به نام Snap اضافه کرده است که در آن کاربران میتوانند روی عکس یک غذا یا غذا کلیک کنند، و GPT-4 با چت ربات مبتنی بر هوش مصنوعی خود نشان میدهد که چگونه میتوان یک دستور غذا را سالمتر کرد. و چقدر خوب کار خواهد کرد ورزش هایی که فرد باید انجام دهد تا کالری اضافی بسوزاند. در آینده، مدلهای هوش مصنوعی با بینایی کامپیوتری میتوانند به تشخیص بیماریها، ساخت خودروهای خودران و موارد دیگر کمک کنند.
نظرات
برای آخرین اخبار و بررسیهای فنی، Gadgets 360 را دنبال کنید ایکسفیس بوک، واتس اپ، موضوعات و اخبار گوگل. برای آخرین ویدیوها در مورد ابزارها و فناوری، در کانال YouTube ما مشترک شوید. اگر می خواهید همه چیز را در مورد تأثیرگذاران برتر بدانید، Who’sThat360 داخلی ما را در اینستاگرام و یوتیوب دنبال کنید.
Square Enix قصد دارد تا سال 2027 سومین بازی از این سه گانه را با نام Final Fantasy 7 Remake منتشر کند.
طبق گزارش IDC، اپل در حال از دست دادن جایگاه خود به عنوان بهترین سازنده گوشی در برابر سامسونگ است، زیرا عرضه آیفون کاهش می یابد