Baidu غول تکنولوژی چین، چت بات مبتنی بر هوش مصنوعی خود به نام ERNIE را در پاسخ به ChatGPT منتشر کرده است. نظرات متفاوتی در رابطه با هوش مصنوعی Ernie Bot ثبت گردیده اما زمان زیادی از ارائه این چت بات هوشمند نگذشته و شاید هنوز برای قضاوت زود باشد.
تصویر(1)
چت بات شرکت Baidu بر مبنای Large Language Model که از سوی همین کمپانی با نام ERNIE ارائه شده، توسعه یافته است. Large Language Model یا LLM، نوعی از الگوریتم یادگیری عمیق میباشد که بر اساس دانش کسب شده از مجموعه دادههای عظیم، توانایی تشخیص دادن، خلاصهنویسی، ترجمه، پیشبینی، تولید محتوای متنی و سایر محتواها را دارد. شرکت Baidu در سال 2019 مدل LLM خود را معرفی نمود و همانند گوگل BERT، از اختصار حروف برای نامگذاری آن استفاده کرد. LLM شرکت گوگل Bidirectional Encoder Representations from Transformers یا به اختصار BERT نام دارد. LLM شرکت Baidu نیز Enhanced Representation through kNowledge IntEgration یا به اختصار ERNIE نامگذاری شده است. هر دو LLM، بر مبنای الگوریتم transformer به روش یادگیری ماشین بدون ناظر آموزش دیده اند. از طرف دیگر، شرکت OpenAI با سرمایه گذاری در بخش پیش آموزش (pre-training) و انتشار عمومی چت بات مبتنی بر این مدل یعنی ChatGPT، مدل LLM خود را منتشر نموده است.
مطالب بسیار زیادی پیرامون هوش مصنوعی Ernie Bot و ضعفهای آن در مقایسه با GPT-4 یا ChatGPT در حال انتشار میباشد اما احتمالا این شکاف بین مدلها کاهش خواهد یافت. در کاهش این فاصله بین چت باتها، دانش فنی مطرح نخواهد بود بلکه میزان اختصاص بودجه و جمع آوری دادهها، ملاک میباشد.
هوش مصنوعی Ernie Bot روی تصاحب بزرگترین بازار جهان متمرکز شده است، جایی که OpenAI به آن دسترسی ندارد (دولت چین دسترسی به ChatGPT را مسدود نموده است). بر اساس پیشبینی Robin Li، یکی از بنیانگذاران و مدیرعامل شرکت Baidu، اکوسیستم ERNIE موجب ظهور اپلیکیشنهایی تا 10 برابر قویتر از WeChat و Douyin خواهد شد. الگوریتم transformer در سال 2017 منتشر شد و محققان به میزان کارایی آن پی بردند. این الگوریتم موجب رشد Large Language Model ها شد. BERT گوگل، اولین نمونه استفاده موفق از LLM ها بود.
تصویر(2)
اما شرکت OpenAI این ریسک را پذیرفت که مدل خود را در معرض شرایطی فراتر از هر آنچه که قبلا امتحان شده بود، قرار دهد. این شرکت به صورت رسمی هزینه پرداخت شده برای انجام این ریسک را اعلام نکرده است. شرکت مایکروسافت طی دو مرحله مبالغ 1 و 2 میلیارد دلاری را در این شرکت سرمایه گذاری نمود تا OpenAI قدرت محاسباتی مورد نیاز برای افزایش مقیاس پذیری مدل خود را به دست آورد. سایر شرکتهای بزرگ دنیا صرفا نظارهگر بودند. البته اکنون تمامی آنها از نتیجه و میزان موفقیت به دست آمده، شگفت زده شدهاند.
طبیعتا شرکت های Google و Baidu نیز پس از مشاهده سرمایهگذاری موفقیتآمیز مایکروسافت در OpenAI، راه خود را با قدرت ادامه میدهند. فضای هوش مصنوعی و چت بات ها، به سرعت در حال رشد و تغییر است. لذا نباید کاستیهای فعلی مدلهای Google و Baidu در مقایسه با GPT-4 را به عنوان یک نتیجه نهایی در نظر گرفت.
تصویر(3)
چینی ها از نظر حجم محتوای موجود برای آموزش چت بات خود محدودیت دارند. محتوای موجود در اینترنت تحت زبان چینی در مقایسه با محتوای انگلیسی بسیار ناچیز است. برخی بر این باور هستند که جو سیاسی حاکم بر چین نیز از رشد و پیشرفت نوآوریهایی مانند LLM جلوگیری میکند. با این حال، تاثیر این محدودیتهای حکومتی نیز مانند محدودیتهای فرهنگی و قانونی غرب که روی GPT-4 اعمال شده است، هنوز به صورت کامل مشخص نمیباشد.
LLM های آمریکایی نیز دارای سانسور و محدودیت هستند. به عنوان مثال اگر مطالب و سوالات مرتبط با بزرگسالان از ChatGPT پرسیده شود، احتمالا این چت بات از پاسخ به آنها خودداری خواهد نمود. فرایند پردازش و سانسور محتوای تولید شده، از بزرگترین چالشهای شرکتهای توسعه دهنده هوش مصنوعی میباشد. شرکت Baidu سالها تحت قوانین دولت چین اقدام به ارائه موتور جستجو و سایر خدمات نموده که تجربیات ارزشمندی نیز کسب کرده است.
Baidu اولین شرکت چینی میباشد که چت بات مبتنی بر LLM خود را به صورت عمومی عرضه کرده است اما LLM ها دیگری نیز در این کشور توسعه داده شدهاند. از مشهورترین آن ها میتوان به موارد زیر اشاره نمود:
- Alibaba M6 جهت پردازش زبان طبیعی چینی بهینه شده است. M6 شرکت Alibaba در دسته بندی متون، تجزیه و تحلیل احساسات و پاسخگویی به سوالات، عملکرد خوبی دارد. از طرف دیگر، در مقایسه با BERT شرکت گوگل، Alibaba M6 از منابع پردازشی کمتری نیز استفاده مینماید. این شرکت در حال کار روی چت بات مبتنی بر LLM میباشد.
- Tencent's Hunyuan model برای ترجمه با کیفیت زبان چینی به انگلیسی و بالعکس طراحی شده است. این مدل، به صورت موازی توسط مجموعههای عظیم متن آموزش داده شده و تمرکز آن روی بهبود دقت ترجمه و روان بودن متن میباشد. شرکت Tencent نیز در حال کار روی چت بات هوشمند مبتنی بر مدل LLM خود است.
- گروه مهندسی دانشگاه Tsinghua پروژه GLM-130B خود را به صورت متن باز منتشر نموده است. GLM-130B یک LLM چینی و انگلیسی pre-trained یا "از پیش آموزش دیده" میباشد. این مدل دقت بالایی در حل چالش های کوچک دارد.
تصویر(4)
- آکادمی هوش مصنوعی Beijing نیز LLM خود را با نام WuDao توسط بیش از یک تریلیون پارامتر و ترکیبی از معماری های پیشرفته، ساخته است. رویکرد WuDao با LLM های رایج تفاوت دارد. علیرغم اینکه WuDao جهت فعالیت به صورت چتبات طراحی نشده است اما میتواند همانند انسانها به تولید متن، ترجمه زبانها و ایجاد تصاویر بپردازد.
اما هوش مصنوعی Ernie Bot به دلیل دانش بیشتر و قابلیت تولید محتوای مبتنی بر چندین مدل، از سایر رقبای چینی خود متمایز میباشد. این چت بات بر اساس مدل ERNIE و مدل گفتگوی از پیش آموزشدیده PLATO شرکت Baidu، ساخته شده است.
تصویر(5)
چت بات ERNIE میتواند متن، تصویر، صدا و ویدیو را در پاسخ به متن ارسالی کاربر، ایجاد نماید. این چت بات حتی قادر به ارائه صدا در چند گویش محلی مانند زبان بومی سیچوان نیز میباشد. قابلیت تولید ویدیو این چت بات، به دلیل هزینه بالا برای اکثر کاربران ERNIE در دسترس نیست. یکی از ویژگی های شاخص هوش مصنوعی Ernie Bot، استفاده از دو روش جهت بهبود گراف دانش است:
- داخلی سازی دانش (Knowledge internalization)
- استفاده از دانش خارجی (external utilization)
به فرایند ترکیب دانش و تجربیات قبلی با مدل آموزش، داخلی سازی دانش گفته میشود. از طرف دیگر، استفاده از دانش خارجی، معادل به کارگیری منابعی همچون دیتابیسهای آنلاین و پایگاههای دانش (wiki و ontologies) جهت افزایش درک مدل میباشد.
تصویر(6)
علاوه بر این، چت بات ERNIE از معماری نسل جدید جستجوگرها که دارای درک و تطبیق معنایی است، بهره میبرد. این معماری به چت بات ERNIE توانایی درک بهتر درخواست کاربر جهت ارائه پاسخ های دقیقتر را میدهد. این معماری جستجو با مدل بهبود گراف دانش ERNIE ادغام شده و از طریق رجوع به منابع دانش خارجی، میتواند پاسخهای دقیق و جامعتری را ارائه نماید.
جمع بندی
Baidu از معدود شرکتهای بزرگ در دنیا است که مجموعه کاملی از ابزارها را ارائه مینماید. از چیپ های هوش مصنوعی Kunlun گرفته تا مدل یادگیری عمیق PaddlePaddle، LLM و تعداد بسیاری از نرم افزارها، همگی به صورت اختصاصی توسط شرکت Baidu طراحی و پیاده سازی شدهاند. این شرکت فناوریهای زیادی را توسعه داده و با ایجاد ارتباط بین لایه های مختلف، بستر رشد و بهینهسازی را به صورت کامل فراهم کرده است.
اگرچه هوش مصنوعی Ernie Bot فقط برای گروه محدودی از کاربران در دسترس میباشد اما بیش از یک میلیون نفر در صف دسترسی به آن قرار دارند. Baidu دسترسی به API چت بات ERNIE را توسط Baidu AI Cloud فراهم کرده است. بنابراین، سازمانها میتوانند از قابلیتهای پیشرفته این چت بات استفاده نمایند. بر اساس آمار ارائه شده از سوی Baidu، بیش از 100000 سازمان درخواست استفاده از API بات ERNIE را ثبت نمودهاند.