گوگل تا حدی توانایی درک متن را دارد. یکی از مهمترین کارهای گوگل، انطباق آنچه که کاربر در نوار جستجو تایپ میکند با نتایج مرتبط است. تنها با تکیه بر نشانههای کاربر (مانند میزان کلیک و نرخ پرش صفحه)، گوگل نمیتواند به درستی این کار را انجام دهد. علاوه بر این، کسب رتبه بالا برای کلمه کلیدی که اصلاً در متن شما به کار نرفته است، امکانپذیر می باشد، هرچند که شناسایی و استفاده از یک یا چند کلمه کلیدی خاص، همچنان روشی بهینه محسوب میشود. بنابراین، کاملاً واضح است که گوگل به روشی خاص، متن شما را میخواند و ارزیابی میکند.
تصویر(1)
نحوه درک متن توسط گوگل
جزئیات این موضوع مشخص نیست و هیچ کس از آن اطلاع ندارد. متاسفانه، این اطلاعات به صورت عمومی در دسترس نمی باشد. همچنین همانطور که می دانید درک متن توسط گوگل دائما در حال بهبود است. با این حال، سرنخهایی وجود دارد که میتوان از آنها نتیجهگیری خوبی انجام داد.
همانطور که می دانید، درک متن توسط گوگل پیشرفتهای قابل توجهی داشته است. همچنین این موتور جستجو سعی میکند نحوه ارتباط کلمات و مفاهیم با یکدیگر را تشخیص دهد. این اطلاعات با پیگیری اخبار مربوط به الگوریتمهای گوگل و بررسی چگونگی تغییر صفحات نتایج جستجو به دست آمده است.
جاسازی کلمه (Word Embedding)
یکی از تکنیکهای جالب که گوگل روی آن کار کرده است، «word embedding» نامیده میشود. هدف این است که ارتباط نزدیک بین کلمات مشخص گردد.
برنامه کامپیوتری با حجم مشخصی از متن تغذیه میشود. سپس این برنامه کلمات موجود در متن را تحلیل کرده و تعیین میکند که کدام کلمات به همراه یکدیگر ظاهر می شوند. در نهایت، هر کلمه به یک سری اعداد ترجمه خواهد شد. این کار به کلمات اجازه میدهد تا مانند یک نمودار نمایش داده شوند. این نمودار نشان میدهد که کدام کلمات و به چه روشی با هم مرتبط هستند.
برای مثال، کلمهای مانند «کلمات کلیدی» به «کپیرایتینگ» تا مثلاً «لوازم آشپزخانه» بسیار نزدیکتر است.
این کار را میتوان برای عبارات، جملات و پاراگرافها نیز انجام داد. هرچه حجم دادهای که به برنامه میدهید بیشتر باشد، بهتر میتواند کلمات را دستهبندی و درک کند. گوگل پایگاه داده ای از کل اینترنت دارد. با چنین مجموعه دادهای، میتوان مدلهای بسیار قابل اطمینانی ایجاد کرد که ارزش متن و محتوا را پیشبینی و ارزیابی میکنند.
موجودیتهای مرتبط (Related Entities)
با درک "word embedding"، رسیدن به مفهوم "Related Entities" بسیار آسان است. با نگاهی به نتایج جستجو، مفهوم موجودیتهای مرتبط توضیح داده می شود. اگر عبارت "types of pasta" را تایپ کنید، در بالای صفحه نتایج جستجو (SERP) با عنوان "types of pasta" و چندین rich results مواجه خواهید شد که شامل انبوهی از انواع مختلف پاستا است. این انواع پاستا حتی به زیرمجموعههایی مانند "پاستای نواری"، "پاستای لوله ای" و سایر زیرمجموعههای پاستا تقسیمبندی میشوند. بسیاری از صفحات نتایج جستجوی مشابه وجود دارند که نشان میدهند کلمات و مفاهیم چگونه به هم مرتبط هستند.
تصویر(2)
گوگل برای مفهوم "Related Entities" ثبت اختراع کرده است. این ثبت اختراع در واقع به پایگاه داده شاخص Related Entities اشاره میکند. این پایگاه داده، مفاهیم یا موجودیتهایی مانند "پاستا" را ذخیره می نماید که دارای ویژگیهایی هستند. برای مثال، لازانیا یک پاستا است، از خمیر درست میشود و یک غذا می باشد.
حال با تحلیل ویژگیهای موجودیتها، میتوان آنها را به روشهای مختلفی گروهبندی و دستهبندی کرد. این کار به گوگل امکان میدهد تا ارتباط کلمات با یکدیگر و در نتیجه، محتوا را درک کند.
گوگل به شدت روی پردازش زبان طبیعی (NLP) سرمایهگذاری کرده است
پردازش زبان طبیعی به درک زبان توسط ماشینها گفته میشود. این حوزه یکی از سختترین بخشهای علوم کامپیوتر است و هم اکنون بیشترین پیشرفتها در همین زمینه صورت میگیرد. امروزه، با جهانی که به طور فزایندهای تحت کنترل سیستمهای مبتنی بر هوش مصنوعی (AI) قرار دارد، درک صحیح زبان، امری کلیدی است. گوگل این موضوع را درک میکند و سرمایهگذاری زیادی روی توسعه مدلهای NLP انجام میدهد.
یکی از سیستمهای کلیدی، مدل BERT بود. این مدل میتوانست متن بعد و قبل از کلمات کلیدی را درک کند. بدین ترتیب، سیستم کل متن جمله را در اختیار داشت تا معنای آن را به درستی استخراج نماید. کاری که BERT انجام داد فوقالعاده بود اما گوگل فراتر از آن عمل میکند.
MUM: مدل زبان گوگل
در سال ۲۰۲۱، گوگل مدل زبان جدیدی به نام MUM را معرفی کرد که توانایی انجام چند کار همزمان را دارد، به این معنی که میتواند متن را بخواند، معنای آن را درک کند، دانش عمیقتری در مورد موضوع به دست آورد، از سایر رسانهها برای غنیسازی آن دانش استفاده نماید و تمامی آنها را به محتوایی ترجمه کند که پاسخ پرسشهای پیچیده را بدهد.
تصویر(3)
آیا ظهور هوش مصنوعی همه چیز را تغییر میدهد؟
طی سال گذشته، جهان شاهد پیشرفتهای زیادی در زمینه هوش مصنوعی (AI) بود. طبیعتاً گوگل نمیتوانست از این قافله عقب بماند و مجموعه ابزارهای خود از جمله مدل هوش مصنوعی Gemini را معرفی کرد. اخیراً آنها قابلیت «بررسی اجمالی هوش مصنوعی» را در موتور جستجوی خود معرفی کردهاند اما مدلهای پردازش زبان طبیعی (NLP) زمانی که در حال توسعه قابلیتهای هوش مصنوعی هستید، بسیار مفید واقع میشوند. بنابراین، تحقیقات مداوم گوگل درباره پردازش زبان طبیعی و یادگیری ماشین به این زودیها متوقف نخواهد شد.
نتیجهگیریهای کاربردی
با این اوصاف، گوگل دقیقاً چگونه متن را درک میکند؟ اطلاعات کسب شده به دو نکته بسیار مهم منجر میشود:
۱. متن یا context اهمیت کلیدی دارد:
اگر گوگل متن را درک کند، به ارزیابی و قضاوت آن نیز میپردازد. هرچه محتوای شما با درک گوگل از متن مطابقت داشته باشد، احتمال کسب رتبه بهتر آن بیشتر میشود. بنابراین، محتوای ضعیف و سطحی، در رتبه پایینتر قرار خواهد گرفت. همچنین، پوشش مفاهیم مرتبط و ارائه مجموعهای کامل از محتوا در وبسایت، اعتبار (authority) شما را در زمینه موضوعی که درباره آن مینویسید و تخصص دارید، تقویت میکند.
۲. برای مخاطب خود بنویسید:
متنهایی که به راحتی قابل خواندن هستند و روابط بین مفاهیم را به خوبی نشان میدهند، نه تنها به نفع خوانندگان شما خواهند بود بلکه به گوگل نیز کمک میکنند. درک متون دشوار، نامنسجم و ضعیف از نظر ساختار، هم برای انسان و هم ماشین سختتر است. میتوانید با تمرکز بر موارد زیر به موتور جستجو در درک متون خود کمک نمایید:
- خوانایی (Readability): خواندن متن خود را تا حد امکان آسان کنید، بدون اینکه در محتوا تغییرات زیادی ایجاد نمایید.
- ساختار مناسب: با افزودن زیرعنوانهای واضح و استفاده از Transition words (کلمات یا عباراتی هستند که برای برقرار ارتباط بین ایدهها و جملات در نوشتار شما به کار میروند)، ساختار درستی به متن خود بدهید.
- محتوای خوب: توضیحات شفافی اضافه کنید تا نشان دهد آنچه میگویید چگونه با اطلاعات موجود درباره یک موضوع مرتبط است.
هرچه بهتر عمل کنید، درک متن توسط گوگل و کاربران آسانتر میشود. همچنین این امر به شما کمک می نماید تا زمانی که کاربری عبارتی خاص را جستجو میکند، با صفحات مناسب رتبهبندی شوید زیرا گوگل اساساً در حال ایجاد مدلی است که از نحوه پردازش زبان و اطلاعات توسط انسانها تقلید میکند.
گوگل به طور فزایندهای شبیه یک کاربر واقعی میشود. با نوشتن محتوای غنی، ساختار مناسب و خوانایی آسان که موضوع موردنظر در متن گنجانده شده باشد، شانس موفقیت خود را در نتایج جستجو افزایش خواهید داد.
نتیجه گیری
درک متن توسط گوگل در سالهای اخیر به طور قابلتوجهی پیشرفت کرده است و این امر به لطف پیشرفتهای چشمگیر در هوش مصنوعی، خصوصا در زمینههای یادگیری ماشین و پردازش زبان طبیعی (NLP) حاصل شده است.
توسط طیف وسیعی از تکنیکها، گوگل میتواند ساختار، معنا و محتوای متن را تجزیه و تحلیل کند. این امر به گوگل امکان میدهد تا موضوع متن، لحن و احساسات نویسنده و همچنین اطلاعات و ایدههای کلیدی ارائه شده در متن را درک نماید. درک متن توسط گوگل کاربردهای مختلفی دارد. از جمله این کاربردها میتوان به رتبهبندی نتایج جستجو، ارائه پیشنهادات محتوا و تبلیغات و بهبود تجربه کاربری اشاره کرد.