اطلاعات نادرست و ناقص زیادی درباره بروزرسانی اخیر الگوریتم گوگل وجود دارد و نمی توان به همه آن ها اعتماد کرد. اما سوالاتی که وجود دارد این است که در واقع الگوریتم BERT چیست و چگونه کار می کند؟ همچنین سوال مهم دیگری که وجود دارد این است که آیا این الگوریتم در روند کار معمول متخصصین سئو نیز تاثیر گذار است یا خیر؟
ما در این مطلب با استناد به یکی از وایتبرد فرایدی های وب سایت Moz.com که توسط متخصص سئو و تولید محتوا، خانم بریتنی مولر، تهیه شده است، به بررسی این موضوع پرداخته و الگوریتم Bert گوگل را از نزدیک مورد بازبینی قرار می دهیم. امیدواریم این ویدیو زیرنویس شده، بتواند به شما کمک نماید.
سلام بر کاربران Moz. به یک وایتبرد فرایدی دیگر خوش آمدید. امروز ما قصد داریم در رابطه با الگوریتم BERT گوگل صحبت کنیم و من بسیار هیجان زده ام تا این الگوریتم را برای همه مورد بررسی قرار دهم. من ادعا نمی کنم که متخصص BERT هستم، اما من تحقیقات زیادی را در این باره انجام داده ام. من گفتگوهایی را نیز با متخصصان این حوزه انجام داده ام و هدفم این است بتوانم فهم و یادگیری این اطلاعات را ساده تر نمایم.
در حال حاضر هیاهوی بسیاری پیرامون الگوریتم BERT گوگل و اینکه نمی توانید برای آن بهینه سازی انجام دهید، وجود دارد. حقیقت امر نیز همین است! شما نمی توانید! شما فقط نیاز به تولید محتوای واقعا خوب برای کاربران خود دارید. من معتقدم بسیاری از ما کمابیش به این حوزه وارد شده ایم، چرا که ذاتا کنجکاو هستیم.
اگر شما کنجکاو به یادگیری بیشتر درباره BERT هستید و می خواهید آن را با کمی جزئیات بیشتر به کاربران خود توضیح داده یا به بحث درباره آن بپردازید، امیدوارم که از تماشای این ویدیو لذت ببرید. اگر نه، بازم هم می تواند مفید باشد.
احتیاط: BERT را بیش از حد بزرگ نکنید!
آنقدر هیجان زده ام که دوست دارم مستقیم سر اصل مطلب بروم. اولین چیزی که می خواهم به آن اشاره کنم این بود که توانستم با آلیسون اتینگر، که یک پژوهشگر پردازش زبان طبیعی است، گفتگو کنم. او استاد دانشگاه شیکاگو است. از او قدردانی بسیاری می کنم که وقت خود را برای گفتگو در مورد BERT به من داد.
اصلی ترین نکته ای که من از این ناهار دو نفره برداشت کردم، این است که نباید BERT را بیش از حد بزرگ کنیم. صحبت های بسیاری در این زمینه وجود دارد اما در حال حاضر این الگوریتم بسیار دورتر از زبان و مفهومی است که بشر می تواند درک کند.
بنابراین من تصور می کنم که مهم است به خاطر داشته باشیم که نباید آنچه را که این مدل می تواند انجام دهد، بیش از حد بزرگ کنیم. اما باید گفت که این موضوع همچنان جذاب بوده و یک اتفاق بسیار جالب توجه در یادگیری ماشین و پردازش زبان طبیعی است.
بدون توضیحات اضافه دیگر، بیایید به اصل مطلب بپردازیم.
BERT از کجا آمده است؟
من می خواهم مفهوم گسترده تری را درباره اینکه BERT از کجا آمده و به کجا قرار است برود، به شما بدهم. من فکر می کنم تاکنون اخبار زیادی درباره BERT در صنعت سئو سر و صدا کرده است، درست مثل فریم هایی از یک فیلم، قبل از اینکه خود فیلم را به طور کامل دیده باشیم. ما فقط یک فریم را داریم. بنابراین ما تنها به همین اخبار BERT بسنده کرده ایم، اما بیایید کمی به عقب برگردیم.
پردازش زبان طبیعی
در گذشته برای کامپیوترها درک زبان امری غیر ممکن بود. آن ها می توانستند متون را ذخیره کنند و ما می توانستیم متونی را در آن ها وارد کنیم، اما همیشه درک این زبان برای کامپیوترها امری بسیار پیچیده و دشوار بود. بنابراین مفهوم “پردازش زبان طبیعی (NLP)” به وجود آمد که در آن محققان تلاش می کنند تا موضوع نوع خاصی از درک زبان را مدل سازی کنند. مثال هایی از این فناوری، با نام های تشخیص موجودیت، طبقه بندی، آنالیز احساسات و پرسش و پاسخ شناخته شده اند.
همه این مسائل به وسیله مدل های انفرادی که مختص زبان خاصی بوده است، حل شده اند و این می تواند کمی شبیه به آشپزخانه شما باشد:
به این مدل های انفرادی، مثل ابزار آشپزخانه خود نگاه کنید، همه آن ها در وظیفه خاص خود، عالی هستند.
حال تصور کنید 11 مورد از ابزار آشپزخانه شما که بیشترین استفاده را دارند، در یک ابزار تجمیع شده باشد. این BERT است! یک ابزار آشپزخانه که 11 مسئله برتر پردازش زبان طبیعی را توانسته به خوبی در خود جای داده و از آن استفاده کند.
یک نو آوری خاص در فضای پردازش زبان طبیعی. به همین علت است که اکثر افراد واقعا از این موضوع هیجان زده اند، چرا که دیگر نیازی به این همه مدل های انفرادی ندارند. آن ها می توانند از BERT برای حل مسائل حوزه NLP استفاده کنند که می تواند این عقیده را که گوگل از BERT در الگوریتم های خود استفاده می کند، قوت ببخشد.
BERT به کجا می رود؟
هدف نهایی چیست؟ این الگوریتم به کجا قرار است برود؟ آلیسون به این سوال اینگونه پاسخ داد:
من تصور می کنم ما همچنان در این مسیر قدم خواهیم برداشت و انواع مختلف و بهتری از BERT را ایجاد خواهیم کرد که بسیار قوی تر خواهند بود و احتمالا با همان ویژگی های اساسی BERT همخوانی دارند.
آلیسون اتینگر
در حال حاضر، هزاران نسخه مختلف از BERT وجود دارد و ما تعداد بیشتری از آن را در آینده خواهیم دید. این موضوع بسیار هیجان انگیز است که ببینیم این موضوع به کجا خواهد رفت.
BERT چگونه اینقدر هوشمند است؟
حال چطور است تا یک نگاه بسیار مختصر به BERT بیاندازیم تا چگونگی هوشمندی آن را بررسی نماییم.
گوگل متون ویکی پدیا را در اختیار گرفت و هزینه بسیار زیادی را نیز بابت تامین نیروی محاسباتی که روی این مدل بزرگ کار کند، پرداخت نمود. آن ها از یک شبکه عصبی بدون نظارت برای آموزش سیستم خود با استفاده از تمام متن ویکی پدیا استفاده نمودند تا بتوانند درک زبان و مفاهیم را بهبود ببخشند.
نکته جالب در چگونگی یادگیری آن این است که می تواند هر طولی از متن را انتخاب کرده (که بسیار خوب است چون زبان گفتگوی ما طولی کاملا دلخواه دارد) و آن را به یک بردار تبدیل کند.
هر بردار یک رشته مشخص از اعداد است. این قضیه کمک می کند تا زبان طبیعی به زبان ماشین تبدیل شود.
این موضوع در یک فضای واقعا بزرگ n بعدی صورت می پذیرد که تصورش هم سخت است. قرار دادن زبان متنی مطابق با فضای سطحی خود.
همچون پروژه Word2vec، مدل BERT برای هوشمند تر شدن از روشی به نام ماسکینگ (Masking) استفاده می کند.
ماسکینگ زمانی اتفاق می افتد که در یک جمله، یک کلمه به طور تصادفی ناپدید شود.
در این هنگام BERT یک مدل دو جهته را اتخاذ می کند تا کلمات قبل و بعد از آن را یافته و به این وسیله کلمه جا افتاده را حدس بزند.
این اتفاق بارها و بارها و بارها تکرار می شود تا در پیش بینی کلمات ماسک شده، قدرتمند گردد. پس از آن می تواند در 11 مسئله پر کاربرد پردازش زبان طبیعی، دقیق تر و دقیق تر شود. واقعا واقعا که هیجان انگیز است و بسیار جالب است که در این فضا هستیم.
BERT چیست؟
BERT یک مدل پردازش زبان طبیعی است که توسط یک روش بدون نظارت، آموزش دیده است. BERT می تواند 11 مسئله پرکاربرد حوزه NLP را پس از تنظیم دقیق، بهتر از قبل انجام دهد، در واقع می تواند به عنوان یک سرعت دهنده برای حوزه پردازش و درک زبان طبیعی عمل کند.
برت یک مدل دو جهته است، به این معنی که به کلمات قبل و بعد از یک موجودیت توجه کرده و با استفاده از آموزش های خود در ویکی پدیا سعی می کند تا درک بهتری از زبان را ارائه دهد.
برای دریافت اطلاعات بیشتر در خصوص مدل های بدون نظارت، وایت برد فرایدی بعدی را از دست ندهید.
BERT چه کارهایی را نمی تواند انجام دهد؟
آلیسون اتینگر، یک مقاله تحقیقات بسیار عالی را در رابطه با این که BERT چه کارهایی را نمی تواند انجام دهد، نوشته است. مهمترین و جالب توجه ترین بخش تحقیقات او مربوط به حوزه “تشخیص نفی” است، به این معنی که BERT نمی تواند نفی را بفهمد یا چیزهایی را که وجود ندارند، درک کند.
به عنوان مثال، هنگامی که ورودی “سینه سرخ یک … هست” را به آن می دهیم، در جای خالی کلمه “پرنده” را پیشبینی می کند که درست است. اما وقتی که ورودی ” سینه سرخ یک … نیست” را به آن می دهیم، باز هم کلمه “پرنده” را پیشبینی می کند.
بنابراین در مسائلی که BERT در نفی آن ها نمونه یا متنی ندارد، هنوز نمی تواند به درستی مفاهیم را درک کند. در مقاله آلیسون اتینگر، موارد اینچنینی بسیاری وجود دارد که عمیقا توصیه می کنم آن را مطالعه کنید.
چگونه برای BERT بهینه سازی انجام دهید؟ (شما نمی توانید!)
در نهایت، سوالی که پیش می آید این است که چگونه می توانید برای BERT بهینه سازی کنید؟ دوباره می گویم، شما نمی توانید. تنها راهی که می توانید وب سایت خود را با این آپدیت سازگار کنید تولید محتوای واقعا خوب برای کاربرانتان و تحقق هدفی است که برای آن به وب سایت شما آمده اند.
یک منبع بسیار عالی برای راهنمایی بیشتر در این زمینه که مقاله ” Briggsby’s On-page SEO for NLP ” می باشد.
قابلیت درک سوالات طبیعی در گوگل در حال افزایش است
موضوعی که لحظه ای من را رها نمی کند و باید به آن اشاره کنم، نکته ای از “Jeff Dean” از کارمندان گوگل است. او درباره BERT صحبت کرده است و سپس در رابطه با سوالات طبیعی و درک سوالات طبیعی نیز سخن گفته است. بزرگ ترین نکته برای من در این مثال نهفته است، بسیار خب، بیایید از کسی بخواهیم که این سوال را بپرسد، “آیا در حالت Airplane می توانید تماس بگیرید یا تماسی دریافت کنید؟”
بلاکی از متن که در آن لایه ترجمه زبان طبیعی گوگل سعی در درک تمام متن دارد، از نظر فنی بسیار پیچیده است:
حالت Airplane، حالت aeroplane، حالت پرواز، حالت آفلاین یا حالت Standalone، تنظیماتی است که در اکثر تلفن های همراه هوشمند، کامپیوترهای قابل حمل و دستگاه های الکترونیکی دیگر وجود دارد که وقتی فعال باشد، جلوی انتقال سیگنال های فرکانس رادیویی توسط دستگاه گرفته می شود، در نتیجه بلوتوث، تلفن و وای فای غیر فعال می شوند. GPS ممکن است فعال بماند، چراکه شامل انتقال امواج رادیویی نمی شود.
با این لایه ها، و اعمال ابزارهایی نظیر BERT، آن ها می توانند به جای استفاده از این زبان گیج کننده، طولانی و بسیار پیچیده، تنها بگویند “نه”. BERT در این زمینه می تواند بسیار بسیار قدرتمند باشد.
تصور کنید امکاناتی نظیر Featured Snippets یا ویژگی های SERP را. منظور من این است که این می تواند در حوزه ما تاثیرات واقعا شگرفی ایجاد کند. بنابراین من تصور می کنم که باید داشته هایمان درباره اینکه این قابلیت چه هدفی دارد و به چه سمتی می رود، مرتب کنیم.
دیدگاهی بنویسید