مطالعه موردی ( Case Study ):
AlphaGo یک برنامه کامپیوتری است که در اکتبر سال 2015 در لندن توسط شرکت گوگل برای انجام بازی Go ساخته شد و در سال 2016 توسعه پیدا کرد.
خودِ بازی Go، قدمتی 2500 ساله در کشور چین دارد و در واقع شبیه ساز یک جنگ انتزاعی است. بازیکنان بازی را با یک صفحهی شطرنجی خالی آغاز میکنند و سپس در هر حرکت یک مهره سیاه و یا سفید را روی خانههای صفحه قرار میدهند. وقتی مهرهای در یک خانه شطرنجی قرار میگیرد، دیگر نمیتواند جابهجا شود و اگر این مهره توسط مهرههای رنگ مخالف محاصره شود، کشته میشود. بازی با حرکت یک درمیان مهرههای سفید و سیاه آنقدر ادامه مییابد تا تمام صفحه توسط مهرهها تسخیر شود. هدف بازی، تصاحب سطح بیشتری از زمین شطرنجی بازی توسط مهرههاست و رنگی که سطح بیشتری را اشغال کرده باشد، برنده است.
قواعد بازی بسیار ساده است اما بازی ظاهرا بیپایان است زیرا تعداد موقعیتهای بالقوه برای حرکت قانونی مهرهها برابر است با عدد 171 رقمی زیر:
208,168,199,381,979,984,699,478,
633,344,862,770,286,522,453,884,
530,548,425,639,456,820,927,419,
612,738,015,378,525,648,451,698,
519,643,907,259,916,015,628,128,
546,089,888,314,427, 129,715,319,
317,557,736,620,397,247,064,840,935.
یعنی عددی بزرگتر از تعداد اتمهای سازنده جهان هستی!! انجام بازی Go به دلیل گزینههای بسیار زیاد موجود برای حرکت مهرهها، حتی برای کامپیوترها نیز بسیار دشوار است. به طوری که برخی این بازی را "جام مقدس" (دست نیافتنی) در هوش مصنوعی مینامیدند.
AlphaGo از الگوریتم جستجوی اکتشافی به نام Monte Carlo tree search و استفاده از دانش یاد گرفته شده از تجربههای قبلی، برای تشخیص و پیدا کردن حرکت هایش بهره میبرد. این الگوریتم بر پایهی یادگیری ماشین یا Machine Learning و بهطور خاص شبکه عصبی مصنوعی ( Artificial Neural Network ) که یکی از اصول Deep Learning یا یادگیری عمیق است، استوار است.
راههایی که ما میتوانیم از طریق Machine Learning به پیشرفتهای انقلابی برسیم، مانند توانایی تقلید از خلاقیت و قدرت شهود انسان ها، بی پایان است.
یادگیری عمیق مفهومی جدید در علم یادگیری داده است. در این روش با استفاده از مدلهای پیشرفته شبکه های عصبی مصنوعی، از طریق تعداد زیاد گرههای ورودی، میتوان روابط غیرخطی و خطی گوناگون را از داده ها استخراج نمود.
یادگیری ماشین فرآیند استفاده از الگوریتم ها برای تجزیه داده جهت استخراج مفاهیم از آنها و پیشبینی و بیان هر آنچه در جهان است میباشد. Machine Learning تاکید بر نوشتن نرمافزار با استفاده از تجربیات گذشته دارد. اگر بخواهیم تعریف تام میشل پروفسور دانشگاه کارنگی ملون را ساده کنیم، Machine Learning یعنی نوعی از یک برنامه کامپیوتری که بتواند عملکرد خود را با استفاده از تجربیات گذشته بهبود بخشد.
همین اتفاق، یعنی بهبود عملکرد با استفاده از تجربیات گذشته، اتفاقی است که در ستهای متوالی بازی Go در مقابل Lee قهرمان جهانی بازی Go رخ داد. یادگیری از تجربهی سه برد و یک باخت در چهار ست متوالی رفته رفته AlphaGo را قویتر ساخت و با برد در ست پنجم موجب حیرت جهانیان شد.
مهمترین چیزی که از پیروزی AlphaGo بر قهرمان جهانی بازی Go میتوان آموخت این نیست که هوش مصنوعی شرکت DeepMind توانایی غلبه بر بازی Go را دارد! بلکه این است که با گسترش بهکارگیری تکنیکهای یادگیری ماشین میتوان هر مسئله سادهتری از Go را نیز به راحتی تسخیر نمود، و این یعنی حل تعداد بسیار زیادی از مسائل جهان.
اما در اصل AlphaGo تنها ساختهی دست بشر است. یکی از دانشمندان کامپیوتر به نام Andy Salerno بیان کرد: AlphaGo یک موجود ناشناخته از سیارهای دیگر نیست بلکه او خود ماست! Lee نباید از شکست خود شرمسار باشد زیرا او به یک ماشین نباخته است بلکه این پیروزی ماحصل بهکارگیری توانمندیهای ذهن و تواناییهای ما انسانها بوده است.
برای مطالعه شرح کامل این مسابقه، مقاله How Google's AlphaGo Beat a Go World Champion را مطالعه کنید.
نظرات