¹ÙµÏ¿¡¼ °æ¿ìÀÇ ¼ö°¡ ¾ó¸¶³ª ¸¹ÀºÁö¸¦ º¸¿©ÁÖ´Â °³³äµµ/»çÁø=µö ¸¶Àεå À¯Æ©ºê<br> |
°ú¿¬ À̼¼µ¹9´Ü°ú ¾ËÆÄ°í, ´©°¡ À̱æ±î?
¾ËÆÄ°í´Â ±¸±ÛÀÌ 2014³â¿¡ ÀμöÇÑ ÀÚȸ»çÀÎ µö¸¶Àεå(Deep Mind)°¡ °³¹ßÇÑ ¹ü¿ëÀÇ ÄÄÇ»ÅÍ ÇÁ·Î±×·¥À¸·Î, ÀÌ ÇÁ·Î±×·¥ÀÌ ÇÁ·Î±â»ç¸¦ ²ªÀ½¿¡ µû¶ó ¼¼°èÀûÀÎ µÎ°¢À» ³ªÅ¸³Â´Ù.
½ÉÁ¤ÀûÀ¸·Î´Â À̼¼µ¹9´ÜÀÌ ¾ÐµµÀûÀ¸·Î ÀÌ±æ °ÍÀ̶ó°í ¸»ÇÏ°í ½ÍÁö¸¸, ÄÄÇ»ÅÍ¿¡ ´ëÇÑ ÀÌÇصµ°¡ ³ôÀº »ç¶÷µéÀº ´ëü·Î ¾ËÆÄ°í°¡ ¿ì¼¼ÇÒ °ÍÀ̶ó´Â ÀÇ°ßÀ» º¸ÀδÙ.
¡Þ"½Ç¼ö¸¦ ÇÏÁö ¾Ê´Â ÄÄÇ»ÅÍ°¡ À¯¸®ÇÏ´Ù"
¼ÒÇÁÆ®¿þ¾îÁ¤Ã¥¿¬±¸¼Ò(SPRI)ÀÇ ±è¼®¿ø ¹Ú»ç´Â "¸¸¾à À̹ø ¹ÙµÏÀ» ³õ°í ³»±â¸¦ °Ç´Ù¸é ³ª´Â Å« µ·À» °ÉÁö´Â ¾Ê°Ú´Ù"°í ¸»Çß´Ù. ½ÂºÎ°¡ ±Ù¼ÒÇϸ®¶ó´Â ¿¹ÃøÀÌ´Ù. '±¸±ÛÀÇ ¹ÙµÏÀΰøÁö´É AlphaGo, Àΰ£ èÇÇ¿ÂÀ» ²ª´Ù'´Â º¸°í¼¸¦ ÀÛ¼ºÇÑ ±è¼®¿ø ¹Ú»ç´Â "±×·¸Áö¸¸ À̼¼µ¹9´ÜÀÌ Áú ¼öµµ ÀÖÀ» °Í °°´Ù"°í ¸»Çß´Ù.
±è ¹Ú»ç´Â ±× ±Ù°Å·Î ÆÇÈÄÀÌ 2´ÜÀÌ ¾ËÆÄ°í¿ÍÀÇ ´ë±¹¿¡¼ Å©°Ô ¿ÏÆÐÇß´Ù. ÆÇÈÄÀÌ°¡ ¾ËÆÄ°í¿Í ´ë±¹À» ÇÏ¸é¼ 'Å« º®À» ´À³¤´Ù'°í À̾߱âÇÑ °Íó·³, ÄÄÇ»ÅÍ´Â ³Ê¹«³ª ħÂøÇÏ°Ô µÎ±â ¶§¹®¿¡ »ç¶÷ÀÌ ½ºÆ®·¹½º¸¦ ´À³¤´Ù´Â Á¡À» µé¾ú´Ù. ±è ¹Ú»ç´Â "¸¹Àº ±â»çµéÀÌ ½Ç¼ö ¾ø´Â ¹ÙµÏÀ» µÎ°í ½Í´Ù°í ¸»ÇÏ´Â °ÍÀ» º¸µíÀÌ »ç¶÷Àº ¾ðÁ¨°¡´Â ½Ç¼ö¸¦ ÇÑ´Ù"¸é¼ "À̼¼µ¹ 9´ÜÀÌ 2´ë3À¸·Î ÁöÁö ¾ÊÀ»±î ½Í´Ù."°í Á¶½É½º·´°Ô Àü¸ÁÇß´Ù.
ÀÌ»óÁö Ä«À̽ºÆ® ¿¬±¸±³¼öµµ ¿ª½Ã "¾ËÆÄ°í°¡ 3´ë2·Î ÀÌ±æ °Í"À̶ó°í Àü¸ÁÇß´Ù. ÀÌ ±³¼ö´Â "¾Æ¸¶µµ ÇÑ ´Þ¿¡ ÇÑ ÆǾ¿ µÑ ÅÙµ¥, ù ÆÇÀº À̼¼µ¹9´ÜÀÌ ÀÌ±æ °ÍÀ¸·Î º»´Ù"°í ¸»Çß´Ù. ±×·¯³ª ´ÙÀ½ ´ë±¹ÀÌ ¿¸®´Â ÇÑ ´Þ »çÀÌ À绡¸® ´ëÀÀ¼ö´ÜÀ» ¸¶·ÃÇÑ ¾ËÆÄ°í°¡ 2,3,4±¹À» À̱â°í, ÀÌ¿¡ ÀڱعÞÀº À̼¼µ¹À» ºñ·ÔÇÑ ÇÁ·Î±â»çµéÀÌ ÄÄÇ»ÅÍ ¹ÙµÏÀ» ¿¬±¸Çؼ ¸¶Áö¸· ÆÇÀº ¾ËÆÄ°í¸¦ ²ªÀ» °ÍÀ̶ó°í ÆǼ¼¸¦ ºÐ¼®Çß´Ù.
ÀÌ¿Í´Â ¹Ý´ë·Î ±èÀÎÁß Çѵ¿´ë Àü»êÀüÀÚ°øÇкΠ±³¼ö´Â "¿ÜºÎ¿¡¼ Á¤È®È÷ Æò°¡Çϱâ´Â ÈûµéÁö¸¸, ±¸±Û¿¡¼ ÀÚüÀûÀ¸·Î Æò°¡Çϱâ´Â ¾ËÆÄ°í°¡ ÇÁ·Î 5´Ü ¼öÁØÀ̶ó°í ¾ê±âÇßÀ¸´Ï, ±×°ÍÀ» Åä´ë·Î »ý°¢Çϸé À̹ø¿¡´Â À̼¼µ¹ÀÌ ÀÌ±æ °ÍÀ¸·Î º»´Ù"°í Àü¸ÁÇß´Ù.
±×·¯³ª ±è ±³¼öµµ ÄÄÇ»ÅÍ ¹ÙµÏÀÌ °á±¹Àº ÇÁ·Î±â»ç¸¦ ¹°¸®Ä¥ °ÍÀ¸·Î Àü¸ÁÇß´Ù. ±è ±³¼ö´Â "¹ÙµÏÀ̳ª ü½º °°ÀÌ ±ÔÄ¢ÀÌ ÀÏÁ¤ÇÑ °ÍÀº ÄÄÇ»Æà ¼Óµµ°¡ »¡¶óÁö¸é ÄÄÇ»ÅÍ°¡ ÈξÀ À¯¸®ÇÑ ºÎºÐÀÌ ÀÖ´Ù¡±°í ¸»ÇÏ°í ¡°ÀÌ·± Á¡¿¡¼ º¸¸é Àå±âÀûÀ¸·Î »ç¶÷ÀÌ ÄÄÇ»Åͺ¸´Ù À¯¸®ÇÏ´Ù°í º¸±â ¾î·Æ´Ù"°í ¸»Çß´Ù.
¡Þ'µö ·¯´×' È°¿ëÇÑ ¾ËÆÄ°í ¹ÙµÏ½Ç·Â Å©°Ô ´Ã¾î
¾ËÆÄ°í°¡ ¿¹ÀüÀÇ ÄÄÇ»ÅÍ ¹ÙµÏ°ú´Â ´Þ¸® ÇÁ·Î±â»ç¸¦ ¿ÏÀüÈ÷ ¹°¸®Ä£ °ÍÀº ´õ¿í Çâ»óµÈ ¾Ë°í¸®ÁòÀ» È°¿ëÇ߱⠶§¹®ÀÌ´Ù. ÃÖ±Ù ¸î ³â°£ ¼¼°èÀûÀ¸·Î Å« °¢±¤À» ¹Þ´Â µö ·¯´×(Deep Learning) ÀΰøÁö´É ±â¼úÀ» Àû±Ø È°¿ëÇß´Ù.
µö ·¯´×Àº, ÄÄÇ»ÅÍ°¡ ¹°Ã¼¸¦ ÀνÄÇÏ°í ÆÇ´ÜÀ» ³»¸± ¶§ »ç¶÷ÀÇ ³ú¿¡¼ ÀϾ´Â Çö»óÀ» ¸ð¹æÇÑ ÀΰøÁö´É ±â¼úÀÌ´Ù. ³ú¿¡ ´ëÇÑ ¿¬±¸°¡ È°¹ßÇØÁö¸é¼, »ç¶÷ÀÇ ³ú¿¡¼ ¾î¶² Á¤º¸¸¦ °¡Áö°í ÆÇ´ÜÀ» ³»¸± ¶§ ¿©·¯ ´Ü°èÀÇ Á¤º¸Ã³¸® °úÁ¤À» °ÅÄ£´Ù´Â »ç½ÇÀ» ¾Ë°Ô µÆ´Ù.
ÀÌ´Â ¸¶Ä¡ ȸ»ç¿¡¼ Áß¿äÇÑ °áÁ¤À» ³»¸± ¶§ »ç¿øÀÌ ¼öÁýÇÑ Á¤º¸¸¦ ´ë¸®¿Í °úÀå ¹× ºÎÀå°ú ÀÓ¿øÀ» °ÅÃÄ »çÀåÀ¸·Î ¿Ã¶ó°¡¸é¼ Ãß·ÁÁö°í ¶Ç Ãß·ÁÁ®¼ ÃÖÁ¾ÀûÀ¸·Î´Â ÇÑ µÎ°¡Áö ÇÙ½ÉÀ¸·Î ¿ä¾àµÈ´Ù´Â °Í°ú ºñ½ÁÇÏ´Ù.
¾ËÆÄ°í´Â ±âÁ¸¿¡ »ç¿ëÇÏ´ø °ÈÇнÀ(Reinforced Learning) ¸óÅ× Ä«¸¦·Î Æ®¸®¼Ä¡(MCTR Monte Carlo Tree Search)°°Àº °ÍÀ» ÃÖ´ëÇÑ È°¿ëÇÑ ¹ÙÅÁÀ§¿¡ Á¤Ã¥¸Á(Policy Network)°ú °¡Ä¡¸Á(Value Network)µîÀÇ ±â¹ýÀ» Ãß°¡Çß´Ù.
¸óÅ× Ä«¸¦·Î Æ®¸® ¼Ä¡(MCTS)´Â ¸ðµç °æ¿ìÀÇ ¼ö¸¦ ÀüºÎ ¹æ¹®Çؼ °á°ú¸¦ ¾ò´Â ´ë½Å, »ùÇøµÇؼ ³ª¿Â °á°ú¸¦ °¡Áö°í ´ë·«ÀûÀÎ ±Ù»çÄ¡¸¦ ³»´Â ±â¼úÀÌ´Ù. ¹ÙµÏ¿¡¼´Â ÀÏÁ¾ÀÇ ¼öÀб⠱â¼úÀ̶ó°í ÇÒ ¼ö ÀÖ´Ù. ÇÁ·Î±â»çµéÀÌ ¹ÙµÏ¾ËÀ» ³õÀ» ¶§ ¿ÏÀüÇÑ ¼öÀб⸦ ÇÏ´Â ´ë½Å °æÇè°ú Á÷°ü¿¡ ÀÇÇØ ¼ö¸¦ ³õ´Â °Í°ú ºñ½ÁÇÏ´Ù.
°ÈÇнÀ(RL)Àº Àü¹®°¡°¡ ¾ø´Â »óÅ¿¡¼ ÄÄÇ»ÅÍ°¡ ½º½º·Î ÇнÀÇؼ ¹è¿ì´Â ±â´ÉÀ» ¸»ÇÑ´Ù.
Á¤Ã¥¸ÁÀº ¾î´À µ¹ÀÌ ¾î´À À§Ä¡¿¡ ³õÀÏ ¶§, ¹ÙµÏÀÇ ÇÁ·Î°í¼öµéÀº ÀÌ·¸°Ô ³õ¾Ò´Ù´Â ½ÄÀÇ °áÁ¤À» µ½´Â ÇÁ·Î±×·¥ÀÌ´Ù. °¡Ä¡¸ÁÀº µ¹À» ÀÌ·¸°Ô ³õ¾ÒÀ» ¶§, ½Â·üÀÌ ¸î %°¡ µÈ´Ù´Â °ÍÀ» ÃøÁ¤ÇÏ´Â ±â¼úÀÌ´Ù.
¾ËÆÄ°í°¡ ÀÌ°°ÀÌ º¹ÀâÇÑ ÇÁ·Î±×·¥À» Ãѵ¿¿øÇÑ °ÍÀº ¹ÙµÏ¿¡¼ ¹ß»ýÇÒ ¼ö ÀÖ´Â °æ¿ìÀÇ ¼ö°¡ ³Ê¹«³ª ¸¹±â ¶§¹®ÀÌ´Ù. °üÁ¡¿¡ µû¶ó ¼öÄ¡´Â ´Ù¸£Áö¸¸ ±¸±ÛÀº ¹ÙµÏÀ» µÑ ¶§ ¹ß»ýÇÏ´Â °æ¿ìÀÇ ¼ö¸¦ 250ÀÇ 150½ÂÀ¸·Î ÃßÁ¤Çß´Ù.
À̹ø ´ë±¹ÀÇ °á°ú¿Í »ó°ü¾øÀÌ ¸¶ÄÉÆà ȫº¸ Ãø¸é¿¡¼´Â ÀÌ¹Ì ±¸±ÛÀÌ ½ÂÀÚ¶ó´Â ºÐ¼®ÀÌ ³ª¿Â °Íµµ Èï¹Ì·Ó´Ù. ´ëȸ »ó±ÝÀ¸·Î ±¸±ÛÀº 100¸¸ ´Þ·¯¸¦ °É¾úÁö¸¸, ´ëȸ ¹ßÇ¥¸¦ ³õ°í ¹ú¾îÁö´Â ¾ð·ÐÀÇ °ü½Éµµ¿Í ¾ÕÀ¸·Î ´ë±¹ÀÌ ¿¸± ¶§ ¸¶´Ù ½ñ¾ÆÁö´Â ¸Å½ºÄÄÀÇ º¸µµ ¿¹»ó·®¸¸ µûÁ®µµ ±× ÀÌ»óÀÇ È«º¸È¿°ú¸¦ º¸¾Ò´Ù´Â °ÍÀÌ´Ù.
±¸±ÛÀÌ ¹ÙµÏÇÁ·Î±×·¥ÀÇ À̸§À» ¾ËÆÄ°í(AlphaGo)¶ó°í ÇÑ °Íµµ Áö³ÇØ ±¸±ÛÀÇ ÁöÁÖȸ»ç·Î ¼³¸³ÇÑ ¡®¾ËÆÄ'¸¦ ¾Ë¸®±â À§ÇÑ ¼ö´ÜÀÇ ÇϳªÀÌ´Ù.
¡Øº» ÄÜÅÙÃ÷ ÀúÀÛ±ÇÀº »çÀ̾ð½ºÅ¸ÀÓÁî(//www.sciencetimes.co.kr)¿¡ ÀÖ½À´Ï´Ù.