ÇѾç´ëÇб³ °ø°ú´ëÇÐ

´ëÇѹα¹ ±â¼ú Çö½ÇÈ­ÀÇ »ê½Ç

ȨÀ¸·Î °ø°ú´ëÇÐ ¼Ò½Ä±³¼ö

±³¼ö

°Ô½Ã¹° »ó¼¼³»¿ë
È¿À²ÀûÀÎ ´Ù±¹¾î ´ëÈ­Çü 꺿 µ¥ÀÌÅÍ »ý¼º±â¼ú °³¹ß
ÀÛ¼ºÀÚ : ÇѾç´ëÇб³ °ø°ú´ëÇÐ(help@hanyang.ac.kr)   ÀÛ¼ºÀÏ : 23.10.06   Á¶È¸¼ö : 107

¡¸ACL¡¹ Çмú´ëȸ ³í¹® ¹ßÇ¥

 

ÇѾç´ë ÄÄÇ»ÅͼÒÇÁÆ®¿þ¾îÇкΠ¼­Áö¿ø ±³¼ö ¿¬±¸ÆÀÀÌ ÃÖ±Ù ¹Ì±¹(Stanford University), Áß±¹(Tianjin University), ÇÁ¶û½º(Université Paris-Saclay), Àεµ(Microsoft Research India, International Institute of Information Technology, Karya. Inc) ¿¬±¸ÆÀ°úÀÇ Çù¾÷À¸·Î ´Ù±¹¾î ¾ð¾î¸¦ Áö¿øÇÏ´Â ´ëÈ­Çü 꺿 ¿¡ÀÌÀüÆ®ÀÇ ÇнÀ È¿À²¼ºÀ» Áõ°¡½ÃÅ°´Â °íÇ°ÁúÀÇ µ¥ÀÌÅÍ »ý¼º ±â¼úÀ» °³¹ßÇß´Ù°í, ÇѾç´ë°¡ 13ÀÏ ¹àÇû´Ù.

 

¿¬±¸ÆÀÀÇ ±â¼úÀ» È°¿ëÇÏ¸é °íÇ°ÁúÀÇ ´Ù±¹¾î 꺿 ¿¡ÀÌÀüÆ®¸¦ Àú·ÅÇÑ ºñ¿ëÀ¸·Î ±â°èÇнÀ ½Ãų ¼ö ÀÖ´Ù. À̹ø ¿¬±¸´Â ÀÚ¿¬¾î ó¸® ºÐ¾ßÀÇ ÃÖ¿ì¼ö Çмú´ëȸÀÎ ¡®ACL (Conference on Machine Learning and Systems)¡¯ÀÇ ¡®Findings¡¯ Æ®·¢¿¡¼­ ¹ßÇ¥µÆÀ¸¸ç, °øµ¿ ¿¬±¸ÆÀÀº µ¥ÀÌÅͼÂ, ÄÚµå, Åø µîÀ» ¿ÀǼҽº·Î °ø°³ÇÏ¿´´Ù.

 

±×µ¿¾È ÁÖ¿ä ±¹Á¦ ÇÐȸ¿¡¼­ ¹ßÇ¥µÇ°í ³íÀÇµÈ ´ëÈ­Çü 꺿 ¿¬±¸´Â ÁÖ·Î ¿µ¾î, Áß±¹¾î¿Í °°ÀÌ ³Î¸® »ç¿ëµÇ´Â ¾ð¾î¿¡ ±¹ÇÑµÇ¾î ¿Ô´Ù. »õ·Î¿î ¾ð¾î¸¦ À§ÇÑ µ¥ÀÌÅͼÂÀ» ¸¸µå´Â µ¥ ÀûÁö ¾ÊÀº ºñ¿ëÀÌ µé¾î°¡±â ¶§¹®ÀÌ´Ù. ¿¬±¸ÆÀÀÌ Á¦¾ÈÇÑ ±â¹ýÀ» »ç¿ëÇϸé, »ç¶÷ÀÌ ¹ø¿ªÇÑ µ¥ÀÌÅͼ ÀϺθ¦ ±â¹ÝÀ¸·Î Àüü µ¥ÀÌÅͼ¿¡ ´ëÇÑ ÀÚµ¿ ¹ø¿ª Ç°ÁúÀ» Çâ»ó½ÃÄÑ ³Î¸® »ç¿ëµÇÁö ¾ÊÀº ¾ð¾î¿¡ ´ëÇؼ­µµ µ¥ÀÌÅͼ Á¦ÀÛ ºñ¿ëÀ» ÇöÀúÈ÷ ÁÙÀÏ ¼ö ÀÖ´Ù.

 

¿¬±¸ÆÀÀº ½Å°æ¸Á ±â¹Ý ±â¼ú°ú »çÀü ±â¹Ý ±â¼úÀ» µ¶Ã¢ÀûÀ¸·Î ÅëÇÕÇÏ´Â ÀÚ¿¬¾î ó¸® ±â¼úÀÎ ÅëÇÕÀû °³Ã¼ Á¤·Ä(Hybrid Entity Alignment) ±â¼úÀ» °í¾ÈÇß´Ù. ¿¬±¸ÆÀÀº À̸¦ È°¿ëÇÏ¿© Àüü µ¥ÀÌÅͼÂÀ» ¹ø¿ªÇÏ´Â ´ë½Å ÀÛÀº Å©±âÀÇ ÀϺΠµ¥ÀÌÅͼ¸¸ ¹ø¿ªÇÑ ÈÄ ±â¼úÀ» Àû¿ëÇÏ´Â ¡®¹ø¿ª ¹× ÈÄÆíÁý ¹æ¹ý·Ð¡¯À» Á¦¾ÈÇÏ¿´´Ù.

 

ÀÌ ±â¹ýÀ» Àû¿ëÇÏ¸é µ¥ÀÌÅͼ Àüü¸¦ ¹ø¿ªÇÏÁö ¾Ê¾Æµµ 꺿 ¸ðµ¨ÀÇ ´Ù±¹¾î ¼º´ÉÀ» À¯ÀǹÌÇÏ°Ô ³ôÀÏ ¼ö ÀÖ´Ù. ¿¹¸¦ µé¸é, Çѱ¹¾î·Î ÈÆ·ÃµÈ Ãªº¿ ¸ðµ¨À» ¼­ºñ½ºÇÏ´Â ±â¾÷¿¡¼­ ±Û·Î¹ú °í°´À» ÀÀ´ëÇϱâ À§ÇØ ¿µ¾î¿Í ÇÁ¶û½º¾î¿¡ ´ëÇؼ­µµ °°Àº ±â´ÉÀÇ Ãªº¿ ¸ðµ¨À» ¼­ºñ½ºÇØ¾ß ÇÒ ¶§, ±âÁ¸¿¡´Â Çѱ¹¾î ¸ðµ¨À» ÈÆ·ÃÇÒ ¶§ »ç¿ëÇß´ø µ¥ÀÌÅͼ Àüü¸¦ ¹ø¿ªÇØ¾ß ÇßÁö¸¸ ¡®¹ø¿ª ¹× ÈÄÆíÁý ¹æ¹ý·Ð¡¯À» Àû¿ëÇÏ¸é µ¥ÀÌÅͼÂÀÇ ÀϺθ¸ ¹ø¿ªÇصµ ºñ½ÁÇÑ ¼º´ÉÀ» °¡Áö´Â ´Ù±¹¾î 꺿 ¸ðµ¨À» ¼­ºñ½ºÇÒ ¼ö ÀÖ°Ô µÈ´Ù.

 

°øµ¿ ¿¬±¸ÆÀÀº µ¶¸³Ã¼ Á¤·Ä ±â¼úÀÇ ¼º´ÉÀ» ÃøÁ¤Çϱâ À§ÇÏ¿© Áß±¹¾î·Î µÈ ¡®RiSAWOZ¡¯ µ¥ÀÌÅͼÂÀ» ¿µ¾î, ÇÁ¶û½º¾î, Èùµð¾î, Çѱ¹¾î, ¿µ¾î-Èùµð º¯Çü(Code-mixed)ÀÇ 5°¡Áö Ÿ±ê ¾ð¾î¿¡ ´ëÇÏ¿© ½ÇÇèÀ» ¼öÇàÇÏ¿´´Ù. ¶ÇÇÑ µ¥ÀÌÅͼÂÀÇ Ç°ÁúÀ» ´õ¿í ³ôÀÏ ¼ö ÀÖ´Â ´Ù¾çÇÑ ÀÚµ¿È­, ¹ÝÀÚµ¿È­ °Ë»ç ÅøµéÀ» °³¹ßÇÏ¿´´Ù.

 

ƯÈ÷ Çѱ¹¾î´Â ´Ù¸¥ ¾ð¾î¿Í ´Ü¾î Á¶ÇÕ ¹æ¹ýÀÌ ´Þ¶ó ÅëÇÕÀû °³Ã¼ Á¤·Ä ±â¼úÀ» Àû¿ëÇϱ⿡ ¾î·Á¿òÀÌ ÀÖ¾ú´Ù. ¼­Áö¿ø ±³¼ö ¿¬±¸ÆÀÀÇ ±è¼º±Õ ¹Ú»ç°úÁ¤ ¿¬±¸¿øÀº Çѱ¹¾î µ¥ÀÌÅͼÂÀÇ µ¶¸³Ã¼ Á¤·Ä ±â¼ú ¼º´ÉÀ» ³ôÀ̱â À§ÇÏ¿© ¾îÀý ´ÜÀ§°¡ ¾Æ´Ñ ´Ü¾î ´ÜÀ§·Î °³Ã¼ Á¤·ÄÀ» Àû¿ëÇÒ ¼ö ÀÖµµ·Ï ¹®ÀÚ ´ÜÀ§ÀÇ °³Ã¼ Á¤·Ä ±â¹ýÀ» Á¦¾ÈÇÏ°í, À̸¦ À§ÇÑ µµ±¸ °³¹ß¿¡ Âü¿©ÇÏ¿´´Ù. À̸¦ ÅëÇØ Á¶»ç, º¸Á¶ ¿ë¾ð°°ÀÌ ÇÑ ¾îÀý¿¡¼­ ³ªÅ¸³ª´Â º¯È­¸¦ Æ÷ÇÔÇÑ ¿©·¯ Çѱ¹¾îÀÇ Æ¯¼ºµéÀ» °í·ÁÇÒ ¼ö ÀÖ°Ô µÆ´Ù.

 

±è¼º±Õ ¹Ú»ç°úÁ¤ ¿¬±¸¿øÀº À̹ø ¿¬±¸°á°ú¿¡ ´ëÇØ ¡°Ãªº¿ ¸ðµ¨ÀÌ Áö¿øÇÏ´Â ¾ð¾î¸¦ Ãß°¡ÇÒ ¶§ ºñ¿ëÀûÀÎ À庮ÀÌ Å©°Ô ³·¾ÆÁú ¼ö ÀÖ´Ù¡±¶ó¸ç ¡°Æ¯È÷ ³Î¸® »ç¿ëµÇÁö ¾Ê¾Æ 꺿 ¾ð¾î ¸ðµ¨À» ÈÆ·ÃÇϱâ À§ÇÑ µ¥ÀÌÅͼÂÀ» ¸¸µé±â ¾î·Á¿î ¾ð¾îµé¿¡ ´ëÇؼ­µµ 꺿 ¼­ºñ½º Áö¿øÀ» ±â´ëÇÏ°í ÀÖÀ¸¸ç, À̸¦ ÅëÇؼ­ ºñÁÖ·ù ¾ð¾î »ç¿ëÀÚµéÀÇ ¼­ºñ½º Á¢±Ù¼ºÀÌ Áõ°¡ÇÏ´Â È¿°ú¸¦ ±â´ëÇÏ°í ÀÖ´Ù¡±¶ó°í ¹àÇû´Ù.

 

°øµ¿ ¿¬±¸ÆÀÀº º» ¿¬±¸ °á°úÀÎ ´ëÈ­Çü 꺿 ¿¡ÀÌÀüÆ®¸¦ À§ÇÑ ¿£µå Åõ ¿£µå(End-to-End) µ¥ÀÌÅͼ°ú °Ë»ç ÅøµéÀ» Æ÷ÇÔÇÑ ¡®X-RiSAWOZ¡¯ º¥Ä¡¸¶Å©¸¦ ¿ÀǼҽº·Î °ø°³ÇÏ¿´´Ù.

 

¼­Áö¿ø ±³¼ö

¼­Áö¿ø ±³¼ö

 

±è¼º±Õ ¹Ú»ç°úÁ¤ ¿¬±¸¿ø

±è¼º±Õ ¹Ú»ç°úÁ¤ ¿¬±¸¿ø

 

[±×¸² 1] Áß±¹¾î-¿µ¾î ȯ°æ¿¡¼­ ¹ø¿ª(1) ¹× ÈÄÆíÁý(2,3,4) ¹æ¹ý·ÐÀÌ Àû¿ëµÈ X-RiSAWOZÀÇ ÇÁ·Î¼¼½º ¸ð½Äµµ. ³ë¶õ ºÎºÐÀº »ç¶÷ÀÌ Á÷Á¢ ÇØ ÁÖ¾î¾ß ÇÏ´Â ¿µ¿ªÀÌ°í, ºÓÀº ºÎºÐÀº ¼Ò½º ¾ð¾îÀÇ µ¥ÀÌÅͼ ¿µ¿ª, º¸¶ó»ö ºÎºÐÀº ÀÚµ¿À¸·Î »ý¼ºµÇ´Â Ÿ±ê ¾ð¾î ¿µ¿ªÀÌ´Ù.

[±×¸² 1] Áß±¹¾î-¿µ¾î ȯ°æ¿¡¼­ ¹ø¿ª(1) ¹× ÈÄÆíÁý(2,3,4) ¹æ¹ý·ÐÀÌ Àû¿ëµÈ X-RiSAWOZÀÇ ÇÁ·Î¼¼½º ¸ð½Äµµ. ³ë¶õ ºÎºÐÀº »ç¶÷ÀÌ Á÷Á¢ ÇØ ÁÖ¾î¾ß ÇÏ´Â ¿µ¿ªÀÌ°í, ºÓÀº ºÎºÐÀº ¼Ò½º ¾ð¾îÀÇ µ¥ÀÌÅͼ ¿µ¿ª, º¸¶ó»ö ºÎºÐÀº ÀÚµ¿À¸·Î »ý¼ºµÇ´Â Ÿ±ê ¾ð¾î ¿µ¿ªÀÌ´Ù.

ÀÌÀü±Û ¹ÚÈñÈ£ ±³¼öÆÀ, È¿°úÀûÀÎ Á¶Á÷Àç»ý ¾à¹° Àü´Þ ½Ã½ºÅÛ °³¹ß
´ÙÀ½±Û ±ÇÀÏÇÑ ±³¼ö, 2023³â 9¿ù ¡®ÀÌ´ÞÀÇ °úÇбâ¼úÀÎ»ó¡¯ ¼±Á¤
¸®½ºÆ®