ProQA: ÅëÇÕ Áú¹® ÀÀ´äÀ» À§ÇÑ ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ±³À° | ...........with.QA
Àüü°ø°³ 2024.04.01. 22:05

ProQA: ÅëÇÕ Áú¹® ÀÀ´äÀ» À§ÇÑ ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ±³À°

Wanjun Zhong 1 , Yifan Gao 4* , Ning Ding 3 , Yujia Qin 3 , Zhiyuan Liu 3 ,

¹ÖÀú¿ì 5, Jiahai Wang 1 , Jian Yin 1 ¹× Nan Duan 2

1 Sun Yat-sen University   2 Microsoft Research Asia

3 Tsinghua University   4 Chinese University of Hong Kong   5 Langboat Technology

{zhongwj25@mail2, wangjiah@mail,issjyin@mail}.sysu.edu.cn

yfgao@cse.cuhk.edu.hk; liuzy@tsinghua.edu.cn

{dingn18, qyj20}@mails.tsinghua.edu.cn

nanduan@microsoft.com; zhouming@chuangxin.com

±Õµî ±â¿©¸¦ ³ªÅ¸³À´Ï´Ù.

Ãß»óÀûÀÎ

QA(Áú¹® ÀÀ´ä)´Â ÀÚ¿¬¾î ó¸® ºÐ¾ß¿¡¼­ ¿À·£ °úÁ¦ÀÔ´Ï´Ù. ±âÁ¸ QA ÀÛ¾÷Àº ´ëºÎºÐ ƯÁ¤ Áú¹® À¯Çü, Áö½Ä ¿µ¿ª ¶Ç´Â Ãß·Ð ±â¼ú¿¡ ÁßÁ¡À» µÓ´Ï´Ù. QA ¿¬±¸ÀÇ Àü¹®¼ºÀº ½Ã½ºÅÛÀÌ ÀÛ¾÷ °£ÀÇ °øÅ뼺À» ¸ðµ¨¸µÇÏ°í ´õ ³ÐÀº ÀÀ¿ë ÇÁ·Î±×·¥À» ÀϹÝÈ­ÇÏ´Â °ÍÀ» ¹æÇØÇÕ´Ï´Ù. ÀÌ·¯ÇÑ ¹®Á¦¸¦ ÇØ°áÇϱâ À§ÇØ ¿ì¸®´Â ´ÜÀÏ ¸ðµ¨À» ÅëÇØ ´Ù¾çÇÑ ¾÷¹«¸¦ ÇØ°áÇÏ´Â ÅëÇÕ QA Æз¯´ÙÀÓÀÎ ProQA¸¦ Á¦½ÃÇÕ´Ï´Ù. ProQA´Â ÅëÀÏµÈ ±¸Á¶Àû ÇÁ·ÒÇÁÆ®¸¦ ±³·®À¸·Î »ï¾Æ ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ÇнÀÀ» ÅëÇØ QA Á᫐ ´É·ÂÀ» Çâ»ó½Ãŵ´Ï´Ù . ±¸Á¶ÀûÀ¸·Î ¼³°èµÈ ÇÁ·ÒÇÁÆ® ±â¹Ý ÀÔ·Â ½ºÅ°¸¶¸¦ ÅëÇØ ProQA´Â ¸ðµç ƯÁ¤ QA ÀÛ¾÷¿¡ ´ëÇÑ Áö½Ä »ç¿ëÀÚ Á¤ÀǸ¦ À¯ÁöÇϸ鼭 ¸ðµç QA ÀÛ¾÷¿¡ ´ëÇÑ Áö½Ä ÀϹÝÈ­¸¦ µ¿½Ã¿¡ ¸ðµ¨¸µÇÕ´Ï´Ù. ¶ÇÇÑ ProQA´Â ±¸Á¶Àû ÇÁ·ÒÇÁÆ® Çü½ÄÀÇ ´ë±Ô¸ð ÇÕ¼º ÄÚÆÛ½º·Î »çÀü ÈƷõǾî ÀϹÝÀûÀ¸·Î ¿ä±¸µÇ´Â QA ´É·ÂÀ» ¸ðµ¨¿¡ ºÎ¿©ÇÕ´Ï´Ù. 11°³ QA º¥Ä¡¸¶Å©¿¡ ´ëÇÑ ½ÇÇè °á°ú´Â ProQA°¡ Àüü µ¥ÀÌÅÍ ¹Ì¼¼ Á¶Á¤, ¼Ò¼ö ÇнÀ ¹× Á¦·Î ¼¦ Å×½ºÆ® ½Ã³ª¸®¿À ¸ðµÎ¿¡¼­ Áö¼ÓÀûÀ¸·Î ¼º´ÉÀ» Çâ»ó½ÃÅ°´Â °ÍÀ¸·Î ³ªÅ¸³µ½À´Ï´Ù. ¶ÇÇÑ ProQA´Â ±¸Á¶Àû ÇÁ·ÒÇÁÆ®ÀÇ ÀåÁ¡À» È°¿ëÇÏ¿© Áö¼ÓÀûÀÎ ÇнÀ°ú ÀüÀÌ ÇнÀ ¸ðµÎ¿¡¼­ °­·ÂÇÑ ´É·ÂÀ» ¹ßÈÖÇÕ´Ï´Ù. 1

1

ÄÚµå´Â https://github.com/zhongwanjun/ProQA ¿¡¼­ È®ÀÎÇÒ ¼ö ÀÖ½À´Ï´Ù .

1¼Ò°³

±×¸² 1:ProQAÀÇ Á¢±Ù ¹æ½Ä °³¿ä. °¢ »óÀÚ´Â ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ·Î ±¸¼ºµÈ ƯÁ¤ ÀνºÅϽº¸¦ ³ªÅ¸³»¸ç ProQA´Â ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ÇнÀ À¸·Î »çÀü ÇнÀµÇ¾ú½À´Ï´Ù .

[]

Ư¼ö Å° Ç¥½Ã±â¸¦ ³ªÅ¸³À´Ï´Ù .

<>

´Â Çϵå ÇÁ·ÒÇÁÆ®¸¦ ³ªÅ¸³»°í »ö»óÀÌ ÀÖ´Â »ç°¢ÇüÀº ¿¬¼ÓÀûÀ¸·Î ÇнÀ °¡´ÉÇÑ ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¸¦ ³ªÅ¸³À´Ï´Ù .

Áú¹® ´äº¯Àº ¿À·§µ¿¾È NLP ¿¬±¸¿¡¼­ ¿µ°¨À» ÁÖ´Â µµÀüÀ̾úÀ¸¸ç Â÷¼¼´ë °Ë»ö ¿£ÁøÀÌÀÚ Àΰ£ÀÌ Áö½ÄÀ» ¾ò´Â µ¥ ÇʼöÀûÀÎ µµ±¸·Î °£Áֵ˴ϴ٠.2011³â) . ´Ù¾çÇÑ °³º° µ¥ÀÌÅÍ ¼¼Æ® Rajpurkar et al. (2016³â); Laiet al. (2017³â); Kwiatkowskiet al. (2019); Gaoet al. (2021) Àº QA¿¡ ´ëÇÑ ¿¬±¸ µ¿Çâ°ú ÇÔ²² ¸Å¿ì ´Ù¾çÇÑ Áú¹® À¯Çü(¿¹: ÃßÃâÀû QA, Ãß»óÀû QA, °´°ü½Ä QA ), µµ¸ÞÀÎ(¿¹: ±ÝÀ¶, ÀÏÀÏ À̺¥Æ® ), ´äº¯ À¯Çü(¿¹: ÀÚÀ¯- Çü¼ºµÈ ÅؽºÆ®, ¼±ÅÃµÈ ¿É¼Ç ). ÀÌÀü ¿¬±¸ÀÇ ´ëºÎºÐÀº ƯÁ¤ Áú¹® À¯ÇüÀÌ ÀÖ´Â ÀÛ¾÷¿¡ ÃÊÁ¡À» ¸ÂÃè½À´Ï´Ù . Lai et al. (2017³â); Yanget al. (2018); Gaoet al. (2020) ¶Ç´Â ƯÁ¤ µµ¸ÞÀÎ Trischler et al. (2017³â); Kwiatkowskiet al. (2019) . »çÀü ÈÆ·ÃµÈ ´ë±Ô¸ð ¾ð¾î ¸ðµ¨¿¡ ´ëÇÑ ÃÖ±Ù ¿¬±¸ Brown et al. (2020); Bommasaniet al. (2021)´Â ´Ù¾çÇÑ ÀÛ¾÷ °£¿¡ ±ä¹ÐÇÑ ¿¬°áÀÌ ÀÖÀ» ¼ö ÀÖÀ½À» ³ªÅ¸³»¸ç, ÀÌ´Â °øÅ뼺À» ¸ðµ¨¸µÇϱâ À§ÇØ ´Ù¾çÇÑ QA ÀÛ¾÷À» ÇØ°áÇÏ´Â µ¥ ÀáÀçÀûÀ¸·Î Àû¿ëµÉ ¼ö ÀÖ´Â ÅëÇÕ Æз¯´ÙÀÓÀ» ¹àÈü´Ï´Ù.

ÀÌ·¯ÇÑ °üÂûÀº ¿ì¸®°¡ ÀϹÝÀûÀ¸·Î ¿ä±¸µÇ´Â QA ´É·Â°ú µ¿ÀÏÇÑ Æз¯´ÙÀÓ ³»¿¡¼­ ´Ù¾çÇÑ QA ÀÛ¾÷ °£ÀÇ Â÷À̸¦ ¸ðµÎ ¸ðµ¨¸µÇÒ ¼ö ÀÖ´Â ÅëÇÕ QA ¸ðµ¨À» °³¹ßÇϵµ·Ï µ¿±â¸¦ ºÎ¿©ÇÕ´Ï´Ù. ÀÌ ¸ñÇ¥¸¦ ´Þ¼ºÇÏ·Á¸é ÇØ°áÇØ¾ß ÇÒ ¸î °¡Áö ÁÖ¿ä °úÁ¦°¡ ÀÖ½À´Ï´Ù. (1) °øÅ뼺À» ¸ðµ¨¸µÇÏ°í ´Ù¾çÇÑ µµ¸ÞÀÎ/Çü½ÄÀÇ ´Ù¾çÇÑ QA ÀÛ¾÷ °£ÀÇ ÀÌÀü °¡´É¼ºÀ» Çâ»ó½ÃÅ°´Â µ¿½Ã¿¡ QA ÀÛ¾÷ °£ÀÇ Ãæµ¹À» ÁÙÀÌ´Â ¹æ¹ýÀº ¹«¾ùÀԴϱî? (2) »çÀü ÇнÀÀ» À§ÇÑ °íÇ°Áú QA Á᫐ µ¥ÀÌÅÍ°¡ ºÎÁ·ÇϹǷΠ´ë±Ô¸ð QA ÄÚÆÛ½º¸¦ ¾î¶»°Ô ±¸¼ºÇÒ ¼ö ÀÖ½À´Ï±î?

ÀÌ¿¡ ºñÃß¾î ¿ì¸®´Â ±¸Á¶Àû ÇÁ·ÒÇÁÆ®¸¦ È°¿ëÇÏ¿© ´Ù¾çÇÑ QA ÀÛ¾÷À» ÇØ°áÇϱâ À§ÇÑ ÀÏ¹Ý ¸ðµ¨À» ±¸ÃàÇÏ°í ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ÇнÀÀ» ÅëÇØ ÀϹÝÀûÀ¸·Î ¿ä±¸µÇ´Â QA ´É·ÂÀ» Çâ»ó½ÃÅ°´Â ÅëÇÕ QA Æз¯´ÙÀÓÀÎ ProQA¸¦ ±¸»óÇÕ´Ï´Ù .

ù°, °øÅëÁ¡À» ¸ðµ¨¸µÇÏ°í ÀÛ¾÷ Â÷À̸¦ ±¸º°Çϱâ À§ÇØ ±¸Á¶ÀûÀ¸·Î ¼³°èµÈ ÅëÀÏµÈ ÀÔ·Â ½ºÅ°¸¶¸¦ »ç¿ëÇÏ¿© ÀÔ·ÂÀ» ±¸¼ºÇÏ´Â ±¸Á¶Àû ÇÁ·ÒÇÁÆ®¸¦ äÅÃÇÕ´Ï´Ù. ±×¸² 1 ¿¡ µµ½ÃµÈ ¹Ù¿Í °°ÀÌ , º¹ÀâÇÑ ±¸¼º ¿ä¼Ò(¿¹: "Domain" , "Format" , "Task" , "Question" , "Passage" )°¡ ÀÔ·ÂÀ¸·Î ÁÖ¾îÁö¸é ProQA´Â ±¸¼º ¿ä¼Ò¸¦ ¿©·¯ Å°-°ª ½ÖÀ¸·Î ³ª´¯´Ï´Ù. "Question" °ú °°Àº ƯÁ¤ ±¸¼º ¿ä¼Ò´Â Å°¸¦ ³ªÅ¸³»¸ç ÀÌ ±¸¼º ¿ä¼ÒÀÇ Æ¯Á¤ ÀνºÅϽº°¡ °ªÀ¸·Î »ç¿ëµË´Ï´Ù. ÀÌ·¯ÇÑ ¹æ½ÄÀ¸·Î ¸ðµ¨Àº ÁÖ¿ä ÁöÇ¥·Î ´Ù¾çÇÑ ÀÔ·Â ±¸¼º ¿ä¼Ò¸¦ ±¸º°ÇÏ°í ÀÛ¾÷º° °ª(ÇнÀ °¡´ÉÇÑ ÇÁ·ÒÇÁÆ®)À» ÅëÇØ °¢ ÀÛ¾÷ÀÇ Æ¯¼ö¼ºÀ» ¸ðµ¨¸µÇÒ ¼ö ÀÖ½À´Ï´Ù.

µÑ°, µ¥ÀÌÅÍ Èñ¼Ò¼º ¹®Á¦¸¦ ¿ÏÈ­ÇÏ°í ¸ðµ¨¿¡ »õ·Î¿î ÀÛ¾÷ ÀûÀÀ¿¡ ´ëÇÑ ÀüÀ̼ºÀ» ºÎ¿©Çϱâ À§ÇØ ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ÇнÀÀ» ¼öÇàÇÕ´Ï´Ù . ¸ÕÀú Wikipedia¿¡¼­ ´ë±Ô¸ð ÇÕ¼º QA ÄÚÆÛ½º¸¦ ÀÚµ¿À¸·Î ±¸ÃàÇÏ¿© »çÀü ÇнÀ ÄÚÆÛ½º ±¸¼ºÀ» À§ÇÑ »çÀü °¨µ¶À¸·Î ¸î °¡Áö ½Ãµå µ¥ÀÌÅÍ ¼¼Æ®¸¸ È°¿ëÇÏ°í ÃÖÁ¾ÀûÀ¸·Î ±âº» QA Çü½ÄÀ» ´Ù·ì´Ï´Ù. ±×·± ´ÙÀ½ ±¸Á¶Àû ÇÁ·ÒÇÁÆ®¸¦ »ç¿ëÇÏ¿© »çÀü ÇнÀ µ¥ÀÌÅÍÀÇ Çü½ÄÀ» ÁöÁ¤ÇÏ°í »çÀü ÇнÀÀ» ÅëÇØ ±¸Á¶Àû ÇÁ·ÒÇÁÆ®ÀÇ °¢ ±¸¼º ¿ä¼ÒÀÇ ±â´É°ú ¹ü¿ë QA Á᫐ ´É·ÂÀ» ÇнÀÇϵµ·Ï ¸ðµ¨À» °¡¸£Ä¨´Ï´Ù.

¿ì¸®´Â 11°³ÀÇ ´Ù¿î½ºÆ®¸² QA º¥Ä¡¸¶Å©¿¡¼­ ProQAÀÇ È¿À²¼ºÀ» Æò°¡ÇßÀ¸¸ç, ±× °á°ú ¿ì¸® ½Ã½ºÅÛÀÌ Àüü µ¥ÀÌÅÍ ¹Ì¼¼ Á¶Á¤, Ç»¼¦ ÇнÀ ¹× Á¦·Î¼¦ ÇнÀ ¼³Á¤¿¡¼­ ÀÏ°üµÈ ¼º´É Çâ»óÀ» ´Þ¼ºÇÑ °ÍÀ¸·Î ³ªÅ¸³µ½À´Ï´Ù. ½ÇÇèÀº ProQA°¡ ±¸Á¶Àû ÇÁ·ÒÇÁÆ®¿¡ ÀÖ´Â ÀÛ¾÷º° ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¸¦ º¹¿øÇÏ¿© Áö¼ÓÀûÀÎ ÇнÀ Áß¿¡ Ä¡¸íÀûÀÎ ¸Á°¢ ¹®Á¦¸¦ ´õ Àß ¿ÏÈ­ÇÒ ¼ö ÀÖÀ½À» º¸¿©ÁÝ´Ï´Ù. Ãß°¡ ºÐ¼®¿¡¼­´Â ¿ì¸® ¸ðµ¨ÀÌ »õ·Î °ü·ÃµÈ ÀÛ¾÷¿¡ ´õ ºü¸£°Ô ÀûÀÀÇÒ ¼ö Àֱ⠶§¹®¿¡ ´õ ³ªÀº Àü´Þ °¡´É¼ºÀ» °¡Áö°í ÀÖÀ½À» º¸¿©ÁÝ´Ï´Ù. ÀýÁ¦ ¿¬±¸´Â ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¿Í ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ÈÆ·Ã ¸ðµÎÀÇ È¿°ú¸¦ °ËÁõÇÕ´Ï´Ù.

±â¿©´Â ´ÙÀ½°ú °°ÀÌ ¿ä¾àµË´Ï´Ù.

• ¿ì¸®´Â È®Àå °¡´ÉÇÏ°í ÇнÀ °¡´ÉÇÑ ±¸Á¶Àû ÇÁ·ÒÇÁÆ®¸¦ °¡±³·Î »ï¾Æ ´ÜÀÏ Æз¯´ÙÀÓ ³»¿¡¼­ ´Ù¾çÇÑ ÀÛ¾÷À» ÇØ°áÇϱâ À§ÇÑ ÅëÇÕ QA ÇÁ·¹ÀÓ¿öÅ©ÀÎ ProQA¸¦ Á¦¾ÈÇÕ´Ï´Ù.

• ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ±³À°À» ÅëÇØ Àü¹ÝÀûÀÎ QA Á᫐ ¿ª·®À» °­È­ÇÕ´Ï´Ù.

• Æ÷°ýÀûÀÎ ½ÇÇè¿¡ µû¸£¸é ¿ì¸® ¸ðµ¨Àº ƯÈ÷ ÀúÀÚ¿ø ¼³Á¤¿¡¼­ 11°¡Áö QA ÀÛ¾÷ÀÇ ¼º´ÉÀ» Áö¼ÓÀûÀ¸·Î Çâ»ó½ÃÅ°°í Áö¼ÓÀûÀÎ ÇнÀ ¹× ¼Ò¼öÀÇ ÀüÀÌ ÇнÀ¿¡¼­ ´õ ³ªÀº È¿À²¼ºÀ» ³ªÅ¸³À´Ï´Ù.

2°ü·ÃµÈ ÀÏ

QA Çü½Ä ÅëÇÕ.

Áú¹® À¯Çü, ´äº¯ À¯Çü, ´äº¯ ¼Ò½º ¹× µ¥ÀÌÅÍ µµ¸ÞÀο¡¼­ ÇöÀç QA ÀÛ¾÷ÀÌ ¸Å¿ì ´Ù¾çÇÔ¿¡µµ ºÒ±¸ÇÏ°í (Zeng et al.,2020) ´Ù¾çÇÑ QA ¾÷¹«¿¡ ´ëÇÑ ÅëÀÏµÈ Çü½ÄÀ» ¸ð»öÇÏ·Á´Â ³ë·ÂÀÌ ÀÖ¾î ¿Ô½À´Ï´Ù . ÀϺδ ´Ù¾çÇÑ QA ÀÛ¾÷ °£ÀÇ ÀϹÝÈ­ ¹× ÀÌÀü °¡´É¼ºÀ» ÀÔÁõÇϱâ À§ÇØ ¼±±¸ÀûÀÎ ¿ªÇÒÀ» Çß½À´Ï´Ù (Talmor ¹× Berant,2019; µÎ¾Æ ¿Ü.,2019a; Fisch et al.,2019) . ¶Ç ´Ù¸¥ ÀÛ¾÷ ¶óÀÎÀº QA¸¦ À§ÇÑ ´ÙÁß ÀÛ¾÷ ÇнÀÀ» Á¶»çÇÕ´Ï´Ù (McCann et al.,2018; ¼¾ ¿Ü.,2019; µ­ µî,2019) Áö½Ä °øÀ¯¸¦ ÃËÁøÇϱâ À§ÇØ ´ÜÀÏ ÀÎÄÚ´õ¸¦ °øµ¿À¸·Î ±³À°ÇÕ´Ï´Ù. ±×·¯³ª ÀÌ·¯ÇÑ ¹æ¹ýÀº ÀϹÝÀûÀ¸·Î ´Ù¾çÇÑ ÀÛ¾÷¿¡ ´ëÇØ °íÀ¯ÇÑ ¿¹Ãø Çìµå¸¦ ¹èÆ÷ÇØ¾ß ÇϹǷΠ»õ·Î¿î À¯ÇüÀÇ »õ·Î¿î QA ÀÛ¾÷¿¡ Á÷¸éÇÒ ¶§ È®À强°ú À¯¿¬¼ºÀÌ ÀúÇϵ˴ϴÙ.

À̸¦ À§ÇØ ¿©·¯ ÀÛ¾÷À» µ¿ÀÏÇÑ ÅؽºÆ® ´ë ÅؽºÆ® Çü½ÄÀ¸·Î ij½ºÆÃÇÑ ¼º°ø¿¡¼­ ¿µ°¨À» ¾ò¾ú½À´Ï´Ù (Lewis et al.,2020; ¶óÆç ¿Ü,2020) , ¿¬±¸ÀÚµéÀº ´Ù¾çÇÑ QA Çü½ÄÀ» ÅëÇÕÇÏ¿© ÀÛ¾÷º° ¼³°è¿¡ µå´Â ¼ö°í¸¦ ´ú¾îÁÖ´Â ´ÜÀÏ ¸ðµ¨À» ÇнÀÇÒ °ÍÀ» Á¦¾ÈÇÕ´Ï´Ù (Khashabi et al.,2020b; ŸÇǿ丣µå¿Í Ŭ¶óÅ©,2021) . ±×·¯³ª ÀÌ·¯ÇÑ ¸ðµ¨Àº (1) ÀÛ¾÷ ¶Ç´Â ±¸¼º ¿ä¼Ò Ư¼ºÀ» ¸í½ÃÀûÀ¸·Î ¸ðµ¨¸µÇÏÁö ¾ÊÀ¸¹Ç·Î QA ÀÛ¾÷ °£ÀÇ Â÷À̸¦ ÀûÀýÇÏ°Ô ºÐ¸®ÇÏÁö ¸øÇÕ´Ï´Ù. (2) µ¥ÀÌÅÍ°¡ ºÎÁ·ÇÑ ½Ã³ª¸®¿À¿¡¼­´Â »ç¿ëÇÒ ¼ö ¾ø´Â ƯÁ¤ ÀÛ¾÷ÀÇ °¨µ¶ µ¥ÀÌÅÍ¿¡ °úµµÇÏ°Ô ÀÇÁ¸ÇÕ´Ï´Ù.

QA Áß½ÉÀÇ »çÀü ±³À°.

(1) ¹«ÀÛÀ§·Î ¼±ÅÃµÈ º¹±¸¸¦ À§ÇØ PLMÀ» ÈƷýÃÅ°´Â µ¹Ãâ ¹üÀ§ ¸¶½ºÅ·À» »ç¿ëÇÑ ¾ð¾î ¸ðµ¨¸µ ÀûÀÀÀ» Æ÷ÇÔÇÏ¿© ´ë»ó QA ÀÛ¾÷À» ¹Ì¼¼ Á¶Á¤Çϱâ Àü¿¡ Áß°£ »çÀü ÈÆ·Ã ´Ü°è¸¦ ÅëÇØ PLMÀÇ Ãß·Ð ´É·ÂÀ» Çâ»ó½ÃÅ°±â À§ÇØ ¼ö¸¹Àº ³ë·ÂÀÌ ±â¿ï¿©Á³½À´Ï´Ù (Guu et al .,2020; ¿Õ ¿Ü.,2021) ¶Ç´Â ±â°è »ý¼º (Kang et al.,2020) ¿ø½Ã ÄÚÆÛ½ºÀÇ ¸¶½ºÅ©µÈ ¸í¸íµÈ ¿£ÅÍƼ; (2) ÈÆ·Ã µ¥ÀÌÅÍ È®´ë Zhong et al. (2022³â) (a) Àû´ëÀû ÈÆ·ÃÀ» ÅëÇÑ ÀÇ»ç Áú¹® »ý¼º°ú °°Àº ÇÕ¼º Áú¹®-´äº¯-ÄÁÅؽºÆ® Æ®¸®Çà (Hosking and Riedel,2019; ¸® ¿Ü.,2019) , Áö½Ä ±â¹Ý (Hu et al.,2021) ¶Ç´Â ±â°è ¹ø¿ª (Lewis et al.,2019; ¸® ¿Ü.,2020) , (b) ¹Ýº¹ ¹üÀ§¸¦ È°¿ëÇÏ´Â ÀÇ»ç ´äº¯ (Ram et al.,2021) ¶Ç´Â °æÇèÀû ¹æ¹ý¿¡ ±â¹ÝÇÑ ±ÔÄ¢ (Bian et al.,2021) ¹× (c) Á¤º¸ °Ë»öÀ» ÅëÇÑ ÀÇ»ç ÄÁÅؽºÆ® (Glass et al.,2020) . ±×·³¿¡µµ ºÒ±¸ÇÏ°í ÀÌ·¯ÇÑ ÀÛ¾÷Àº ÁÖ·Î PLMÀÇ Æ¯Á¤ Ãß·Ð ´É·ÂÀ» Çâ»ó½ÃÅ°´Â °ÍÀ» ¸ñÇ¥·Î ÇϹǷΠ´Ù¸¥ QA ÀÛ¾÷À¸·Î ½±°Ô ÀϹÝÈ­µÉ ¼ö ¾ø½À´Ï´Ù.

PLM¿¡ ´ëÇÑ ÇÁ·ÒÇÁÆ®.

»çÀü ÈÆ·ÃÀ» ÅëÇØ È¹µæÇÑ Áö½ÄÀ» È¿°úÀûÀ¸·Î ÀÚ±ØÇϱâ À§ÇØ ½Å¼ÓÇÑ ÁöÇâÀÇ ¹Ì¼¼ Á¶Á¤ÀÌ Liu et al. (2021); Dinget al. (2021) ¼öµ¿À¸·Î ¼³°èµÈ Ç׸ñÀ» »ðÀÔÇÏ¿© »çÀü ÈƷðú À¯»çÇÑ ´Ù¿î½ºÆ®¸² ÀÛ¾÷ÀÇ ¸ñÇ¥¸¦ ´Ù½Ã °ø½ÄÈ­ÇÕ´Ï´Ù (Schick and Schütze,2021a,ºñ) ¶Ç´Â ÀÚµ¿À¸·Î °Ë»öµË´Ï´Ù (Jiang et al.,2020; ½Å ¿Ü,2020) Çϵå ÇÁ·ÒÇÁÆ® ÅäÅ«À» ÀÔ·Â ÅؽºÆ®¿¡ Ãß°¡ÇÕ´Ï´Ù. ¿¬¼Ó ÀÓº£µù °ø°£¿¡¼­´Â °³º° ÇÁ·ÒÇÁÆ®°¡ ÃÖÀûÀÇ ¼Ö·ç¼ÇÀÌ ¾Æ´Ò ¼ö ÀÖ´Ù´Â Á¡À» °í·ÁÇÏ¿© ÃÖ±Ù ¿¬±¸ (Li and Liang,2021; Hambardzumyanet al.,2021) Á¶Á¤ °¡´ÉÇÑ ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¸¦ Á¦¾ÈÇß½À´Ï´Ù. ƯÈ÷ ¸ðµ¨ Å©±â°¡ ±Øµµ·Î Ä¿Áú ¶§ ¸¸Á·½º·¯¿î ¼º´ÉÀ» ´Þ¼ºÇÕ´Ï´Ù (Lester et al.,2021) . PLMÀÇ ¹ø°Å·Î¿î ¸Å°³ º¯¼ö¿Í ºñ±³ÇÒ ¶§ ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®´Â °¡º±°í Ç÷¯±× °¡´ÉÇϹǷΠ»õ·Î¿î QA ÀÛ¾÷¿¡ À¯¿¬ÇÏ°Ô ÀûÀÀÇÏ·Á´Â ¸ñÇ¥¸¦ ´Þ¼ºÇÒ ¼ö ÀÖ½À´Ï´Ù.

»ïÇÁ·ÎQA

º» ¼½¼Ç¿¡¼­´Â µ¿ÀÏÇÑ Æз¯´ÙÀÓ ³»¿¡¼­ ´Ù¾çÇÑ QA ¾÷¹«¸¦ ÇØ°áÇÏ´Â ¹ü¿ë QA¸¦ À§ÇÑ ProQAÀÇ Àüü ÇÁ·¹ÀÓ¿öÅ©¸¦ ÀÚ¼¼È÷ ¼³¸íÇÕ´Ï´Ù.

3.1°³¿ä

±×¸² 2 ¿¡¼­ º¼ ¼ö ÀÖµíÀÌ ¿ì¸®´Â ÅëÀÏµÈ ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ( § 3.2 ) ¸¦ »ç¿ëÇÏ¿© ´Ù¾çÇÑ QA ÀÛ¾÷ÀÇ ÀÔ·ÂÀ» ±¸¼º ÇÏ°í Áú¹® ´äº¯À» À§ÇÑ ÅëÀÏµÈ ¸ðµ¨À» äÅÃÇÕ´Ï´Ù. ±×·± ´ÙÀ½ QA Á᫐ ´É·Â°ú ±¸Á¶Àû ÇÁ·ÒÇÁÆ®ÀÇ Àǹ̸¦ ÇнÀÇÏ´Â ¸ðµ¨À» °­È­Çϱâ À§ÇØ ±¸Á¶Àû ÇÁ·ÒÇÁÆ®·Î Æ÷¸ËµÈ ÇÕ¼º »çÀü ÇнÀ ÄÚÆÛ½º¸¦ »ç¿ëÇÏ¿© ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ÇнÀÀ» ¼öÇàÇÕ´Ï´Ù( § 3.3 ).

Khashabi µî À¸·ÎºÎÅÍ ¿µ°¨À» ¾ò¾ú½À´Ï´Ù . (2020b) ¹× T5 Raffel et al. (2020) , ¿ì¸®´Â ÅëÇÕµÈ ÅؽºÆ®-ÅؽºÆ® ¸ðµ¨À» »ç¿ëÇÏ¿© ¸ðµç ´Ù¿î½ºÆ®¸² QA ÀÛ¾÷À» ÇØ°áÇÕ´Ï´Ù. ÀÌ ÀÛ¾÷¿¡¼­´Â ÁÖ·Î T5¸¦ ¸ðµ¨ ¹éº»À¸·Î äÅÃÇÕ´Ï´Ù. ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý ¸ðµ¨ ÀÔ·ÂÀ» ¹Þ¾Æ ÅëÇÕ ¸ðµ¨Àº Áú¹®¿¡ ´ëÇÑ ´äº¯À» »ý¼ºÇÕ´Ï´Ù.

±×¸² 2:±¸Á¶Àû ÇÁ·ÒÇÁÆ®ÀÇ ±×¸²ÀÔ´Ï´Ù.

[]

Ưº°ÇÑ ÇÙ½É ÁöÇ¥¸¦ ³ªÅ¸³À´Ï´Ù.

<>

´Â Çϵå ÇÁ·ÒÇÁÆ®¸¦ ³ªÅ¸³»°í ȸ»ö »ç°¢ÇüÀº ¿¬¼ÓÀûÀÎ ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¸¦ ³ªÅ¸³À´Ï´Ù.

3.2±¸Á¶Àû ÇÁ·ÒÇÁÆ®

¿©±â¿¡¼­´Â ±¸Á¶Àû ÇÁ·ÒÇÁÆ®ÀÇ µðÀÚÀΰú ¸ðµ¨¿¡ ´ëÇÑ Çü½ÄÈ­µÈ ÀÔ·ÂÀ» ÀÚ¼¼È÷ ¼³¸íÇÕ´Ï´Ù.

Á¤ÀÇ.

¿ì¸®´Â ±¸Á¶Àû ÇÁ·ÒÇÁÆ®¸¦ ÅëÇØ º¹ÀâÇÑ QA ÀÛ¾÷ ÀÔ·ÂÀ» ±¸¼ºÇÕ´Ï´Ù. ±×¸² 2 ¿¡¼­ º¼ ¼ö ÀÖµíÀÌ ±¸Á¶Àû ÇÁ·ÒÇÁÆ®´Â ¿©·¯ °³ÀÇ ÇÁ·ÒÇÁÆ®·Î ±¸¼ºµË´Ï´Ù.

{ÄÉÀÌ​ÀÌÀÚÇü​¿ÍÀÌ:�​¤¿​¿¤​À¯​ÀÌÀÚÇü}

½Ö, ¿©±â¼­

ÄÉÀÌ​ÀÌÀÚÇü​¿ÍÀÌ

ƯÁ¤ ±¸¼º ¿ä¼Ò¸¦ ³ªÅ¸³À´Ï´Ù 2

2

" Format " Å°´Â ÀÛ¾÷ÀÇ Çü½Ä À¯Çü(¿¹: " MultiChoice QA ")À» ³ªÅ¸³»°í " Task " Å°´Â ƯÁ¤ µ¥ÀÌÅÍ ¼¼Æ®(¿¹: " SQuAD ")¸¦ ³ªÅ¸³À´Ï´Ù.

(¿¹: " ÀÛ¾÷ ", " Çü½Ä ", " Áú¹® " µî) ¹×

�​¤¿​¿¤​À¯​ÀÌÀÚÇü

µÎ °¡Áö °¡´ÉÇÑ À¯ÇüÀÌ ÀÖ½À´Ï´Ù: (1) µ¥ÀÌÅÍ ÀνºÅϽºÀÇ ÅؽºÆ® ÄÜÅÙÃ÷(¿¹: Áú¹® , ±¸Àý , ¿É¼Ç ); (2) °³º° Çϵå ÇÁ·ÒÇÁÆ® ¿Í ¿¬¼Ó ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ® ÀÇ Á¶ÇÕÀ¸·Î Ç¥ÇöµÇ´Â ÀÛ¾÷ ¼Ó¼º(¿¹: Çü½Ä, µµ¸ÞÀÎ ) . Çϵå ÇÁ·ÒÇÁÆ®´Â ¹Ì¸® Á¤ÀÇµÈ °³º° ¼³¸í(¿©±â¼­´Â Ư¼ö ÅäÅ«À» äÅÃÇÔ)ÀÌ°í ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®´Â ÀÛ¾÷ ÀûÀÀ¿¡¼­ ¸Å°³º¯¼ö È¿°úÀûÀÎ °ÍÀ¸·Î ÀÔÁõµÈ °æ·® ÇнÀ °¡´É ¹× Ç÷¯±×Çü ¿¬¼Ó ÀÓº£µùÀÔ´Ï´Ù. Lester et al. (2021) . ±¸Á¶Àû ÇÁ·ÒÇÁÆ® Çü½ÄÀÇ ¿¹´Â ±×¸² 1 ¿¡ ³ª¿Í ÀÖ½À´Ï´Ù . SQuAD µ¥ÀÌÅͼ¼Æ®ÀÇ °æ¿ì, “

Çü½Ä ÇÁ·ÒÇÁÆ®

","

ÀÛ¾÷ ÇÁ·ÒÇÁÆ®

","

µµ¸ÞÀÎ ÇÁ·ÒÇÁÆ®

" µÉ°Å¾ß "

̧̉˞ QA

","

ºÐ´ë

","

À§Å°Çǵð¾Æ

", °¢°¢.

±¸¼º ¿ä¼Ò °£ÀÇ ±â´ÉÀû Â÷À̸¦ ½Äº°ÇÏ´Â ¸ðµ¨À» Çâ»ó½ÃÅ°±â À§ÇØ °¢ Å°¸¦ ³ªÅ¸³»´Â ÇнÀ °¡´ÉÇÑ Ç¥ÇöÀÌ Àִ Ư¼ö Å° Ç¥½Ã±â¸¦ äÅÃÇÕ´Ï´Ù. ¶ÇÇÑ ¿©·¯ ÀÛ¾÷/µµ¸ÞÀÎ/Çü½Ä °£ÀÇ Â÷À̸¦ ¸ðµ¨¸µÇϱâ À§ÇØ ÇнÀ °¡´ÉÇÏ°í ÀúÀå °¡´ÉÇÑ Æ¯Á¤ ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ® µµ äÅÃÇß½À´Ï´Ù .

�​¤¿​¿¤​À¯​ÀÌÀÚÇü

»ç¿ëÀÚ Á¤ÀÇµÈ Æ¯¼ºÀ» ³ªÅ¸³»±â ¶§¹®¿¡ ¸ðµ¨ÀÌ ÀÛ¾÷ ÀûÀÀ¿¡ ´õ À¯¿¬ÇØÁý´Ï´Ù.

°á°úÀûÀ¸·Î ±¸Á¶Àû ÇÁ·ÒÇÁÆ®´Â ´ÙÀ½°ú °°Àº Ãø¸é¿¡¼­ ¸ðµ¨¿¡ ±ÇÇÑÀ» ºÎ¿©ÇÒ ¼ö ÀÖ½À´Ï´Ù. (1) ÅëÇÕ ÀÔ·Â ½ºÅ°¸¶¸¦ È°¿ëÇÏ¿© ´Ù¾çÇÑ ÀÛ¾÷¿¡ ´ëÇÑ Áö½Ä ÀϹÝÈ­ ¸ðµ¨¸µ; (2) Ư¼öÇÑ ±¸¼º ¿ä¼Ò·Î ´Ù¾çÇÑ ±¸¼º ¿ä¼Ò¸¦ ½Äº°ÇÕ´Ï´Ù.

ÄÉÀÌ​ÀÌÀÚÇü​¿ÍÀÌ

Áö½ÃÀÚ; (3) ÇнÀ °¡´ÉÇÏ°í ÀúÀå °¡´ÉÇÑ ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¸¦ »ç¿ëÇÏ¿© °¢ ÀÛ¾÷/Çü½Ä/µµ¸ÞÀÎÀÇ Æ¯¼ö¼ºÀ» »ç¿ëÀÚ Á¤ÀÇÇÕ´Ï´Ù.

�​¤¿​¿¤​À¯​ÀÌÀÚÇü

ÇØ´ç Å° ¾Æ·¡¿¡ ÀÖ½À´Ï´Ù.

ÀԷ ǥÇö.

ƯÈ÷, ±¸Á¶Àû ÇÁ·ÒÇÁÆ® Çü½ÄÀÇ ÀνºÅϽº°¡ ÁÖ¾îÁö¸é ¸ðµ¨ ÀÔ·ÂÀÇ Æ¯Á¤ Ç¥ÇöÀ» ¼³¸íÇÕ´Ï´Ù. ¿ì¸®´Â ¸ÕÀú ¹ø¿ªÇÕ´Ï´Ù

ÄÉÀÌƼ​½Ã°£

ÇÙ½É ÁöÇ¥ ÀÇ ÇÙ½É

µðÄÉÀÌ

(Ư¼ö ÅäÅ«), ÅäÅ«¿¡ ÀÇÇØ Ã·ºÎµÊ

�ÄÉÀÌ

ƯÁ¤ °ªÀ» »ç¿ëÇÏ¿© ÅäÅ« ½ÃÄö½º¸¦ Çü¼ºÇÕ´Ï´Ù. ÀÌ´Â ´ÙÀ½°ú °°ÀÌ Ãß°¡·Î Ç¥ÇöµË´Ï´Ù.

𝑬ÄÉÀÌ=ÀÌÀÚÇü​Áß​ºñ​ÀÌÀÚÇü​µð​µð​³ª​�​�​([µðÄÉÀÌ;�ÄÉÀÌ])

. ÀÇ Ç¥Çö

µðÄÉÀÌ

ÈÆ·Ã Áß¿¡ ÃʱâÈ­µÇ°í ¾÷µ¥ÀÌÆ®µË´Ï´Ù. ¿ì¸®´Â ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¸¦ »ç¿ëÇϱ⠶§¹®¿¡

𝑷ÀÏ

/

𝑷üÀç

/

𝑷µµ¸ÞÀÎ

ÇØ´ç Å°ÀÇ °ªÀ¸·Î ¸ðµç ÀÛ¾÷¿¡ ÀϹÝÀûÀ¸·Î ÇÊ¿äÇϹǷΠÆíÀǸ¦ À§ÇØ ÀÔ·Â ¾Õ¿¡ Ãß°¡ÇÏ°í ¸ðµç Å°¸¦ ¿¬°áÇÕ´Ï´Ù.

𝑬ÄÉÀÌ

ÃÖÁ¾ ¸ðµ¨ ÀÔ·ÂÀ» Çü¼ºÇϱâ À§ÇØ

𝑿

:

𝑿=[𝑷µµ¸ÞÀÎ;𝑷üÀç;𝑷ÀÏ;𝑬1;…;𝑬ÄÉÀÌ]

(1)

Ç¥ÇöÀÌ ÀÖ´Ù´Â Á¡µµ ÁÖ¸ñÇÒ °¡Ä¡°¡ ÀÖ½À´Ï´Ù.

𝑫

ÁÖ¿ä ÁöÇ¥ ¹× ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®

𝑷

±¸Á¶Àû ÇÁ·ÒÇÁÆ®ÀÇ Àǹ̸¦ ÇнÀÇϱâ À§ÇØ »çÀü ÈÆ·Ã Áß¿¡ ÁÖ¿ä ¸ðµ¨ ¸Å°³º¯¼ö¿Í °øµ¿À¸·Î ÈƷõ˴ϴÙ. ¶ÇÇÑ ´Ù¾çÇÑ ÀÛ¾÷À» ÅëÇØ Á¶Á¤µÈ ÈÄ ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®°¡ Ç¥½ÃµË´Ï´Ù.

𝑷

¸ÂÃãÇü ÀÛ¾÷º° Ư¼ºÀ» ±â·ÏÇϱâ À§ÇØ ÀúÀåÇÒ ¼ö ÀÖ½À´Ï´Ù.

3.3±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ÈÆ·Ã

ÀÌ ºÎºÐ¿¡¼­´Â ¸ðµ¨ÀÌ ÀϹÝÀûÀ¸·Î ¿ä±¸µÇ´Â QA ´É·Â°ú »çÀü ÈÆ·Ã Áß¿¡ ±¸Á¶Àû ÇÁ·ÒÇÁÆ®ÀÇ Àǹ̸¦ ÇнÀÇÏ¿© ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ÈÆ·ÃÀ» ¼öÇàÇÏ¿© ´Ù¿î½ºÆ®¸² ÀÛ¾÷¿¡ ´ëÇÑ ±¸Á¶Àû ÇÁ·ÒÇÁÆ®ÀÇ ÀûÀÀÀ» ÃËÁøÇÏ´Â ¹æ¹ýÀ» ¼Ò°³ÇÕ´Ï´Ù.

ÀÛ¾÷ °ø½ÄÈ­.

±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý Æз¯´ÙÀÓ°ú ÇÔ²² ÀϹÝÀûÀÎ QA Á᫐ ´É·ÂÀ» ÁÖÀÔÇϱâ À§ÇÑ »çÀü ÈÆ·ÃÀ» À§ÇØ ´Ù¾çÇÑ ¿¹½ÃÀûÀÎ QA Çü½Ä À¯Çü(¿¹: ÃßÃâ QA , Ãß»ó QA , °´°ü½Ä QA ¹× ¿¹/¾Æ´Ï¿ä QA )À» ³ªÅ¸³À´Ï´Ù. ´ÙÁß Çü½Ä QA »çÀü ÈÆ·Ã ÄÚÆÛ½º°¡ ÁÖ¾îÁö¸é Á¦¾ÈµÈ ±¸Á¶Àû ÇÁ·ÒÇÁÆ®¿¡ µû¶ó ¸ðµç QA Çü½ÄÀ» º¯È¯ÇÏ¿© ´Ù¾çÇÑ Çü½Ä °£ÀÇ Â÷À̸¦ À¯ÁöÇϸ鼭 °øµ¿ »çÀü ÈÆ·ÃÀ» °¡´ÉÇÏ°Ô ÇÕ´Ï´Ù. ±¸Á¶Àû ÇÁ·ÒÇÁÆ® Çü½ÄÀÇ ÀνºÅϽº¸¦ ÀÔ·ÂÀ¸·Î »ç¿ëÇÏ°í ÀÚÀ¯ Çü½Ä ´äº¯À» Ãâ·ÂÀ¸·Î »ç¿ëÇÏ¿© ÀÛ¾÷Àº ÀÎÄÚ´õ-µðÄÚ´õ ¸ðµ¨À» »ç¿ëÇÏ´Â QA ÀÛ¾÷¿¡ ¸Â°Ô ´õ¿í ¸ÂÃãÈ­µË´Ï´Ù.

»çÀü ÈÆ·Ã ÄÚÆÛ½º ±¸¼º.

QA »çÀü ÈÆ·Ã ÄÚÆÛ½º¸¦ ÁغñÇÒ ¶§ (1) »çÀü ÈÆ·ÃÀ» À§ÇÑ ´ë±Ô¸ð °íÇ°Áú ÁÖ¼® µ¥ÀÌÅ͸¦ ¾ò´Â °ÍÀÌ ºñÇö½ÇÀûÀÌ°í Èûµé¸ç (2) QA¸¦ »ý¼ºÇϱ⠾î·Æ±â ¶§¹®¿¡ µ¥ÀÌÅÍ Èñ¼Ò¼º ¹®Á¦°¡ ¸Å¿ì ½É°¢ÇÕ´Ï´Ù. -±ÔÄ¢ ±â¹Ý ¹æ¹ý(¿¹: ÅäÅ« ¸¶½ºÅ· ¶Ç´Â ¹®Àå ÀçÁ¤·Ä)À» »ç¿ëÇÏ´Â Á᫐ Àڱ⠰¨µ¶ µ¥ÀÌÅÍ. ÀÌ ÀÛÇ°¿¡¼­´Â Lewis et al. (2021) , ¿ì¸®´Â °ÅÀÇ 600¸¸ °³ÀÇ ±¸ÀýÀÌ ÀÖ´Â ·¹À̺íÀÌ ÁöÁ¤µÇÁö ¾ÊÀº ´ë±Ô¸ð Wikipedia ÄÚÆÛ½º¸¦ ±â¹ÝÀ¸·Î ´ë±Ô¸ð »çÀü ÈÆ·Ã ÄÚÆÛ½º¸¦ ÇÕ¼ºÇϱâ À§ÇØ ¼¼´ë ÇÊÅ͸µ ±â¹Ý ÄÚÆÛ½º ±¸¼º ¹æ¹ýÀ» äÅÃÇÕ´Ï´Ù.

ÀϹÝÀûÀ¸·Î ÀÏ¹Ý »ý¼º ÇÊÅ͸µ ÇÁ·Î¼¼½º´Â ´ÙÀ½ ±¸¼º ¿ä¼Ò·Î ±¸¼ºµË´Ï´Ù.

1. QA ½Ö »ý¼º ¸ðµ¨

�Å¥​¤¿​(Å¥,¤¿|¾¾)

: ÁÖ¾îÁø ±¸Àý

¾¾

ÀÔ·ÂÀ¸·Î,

�Å¥​¤¿​(Å¥,¤¿|¾¾)

»ý¼ºÇÏ´Ù

Å¥​[9¿ù]​¤¿

ÇÑ ½ÖÀÇ Áú¹®À» Æ÷ÇÔÇÏ´Â Ãâ·Â ½ÃÄö½º·Î

Å¥

±×¸®°í ±× ´ë´ä

¤¿

.

2. ÇÊÅ͸µ QA ¾ð¾î ¸ðµ¨

¿¡ÇÁ​(¤¿|Å¥,¾¾)

Áú¹®°ú ´äº¯ÀÇ Ç°Áú°ú ÀÏ°ü¼ºÀ» º¸ÀåÇϱâ À§ÇØ »ý¼ºµÈ QA ½ÖÀ» ÇÊÅ͸µÇÕ´Ï´Ù.

¿¡ÇÁ​(¤¿|Å¥,¾¾)

QA ½ÖÀ» ºÎµå·´°Ô ÇÊÅ͸µÇÏ´Â Á¶°ÇºÎ È®·ü ±â¹Ý Á¢±Ù ¹æ½ÄÀÔ´Ï´Ù. QA ½ÖÀÇ Á¡¼ö¸¦ ¸Å±é´Ï´Ù.

(Å¥,¤¿)

´ë´äÀÇ È®·ü·Î

¤¿

Åë°ú Á¶°Ç¿¡ µû¶ó

¾¾

±×¸®°í Áú¹®

Å¥

. ÀÓ°è°ªº¸´Ù ³ôÀº Á¡¼ö¸¦ °¡Áø QA ½ÖÀº »çÀü ÈÆ·ÃÀ» À§ÇØ º¸°üµË´Ï´Ù.

¿ì¸®´Â »ý¼º ¹× ÇÊÅ͸µ ¸ðµ¨ ¸ðµÎÀÇ ¸ðµ¨ ¹éº»À¸·Î § 3.1 ¿¡ ¼³¸íµÈ °Í°ú µ¿ÀÏÇÑ ÅؽºÆ®-ÅؽºÆ® »çÀü ÇнÀ ¸ðµ¨ T5¸¦ äÅÃÇÕ´Ï´Ù .

»ý¼º ¹× ÇÊÅ͸µ ¸ðµ¨ÀÇ ½Å·Ú¼ºÀ» º¸ÀåÇϱâ À§ÇØ ÇÊ¿¬ÀûÀ¸·Î ÀÌ·¯ÇÑ ¸ðµ¨À» ±³À°Çϱâ À§ÇÑ »çÀü °¨µ¶À¸·Î ¸î °¡Áö ½Ãµå µ¥ÀÌÅÍ ¼¼Æ®(ÀϹÝÀûÀ¸·Î °¢ QA Çü½Ä À¯Çü¿¡ ´ëÇØ Çϳª)¸¦ ¼±ÅÃÇÕ´Ï´Ù. ¿ì¸®´Â Àüü Æз¯´ÙÀÓÀÌ ´õ ³ªÀº È®À强À» °¡Áú °ÍÀ¸·Î ±â´ëÇϱ⠶§¹®¿¡ ¸»¹¶Ä¡ ±¸¼º¿¡ ´õ ¸¹Àº °¨µ¶ µ¥ÀÌÅ͸¦ »ç¿ëÇÏÁö ¾Ê´Â´Ù´Â Á¡À» ¾ð±ÞÇÒ °¡Ä¡°¡ ÀÖ½À´Ï´Ù. Áï, »õ·Î Æ÷ÇÔµÈ QA Çü½Ä À¯Çü¿¡ ´ëÇÑ Æз¯´ÙÀÓÀ» È®ÀåÇÏ°í ½ÍÁö¸¸ Áöµµ µ¥ÀÌÅÍ°¡ Á¦ÇÑµÈ °æ¿ì ÀÌ·¯ÇÑ µ¥ÀÌÅ͸¦ È°¿ëÇÏ¿© ÇÕ¼º ´ë±Ô¸ð »çÀü ÇнÀ ÄÚÆÛ½º¸¦ ÀÚµ¿À¸·Î »ý¼ºÇÒ ¼ö ÀÖ½À´Ï´Ù.

º¸´Ù ±¸Ã¼ÀûÀ¸·Î ¸»Çϸé, ÀÔ·Â ±¸¼º ¿ä¼Ò¿¡ µû¶ó ´Ù¾çÇÑ Çü½Ä¿¡ ´ëÇÑ ±¸¼º ¹æ¹ýÀÇ Â÷ÀÌ°¡ °ÅÀÇ ¾ø½À´Ï´Ù. Extractive QA ¿Í Abstractive QA ÀÇ °æ¿ì ¾Õ¼­ ¾ð±ÞÇÑ ÀϹÝÀûÀÎ ¹æ¹ýÀ» »ç¿ëÇÏ¿© QA ½ÖÀ» ÇÕ¼ºÇÕ´Ï´Ù. ¶ÇÇÑ ¸ÕÀú ±ÔÄ¢ ±â¹Ý ¹æ¹ý(¸í¸íµÈ ¿£ÅÍƼ ¶Ç´Â ÇÙ½É ¹®±¸ ÃßÃâ)À» »ç¿ëÇÏ¿© ´äº¯À» ÃßÃâÇÏ°í Áú¹®¸¸ »ý¼ºÇÏ·Á°í Çß½À´Ï´Ù. ¿ì¸®´Â °æÇèÀûÀ¸·Î ÀÌ ¹æ¹ýÀÌ ±ÔÄ¢ ±â¹Ý ¹æ¹ýÀÇ ´Ü¼ø ÆíÇâÀ» Æ÷ÇÔÇϹǷΠÈξÀ ´õ ³ª»Û ¼º´ÉÀ» ¹ßÈÖÇÑ´Ù´Â °ÍÀ» ¹ß°ßÇß½À´Ï´Ù. °´°ü½Ä QA ÀÇ ÀԷ¿¡´Â »õ·Î¿î ±¸¼º ¿ä¼ÒÀÎ " Èĺ¸ ´äº¯ "ÀÌ Æ÷ÇԵǹǷΠ¹æÇØ ¿ä¼Ò(ºÎÁ¤ ¿É¼Ç) »ý¼º ¸ðµ¨À» äÅÃÇÕ´Ï´Ù.

��​ÀÌÀÚÇü​�​(¿µÇü|¾¾,Å¥,¤¿)

¼¼ °¡Áö ºÎÁ¤ÀûÀÎ ¿É¼ÇÀ» »ý¼ºÇÏ·Á¸é

¿µÇü

. ¿¹/¾Æ´Ï¿ä QA ÀÇ °æ¿ì ÇØ´ç ´äº¯À¸·Î True/False¸¦ ÃëÇÏ¿© Áú¹®À» »ý¼ºÇÕ´Ï´Ù . ÀÚ¼¼ÇÑ ³»¿ëÀº ºÎ·Ï A ¿¡ ¼³¸íµÇ¾î ÀÖ½À´Ï´Ù .

4½ÇÇè ¼³Á¤

üÀç

µ¥ÀÌÅͼ¼Æ®

#±âÂ÷

#°³¹ß

QA 񃬣

̧̉˞ QA

ºÐ´ë*

87k

10,000

´Ü¾î ¸ÅĪ

Äõ·¹ÇÁ

22,000

2õ

»óÈ£ÂüÁ¶ Ãß·Ð

´º½ºQA

76,000

4K

´Ü¾î ¸ÅĪ

Ãß»óÀûÀÎ QA

³ª¸£QA*

65,000

21,000

½ºÅ丮 ÀÌÇØ

¶³¾îÁö´Ù

77,000

9õ

ÀÌ»êÀû Ãß·Ð

NQ¿ÀÇÂ

79,000

3.6k

´ÙÁß ±¸Àý ÀÌÇØ

MultiChoice QA

°æÁÖ*

87k

4K

´ÙÁß ¹®Àå Ãß·Ð

²Þ

6õ

2õ

´ëÈ­ Ãß·Ð

MCÅ×½ºÆ®

1.4k

320

´ÙÁß ¹®Àå Ãß·Ð

OBQA

4K

501

±âº» »ó½Ä

½ÃÄ«

33.4k

2.2k

»ó½ÄÀû Ãß·Ð

1 ¹ø Å×À̺í:µ¥ÀÌÅÍ ¼¼Æ® Åë°è ¹× ÇÊ¿äÇÑ ¾ð¾î ÀÌÇØ ±â¼ú. *°¡ ÀÖ´Â µ¥ÀÌÅÍ ¼¼Æ®´Â »çÀü ÇнÀ µ¥ÀÌÅÍ Áغñ¸¦ À§ÇÑ ½Ãµå µ¥ÀÌÅÍ ¼¼Æ®¸¦ ³ªÅ¸³À´Ï´Ù.

ȯ°æ

µ¥ÀÌÅͼ¼Æ®

̧̉QA

Ãß»óÀûÀÎQA

MultiChoiceQA

Æò±Õ

ºÐ´ë

Äõ·¹ÇÁ

´º½ºQA

³ª¸£QA

¶³¾îÁö´Ù

NQ¿ÀÇÂ

°æÁÖ

²Þ

MCÅ×½ºÆ®

OBQA

½ÃÄ«

Àüü µ¥ÀÌÅÍ

T5

83.4

64.9

45.2

49.3

45.0

42.3

67.9

54.8

44.4

49.6

64.1

55.5

ÅëÇÕQA

84.4

74.8

45.3

49.6

45.1

42.5

71.6

67.6

83.1

57.6

64.9

62.4

ProQA (qapair)

84.9

76.6

50.8

49.8

55.0

43.2

73.6

72.9

85.0

61.6

67.5

65.5

ProQA(ÆÑ)

85.3

76.8

50.4

50.1

52.5

43.9

73.2

73.3

85.9

61.4

67.2

65.5

Ç»¼¦

T5

6.7

14.6

20.5

3.4

5.8

11.9

26.2

34.7

38.1

29.0

32.4

20.3

ÅëÇÕQA

82.0

38.2

34.2

49.1

22.2

31.6

53.0

57.4

73.8

41.2

42.8

48.1

ProQA (qapair)

82.9

44.2

41.1

49.1

24.9

33.3

63.4

64.5

82.5

46.2

49.1

52.8

ProQA(ÆÑ)

84.4

52.2

42.1

49.2

27.1

36.0

66.5

66.0

84.1

44.8

49.4

54.7

Á¦·Î¼¦

T5

0.0

0.0

0.0

3.5

2.0

1.5

24.1

34.2

27.5

21.9

33.2

13.5

ÅëÇÕQA

80.7

27.9

31.4

48.3

18.0

30.9

53.0

57.0

73.4

35.9

40.3

45.2

ProQA (qapair)

80.4

30.5

30.7

48.1

17.0

33.0

62.6

64.3

81.3

36.0

47.2

48.3

ProQA(ÆÑ)

81.3

42.1

31.8

48.4

19.7

36.0

65.9

65.2

81.3

38.6

46.7

50.6

Ç¥ 2:Àüü µ¥ÀÌÅÍ ¹Ì¼¼ Á¶Á¤, ¼Ò¼ö ¼î ÇнÀ ¹× Á¦·Î¼¦ ÇнÀ ¼³Á¤¿¡¼­ 11°³ ´Ù¿î½ºÆ®¸² QA µ¥ÀÌÅÍ ¼¼Æ®¿¡ ´ëÇÑ ÁÖ¿ä °á°úÀÔ´Ï´Ù. ½Ãµå µ¥ÀÌÅÍ ¼¼Æ®ÀÇ °¨µ¶Àº ÇÁ¸® Æ®·¹ÀÌ´× ÄÚÆÛ½º ±¸¼º¿¡ »ç¿ëµÇ¾î Ç»¼¦ ¹× Á¦·Î ¼¦ ¼³Á¤¿¡ ÆíÇâÀÌ ¹ß»ýÇÒ ¼ö ÀÖÀ¸¹Ç·Î ÇØ´ç Ç׸ñ¿¡ ´ëÇÑ °á°ú¿¡´Â ¹ØÁÙÀÌ ±×¾îÁ® ÀÖ½À´Ï´Ù.

4.1µ¥ÀÌÅÍ ¼¼Æ® ¹× Æò°¡ ÁöÇ¥

¿ì¸®´Â ½ÇÇè¿¡¼­ ÃßÃâÀû QA, Ãß»óÀû QA ¹× ´ÙÁß ¼±Åà QA 3 ÀÇ ¼¼ °¡Áö Çü½ÄÀÇ QA µ¥ÀÌÅÍ ¼¼Æ®¸¦ °í·ÁÇÕ´Ï´Ù.

ȕ

¶ÇÇÑ ÆÄÀÏ·µ ¿¬±¸¿¡´Â ¿¹/¾Æ´Ï¿ä QAµµ Æ÷ÇԵ˴ϴÙ. ÀÌ Çü½ÄÀÇ µ¥ÀÌÅÍ ¼¼Æ®´Â ±ØÈ÷ µå¹°±â ¶§¹®¿¡ ÁÖ¿ä ½ÇÇè¿¡¼­´Â °í·ÁÇÏÁö ¾Ê½À´Ï´Ù. ÀÌ QA Çü½Ä¿¡ ´ëÇÑ °á°ú´Â ºÎ·Ï B ¿¡ ³ª¿Í ÀÖ½À´Ï´Ù .

. °¢ QA Çü½Ä¿¡ ´ëÇØ ´ë±Ô¸ð »çÀü ÈÆ·Ã µ¥ÀÌÅ͸¦ ÁغñÇϱâ À§ÇØ Çϳª ÀÇ ½Ãµå µ¥ÀÌÅÍ ¼¼Æ®¸¦ ¼±ÅÃÇÕ´Ï´Ù. ½Ãµå µ¥ÀÌÅͼÂÀº »çÀü ÈÆ·Ã ÄÚÆÛ½º ±¸¼º °úÁ¤¿¡¼­ Áú¹®-´äº¯ »ý¼º ¹× ÇÊÅ͸µ ¸ðµ¨À» ÈÆ·ÃÇÏ´Â µ¥ »ç¿ëµË´Ï´Ù. ÀüüÀûÀ¸·Î ¼¼ °¡Áö Çü½Ä°ú ´Ù¾çÇÑ ¾ð¾î ÀÌÇØ ´É·ÂÀ» °®Ãá 11°³ÀÇ QA µ¥ÀÌÅÍ ¼¼Æ®¿¡ ´ëÇØ ½ÇÇèÀÌ ¼öÇàµÇ¾ú½À´Ï´Ù. ½ÇÇè¿¡ »ç¿ëµÈ µ¥ÀÌÅͼ¼Æ®ÀÇ °³¿ä¿Í ÇÊ¿äÇÑ QA ±â¼úÀº Ç¥ 1 ¿¡ ¿ä¾àµÇ¾î ÀÖ½À´Ï´Ù .

̧̉˞ QA.

¿ì¸®´Â SQuAD 1.1 Rajpurkar et alÀ» »ç¿ëÇÕ´Ï´Ù. (2016³â) À» ÃßÃâ ½ºÅ¸ÀÏ QA¸¦ À§ÇÑ ½Ãµå µ¥ÀÌÅͼ¼Æ®·Î »ç¿ëÇÕ´Ï´Ù. ¶ÇÇÑ NewsQA Trischler et al. (2017³â) ¹× Quoref Dasigi et al. (2019) ¸ðµ¨ÀÇ ÀϹÝÈ­ ´É·ÂÀ» Æò°¡ÇÕ´Ï´Ù. ÃßÃâµÈ ½ºÆÒ°ú °ñµå ´äº¯ ½ºÆÒ °£ÀÇ EM(Exact Match) Á¡¼ö´Â ÃßÃâÀû QAÀÇ Æò°¡ ÁöÇ¥·Î »ç¿ëµË´Ï´Ù.

Ãß»óÀûÀÎ QA.

³»·¯Æ¼ºê QA(NarQA) Kočiský et al. (2018)´Â Abstractive QAÀÇ ½Ãµå µ¥ÀÌÅͼ¼Æ®·Î »ç¿ëµË´Ï´Ù. DROP Dua ¿Ü. (2019b) ¹× NaturalQuestions(NQOpen) Kwiatkowski et al. ÀÇ ¿ÀÇ µµ¸ÞÀÎ ¹öÀü . (2019) µµ °í·ÁµÈ´Ù. NQOpenÀÇ °¢ Áú¹®¿¡ ´ëÇÑ Áö¹®Àº ¹Ðµµ°¡ ³ôÀº Áö¹® °Ë»ö±â Karpukhin et al. ¿¡ ÀÇÇØ °Ë»öµË´Ï´Ù. (2020) ½ÃÄö½º·Î ¿¬°áµË´Ï´Ù. ¿ì¸®´Â ROUGE-L ¸°(2004³â) DROP ¹× NQOpen¿¡ ´ëÇÑ NarQA ¹× F1 Á¡¼ö¿¡ ´ëÇÑ ÃøÁ¤Ç׸ñÀÔ´Ï´Ù.

°´°ü½Ä QA.

°´°ü½Ä QAÀÇ °æ¿ì ´ÙÀ½ µ¥ÀÌÅÍ ¼¼Æ®°¡ °í·ÁµË´Ï´Ù. RACE Lai et al. (2017³â) (½Ãµå µ¥ÀÌÅͼ¼Æ®), DREAM Sun et al. (2019) , MCTest Richardson ¿Ü. (2013³â) , OpenBookQA(OBQA) Mihaylov et al. (2018) , Social IQa(SIQA) Sap et al. (2019) . OBQA¿¡´Â ¸Æ¶ô(µ¶ÇØ ±¸Àý)ÀÌ ¾ø½À´Ï´Ù. DREAMÀÇ ¸Æ¶ôÀº ´ëÈ­ ½ºÅ¸ÀÏÀ̸ç À̸¦ ±¸Àý ÀÔ·ÂÀ¸·Î ½ÃÄö½º·Î ¿¬°áÇÕ´Ï´Ù. »ý¼ºµÈ ´äº¯°ú ÅؽºÆ® À¯»ç¼ºÀÌ °¡Àå ³ôÀº ¿É¼ÇÀ» ÃÖÁ¾ ´äº¯À¸·Î ¼±ÅÃÇÕ´Ï´Ù. ¿ì¸®´Â ¸ðµç °´°ü½Ä QA µ¥ÀÌÅÍ ¼¼Æ®¿¡ ´ëÇØ ¿Ã¹Ù¸¥ ¿É¼ÇÀÇ Á¤È®¼ºÀ» °è»êÇÕ´Ï´Ù.

Çൿ ¾ç½Ä

ÀÛ¾÷ A

ÀÛ¾÷ B

Àü

Àü

Àü

AB

Àü

MC

AB

Àü

AB

AB

AB

MC

MC

Àü

MC

AB

MC

MC

Æò±Õ

ÀÛ¾÷ B ¸ðµ¨

20.5%

26.2%

13.0%

8.9%

6.3%

6.5%

4.6%

4.9%

0.9%

9.9%

ÀÛ¾÷ B ¸ðµ¨(ÀÛ¾÷ A ÇÁ·ÒÇÁÆ® Æ÷ÇÔ)

17.1%

10.6%

6.7%

3.1%

3.1%

2.2%

0.4%

0.7%

-0.5%

4.3%

Ç¥ 3: ¿ø·¡ ÀÛ¾÷°ú ºñ±³ÇÏ¿© Æò±Õ ¼º´É ÀúÇÏ¿¡ ´ëÇÑ Áö¼ÓÀûÀÎ ÇнÀ °á°ú A´Â ´Ù¸¥ ÀÛ¾÷ ÇнÀ ¼ø¼­¿¡ µû¸¥ °á°úÀÔ´Ï´Ù( ³·À»¼ö·Ï ÁÁÀ½ ). À½¼ö´Â ¿ø·¡ ÀÛ¾÷ A °á°ú¿¡ ºñÇØ ¼º´ÉÀÌ Çâ»óµÇ¾úÀ½À» ÀǹÌÇÕ´Ï´Ù. EX: ÃßÃâÀû QA; AB: Ãß»óÀûÀÎ QA; MC: ¿©·¯ ÆÀÀÇ QAÀÔ´Ï´Ù.

4.2±¸È¥

T5

Raffelet al. (2020)´Â ¸ðµç ÅؽºÆ® ±â¹Ý ¾ð¾î ¹®Á¦¸¦ ´Ù·ç´Â ÅëÇÕµÈ ÅؽºÆ® ´ë ÅؽºÆ® »çÀü ÇнÀ ÇÁ·¹ÀÓ¿öÅ©ÀÔ´Ï´Ù. ¿ì¸®´Â HuggingFace Transformers Wolf et al ÀÇ google / t5-v1_1-base¸¦ »ç¿ëÇÕ´Ï´Ù. (2020) °¨µ¶µÈ ÈÆ·Ã µ¥ÀÌÅÍ ¼¼Æ®(¿¹: QA µ¥ÀÌÅÍ ¼¼Æ®)¸¦ Á¦¿ÜÇÏ°í C4¿¡¼­¸¸ »çÀü ÈƷõǾú½À´Ï´Ù.

ÅëÇÕQA

Khashabiet al. (2020b)´Â T5¿¡¼­ ÅؽºÆ® ´ë ÅؽºÆ® ÀÛ¾÷À¸·Î °ø½ÄÈ­ÇÏ¿© ´Ù¾çÇÑ QA ÀÛ¾÷ÀÇ Çü½Ä °æ°è¸¦ ³Ñ½À´Ï´Ù. \nÀ» ÅëÇÑ ¸ðµç ÀÔ·ÂÀ» ½ÃÄö½º·Î Á÷Á¢ ¿¬°á ÇÏ°í ´äÀ» ¿¹ÃøÇϱâ À§ÇØ T5¿¡ °ø±ÞÇÕ´Ï´Ù. ¿ì¸®´Â ¾Õ¼­ ¾ð±ÞÇÑ ¼¼ °¡Áö ½Ãµå µ¥ÀÌÅÍ ¼¼Æ®, Áï SQuAD, NarQA ¹× RACEÀÇ Á¶ÇÕÀ» ÅëÇØ ÀÚü UnifiedQA ¸ðµ¨À» ±³À°ÇÕ´Ï´Ù.

ÇÁ·ÎQA

¿ì¸®°¡ Á¦¾ÈÇÑ ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ÈÆ·Ã Á¢±Ù¹ýÀÔ´Ï´Ù. ProQA´Â ÃßÃâÀû QA, Ãß»óÀû QA, ´ÙÁß ¼±Åà QA¶ó´Â ¼¼ °¡Áö »çÀü ÈÆ·Ã ÄÚÆÛ½º Çü½ÄÀ¸·Î °øµ¿À¸·Î »çÀü ÈƷõ˴ϴÙ. § 3.3 ¿¡ ¼³¸íµÈ QA ½Ö »ý¼º ÇÊÅ͸µ ¸ðµ¨¿¡¼­ ÁغñµÈ ÄÚÆÛ½º¸¦ »ç¿ëÇÏ´Â ÀÌ Á¢±Ù ¹æ½ÄÀ» ProQA(qapair)¶ó°í ÇÕ´Ï´Ù. ¶ÇÇÑ, ¿ì¸®´Â ¾Æ¸¶µµ ¹¯´Â Áú¹®/PAQ Lewis et al. ÀÇ ±â¼ºÇ° ´ë±Ô¸ð QA ½ÖÀ» È°¿ëÇÕ´Ï´Ù . (2021) , ±×¸®°í ÃßÃâÀû QA »çÀü ÈÆ·Ã ÄÚÆÛ½º¸¦ PAQÀÇ ÇÏÀ§ ÁýÇÕÀ¸·Î ´ëüÇÕ´Ï´Ù(Ãß»óÀû QA ¹× °´°ü½Ä QA ÄÚÆÛ½º´Â º¯°æµÇÁö ¾ÊÀ½). PAQ´Â QA ½Ö »ý¼ºÀÇ ¸ðµç ´Ü°è(¿¹: ±¸Àý ¼±ÅÃ, ´äº¯ ½Äº°, Áú¹® »ý¼º ¹× ÇÊÅ͸µ)¿¡¼­ ÇнÀµÈ ¸ðµ¨À» µµÀÔÇÏ´Â ¼¼·ÃµÈ ÆÄÀÌÇÁ¶óÀÎÀ» Á¦°øÇÕ´Ï´Ù. ¿ì¸®´Â ÀÌ º¯Á¾À» ProQA(paq)¶ó°í ¸í¸íÇÕ´Ï´Ù.

¸ðµç ´Ù¿î½ºÆ®¸² QA µ¥ÀÌÅͼ¼Æ®¿¡ ´ëÇØ À§ÀÇ »çÀü ÈÆ·ÃµÈ ¸ðµ¨¿¡¼­ ½ÃÀÛÇÏ¿© Àüü µ¥ÀÌÅÍ ¹Ì¼¼ Á¶Á¤, Ç»¼¦ ÇнÀ ¹× Á¦·Î¼¦ ÇнÀ ¼³Á¤¿¡¼­ ½ÇÇèÀ» ¼öÇàÇÕ´Ï´Ù. Ç»¼¦ ÇнÀÀ» À§ÇØ ÈÆ·Ã ¼¼Æ®¿¡¼­ ¹«ÀÛÀ§·Î 32°³ÀÇ ÀνºÅϽº¸¦ »ùÇøµÇÕ´Ï´Ù.

5°á°ú ¹× ºÐ¼®

5.1ÁÖ¿ä °á°ú

ÁÖ¿ä °á°ú´Â Ç¥ 2 ¿¡ ³ª¿Í ÀÖÀ¸¸ç ´ÙÀ½°ú °°Àº °üÂû °á°ú°¡ ÀÖ½À´Ï´Ù.

• QA Áß½ÉÀÇ »çÀü ÈÆ·ÃµÈ ¸ðµ¨, Áï UnifiedQA ¹× ProQA´Â ½Ãµå µ¥ÀÌÅÍ ¼¼Æ®¿Í ºñ ½Ãµå µ¥ÀÌÅÍ ¼¼Æ® ¸ðµÎ¿¡¼­ T5º¸´Ù Å« Â÷ÀÌ·Î ¼º´ÉÀÌ ¶Ù¾î³³´Ï´Ù. ÀÌ´Â ´Ù¾çÇÑ QA ÀÛ¾÷ Àü¹Ý¿¡ °ÉÃÄ ÀÌÀü °¡´ÉÇÑ Áö½ÄÀÌ Àֱ⠶§¹®ÀÔ´Ï´Ù. QA ÀÛ¾÷À» ÅëÇØ ¸ðµ¨ÀÌ »çÀü ÈƷõǸé ÇнÀµÈ Áö½ÄÀ» ´Ù¸¥ µ¥ÀÌÅͼ¼Æ®¿¡ ÀϹÝÈ­ÇÒ ¼ö ÀÖ½À´Ï´Ù.

• ProQA´Â UnifiedQAº¸´Ù ´õ ³ªÀº Áö½Ä »ç¿ëÀÚ Á¤ÀÇ ±â´ÉÀ» º¸¿©ÁÝ´Ï´Ù. ProQA´Â Ç»¼¦ ¹× Á¦·Î¼¦ ¼³Á¤¿¡¼­ UnifiedQA¸¦ Å« Â÷ÀÌ·Î ´É°¡ÇÕ´Ï´Ù. ÀÌ´Â (1) ±¸Á¶Àû ÇÁ·ÒÇÁÆ®ÀÇ Çϵå ÇÁ·ÒÇÁÆ®¿Í ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®°¡ ¸ðµç QA ÀÛ¾÷, ƯÈ÷ ¸ðµç QA ÀÛ¾÷¸¶´Ù ´Ù¸¥ "ÀÛ¾÷" Å°-°ª ½Ö¿¡ ´ëÇØ ´õ ³ªÀº Áö½Ä »ç¿ëÀÚ Á¤ÀǸ¦ °¡´ÉÇÏ°Ô Çϱ⠶§¹®ÀÔ´Ï´Ù. (2) ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ÈÆ·ÃÀ» ÅëÇØ ProQA´Â ÀÌ·¯ÇÑ ºñ½Ãµå µ¥ÀÌÅÍ ¼¼Æ®¿¡ ´õ ºü¸£°í( § 5.3 ) ´õ È¿°úÀûÀ¸·Î(Ç¥ 2 ) ÀûÀÀÇÒ ¼ö ÀÖ½À´Ï´Ù.

• ProQA(qapair)¿Í ProQA(paq)¸¦ ºñ±³Çϸé ProQA(paq)°¡ ´ëºÎºÐÀÇ ½Ã³ª¸®¿À¿¡¼­ ´õ ³ªÀº ¼º´ÉÀ» ¹ßÈÖÇÑ´Ù´Â °ÍÀ» ¾Ë ¼ö ÀÖ½À´Ï´Ù. ¾Æ¸¶µµ PAQ´Â ÆÄÀÌÇÁ¶óÀÎ Á¢±Ù ¹æ½ÄÀ» ÅëÇØ °íÇ°Áú »çÀü ÈÆ·Ã ÄÚÆÛ½º¸¦ Á¦°øÇÒ °ÍÀÔ´Ï´Ù. PAQ ÄÚÆÛ½º »ý¼ºÀ» À§ÇØ ÁغñÇÒ BERT Å©±â ¸ðµ¨Àº ÃÑ 4°³ÀÔ´Ï´Ù. ´ë½Å ¿ì¸®°¡ Á¦¾ÈÇÑ QA ½Ö »ý¼º Á¢±Ù ¹æ½ÄÀº °£´ÜÇÏ¸ç »çÀü ÇнÀ ÄÚÆÛ½º ±¸¼º ÇÁ·Î¼¼½º¿¡¼­ Extractive QA»Ó¸¸ ¾Æ´Ï¶ó Abstractive QA ¹× Multiple-choice QA¿¡µµ Àû¿ëÇÒ ¼ö ÀÖ½À´Ï´Ù.

5.2¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¸¦ ÅëÇÑ Áö¼ÓÀûÀÎ ÇнÀ

ProQA¿¡ ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¸¦ µµÀÔÇÏ¸é »õ·Î¿î ÀÛ¾÷¿¡ ÀûÀÀÇÒ ¶§ Ä¡¸íÀûÀÎ ¸Á°¢ ¹®Á¦¸¦ ÀáÀçÀûÀ¸·Î ¿ÏÈ­ÇÒ ¼ö ÀÖ´Ù´Â ÀÌÁ¡ÀÌ ÀÖ½À´Ï´Ù. ProQA°¡ Ç»¼¦ ¼³Á¤À¸·Î ÀÛ¾÷ A¿Í ÀÛ¾÷ B¿¡ ´ëÇØ ¼øÂ÷ÀûÀ¸·Î ¹Ì¼¼ Á¶Á¤ µÇ¸é ÀÛ¾÷ A¿¡ ´ëÇØ ´Ù½Ã Æò°¡µÉ ¶§ ÀÛ¾÷ A ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¸¦ ´Ù½Ã ·ÎµåÇÒ ¼ö ÀÖ½À´Ï´Ù. ProQAÀÇ Ç÷¯±×ÀÎ À¯¿¬¼ºÀº ±âÁ¸ ProQA¿¡ ºñÇØ Å©°Ô Çâ»óµÇ¾ú½À´Ï´Ù. ÀÛ¾÷ B ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¸¦ À¯ÁöÇÏ´Â »ó´ë¹æ.

Çü½Ä 4 ÀÇ µ¥ÀÌÅÍ ¼¼Æ® °£¿¡ ÀÛ¾÷ A¿Í B¸¦ ¼­·Î ´Ù¸¥ Á¶ÇÕÀ¸·Î ¼³Á¤ÇÏ¿© Áö¼ÓÀûÀÎ ÇнÀÀ» ¼öÇàÇÕ´Ï´Ù.

4

µ¿ÀÏÇÑ Çü½Ä(¿¹: MC)¿¡ ´ëÇÑ ÀÛ¾÷ ÀûÀÀÀ» Á÷Á¢ Á¶»çÇϱ⸦ ¿øÇϱ⠶§¹®¿¡ Áö¼ÓÀûÀÎ ÇнÀ¿¡¼­ µÎ °¡Áö ÀÛ¾÷À» °í·ÁÇÕ´Ï´Ù.

MC) ¶Ç´Â ´Ù¸¥ Çü½Ä(¿¹: AB

Àü).

: ÃßÃâ QA(EX), Ãß»ó QA(AB), °´°ü½Ä QA(MC). °ø½ÄÀûÀ¸·Î´Â ¸ÕÀú ¸ðµ¨ A¸¦ ¾ò±â À§ÇØ ¸î ¹øÀÇ ÇнÀÀ» ÅëÇØ ÀÛ¾÷ A¿¡ ProQA¸¦ Àû¿ëÇÕ´Ï´Ù.

¿¡ÇÁ�¤¿

¼º´ÉÀ¸·Î

¿¡½º¤¿

. ±×·± ´ÙÀ½ ¼øÂ÷ÀûÀ¸·Î ÀûÀÀÇÕ´Ï´Ù.

¿¡ÇÁ�¤¿

ÀÛ¾÷ B·Î Àü¼ÛÇÏ°í ÀÛ¾÷ B ¸ðµ¨ ¼ö½Å

¿¡ÇÁ�¤¿​ºñ

. ¸ðµ¨ÀÇ ¼º´ÉÀ» Æò°¡ÇÕ´Ï´Ù.

¿¡ÇÁ�¤¿​ºñ

ÀÛ¾÷ A¿¡¼­ µÎ °¡Áö ¼³Á¤: (1) Á÷Á¢ Å×½ºÆ®(ÀÛ¾÷ B ÇÁ·ÒÇÁÆ®) (2) ¸ÕÀú ÇнÀµÈ ÀÛ¾÷ A ÇÁ·ÒÇÁÆ®¸¦ ´ÙÀ½¿¡¼­ º¹¿øÇÕ´Ï´Ù.

¿¡ÇÁ�¤¿

¸ðµ¨¿¡°Ô

¿¡ÇÁ�¤¿​ºñ

±×·± ´ÙÀ½ Å×½ºÆ®ÇÕ´Ï´Ù. µÎ ¼³Á¤ÀÇ ¼º´ÉÀº ´ÙÀ½°ú °°ÀÌ Ç¥½ÃµË´Ï´Ù.

¿¡½º¤¿​ºñ

±×¸®°í

¿¡½º¤¿​ºñ′

, °¢°¢. ¿ì¸®´Â ÀÛ¾÷ AÀÇ ¼º´É ÀúÇÏ ºñÀ²À» »ç¿ëÇÏ¿© ÀÌ µÎ °¡Áö ¼³Á¤¿¡¼­ Áö¼ÓÀûÀÎ ÇнÀ ¼º´ÉÀ» Æò°¡ÇÕ´Ï´Ù . " ÀÛ¾÷ B ¸ðµ¨ "=

¿¡½º¤¿-¿¡½º¤¿​ºñ¿¡½º¤¿

¹× " ÀÛ¾÷ B ¸ðµ¨(ÀÛ¾÷ A ÇÁ·ÒÇÁÆ® Æ÷ÇÔ) " =

¿¡½º¤¿-¿¡½º¤¿​ºñ′¿¡½º¤¿

.

Ç¥ 3 ¿¡¼­ º¼ ¼ö ÀÖµíÀÌ ÀÛ¾÷ B ¸ðµ¨(" ÀÛ¾÷ B ¸ðµ¨ ") À» »ç¿ëÇÏ¿© ÀÛ¾÷ A¸¦ Á÷Á¢ Æò°¡ÇÒ ¶§ Ä¡¸íÀûÀÎ ¸Á°¢ ¹®Á¦°¡ Á¸ÀçÇÕ´Ï´Ù . EXÀÇ °æ¿ì ¼º´ÉÀÌ ÃÖ´ë 26.2% ÀúÇϵ˴ϴÙ.

AB. ±×·¯³ª ÀÛ¾÷ A ÇÁ·ÒÇÁÆ®¸¦ º¹¿øÇÏ¸é ¸ðµç ÀÛ¾÷ Á¶ÇÕ(" ÀÛ¾÷ A ÇÁ·ÒÇÁÆ®°¡ Æ÷ÇÔµÈ ÀÛ¾÷ B ¸ðµ¨ ")¿¡¼­ Å« °³¼±ÀÌ ÀÌ·ç¾îÁý´Ï´Ù. ÀÛ¾÷ A ÇÁ·ÒÇÁÆ®¸¦ º¹¿øÇÏ¸é ¶§¶§·Î ÀÛ¾÷ A ¼º´ÉÀÌ Çâ»óµÉ ¼öµµ ÀÖ´Ù´Â »ç½ÇÀº ³î¶ø½À´Ï´Ù(MC

MC =

-

0.5%). ¾Æ¸¶µµ µ¿ÀÏÇÑ Áú¹® Çü½Ä(MC) ÇÏ¿¡¼­ µÎ °¡Áö ÀÛ¾÷À» ¼øÂ÷ÀûÀ¸·Î ÇнÀÇÏ¸é ¸ðµ¨ÀÌ Àü´Þ °¡´ÉÇÑ Áö½ÄÀ» ÇнÀÇÏ°Ô µÇ°í ÀÛ¾÷ ÇÁ·ÒÇÁÆ®¸¦ º¹¿øÇϸé ÀÛ¾÷º° Áö½ÄÀ» °¡Á®¿À°Ô µË´Ï´Ù. 33°³ µ¥ÀÌÅÍ ¼¼Æ® Á¶ÇÕ¿¡ ´ëÇÑ ÀÚ¼¼ÇÑ ½ÇÇè °á°ú´Â ºÎ·Ï C ¿¡¼­ È®ÀÎÇÒ ¼ö ÀÖ½À´Ï´Ù .

±×¸² 3: NewsQA ÀÛ¾÷ÀÇ °ËÁõ ¼¼Æ®¿¡ ´ëÇÑ EM Á¡¼öÀÇ ¸î ¹øÀÇ ÇнÀ °î¼±ÀÔ´Ï´Ù.

5.3À¶Çպм®

Ç»¼¦ ÇнÀ ¼³Á¤¿¡¼­ ´Ü°èº° ¼º´ÉÀ» ºñ±³ÇÏ¿© »çÀü ÇнÀÀÇ È¿À²¼ºÀ» Á¶»çÇÕ´Ï´Ù. NewsQA ÀÛ¾÷ÀÇ °ËÁõ ¼¼Æ®¿¡ ´ëÇÑ EM Á¡¼öÀÇ ÇнÀ °î¼±ÀÌ ±×¸² 3 ¿¡ ³ª¿Í ÀÖ½À´Ï´Ù . ¼¼ °¡Áö ¸ðµ¨ Áß T5 ¼ö·ÅÀº QA Á᫐ Áö½ÄÀÌ ¾ø±â ¶§¹®¿¡ °¡Àå ´À¸³´Ï´Ù. ¹Ý¸é Á¦¾ÈµÈ ProQA´Â °¡Àå ºü¸£°í °¡Àå Àß ÀûÀÀÇÕ´Ï´Ù. ¶ÇÇÑ UnifiedQA EM Á¡¼ö°¡ ºü¸£°Ô Æ÷È­µÇ°í °á±¹ ¾à°£ ÀúÇϵǴ °ÍÀ» ¹ß°ßÇߴµ¥, ÀÌ´Â ¸ðµ¨ÀÌ ¸î ¹øÀÇ ¼¦ ¼³Á¤¿¡¼­ °úÀûÇյǾúÀ½À» ½Ã»çÇÕ´Ï´Ù. ¹Ý¸é, ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ³»ºÎÀÇ Çϵå ÇÁ·ÒÇÁÆ®¿Í ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®°¡ Áö½Ä ÀϹÝÈ­¿Í Áö½Ä ¸ÂÃãÈ­ÀÇ ±ÕÇüÀ» Àß À¯ÁöÇϱ⠶§¹®¿¡ ProQA´Â Áö¼ÓÀûÀ¸·Î °³¼±µÇ°í °áÄÚ ÀúÇϵÇÁö ¾Ê½À´Ï´Ù.

ȯ°æ

¸ðµ¨

´º½ºQA

¶³¾îÁö´Ù

²Þ

Àüü µ¥ÀÌÅÍ

ÇÁ·ÎQA

50.4

52.5

73.3

 ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ® ¾øÀÌ

48.6

51.2

69.9

  »çÀü ÈÆ·Ã ¾øÀÌ

48.1

44.5

68.4

UnifiedQA + »çÀü ÇнÀ ÄÚÆÛ½º

46.8

50.3

69.4

Ç»¼¦

ÇÁ·ÎQA

42.1

27.1

66.0

 ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ® ¾øÀÌ

38.5

24.3

64.5

  »çÀü ÈÆ·Ã ¾øÀÌ

20.5

4.8

35.1

UnifiedQA + »çÀü ÇнÀ ÄÚÆÛ½º

37.3

23.5

59.6

Á¦·Î¼¦

ÇÁ·ÎQA

31.8

19.7

65.2

 ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ® ¾øÀÌ

29.8

19.0

63.5

  »çÀü ÈÆ·Ã ¾øÀÌ

0.0

0.2

32.6

UnifiedQA + »çÀü ÇнÀ ÄÚÆÛ½º

26.0

18.1

58.0

Ç¥ 4:¼­·Î ´Ù¸¥ QA Çü½Ä(ÃßÃâ, Ãß»ó, °´°ü½Ä)À¸·Î ¼¼ °¡Áö ºñ½Ãµå µ¥ÀÌÅÍ ¼¼Æ®¿¡ ´ëÇÑ ÀýÁ¦ ¿¬±¸ °á°úÀÔ´Ï´Ù.

5.4ÀýÁ¦ ¿¬±¸

ProQAÀÇ ¸ðµç ±¸¼º ¿ä¼ÒÀÇ È¿À²¼ºÀ» ¹àÈ÷±â À§ÇØ ÀýÁ¦ ¿¬±¸°¡ ¼öÇàµË´Ï´Ù. ¿ì¸®´Â ProQAÀÇ ¼¼ °¡Áö º¯ÇüÀ» °í·ÁÇÕ´Ï´Ù. (1) ±¸Á¶Àû ÇÁ·ÒÇÁÆ®¿¡ ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®°¡ ¾ø´Â ProQA; (2) ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ±³À° ¾øÀÌ ProQA¸¦ Ãß°¡·Î ¼öÇàÇÕ´Ï´Ù. (3) UnifiedQA + Pre-train Corpus´Â ÁغñµÈ ´ë±Ô¸ð ÇÕ¼º QA ÄÚÆÛ½º¿¡ ´ëÇØ »çÀü ÈÆ·ÃµÈ UnifiedQA ¸ðµ¨ÀÔ´Ï´Ù. ¼­·Î ´Ù¸¥ QA Çü½ÄÀÇ ¼¼ °¡Áö ºñ½Ãµå µ¥ÀÌÅÍ ¼¼Æ®¿¡ ´ëÇÑ °á°ú°¡ Ç¥ 4 ¿¡ ³ª¿Í ÀÖ½À´Ï´Ù . ¸ðµ¨¿¡¼­ ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¸¦ Á¦°ÅÇÏ¸é »çÀü ÈÆ·Ã Áß¿¡ ÇнÀµÈ ÀÛ¾÷º° Áö½ÄÀÌ ºñÈ°¼ºÈ­µÈ´Ù´Â °ÍÀ» ¹ß°ßÇß½À´Ï´Ù. °Ô´Ù°¡ ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ÈÆ·ÃÀ» Á¦°ÅÇÏ¸é µ¿µîÇÑ ¸ðµ¨(T5 + ÇÏµå ±¸Á¶Àû ÇÁ·ÒÇÁÆ®)¿¡ QA Áö½ÄÀÌ ¾ø±â ¶§¹®¿¡ ¼º´ÉÀÌ Å©°Ô ÀúÇϵ˴ϴÙ. ¸¶Áö¸·À¸·Î UnifiedQA + Pre-train Corpus´Â ProQA¿Í °æÀïÇÒ ¼ö ¾ø¾úÀ¸¸ç, ÀÌ´Â ¿ì¸®°¡ Á¦¾ÈÇÑ ±¸Á¶Àû ÇÁ·ÒÇÁÆ®°¡ UnifiedQAº¸´Ù Áö½Ä ÀϹÝÈ­¿Í Áö½Ä ¸ÂÃãÈ­ »çÀÌ¿¡¼­ ´õ ³ªÀº ±ÕÇüÀ» ¾ò´Â´Ù´Â °ÍÀ» º¸¿©ÁÝ´Ï´Ù.

6³íÀÇ

ÀÌ ¼½¼Ç¿¡¼­´Â »õ·Î¿î ½ºÅ°¸¶¸¦ »ç¿ëÇÏ¿© ProQA¸¦ »õ·Î¿î ÀÛ¾÷À¸·Î È®ÀåÇÏ´Â ¹æ¹ý¿¡ ´ëÇØ ³íÀÇÇÏ°í ÀáÀçÀûÀÎ ÇâÈÄ ¹æÇâÀ» Á¶¸íÇÕ´Ï´Ù.

1) ±¸Á¶Àû ÇÁ·ÒÇÁÆ®¸¦ ÅëÇÑ ÀÛ¾÷ ÀûÀÀ: ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ¼³°è´Â ProQA¿¡ ´õ ³ªÀº È®À强À» ºÎ¿©ÇÕ´Ï´Ù. ÁÖ¿ä ½ÇÇè¿¡¼­´Â 3°¡Áö Çü½Ä À¯Çü°ú 11°¡Áö QA ÀÛ¾÷À» äÅÃÇß½À´Ï´Ù. ¾ÕÀ¸·Î´Â ProQA¸¦ ´õ ¸¹Àº ÀÛ¾÷, Çü½Ä, µµ¸ÞÀÎ ¹× »õ·Î¿î ÀÔ·Â ½ºÅ°¸¶¿¡ Àû¿ëÇÒ ¼ö ÀÖ½À´Ï´Ù. Á÷°üÀûÀ¸·Î ProQA´Â º¸ÀÌÁö ¾Ê´Â Çü½Ä/µµ¸ÞÀÎÀÌ ÀÖ´Â »õ·Î¿î ÀÛ¾÷¿¡ ÀûÀÀÇÒ ¶§ ƯÁ¤ ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¸¦ ÃʱâÈ­ÇÏ°í ¸ðµ¨ ÈÆ·ÃÀ» ÅëÇØ »õ·Î¿î µµ¸ÞÀÎ/ÀÛ¾÷ÀÇ Æ¯¼ºÀ» ÇнÀÇÒ ¼ö ÀÖ½À´Ï´Ù. ¶ÇÇÑ, »õ·Î¿î Å°¸¦ Æ÷ÇÔÇÏ´Â »õ·Î¿î ÀÔ·Â ½ºÅ°¸¶(¿¹: " ÃßÃâµÈ ¿£ÅÍƼ ¶Ç´Â »ó½ÄÀû Áö½Ä ") ¸¦ ¹ß°ßÇϸé ÀÔ·Â ½ºÅ°¸¶¿¡ »õ·Î¿î Å°-°ª ½ÖÀ» Ãß°¡ÇÏ°í ÈÆ·ÃÀ» ÅëÇØ »õ·Î¿î Å° ÁöÇ¥ÀÇ ±â´ÉÀ» ÇнÀÇÒ ¼ö ÀÖ½À´Ï´Ù.

2) ÅëÇÕ QA ½Ã½ºÅÛ: ÅëÇÕ QA ½Ã½ºÅÛ¿¡ ´ëÇÑ Ãß°¡ ¿¬±¸´Â ¹ü¿ë QA¸¦ À§ÇÑ ´õ ³ªÀº »çÀü ÈÆ·Ã ½ºÅ°¸¶¸¦ ¸ñÇ¥·Î Çϰųª ´õ º¹ÀâÇÑ ÀÔ·Â ¶Ç´Â Ãâ·Â Çü½ÄÀ» ó¸®Çϱâ À§ÇÑ ±¸Á¶Àû ÇÁ·ÒÇÁÆ®¿¡ ´ëÇÑ ¸ðµ¨¸µ Àü·«À» ÃÖÀûÈ­ÇÒ ¼ö ÀÖ´Ù°í »ý°¢ÇÕ´Ï´Ù(¿¹: ÃßÃâµÈ ¿£ÅÍƼ ¶Ç´Â °Ë»öµÈ Áö½Ä).

3) ±¸Á¶Àû ÇÁ·ÒÇÁÆ®¿ÍÀÇ ÅëÇÕ : ±¸Á¶Àû ÇÁ·ÒÇÁÆ®ÀÇ Àû¿ëÀº QA ¾÷¹«¿¡¸¸ ±¹ÇѵÇÁö ¾Ê½À´Ï´Ù. Á÷°üÀûÀ¸·Î ´Ù¾çÇÑ Çü½ÄÀ̳ª ±¸¼º¿ä¼Ò¸¦ °¡Áø ÀÛ¾÷ ÀÔ·Â/Ãâ·ÂÀº °¨Á¤ ºÐ¼® Zhong et al. °ú °°Àº ±¸Á¶Àû ÇÁ·ÒÇÁÆ®·Î ±¸¼ºµÉ ¼öµµ ÀÖ½À´Ï´Ù . (2021) , ½ºÅ¸ÀÏ Àü´Þ Li et al. (2022³â) . ÀÌ·¯ÇÑ ¹æ½ÄÀ¸·Î ¿ì¸®´Â ½ÅÁßÇÏ°Ô ±¸¼ºµÈ ±¸Á¶Àû ÀÔ·ÂÀ¸·Î ¿©·¯ ÀÛ¾÷À» ÅëÇÕÇÏ°í Àüü Æз¯´ÙÀÓÀÇ ÅëÀϼº°ú È®À强À» Çâ»ó½Ãų ¼ö ÀÖ½À´Ï´Ù.

7°á·Ð

±¸Á¶Àû ÇÁ·ÒÇÁÆ®ÀÇ ºê¸®Áö¸¦ ÅëÇØ ´Ù¾çÇÑ QA ÀÛ¾÷À» ÇØ°áÇϱâ À§ÇØ ´ÜÀÏ ¸ðµ¨À» äÅÃÇÏ´Â ÅëÇÕ QA Æз¯´ÙÀÓÀÎ ProQA¸¦ ¼Ò°³ÇÕ´Ï´Ù. ±¸Á¶Àû ÇÁ·ÒÇÁÆ®´Â ±¸Á¶ÀûÀ¸·Î ¼³°èµÈ ÇнÀ °¡´ÉÇÑ ÀÔ·Â ½ºÅ°¸¶¸¦ ÅëÇØ ´Ù¾çÇÑ ÀÛ¾÷¿¡ ÇÊ¿äÇÑ °øÅë ´É·ÂÀ» µ¿½Ã¿¡ ¸ðµ¨¸µÇÏ°í °¢ ÀÛ¾÷ÀÇ Àü¹®¼ºÀ» À¯ÁöÇÕ´Ï´Ù. ¿ì¸®´Â ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ÇнÀÀ» Ãß°¡·Î ¼öÇàÇÏ¿© ¸ðµ¨¿¡ ÀϹÝÀûÀÎ QA Á᫐ ´É·ÂÀ» ºÎ¿©ÇÏ°í ±¸Á¶Àû ÇÁ·ÒÇÁÆ®¿¡ ´ëÇÑ Àǹ̷ÐÀû Áö½ÄÀ» »çÀü ÇнÀ ¸ðµ¨¿¡ ÁÖÀÔÇÕ´Ï´Ù. 11°³ QA º¥Ä¡¸¶Å©¿¡ ´ëÇÑ ½ÇÇè °á°ú´Â ProQA°¡ ¸ðµç ¼³Á¤¿¡¼­ ¼º´ÉÀ» Å©°Ô Çâ»ó½Ãų ¼ö ÀÖÀ½À» º¸¿©ÁÝ´Ï´Ù. Ãß°¡ ºÐ¼®¿¡¼­´Â ¿ì¸®ÀÇ ¹æ¹ýÀÌ Áö¼ÓÀûÀÎ ÇнÀ Áß¿¡ Ä¡¸íÀûÀÎ ¸Á°¢ ¹®Á¦¸¦ ´õ Àß ¿ÏÈ­ÇÒ ¼ö ÀÖÀ¸¸ç ±¸Á¶Àû ÇÁ·ÒÇÁÆ®ÀÇ ÀÌÁ¡À» È°¿ëÇÏ¿© »õ·Î °ü·ÃµÈ ÀÛ¾÷¿¡ ´õ ºü¸£°Ô ÀûÀÀÇÒ ¼ö ÀÖÀ½À» º¸¿©ÁÝ´Ï´Ù. ¾ÕÀ¸·Î´Â ¿ì¸®ÀÇ ºÐ¼®ÀÌ ÅëÇÕµÈ QA ¹æ¹ý¿¡ ´ëÇÑ ´õ ¸¹Àº Ž»ö¿¡ ¿µ°¨À» Áְųª ±¸Á¶Àû ÇÁ·ÒÇÁÆ®¿¡ ÀÇÇÑ º¹ÀâÇÑ ÀÔ·Â ¸ðµ¨¸µÀ» ÅëÇØ °³º° ÀÛ¾÷À» ÅëÇÕÇÒ ¼ö Àֱ⸦ ¹Ù¶ø´Ï´Ù. ¶ÇÇÑ º¹ÀâÇÑ ÀÔ·ÂÀ¸·Î ´õ ¸¹Àº ÀÛ¾÷À» ÅëÇÕÇÏ´Â µ¥ ±¸Á¶Àû ÇÁ·ÒÇÁÆ®°¡ ´õ¿í È°¿ëµÉ ¼ö Àֱ⸦ ¹Ù¶ø´Ï´Ù.

8°¨»çÀÇ ¸»

Jian YinÀÌ ±³½ÅÀúÀÚÀÔ´Ï´Ù. Wanjun Zhong, Jiahai Wang ¹× Jian YinÀº ±¤µÕ¼º ÇÙ½É Áö¿ª ¿¬±¸ °³¹ß ÇÁ·Î±×·¥(2020B0101100001)ÀÇ Áö¿øÀ» ¹Þ½À´Ï´Ù.

Âü°íÀÚ·á

Bianet al. (2021)Ning Bian, Xianpei Han, Bo Chen, Hongyu Lin, Ben He ¹× Le Sun. 2021.¾ð¾î ¸ðµ¨°ú µ¶ÇØ »çÀÌÀÇ °ÝÂ÷ ÇؼÒ: Àڱ⠰¨µ¶À» ÅëÇÑ °¨µ¶µÇÁö ¾ÊÀº mrc .ArXiv »çÀü Àμâ , ABS/2107.08582.

Bommasaniet al. (2021)Rishi Bommasani, Drew A Hudson, Ehsan Adeli, Russ Altman, Simran Arora, Sydney von Arx, Michael S Bernstein, Jeannette Bohg, Antoine Bosselut, Emma Brunskill µî 2021.±âÃÊ ¸ðµ¨ÀÇ ±âȸ¿Í À§Çè¿¡ ´ëÇØ .ArXiv »çÀü Àμâ , ABS/2108.07258.

Brownet al. (2020)Åè B. ºê¶ó¿î, º¥ÀڹΠ¸Ç, ´Ð ¶óÀÌ´õ, ¸á¶ó´Ï ¼öºñ¾Æ, ÀÚ·¹µå Ä«Çöõ, ÇÁ¶óÇ®¶ó ´Ù¸®¿Ð, ¾Æ¸£ºóµå ´Ò¶óĭź, ÇÁ¶ó³ªºê ¼¤, ±â¸®½¬ »ç½ºÆ®¸®, ¾Æ¸¸´Ù ¾Æ½ºÄÌ, »êµð´Ï ¾Æ°¡¿Ð, ¾Æ¸®¿¤ Çã¹öÆ®-º¸½º, ±×·¹Ã¾ Å©·ç°Å, Åè Çì´ÏÇÑ, ¸®¿ø Â÷Àϵå, ¾ÆµðƼ¾ß Ramesh, Daniel M. Ziegler, Jeffrey Wu, Clemens Winter, Christopher Hesse, Mark Chen, Eric Sigler, Mateusz Litwin, Scott Gray, Benjamin Chess, Jack Clark, Christopher Berner, Sam McCandlish, Alec Radford, Ilya Sutskever ¹× Dario Amodei. 2020.¾ð¾î ¸ðµ¨Àº ¼Ò¼öÀÇ ÇнÀÀÚÀÔ´Ï´Ù .½Å°æ Á¤º¸ ó¸® ½Ã½ºÅÛÀÇ ¹ßÀü 33: ½Å°æ Á¤º¸ ó¸® ½Ã½ºÅÛ¿¡ °üÇÑ ¿¬·Ê ÄÁÆÛ·±½º 2020, NeurIPS 2020, 2020³â 12¿ù 6~12ÀÏ, °¡»ó .

Clarket al. (2019)Å©¸®½ºÅäÆÛ Å¬¶óÅ©, ÄËÆ° ¸®, Àå¹Ö¿þÀÌ, Åè Å©À§¾ÆÆ®ÄÚ½ºÅ°, ¸¶ÀÌŬ Äݸ°½º, Å©¸®½ºÆ¼³ª ÅõŸ³ë¹Ù. 2019.BoolQ: ÀÚ¿¬½º·¯¿î ¿¹/¾Æ´Ï¿ä Áú¹®ÀÇ ³î¶ó¿î ¾î·Á¿ò Ž±¸ .Àü»ê ¾ð¾îÇÐ Çùȸ ºÏ¹Ì ÁöºÎÀÇ 2019 ȸÀÇ ÁøÇà: Àΰ£ ¾ð¾î ±â¼ú, 1±Ç(Àå¹® ¹× ´Ü±â ³í¹®) , 2924~2936ÆäÀÌÁö, ¹Ì³×¼ÒŸ ÁÖ ¹Ì´Ï¾ÖÆú¸®½º. Àü»ê¾ð¾îÇÐÇùȸ.

Dasigiet al. (2019)Pradeep Dasigi, Nelson F. Liu, Ana Marasović, Noah A. Smith ¹× Matt Gardner. 2019.Quoref: »óÈ£ Ãß·ÐÀÌ ÇÊ¿äÇÑ Áú¹®ÀÌ Æ÷ÇÔµÈ µ¶ÇØ µ¥ÀÌÅͼ¼Æ®ÀÔ´Ï´Ù .2019³â ÀÚ¿¬¾î ó¸®ÀÇ °æÇèÀû ¹æ¹ý¿¡ °üÇÑ È¸ÀÇ ¹× Á¦9Â÷ ÀÚ¿¬¾î 󸮿¡ °üÇÑ ±¹Á¦ ÇÕµ¿ ȸÀÇ(EMNLP-IJCNLP) ÁøÇà , ÆäÀÌÁö 5925-5932, È«Äá, Áß±¹. Àü»ê¾ð¾îÇÐÇùȸ.

Deng et al. (2019)Yang Deng, Yuexiang Xie, Yaliang Li, Min Yang, Nan Du, Wei Fan, Kai Lei ¹× Ying Shen. 2019.´äº¯ ¼±Åà ¹× Áö½Ä ±â¹Ý Áú¹® ´äº¯À» À§ÇÑ ´ÙÁß ºä ÁÖÀǸ¦ ÅëÇÑ ´ÙÁß ÀÛ¾÷ ÇнÀ .Àΰø Áö´É¿¡ °üÇÑ Á¦33ȸ AAAI ÄÁÆÛ·±½º , AAAI 2019, Á¦31ȸ Àΰø Áö´ÉÀÇ Çõ½ÅÀûÀÎ ÀÀ¿ë ÄÁÆÛ·±½º, IAAI 2019, Àΰø Áö´É ±³À° ¹ßÀü¿¡ °üÇÑ Á¦9Â÷ AAAI ½ÉÆ÷Áö¾ö, EAAI 2019, ¹Ì±¹ ÇÏ¿ÍÀÌ È£³î·ê·ç, 1¿ù 27ÀÏ - 2019³â 2¿ù 1ÀÏ , 6318~6325ÆäÀÌÁö. AAAI ÇÁ·¹½º.

Dinget al. (2021)Ning Ding, Shengding Hu, Weilin Zhao, Yulin Chen, Zhiyuan Liu, Hai-Tao Zheng ¹× Maosong Sun. 2021.Openprompt: ÇÁ·ÒÇÁÆ® ÇнÀÀ» À§ÇÑ ¿ÀÇ ¼Ò½º ÇÁ·¹ÀÓ¿öÅ©ÀÔ´Ï´Ù .ArXiv »çÀü Àμâ , ABS/2111.01998.

Duaet al. (2019a)Dheeru Dua, Ananth Gottumukkala, Alon Talmor, Sameer Singh ¹× Matt Gardner. 2019a.Orb: ±â°è µ¶ÇØ·ÂÀ» Á¾ÇÕÀûÀ¸·Î Æò°¡Çϱâ À§ÇÑ °ø°³ µ¶¼­ º¥Ä¡¸¶Å©ÀÔ´Ï´Ù .ArXiv »çÀü Àμâ , ABS/1912.12598.

Duaet al. (2019b)Dheeru Dua, Yizhong Wang, Pradeep Dasigi, Gabriel Stanovsky, Sameer Singh ¹× Matt Gardner. 2019b.»èÁ¦: ´Ü¶ô¿¡ ´ëÇÑ °³º° Ãß·ÐÀÌ ÇÊ¿äÇÑ µ¶ÇØ º¥Ä¡¸¶Å©ÀÔ´Ï´Ù .Àü»ê ¾ð¾îÇÐ Çùȸ ºÏ¹Ì ÁöºÎ 2019 ȸÀÇ ÁøÇà: Àΰ£ ¾ð¾î ±â¼ú, 1±Ç(Àå¹® ¹× ´ÜÆí ³í¹®) , 2368~2378ÆäÀÌÁö, ¹Ì³×¼ÒŸ ÁÖ ¹Ì´Ï¾ÖÆú¸®½º. Àü»ê¾ð¾îÇÐÇùȸ.

¿¡Ä¡¿À´Ï (2011)¿À·» ¿¡Ä¡¿À´Ï. 2011.°Ë»ö¿¡´Â º¯È­°¡ ÇÊ¿äÇÕ´Ï´Ù.ÀÚ¿¬ , 476(7358):25–26.

Fischet al. (2019)Adam Fisch, Alon Talmor, Robin Jia, ¼­¹ÎÁØ, ÃÖÀº¼Ö, Danqi Chen. 2019.MRQA 2019 °øÀ¯°úÁ¦: µ¶ÇØÀÇ ÀϹÝÈ­ Æò°¡ .Áú¹® ´äº¯À» À§ÇÑ ±â°è Æǵ¶¿¡ °üÇÑ Á¦2Â÷ ¿öÅ©¼ó ÁøÇà Áß , 1~13ÆäÀÌÁö, Áß±¹ È«Äá. Àü»ê¾ð¾îÇÐÇùȸ.

Gaoet al. (2021)Yifan Gao, Jingjing Li, Michael R Lyu ¹× Irwin King. 2021.°³¹æ °Ë»ö ´ëÈ­Çü ±â°è Àбâ .ArXiv »çÀü Àμâ , ABS/2102.08633.

Gaoet al. (2020)Yifan Gao, Chien-Sheng Wu, Jingjing Li, Shafiq Joty, Steven CH Hoi, Caiming Xiong, Irwin King ¹× Michael Lyu. 2020.Discern: ´ëÈ­Çü ±â°è Àб⸦ À§ÇÑ ´ã·Ð ÀÎ½Ä ¼ö¹Ý Ãß·Ð ³×Æ®¿öÅ© .2020³â EMNLP(ÀÚ¿¬¾î ó¸®ÀÇ °æÇèÀû ¹æ¹ý¿¡ °üÇÑ È¸ÀÇ) ÁøÇà °úÁ¤ , 2439~2449ÆäÀÌÁö, ¿Â¶óÀÎ. Àü»ê¾ð¾îÇÐÇùȸ.

Glasset al. (2020)Michael Glass, Alfio Gliozzo, Rishav Chakravarti, Anthony Ferritto, Lin Pan, G P Shrivatsa Bhargav, Dinesh Garg ¹× Avi Sil. 2020.ÁúÀÇ ÀÀ´äÀ» À§ÇÑ ½ºÆÒ ¼±Åà »çÀü ÈÆ·Ã .Àü»ê¾ð¾îÇÐÇùȸ Á¦58Â÷ ¿¬Â÷ÃÑȸ ÁøÇà , 2773~2782ÆäÀÌÁö, ¿Â¶óÀÎ. Àü»ê¾ð¾îÇÐÇùȸ.

Guu et al. (2020)Kelvin Guu, Kenton Lee, Zora Tung, Panupong Pasupat ¹× Ming-Wei Chang. 2020.¿µ¿ª: °Ë»ö Áõ°­ ¾ð¾î ¸ðµ¨ »çÀü ÈÆ·Ã .ArXiv »çÀü Àμâ , ABS/2002.08909.

Hambardzumyanet al. (2021)Karen Hambardzumyan, Hrant Khachatrian, Jonathan May. 2021.WARP: ´Ü¾î ¼öÁØÀÇ Àû´ëÀû ÀçÇÁ·Î±×·¡¹Ö .ÄÄÇ»ÅÍ ¾ð¾îÇÐ Çùȸ Á¦59Â÷ ¿¬·Ê ȸÀÇ ¹× ÀÚ¿¬¾î 󸮿¡ °üÇÑ Á¦11Â÷ ±¹Á¦ ÇÕµ¿ ȸÀÇ ÁøÇà °úÁ¤(1±Ç: ±ä ³í¹®) , ÆäÀÌÁö 4921-4933, ¿Â¶óÀÎ. Àü»ê¾ð¾îÇÐÇùȸ.

È£½ºÅ·°ú ¸®µ¨ (2019)Åè È£½ºÅ·°ú ¼¼¹Ù½ºÂù ¸®µ¨. 2019.Áú¹® »ý¼º ¸ðµ¨¿¡ ´ëÇÑ º¸»ó Æò°¡ .Àü»ê ¾ð¾îÇÐ Çùȸ ºÏ¹Ì ÁöºÎÀÇ 2019 ȸÀÇ ÁøÇà: Àΰ£ ¾ð¾î ±â¼ú, 1±Ç(Àå¹® ¹× ´ÜÆí ³í¹®) , 2278~2283ÆäÀÌÁö, ¹Ì³×¼ÒŸ ÁÖ ¹Ì´Ï¾ÖÆú¸®½º. Àü»ê¾ð¾îÇÐÇùȸ.

Huet al. (2021)Ziniu Hu, Yizhou Sun ¹× Kai-Wei Chang. 2021.¿ÀÇ µµ¸ÞÀÎ Áú¹® ´äº¯À» À§ÇÑ °ü°è ±â¹Ý »çÀü ±³À° .ÄÄÇ»ÅÍ ¾ð¾îÇÐ Çùȸ Á¶»ç °á°ú: EMNLP 2021 , 3431~3448ÆäÀÌÁö, µµ¹Ì´ÏÄ« °øÈ­±¹ ǬŸ Ä«³ª. Àü»ê¾ð¾îÇÐÇùȸ.

Jianget al. (2020)Zhengbao Jiang, Frank F. Xu, Jun Araki, Graham Neubig. 2020.¾î¶² ¾ð¾î ¸ðµ¨ÀÌ ¾Ë°í ÀÖ´ÂÁö ¾î¶»°Ô ¾Ë ¼ö ÀÖ³ª¿ä?Àü»ê¾ð¾îÇÐÇùȸ °Å·¡ , 8:423-438.

Kanget al. (2020)°­¹Î±â, Çѹ®¼ö, Ȳ¼ºÁÖ. 2020.½Å°æ ¸¶½ºÅ© »ý¼º±â: ¾ð¾î ¸ðµ¨ ÀûÀÀÀ» À§ÇÑ ÀûÀÀÇü ´Ü¾î ¸¶½ºÅ·À» »ý¼ºÇÏ´Â ¹æ¹ýÀ» ÇнÀÇÕ´Ï´Ù .2020³â EMNLP(ÀÚ¿¬¾î ó¸®ÀÇ °æÇèÀû ¹æ¹ý¿¡ °üÇÑ ÄÁÆÛ·±½º) °£Ç๰ , ÆäÀÌÁö 6102-6120, ¿Â¶óÀÎ. Àü»ê¾ð¾îÇÐÇùȸ.

Karpukhinet al. (2020)Vladimir Karpukhin, Barlas Oguz, Sewon Min, Patrick Lewis, Ledell Wu, Sergey Edunov, Danqi Chen ¹× Wen-tau Yih. 2020.¿ÀÇ µµ¸ÞÀÎ Áú¹® ´äº¯À» À§ÇÑ ¹ÐÁýµÈ ±¸Àý °Ë»ö .2020³â EMNLP(ÀÚ¿¬¾î ó¸®ÀÇ °æÇèÀû ¹æ¹ý¿¡ °üÇÑ È¸ÀÇ) ÁøÇà °úÁ¤ , ÆäÀÌÁö 6769-6781, ¿Â¶óÀÎ. Àü»ê¾ð¾îÇÐÇùȸ.

Khashabiet al. (2020a)´Ù´Ï¿¤ Ä«»þºñ, Åõ»þ¸£ ÄÚÆ®, ¾Æ½Ã½Ã »ç¹Ù¿Ð. 2020a.ºñ¿ë ´ëºñ ´õ Å« È¿°ú: °­·ÂÇÑ Áú¹® ´äº¯À» À§ÇÑ ÀÚ¿¬½º·¯¿î µ¿¿ä .2020³â ÀÚ¿¬¾î ó¸®(EMNLP)ÀÇ °æÇèÀû ¹æ¹ý¿¡ °üÇÑ ÄÁÆÛ·±½º ÁøÇà , 163~170ÆäÀÌÁö, ¿Â¶óÀÎ. Àü»ê¾ð¾îÇÐÇùȸ.

Khashabiet al. (2020b)´Ù´Ï¿¤ Ä«»þºñ(Daniel Khashabi), ¹Î¼¼¿ø(Sewon Min), Åõ»þ¸£ ÄÚÆ®(Tushar Khot), ¾Æ½Ã½Ã »ç¹Ù¿Ð(Ashish Sabharwal), ¿ÀÀ̺óµå ŸÇǿ丣µå(Oyvind Tafjord), ÇÇÅÍ Å¬¶óÅ©(Peter Clark), Çѳª³× ÇÏÁö½Ã¸£Áö(Hannaneh Hajishirzi). 2020b.UNIFIEDQA: ´ÜÀÏ QA ½Ã½ºÅÛÀ¸·Î Çü½ÄÀÇ °æ°è¸¦ ³Ñ½À´Ï´Ù .Àü»ê ¾ð¾îÇÐ Çùȸ Á¶»ç °á°ú: EMNLP 2020 , ÆäÀÌÁö 1896-1907, ¿Â¶óÀÎ. Àü»ê¾ð¾îÇÐÇùȸ.

Kočiskýet al. (2018)Tomáš Kočiský, Jonathan Schwarz, Phil Blunsom, Chris Dyer, Karl Moritz Hermann, Gábor Melis ¹× Edward Grefenstette. 2018.NarrativeQA µ¶ÇØ Ã§¸°Áö .Àü»ê¾ð¾îÇÐÇùȸ °Å·¡ , 6:317-328.

Kwiatkowskiet al. (2019)Tom Kwiatkowski, Jennimaria Palomaki, Olivia Redfield, Michael Collins, Ankur Parikh, Chris Alberti, Danielle Epstein, Illia Polosukhin, Jacob Devlin, Kenton Lee, Kristina Toutanova, Llion Jones, Matthew Kelcey, Ming-Wei Chang, Andrew M. Dai, Jakob Uszkoreit, Quoc Le ¹× Slav Petrov. 2019.ÀÚ¿¬½º·¯¿î Áú¹®: Áú¹® ´äº¯ ¿¬±¸ÀÇ º¥Ä¡¸¶Å©ÀÔ´Ï´Ù .Àü»ê¾ð¾îÇÐÇùȸ °Å·¡ , 7:452-466.

Laiet al. (2017)Guokun Lai, Qizhe Xie, Hanxiao Liu, Yiming Yang ¹× Eduard Hovy. 2017.RACE: ½ÃÇè¿¡¼­ ¾òÀº ´ë±Ô¸ð ReAding ÀÌÇØ µ¥ÀÌÅͼ¼Æ® .ÀÚ¿¬¾î ó¸®ÀÇ °æÇèÀû ¹æ¹ý¿¡ °üÇÑ 2017³â ȸÀÇ °£Ç๰ , ÆäÀÌÁö 785-794, µ§¸¶Å© ÄÚÆæÇÏ°Õ. Àü»ê¾ð¾îÇÐÇùȸ.

Lesteret al. (2021)ºê¶óÀ̾𠷹½ºÅÍ, ¶ó¹Ì ¾ËǪ, ³ë¾Æ ÄܽºÅºÆ®. 2021.¸Å°³º¯¼ö È¿À²ÀûÀÎ ÇÁ·ÒÇÁÆ® Æ©´×À» À§ÇÑ ±Ô¸ðÀÇ Èû .ÀÚ¿¬¾î ó¸®ÀÇ °æÇèÀû ¹æ¹ý¿¡ °üÇÑ 2021³â ÄÁÆÛ·±½º ÁøÇà , 3045~3059ÆäÀÌÁö, ¿Â¶óÀÎ ¹× µµ¹Ì´ÏÄ« °øÈ­±¹ ǬŸ Ä«³ª. Àü»ê¾ð¾îÇÐÇùȸ.

Lewiset al. (2020)Mike Lewis, Yinhan Liu, Naman Goyal, Marjan Ghazvininejad, Abdelrahman Mohamed, Omer Levy, Veselin Stoyanov ¹× Luke Zettlemoyer. 2020.BART: ÀÚ¿¬¾î »ý¼º, ¹ø¿ª ¹× ÀÌÇظ¦ À§ÇÑ ½ÃÄö½º °£ »çÀü ÈÆ·ÃÀ» Á¦°ÅÇÕ´Ï´Ù .Àü»ê¾ð¾îÇÐÇùȸ Á¦58Â÷ ¿¬Â÷ÃÑȸ ÁøÇà , 7871-7880ÆäÀÌÁö, ¿Â¶óÀÎ. Àü»ê¾ð¾îÇÐÇùȸ.

Lewiset al. (2019)ÆÐÆ®¸¯ ·çÀ̽º, ·çµµºò µå³ëÀ̾î, ¼¼¹Ù½ºÆ¼¾È ¸®µ¨. 2019.cloze ¹ø¿ªÀ» ÅëÇÑ ÀÚÀ² Áú¹® ´äº¯ .Àü»ê¾ð¾îÇÐÇùȸ Á¦57Â÷ ¿¬Â÷ÃÑȸ ÁøÇà , 4896~4910ÆäÀÌÁö, ÀÌÅ»¸®¾Æ ÇÇ·»Ã¼. Àü»ê¾ð¾îÇÐÇùȸ.

Lewiset al. (2021)Patrick Lewis, Yuxiang Wu, Linqing Liu, Pasquale Minervini, Heinrich Küttler, Aleksandra Piktus, Pontus Stenetorp ¹× Sebastian Riedel. 2021.PAQ: 6,500¸¸ °³ÀÇ Áú¹®°ú À̸¦ È°¿ëÇÏ¿© ¹«¾ùÀ» ÇÒ ¼ö ÀÖ´ÂÁö .Àü»ê¾ð¾îÇÐÇùȸ °Å·¡ , 9:1098-1115.

Li et al. (2019)Jingjing Li, Yifan Gao, Lidong Bing, Irwin King ¹× Michael R. Lyu. 2019.¿äÁ¡ ¸Æ¶ô¿¡ ¸Â°Ô Áú¹® »ý¼ºÀ» °³¼±ÇÕ´Ï´Ù .2019³â ÀÚ¿¬¾î ó¸®ÀÇ °æÇèÀû ¹æ¹ý¿¡ °üÇÑ È¸ÀÇ ¹× Á¦9Â÷ ÀÚ¿¬¾î 󸮿¡ °üÇÑ ±¹Á¦ ÇÕµ¿ ȸÀÇ(EMNLP-IJCNLP) °£Ç๰ , ÆäÀÌÁö 3216-3226, È«Äá, Áß±¹. Àü»ê¾ð¾îÇÐÇùȸ.

Li et al. (2022)Jingjing Li, Zichao Li, Tao Ge, Irwin King ¹× Michael R Lyu. 2022.Áï°¢ÀûÀΠǥÇö ÃÖÀûÈ­¸¦ ÅëÇÑ ÅؽºÆ® °³Á¤ .ArXiv »çÀü Àμâ , ABS/2204.07359.

Li et al. (2020)Jingjing Li, Zichao Li, Lili Mou, Xin Jiang, Michael R. Lyu ¹× Irwin King. 2020.°Ë»ö ÇнÀÀ» ÅëÇÑ ºñÁöµµ ÅؽºÆ® »ý¼º .½Å°æ Á¤º¸ ó¸® ½Ã½ºÅÛÀÇ ¹ßÀü 33: ½Å°æ Á¤º¸ ó¸® ½Ã½ºÅÛ¿¡ °üÇÑ ¿¬·Ê ÄÁÆÛ·±½º 2020, NeurIPS 2020, 2020³â 12¿ù 6~12ÀÏ, °¡»ó .

¸® ¾Ø ¸®¾Ó (2021)¼§ ¸®»ç ¸®¿Í Æ۽à ¸®¾Ó. 2021.Á¢µÎ»ç Á¶Á¤: »ý¼ºÀ» À§ÇÑ ¿¬¼Ó ÇÁ·ÒÇÁÆ® ÃÖÀûÈ­ .Àü»ê ¾ð¾îÇÐ Çùȸ Á¦59Â÷ ¿¬·Ê ȸÀÇ ¹× ÀÚ¿¬¾î 󸮿¡ °üÇÑ Á¦11Â÷ ±¹Á¦ ÇÕµ¿ ȸÀÇ ÁøÇà °úÁ¤(1±Ç: ±ä ³í¹®) , ÆäÀÌÁö 4582-4597, ¿Â¶óÀÎ. Àü»ê¾ð¾îÇÐÇùȸ.

¸° (2004)Ä£À¯ ¸°. 2004.ROUGE: ¿ä¾à ÀÚµ¿ Æò°¡¿ë ÆÐÅ°ÁöÀÔ´Ï´Ù .ÅؽºÆ® ¿ä¾à ¿¡¼­ ºÐ±â°¡ ³ª¿È , 74~81ÆäÀÌÁö, ½ºÆäÀÎ ¹Ù¸£¼¿·Î³ª. Àü»ê¾ð¾îÇÐÇùȸ.

Liu et al. (2021)Pengfei Liu, Weizhe Yuan, Jinlan Fu, Zhengbao Jiang, Hiroaki Hayashi ¹× Graham Neubig. 2021.»çÀü ÇнÀ, ÇÁ·ÒÇÁÆ® ¹× ¿¹Ãø: ÀÚ¿¬¾î ó¸®ÀÇ ÇÁ·ÒÇÁÆ® ¹æ¹ý¿¡ ´ëÇÑ Ã¼°èÀûÀÎ Á¶»ç .ArXiv »çÀü Àμâ , ABS/2107.13586.

McCannet al. (2018)ºê¶óÀ̾ð ¸Æĵ(Bryan McCann), ´ÏƼ½Ã ½¬¸®½¬ ÄɽºÄ«¸£(Nitish Shirish Keskar), Ä«ÀÌ¹Ö ½Ã¿Ë(Caiming Xiong), ¸®Â÷µå ¼ÒÄ¿(Richard Socher). 2018.ÀÚ¿¬¾î 10Á¾ °æ±â: Áú¹® ´äº¯À» ÅëÇÑ ¸ÖƼŽºÅ· ÇнÀ .ArXiv »çÀü Àμâ , ABS/1806.08730.

Mihaylovet al. (2018)Todor Mihaylov, Peter Clark, Tushar Khot ¹× Ashish Sabharwal. 2018.°©¿ÊÀÌ Àü±â¸¦ ÀüµµÇÒ ¼ö ÀÖ³ª¿ä? ¿ÀÇÂºÏ Áú¹®´äº¯À» À§ÇÑ »õ·Î¿î µ¥ÀÌÅͼ¼Æ® .2018³â ÀÚ¿¬¾î ó¸®ÀÇ °æÇèÀû ¹æ¹ý¿¡ °üÇÑ ÄÁÆÛ·±½º ÁøÇà , 2381~2391ÆäÀÌÁö, º§±â¿¡ ºê·ò¼¿. Àü»ê¾ð¾îÇÐÇùȸ.

Raffelet al. (2020)Colin Raffel, Noam Shazeer, Adam Roberts, Katherine Lee, Sharan Narang, Michael Matena, Yanqi Zhou, Wei Li ¹× Peter J. Liu. 2020.ÅëÇÕµÈ ÅؽºÆ®-ÅؽºÆ® º¯È¯±â¸¦ »ç¿ëÇÏ¿© ÀüÀÌ ÇнÀÀÇ ÇѰ踦 Ž»öÇÕ´Ï´Ù .±â°è ÇнÀ ¿¬±¸ Àú³Î , 21(140):1–67.

Rajpurkaret al. (2016)Pranav Rajpurkar, Jian Zhang, Konstantin Lopyrev ¹× Percy Liang. 2016.SQuAD: ±â°èÀÇ ÅؽºÆ® ÀÌÇظ¦ À§ÇÑ 100,000°³ ÀÌ»óÀÇ Áú¹® .ÀÚ¿¬¾î ó¸®ÀÇ °æÇèÀû ¹æ¹ý¿¡ °üÇÑ 2016³â ÄÁÆÛ·±½º ÁøÇà , 2383~2392ÆäÀÌÁö, Åػ罺 ÁÖ ¿À½ºÆ¾. Àü»ê¾ð¾îÇÐÇùȸ.

Ramet al. (2021)¿À¸® ·¥, À¯¹ß Ä¿½ºÅ×ÀÎ, Á¶³ª´Ü º£¶õÆ®, ¾Æ¹Ì¸£ ±Û·Î¹ö½¼, ¿À¸Þ¸£ ·¹ºñ. 2021.»çÀü ÇнÀ ¹üÀ§ ¼±ÅÃÀ» ÅëÇÑ Ç»¼¦ Áú¹® ´äº¯ .Àü»ê ¾ð¾îÇÐ Çùȸ Á¦59Â÷ ¿¬·Ê ȸÀÇ ¹× ÀÚ¿¬¾î 󸮿¡ °üÇÑ Á¦11Â÷ ±¹Á¦ ÇÕµ¿ ȸÀÇ ÁøÇà °úÁ¤(1±Ç: ±ä ³í¹®) , 3066~3079ÆäÀÌÁö, ¿Â¶óÀÎ. Àü»ê¾ð¾îÇÐÇùȸ.

Richardsonet al. (2013)¸ÅÆ© ¸®Ã³µå½¼, Å©¸®½ºÅäÆÛ JC ¹öÁö½º, ¿¡¸° ·»¼î. 2013.MCTest: ¿ÀÇ µµ¸ÞÀÎ ±â°èÀÇ ÅؽºÆ® ÀÌÇظ¦ À§ÇÑ Ã§¸°Áö µ¥ÀÌÅÍ ¼¼Æ®ÀÔ´Ï´Ù .2013³â ÀÚ¿¬¾î ó¸®ÀÇ °æÇèÀû ¹æ¹ý¿¡ °üÇÑ ÄÁÆÛ·±½º ÁøÇà , 193~203ÆäÀÌÁö, ¹Ì±¹ ¿ö½ÌÅÏÁÖ ½Ã¾ÖƲ. Àü»ê¾ð¾îÇÐÇùȸ.

Sap et al. (2019)¸¶Æ¾ »ð, Çѳª ·¡½¬Å², µ¥¸¯ þ, ·Î³­ ¸£ ºê¶ó½º, ÃÖ¿¹Áø. 2019.Social IQa: »çȸÀû »óÈ£ÀÛ¿ë¿¡ ´ëÇÑ »ó½ÄÀû Ãß·Ð .2019³â ÀÚ¿¬¾î ó¸® ½ÇÁõÀû ¹æ¹ý ȸÀÇ ¹× Á¦9ȸ ÀÚ¿¬¾î 󸮿¡ °üÇÑ ±¹Á¦ ÇÕµ¿ ȸÀÇ(EMNLP-IJCNLP) ÁøÇà , 4463~4473ÆäÀÌÁö, Áß±¹ È«Äá. Àü»ê¾ð¾îÇÐÇùȸ.

½¬Å©¿Í ½´Ã¼(2021a)Ƽ¸ð ½¬Å©(Timo Schick)¿Í Èù¸®È÷ ½´Ã¼(Hinrich Schütze). 2021a.¼Ò¼öÀÇ ÅؽºÆ® ºÐ·ù ¹× ÀÚ¿¬¾î Ãß·ÐÀ» À§ÇØ cloze-questions¸¦ È°¿ëÇÕ´Ï´Ù .Àü»ê ¾ð¾îÇÐ Çùȸ À¯·´ ÁöºÎÀÇ Á¦16Â÷ ȸÀÇ ÁøÇà: ÁÖ¿ä º¼·ý , 255-269ÆäÀÌÁö, ¿Â¶óÀÎ. Àü»ê¾ð¾îÇÐÇùȸ.

½¬Å©¿Í ½´Ã¼(2021b)Ƽ¸ð ½¬Å©(Timo Schick)¿Í Èù¸®È÷ ½´Ã¼(Hinrich Schütze). 2021b.Áß¿äÇÑ °ÍÀº Å©±â¸¸ÀÌ ¾Æ´Õ´Ï´Ù. ¼Ò±Ô¸ð ¾ð¾î ¸ðµ¨Àº ¼Ò¼öÀÇ ÇнÀÀÚÀ̱⵵ ÇÕ´Ï´Ù .Àü»ê¾ð¾îÇÐÇùȸ ºÏ¹ÌÁöºÎÀÇ 2021³â ÄÁÆÛ·±½º ÁøÇà: Àΰ£ ¾ð¾î ±â¼ú , ÆäÀÌÁö 2339-2352, ¿Â¶óÀÎ. Àü»ê¾ð¾îÇÐÇùȸ.

Shenet al. (2019)Tao Shen, Xiubo Geng, Tao Qin, Daya Guo, Duyu Tang, Nan Duan, Guodong Long ¹× Daxin Jiang. 2019.´ë±Ô¸ð Áö½Äº£À̽º¸¦ ÅëÇÑ ´ëÈ­Çü ÁúÀÇÀÀ´äÀ» À§ÇÑ ¸ÖƼŽºÅ· ÇнÀ .2019³â ÀÚ¿¬¾î ó¸® ½ÇÁõÀû ¹æ¹ý ȸÀÇ ¹× Á¦9ȸ ÀÚ¿¬¾î 󸮿¡ °üÇÑ ±¹Á¦ ÇÕµ¿ ȸÀÇ(EMNLP-IJCNLP) ÁøÇà °úÁ¤ , 2442~2451ÆäÀÌÁö, Áß±¹ È«Äá. Àü»ê¾ð¾îÇÐÇùȸ.

Shinet al. (2020)Taylor Shin, Yasaman Razeghi, Robert L. Logan IV, Eric Wallace ¹× Sameer Singh. 2020.ÀÚµ¿ ÇÁ·ÒÇÁÆ®: ÀÚµ¿À¸·Î »ý¼ºµÈ ÇÁ·ÒÇÁÆ®¸¦ »ç¿ëÇÏ¿© ¾ð¾î ¸ðµ¨¿¡¼­ Áö½Ä ÃßÃâ .2020³â EMNLP(ÀÚ¿¬¾î ó¸®ÀÇ °æÇèÀû ¹æ¹ý¿¡ °üÇÑ È¸ÀÇ) ÁøÇà °úÁ¤ , 4222~4235ÆäÀÌÁö, ¿Â¶óÀÎ. Àü»ê¾ð¾îÇÐÇùȸ.

Sunet al. (2019)Ä«ÀÌ ¼±(Kai Sun), µð¾È À¯(Dian Yu), þÁ¨½´(Jianshu Chen), µ¿À¯(Dong Yu), ÃÖ¿¹Áø(Yejin Choi), Ŭ·¹¾î Ä«µð(Claire Cardie). 2019.²Þ: ´ëÈ­ ±â¹Ý µ¶Çظ¦ À§ÇÑ Ã§¸°Áö µ¥ÀÌÅÍ ¼¼Æ® ¹× ¸ðµ¨ .Àü»ê¾ð¾îÇÐÇùȸ °Å·¡ , 7:217-231.

ŸÇǿ丣µå¿Í Ŭ¶óÅ©(2021)¿ÀÀ̺óµå ŸÇǿ丣µå(Oyvind Tafjord)¿Í ÇÇÅÍ Å¬¶óÅ©(Peter Clark). 2021.¸¶Ä«¿ì¸¦ ÀÌ¿ëÇÑ ¹ü¿ë ÁúÀÇÀÀ´ä .ArXiv »çÀü Àμâ , ABS/2109.02593.

ÅŸð¾î¿Í º£¶õÆ® (2019)¾Ë·Ð ÅŸÓ(Alon Talmor)¿Í Á¶³ª´Ü º£¶õÆ®(Jonathan Berant). 2019.MultiQA: µ¶ÇØÀÇ ÀϹÝÈ­ ¹× Àü´Þ¿¡ ´ëÇÑ ½ÇÁõÀû Á¶»çÀÔ´Ï´Ù .Àü»ê¾ð¾îÇÐÇùȸ Á¦57Â÷ ¿¬·Ê ȸÀÇ ÁøÇà , 4911~4921ÆäÀÌÁö, ÀÌÅ»¸®¾Æ ÇÇ·»Ã¼. Àü»ê¾ð¾îÇÐÇùȸ.

Trischleret al. (2017)Adam Trischler, Tong Wang, Xingdi Yuan, Justin Harris, Alessandro Sordoni, Philip Bachman ¹× Kaheer Suleman. 2017.NewsQA: ±â°è ÀÌÇØ µ¥ÀÌÅÍ ¼¼Æ® .NLP¸¦ À§ÇÑ Ç¥Çö ÇнÀ¿¡ °üÇÑ 2Â÷ ¿öÅ©¼ó ÁøÇà , 191~200ÆäÀÌÁö, ij³ª´Ù ¹êÄí¹ö. Àü»ê¾ð¾îÇÐÇùȸ.

¿Õ ¿Ü. (2021)Cunxiang Wang, Pai Liu, Yue Zhang. 2021.»çÀü ÈÆ·ÃµÈ »ý¼ºÀû ¾ð¾î ¸ðµ¨ÀÌ ºñ°ø°³ QA¸¦ À§ÇÑ Áö½Ä ±â¹ÝÀ¸·Î »ç¿ëµÉ ¼ö ÀÖ½À´Ï±î?Àü»ê ¾ð¾îÇÐ Çùȸ Á¦59Â÷ ¿¬·Ê ȸÀÇ ¹× ÀÚ¿¬¾î 󸮿¡ °üÇÑ Á¦11Â÷ ±¹Á¦ ÇÕµ¿ ȸÀÇ ÁøÇà °úÁ¤(1±Ç: ±ä ³í¹®) , 3241~3251ÆäÀÌÁö, ¿Â¶óÀÎ. Àü»ê¾ð¾îÇÐÇùȸ.

Wolfet al. (2020)Thomas Wolf, Lysandre µ¥ºß, Victor Sanh, Julien Chaumond, Clement Delangue, Anthony Moi, Pierric Cistac, Tim Rault, Remi Louf, Morgan Funtowicz, Joe Davison, Sam Shleifer, Patrick von Platen, Clara Ma, Yacine Jernite, Julien Plu, Canwen Xu, Teven Le Scao, Sylvain Gugger, Mariama Drame, Quentin Lhoest ¹× Alexander Rush. 2020.Transformers: ÃÖ÷´Ü ÀÚ¿¬¾î ó¸® .ÀÚ¿¬¾î ó¸®ÀÇ °æÇèÀû ¹æ¹ý¿¡ °üÇÑ 2020 ÄÁÆÛ·±½º ÁøÇà: ½Ã½ºÅÛ ½Ã¿¬ , 38~45ÆäÀÌÁö, ¿Â¶óÀÎ. Àü»ê¾ð¾îÇÐÇùȸ.

Yanget al. (2018)Zhilin Yang, Peng Qi, Saizheng Zhang, Yoshua Bengio, William Cohen, Ruslan Salakhutdinov ¹× Christopher D. Manning. 2018.HotpotQA: ´Ù¾çÇÏ°í ¼³¸í °¡´ÉÇÑ ´ÙÁß È© Áú¹® ´äº¯À» À§ÇÑ µ¥ÀÌÅͼ¼Æ®ÀÔ´Ï´Ù .2018³â ÀÚ¿¬¾î ó¸®ÀÇ °æÇèÀû ¹æ¹ý¿¡ °üÇÑ ÄÁÆÛ·±½º ÁøÇà , 2369~2380ÆäÀÌÁö, º§±â¿¡ ºê·ò¼¿. Àü»ê¾ð¾îÇÐÇùȸ.

Zenget al. (2020)Changchang Zeng, Shaobo Li, Qin Li, Jie Hu ¹× Jianjun Hu. 2020.±â°è µ¶Çط¿¡ ´ëÇÑ ¼³¹® Á¶»ç - ÀÛ¾÷, Æò°¡ ÁöÇ¥ ¹× º¥Ä¡¸¶Å© µ¥ÀÌÅÍ ¼¼Æ®.ÀÀ¿ë°úÇÐ , 10(21):7640.

Zhonget al. (2022)Wanjun Zhong, Junjie Huang, Qian Liu, Ming Zhou, Jiahai Wang, Jian Yin ¹× Nan Duan. 2022.Å×ÀÌºí ¹× ÅؽºÆ® ¿ÀÇ µµ¸ÞÀÎ qa¿¡ ´ëÇÑ ÇÏÀ̺긮µå üÀο¡ ´ëÇÑ Ãß·Ð .ArXiv »çÀü Àμâ , ABS/2201.05880.

Zhonget al. (2021)Wanjun Zhong, Duyu Tang, Jiahai Wang, Jian Yin ¹× Nan Duan. 2021.UserAdapter: °¨Á¤ ºÐ¼®¿¡¼­ »ç¿ëÀÚ ÇнÀÀÌ °ÅÀÇ ÀÌ·ç¾îÁöÁö ¾Ê½À´Ï´Ù .ÄÄÇ»ÅÍ ¾ð¾îÇÐ Çùȸ Á¶»ç °á°ú: ACL-IJCNLP 2021 , 1484~1488ÆäÀÌÁö, ¿Â¶óÀÎ. Àü»ê¾ð¾îÇÐÇùȸ.

ºÎ·Ï±¸Çö ¼¼ºÎÁ¤º¸

A.1ÄÚÆÛ½º Áغñ

ÀÌ ºÎºÐ¿¡¼­´Â ¸»¹¶Ä¡ ±¸¼ºÀÇ ¼¼ºÎ »çÇ×À» ¼³¸íÇÕ´Ï´Ù.

ÇöÀç »çÀü ÈÆ·Ã ÄÚÆÛ½º¿¡´Â 100¸¸ °³ÀÇ °´°ü½Ä QA ÀνºÅϽº, 200¸¸ °³ÀÇ ÃßÃâ QA ÀνºÅϽº, 200¸¸ °³ÀÇ Ãß»ó QA ÀνºÅϽº¸¦ Æ÷ÇÔÇÏ¿© ±¸Á¶Àû ÇÁ·ÒÇÁÆ®·Î °ø½ÄÈ­µÈ °ÅÀÇ 400¸¸ °³ÀÇ »çÀü ÈÆ·Ã ÀνºÅϽº°¡ Æ÷ÇԵǾî ÀÖ½À´Ï´Ù. Áú¹®°ú ´äº¯À» »ý¼ºÇÒ ¶§ ÄÁÅؽºÆ®¸¦ ÀÔ·Â À¸·Î »ç¿ëÇÏ°í " Áú¹® [SEP] ´äº¯ " ½ÃÄö½º¸¦ Ãâ·ÂÀ¸·Î »ç¿ëÇÕ´Ï´Ù. ÇÊÅ͸µ ¸ðµ¨À» ÈÆ·ÃÇϱâ À§ÇØ ÄÁÅؽºÆ® ¿Í Áú¹® À» ÀÔ·ÂÀ¸·Î »ç¿ëÇÏ°í ´äº¯À» ´ÙÀ½ °ú °°ÀÌ »ç¿ëÇÕ´Ï´Ù. QA ½Ö ÇÊÅ͸µÀÇ Ãß·Ð °úÁ¤¿¡¼­ ÄÁÅؽºÆ®¿Í »ý¼ºµÈ Áú¹®À» QA ¸ðµ¨ÀÇ ¸ðµ¨ ÀÔ·ÂÀ¸·Î »ç¿ëÇÏ°í »ý¼ºµÈ ´äº¯À» ·¹À̺í·Î ¼³Á¤ÇÑ ´ÙÀ½ ±³Â÷ ¿£Æ®·ÎÇÇ ¼Õ½ÇÀ» »ç¿ëÇÏ¿© ÃÖÁ¾ ¼ÒÇÁÆ® ½ºÄھ °è»êÇÕ´Ï´Ù. ¶óº§°ú QA ¸ðµ¨¿¡ ÀÇÇØ »ý¼ºµÈ ´äº¯ »çÀÌ¿¡¼­ ´ÙÀ½À¸·Î »ý¼ºµÈ ¸ðµç QA ½ÖÀÇ ¼ÒÇÁÆ® ½ºÄھ µû¶ó ¿À¸§Â÷¼øÀ¸·Î ´Ù½Ã ¼øÀ§¸¦ ÁöÁ¤ÇÏ¿© °¡Àå ÀÏ°üµÈ QA ½ÖÀ» »çÀü ÈÆ·Ã ÀνºÅϽº·Î ¼±ÅÃÇÕ´Ï´Ù.

±¸Ã¼ÀûÀ¸·Î ¿ì¸®´Â ¸ðµ¨ ÈÆ·ÃÀ» À§ÇÑ ÃÖÀûÈ­ µµ±¸·Î AdamW¸¦ »ç¿ëÇÕ´Ï´Ù. ¿ì¸®´Â T5-Large¸¦ ¸ðµ¨ ¹éº»À¸·Î äÅÃÇÏ°í ½Ãµå µ¥ÀÌÅÍ ¼¼Æ®¸¦ Áú¹®-´äº¯ ½Ö »ý¼º ¹× ÇÊÅ͸µ QA ¸ðµ¨ ±³À°À» À§ÇÑ °¨µ¶À¸·Î äÅÃÇÕ´Ï´Ù. ÇнÀ ¼Óµµ¸¦ 1e-5·Î, Áغñ ´Ü°è¸¦ 0À¸·Î, ¹èÄ¡ Å©±â¸¦ GPU´ç 2·Î, ÈÆ·Ã ¿¡Æ÷Å©¸¦ 10À¸·Î ¼³Á¤Çß½À´Ï´Ù.

A.2»çÀü ÈÆ·Ã ¹× ÀÛ¾÷ ÀûÀÀ¿¡ ´ëÇÑ ¼¼ºÎÁ¤º¸ÀÔ´Ï´Ù.

»çÀü ÈÆ·Ã.

»çÀü ÈÆ·Ã Áß¿¡ ¿ì¸®´Â Ư¼ö ÇÙ½É ÁöÇ¥ ¿Í ÀÛ¾÷/Çü½Äº° ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ® ÀÇ Ç¥ÇöÀ» »ç¿ëÇÏ¿© ÁÖ¿ä ¸ðµ¨ ¸Å°³º¯¼ö¸¦ °øµ¿À¸·Î ÈÆ·ÃÇÕ´Ï´Ù .

óÀ½¿¡´Â »çÀü ÈÆ·Ã Áß¿¡ ƯÁ¤ ÀÛ¾÷ÀÌ ¾øÀ¸¹Ç·Î ¼¼ °¡Áö »çÀü ÈÆ·Ã ÄÚÆÛ½º(¿¹: " MultiChoiceQA, Extractive QA ¹× Abstractive QA ")¸¦ ¼¼ °¡Áö Ãʱâ ÀÛ¾÷À¸·Î ÃëÇÏ°í ÀÛ¾÷À» ¹«ÀÛÀ§·Î ÃʱâÈ­ÇÏ°í ƯÁ¤ ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ® Çü½ÄÀ» ÁöÁ¤ÇÕ´Ï´Ù.

±¸Ã¼ÀûÀ¸·Î, ¿ì¸®´Â T5-Base¸¦ ¸ðµ¨ ¹éº»À¸·Î »ç¿ëÇÏ°í ÇнÀ ¼Óµµ¸¦ 1e-4·Î, ¹èÄ¡ Å©±â¸¦ GPU´ç 8·Î, ±×·¡µð¾ðÆ® ´©Àû ´Ü°è¸¦ 10À¸·Î ¼³Á¤Çß½À´Ï´Ù. »çÀü ÈÆ·ÃÀ» À§ÇØ 8°³ÀÇ V100 GPU¸¦ äÅÃÇß½À´Ï´Ù.

¹Ì¼¼ Á¶Á¤.

¹Ì¼¼ Á¶Á¤ÇÏ´Â µ¿¾È ƯÁ¤ ´Ù¿î½ºÆ®¸² ÀÛ¾÷¿¡ ´ëÇÑ ÀÛ¾÷/Çü½Äº° ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¸¦ ÃʱâÈ­ÇØ¾ß ÇÕ´Ï´Ù. ÀÛ¾÷ÀÌ »çÀü ÈÆ·Ã ´Ü°è¿¡ Âü¿©Çϴ ƯÁ¤ Çü½Ä¿¡ ÇØ´çÇÏ´Â °æ¿ì ÀÌ Çü½Ä À¯ÇüÀÇ ÇØ´ç ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¸¦ »ç¿ëÇÏ¿© ÇнÀµÈ Áö½ÄÀ» Àü´ÞÇϱâ À§ÇØ ÇöÀç ÀÛ¾÷¿¡ ´ëÇÑ ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¸¦ ÃʱâÈ­ÇÕ´Ï´Ù. ÀÛ¾÷ÀÌ »õ·Î¿î Çü½Ä¿¡ ÇØ´çÇÏ´Â °æ¿ì ÀÛ¾÷/Çü½Ä ÇÁ·ÒÇÁÆ®¸¦ ¹«ÀÛÀ§·Î ÃʱâÈ­ÇÒ ¼ö ÀÖ½À´Ï´Ù.

±¸Ã¼ÀûÀ¸·Î T5-Base¸¦ ¸ðµ¨ ¹éº»À¸·Î »ç¿ë ÇÏ°í ÇнÀ ¼Óµµ¸¦ 1e-4·Î, ¹èÄ¡ Å©±â¸¦ GPU´ç 2·Î, ±×·¡µð¾ðÆ® ´©Àû ´Ü°è¸¦ 2·Î, ÈÆ·Ã ¿¡Æ÷Å©¸¦ 5·Î ¼³Á¤Çß½À´Ï´Ù. ¹Ì¼¼ Á¶Á¤À» À§ÇØ 8°³ÀÇ V100 GPU¸¦ äÅÃÇß½À´Ï´Ù.

Ç»¼¦ ÇнÀ.

¿ì¸®´Â Few-Shot ÇнÀÀ» À§ÇØ ÀÛ¾÷º° ¼ÒÇÁÆ® ÇÁ·ÒÇÁÆ®¸¦ ÃʱâÈ­ÇÏ´Â À¯»çÇÑ ¹æ¹ýÀ» äÅÃÇß½À´Ï´Ù. Ç»¼¦ ÇнÀÀ» À§ÇØ ¹«ÀÛÀ§·Î ¼±ÅÃµÈ 32°³ÀÇ ÀνºÅϽº¸¦ È°¿ëÇϴ ǥÁØ ¼³Á¤À» »ç¿ëÇÕ´Ï´Ù. ±¸Ã¼ÀûÀ¸·Î T5-Base¸¦ ¸ðµ¨ ¹éº»À¸·Î äÅÃÇÏ°í ÇнÀ·üÀ» 1e-5·Î, ¹èÄ¡ Å©±â¸¦ GPU´ç 1·Î, ±×·¡µð¾ðÆ® ´©Àû ´Ü°è¸¦ 1·Î, ÇнÀ ´Ü°è¸¦ 800À¸·Î ¼³Á¤ÇÏ¿© ¼Ò¼ö ¼¦ ÇнÀÀ» ¼öÇàÇÕ´Ï´Ù.

Á¦·Î¼¦ ÇнÀ

Á¦·Î¼¦ ÇнÀ¿¡´Â ÈÆ·Ã ´Ü°è°¡ Æ÷ÇÔµÇÁö ¾ÊÀ¸¹Ç·Î Ãß·ÐÀ» À§ÇØ ÀÛ¾÷º° ÇÁ·ÒÇÁÆ®¸¸ ÃʱâÈ­ÇÏ¸é µË´Ï´Ù. µû¶ó¼­ ÇØ´ç Çü½Ä À¯ÇüÀÇ »çÀü ÈÆ·ÃµÈ ÀÛ¾÷ ÇÁ·ÒÇÁÆ®¸¦ »ç¿ëÇÏ¿© ÀÛ¾÷º° ÇÁ·ÒÇÁÆ®¸¦ ÃʱâÈ­ÇÕ´Ï´Ù.

ȯ°æ

µ¥ÀÌÅͼ¼Æ®

ºÎ¿ïQ

Àüü µ¥ÀÌÅÍ

T5

62.2

ÇÁ·Î QA

80.6

Ç»¼¦

T5

0.0

ÇÁ·Î QA

55.4

Á¦·Î¼¦

T5

0.0

ÇÁ·Î QA

62.1

Ç¥ 5:Àüü µ¥ÀÌÅÍ ¹Ì¼¼ Á¶Á¤, Ç»¼¦ ÇнÀ ¹× Á¦·Î¼¦ ÇнÀ ¼³Á¤¿¡ µû¸¥ µÎ °¡Áö ¿¹/¾Æ´Ï¿ä QA ÀÛ¾÷ÀÇ °á°úÀÔ´Ï´Ù.

ÀÛ¾÷ A

ÀÛ¾÷ A ¸ðµ¨

(¸î °¡Áö °á°ú)

ÀÛ¾÷ B

Task B ¸ðµ¨

(Task A Æò°¡)

ÀÛ¾÷ B ¸ðµ¨(ÀÛ¾÷ A ÇÁ·ÒÇÁÆ® Æ÷ÇÔ)

(ÀÛ¾÷ A¿¡ ´ëÇÑ Æò°¡)

EX/NewsQA (EM)

42.1

EX/Äõ·¹ÇÁ(EM)

33.7

35.3

AB/µå·Ó(F1)

31.3

33.7

AB/NQ¿­±â (F1)

27.6

34.2

MC/µå¸²(Acc)

35.2

37.9

MC/MCÅ×½ºÆ®(Acc)

34.5

36.8

MC/OBQA(Acc)

34.4

35.9

EX/Äõ·¹ÇÁ(EM)

52.2

EX/NewsQA (EM)

41.1

42.8

AB/µå·Ó(F1)

43.0

51.4

AB/NQ¿­±â (F1)

38.0

51.0

MC/µå¸²(Acc)

47.2

51.3

MC/MCÅ×½ºÆ®(Acc)

47.8

52.0

MC/OBQA(Acc)

48.5

51.6

AB/NQ¿­±â (F1)

36.0

EX/NewsQA (EM)

32.8

33.9

EX/Äõ·¹ÇÁ(EM)

36.2

35.4

AB/µå·Ó(F1)

34.3

35.8

AB/µå·Ó(F1)

27.1

EX/NewsQA (EM)

22.8

26.3

EX/Äõ·¹ÇÁ(EM)

24.0

26.6

AB/NQ¿­±â (F1)

25.0

25.6

MC/µå¸²(Acc)

25.1

26.2

MC/MCÅ×½ºÆ®(Acc)

25.4

26.7

MC/OBQA(Acc)

25.6

26.7

MC/MCÅ×½ºÆ®(Acc)

84.1

EX/NewsQA (EM)

81.6

83.1

AB/µå·Ó(F1)

82.8

83.8

MC/µå¸²(Acc)

83.2

83.8

MC/OBQA(Acc)

82.2

82.5

MC/µå¸²(Acc)

66.0

EX/NewsQA (EM)

64.0

65.4

AB/µå·Ó(F1)

63.5

65.7

MC/MCÅ×½ºÆ®(Acc)

65.5

65.8

MC/OBQA(Acc)

65.2

65.5

MC/OBQA(Acc)

44.8

EX/NewsQA (EM)

41.4

45.2

AB/µå·Ó(F1)

40.6

44.2

MC/MCÅ×½ºÆ®(Acc)

44.8

45.8

MC/µå¸²(Acc)

44.2

46.8

Ç¥ 6: Áö¼ÓÀûÀÎ ÇнÀ¿¡ ´ëÇÑ Àüü °á°úÀÔ´Ï´Ù. °¢ ÀÛ¾÷¿¡ ´ëÇØ ÀÛ¾÷ Çü½Ä(EX, AB, MC)°ú ÇØ´ç Æò°¡ ÁöÇ¥(EM, F1, Acc)¸¦ Á¦°øÇÕ´Ï´Ù. EX: ÃßÃâÀû QA; AB: Ãß»óÀûÀÎ QA; MC: °´°ü½Ä QA.

ºÎ·Ï B¿¹/¾Æ´Ï¿ä »çÀü ÈÆ·Ã °á°ú

ÆÄÀÏ·µ ¿¬±¸ Áß¿¡ ¿ì¸®´Â BoolQ Clark et al. (2019)¸¦ ½Ãµå µ¥ÀÌÅͼ¼Æ®·Î »ç¿ëÇÏ¿© ´ë±Ô¸ð »çÀü ÇнÀ ÄÚÆÛ½º¸¦ ±¸ÃàÇÏ°í, »çÀü ÇнÀµÈ ProQA À§¿¡ Àüü µ¥ÀÌÅÍ, Ç»¼¦, Á¦·Î¼¦À» Å×½ºÆ®ÇÕ´Ï´Ù. ¿ì¸®´Â ¶ÇÇÑ ÀÌ µ¥ÀÌÅÍ ¼¼Æ® BoolQ-NP Khashabi et al. ÀÇ ÀÚ¿¬ÀûÀ¸·Î ±³¶õµÈ ¹öÀüÀ» »ç¿ëÇÕ´Ï´Ù . (2020a) Æò°¡¸¦ À§ÇØ °í·ÁµË´Ï´Ù. °á°ú¸¦ Ç¥ 5 ¿¡ ³ªÅ¸³»¾ú´Ù . ¿ì¸®´Â ProQA°¡ ¸ðµç ¼³Á¤¿¡¼­ T5 ±âÁغ¸´Ù ÈξÀ ¶Ù¾î³­ ¼º´ÉÀ» º¸Àδٴ °ÍÀ» ¹ß°ßÇß½À´Ï´Ù. ¿ì¸®´Â ¸ðµ¨ÀÇ Ãâ·ÂÀ» ¾ö°ÝÇÏ°Ô Æò°¡ÇÕ´Ï´Ù. Áï, Ãâ·ÂÀÌ "¿¹", "¾Æ´Ï¿À", "Âü", "°ÅÁþ" Çü½ÄÀÌ ¾Æ´Ñ °æ¿ì ÇØ´ç ¿¹ÃøÀº À߸øµÈ °ÍÀ¸·Î ºÐ·ùµË´Ï´Ù.

ºÎ·Ï CÁö¼ÓÀûÀÎ ÇнÀ¿¡ ´ëÇÑ ¼¼ºÎ »çÇ×

Ç¥ 6Àº ¿¬¼Ó ÇнÀ ½ÇÇèÀÇ Àüü °á°ú¸¦ Á¦°øÇÕ´Ï´Ù. ¸ðµ¨Àº ¸ÕÀú ¸î ¹øÀÇ ¼¦ ¼³Á¤À¸·Î ÀÛ¾÷ A¿¡ ´ëÇØ ÇнÀÇÑ ´ÙÀ½ ÀÛ¾÷ B¿¡ ´ëÇØ ¹Ì¼¼ Á¶Á¤ÇÕ´Ï´Ù. ±×·± ´ÙÀ½ ÀÛ¾÷ A¿¡ ´ëÇØ ÇнÀµÈ "ÀÛ¾÷ B ¸ðµ¨"°ú "ÀÛ¾÷ B ¸ðµ¨(ÀÛ¾÷ A ÇÁ·ÒÇÁÆ® Æ÷ÇÔ)"À» Æò°¡ÇÕ´Ï´Ù. Áö¼ÓÀûÀÎ ÇнÀ ´É·ÂÀ» Å×½ºÆ®ÇÕ´Ï´Ù. ¸ðµç ÀÛ¾÷ A/ÀÛ¾÷ B Á¶ÇÕ(ÃÑ 33°³ º¸°í)¿¡ ´ëÇÑ ÀÚ¼¼ÇÑ °á°ú´Â Ç¥ 6 ¿¡ ³ª¿Í ÀÖ½À´Ï´Ù . µ¿ÀÏÇÑ Çü½Ä(¿¹: MC)¿¡ ´ëÇÑ ÀÛ¾÷ ÀûÀÀµµ Á¶»çÇÏ°í ½Í±â ¶§¹®¿¡ Áö¼ÓÀûÀÎ ÇнÀ¿¡¼­ µÎ °¡Áö ÀÛ¾÷À» °í·ÁÇÕ´Ï´Ù.

MC) ¶Ç´Â ´Ù¸¥ Çü½Ä(¿¹: AB

Àü). °á°ú´Â ¿©·¯ ÀÛ¾÷ÀÌ µµÂøÇßÀ» ¶§ Àü¹ÝÀûÀÎ ÃÖ°íÀÇ ¼º°ú¸¦ ´Þ¼ºÇϱâ À§ÇØ ÀÛ¾÷¿¡ ´ëÇÑ ÈÆ·Ã ¼ø¼­¸¦ ¾î¶»°Ô ¹è¿­ÇÒ ¼ö ÀÖ´ÂÁö¿¡ ´ëÇØ ¹àÇôÁÝ´Ï´Ù.

ÀÌÀü±Û ¾Æ¹öÁö ¾î¸Ó´Ï²² µå¸®´Â Çö´ë½Ä Á¦·Ê¹®À» ½áÁà 2024.04.27.
ProQA: ÅëÇÕ Áú¹® ÀÀ´äÀ» À§ÇÑ ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ±³À° 2024.04.01.
´ä±Û  ProQA: ÅëÇÕ Áú¹® ÀÀ´äÀ» À§ÇÑ ±¸Á¶Àû ÇÁ·ÒÇÁÆ® ±â¹Ý »çÀü ±³À° 2024.04.01.

 

 

·¹ÀÌ¾î ´Ý±â