[´Ý±â X]

ȸ»ç¼Ò°³ ±¤°í¹®ÀÇ Áñ°Üã±â
·Î±×ÀΠȸ¿ø°¡ÀÔ ID/PWã±â
ȸ»ç¼Ò°³ °í°´¼¾ÅÍ ±¤°í¾È³» ȸ¿ø¾à°ü °³ÀÎÁ¤º¸Ãë±Þ¹æħ û¼Ò³âº¸È£Á¤Ã¥
 11¿ù 23ÀÏ (Åä) 20:04 ÁÖ¿ä´º½º
¸íÀÇŽ¹æ ½ÅÁ¦Ç°Á¤º¸ ¿À´ÃÀǵ¿Á¤ µ¥½ºÅ©Ä®·³ Ä¿¹Â´ÏƼ ±¸ÀÎ ±¸Á÷
HOME > ÀÇ·á±â±â ÇÁ¸°Æ® ±â»ç¸ñ·Ï l ÀÌÀü±Û ´ÙÀ½±Û
ºä³ë, ÀΰøÁö´É ÀÇ·á À½¼ºÀÎ½Ä ±â¼ú ÀÔÁõÇØ
ÀÎÅͽºÇÇÄ¡2020¿¡¼­ AI À½¼ºÀÎ½Ä ¿¬±¸ 2Æí ¹ßÇ¥
ÀÇ·á ÀΰøÁö´É(AI) ¼Ö·ç¼Ç °³¹ß ±â¾÷ ÁÖ½Äȸ»ç ºä³ë°¡ ÀÚ»çÀÇ ÀΰøÁö´É ±â¹Ý À½¼ºÀÎ½Ä °ü·Ã ¿¬±¸ ³í¹® 2ÆíÀ» ¡®ÀÎÅͽºÇÇÄ¡ 2020¡¯¿¡¼­ ¹ßÇ¥Çß´Ù.

ºä³ë´Â ÇâÈÄ µÎ ¿¬±¸¿¡¼­ ±¹³» ÀÇ·á µ¥ÀÌÅÍ ±â¹ÝÀ¸·Î °ËÁõÇÑ ÀΰøÁö´É ±â¹Ý À½¼ºÀÎ½Ä ±â¼úµéÀ» ±â¹ÝÀ¸·Î ºä³ë¸Þµå µöASR¢â °íµµÈ­ÇØ ±¹³» ÀÇ·áÁøµé¿¡°Ô ¼±º¸ÀÏ ¿¹Á¤ÀÌ´Ù.

±¹Á¦À½¼ºÅë½ÅÇùȸ(ÀÌÇÏ ISCA)°¡ ÁÖÃÖÇÏ´Â ÀÎÅͽºÇÇÄ¡(INTERSPEECH)´Â À½¼ºÀÎ½Ä ºÐ¾ß¿¡¼­ ÃÖ°íÀÇ ±ÇÀ§¸¦ º¸À¯ÇÑ ±¹Á¦ÇÐȸ·Î¼­, ¸Å³â 1,800¿© ¸íÀÇ À½¼º ¾ð¾î ó¸® °ü·Ã Çаè, ¾÷°è, Á¤ºÎ °ü°èÀÚ µîÀÌ Âü¼®ÇÑ´Ù.

¿ÃÇØ·Î 21ȸ¸¦ ¸ÂÀÌÇÑ ÀÎÅͽºÇÇÄ¡2020Àº 10¿ù 25ÀϺÎÅÍ 29ÀϱîÁö 4ÀÏ°£, ¡®À½¼º 󸮸¦ À§ÇÑ ÀÎÁöÁö´É(Cognitive Intelligence for Speech Processing)¡¯À» ÁÖÁ¦·Î ¿­·ÈÀ¸¸ç, ¸¶ÀÌÅ©·Î¼ÒÇÁÆ®, ¾Æ¸¶Á¸, ¾ÖÇÃ, ÀÎÅÚ, ¹ÙÀ̵Î, ¾Ë¸®¹Ù¹Ù µî ¼¼°èÀûÀÎ IT ±â¾÷µéÀÌ Âü¿©Çß´Ù.

ºä³ë´Â À̹ø ÄÁÆÛ·±½º¿¡¼­ ÀÚ»çÀÇ ÀΰøÁö´É ±â¹Ý ÀÇ·á À½¼ºÀÎ½Ä ¼Ö·ç¼Ç ºä³ë¸Þµå µöASR¢â(VUNO Med¢ç-DeepASR¢â)ÀÇ À½¼ºÀÎ½Ä ¿£Áø °íµµÈ­ÀÇ ÀÏȯÀ¸·Î Âø¼öÇÑ 2ÆíÀÇ ¿¬±¸ ³í¹®À» ¹ßÇ¥Çß´Ù.

µÎ ¿¬±¸ ¸ðµÎ À½¼ºÀÎ½Ä ºÐ¾ßÀÇ ÃֽŠ¿¬±¸ ÁÖÁ¦ÀÎ E2E ¸ðµ¨(end-to-end model, µö·¯´× ¸ðµ¨¸¸À¸·Î ÀÔ·ÂµÈ À½¼º Àü¹®À» Áï½Ã ¹®ÀÚÈ­ÇÏ´Â ¹æ½Ä)À» ±â¹ÝÀ¸·Î À½¼ºÀÎ½Ä ¼º´ÉÀ» °­È­ÇÏ´Â ³»¿ëÀ» ´ã°í ÀÖÀ¸¸ç, ºä³ë´Â ÇâÈÄ ÇØ´ç ¿¬±¸¿¡¼­ È®ÀÎÇÑ ±â¼úÀ» ÀÚ»ç ¼Ö·ç¼Ç¿¡ Àû¿ëÇØ ¼º´É°ú Á¤È®µµ¸¦ Çâ»ó½Ãų ¿¹Á¤ÀÌ´Ù.

º» Çмú´ëȸ¿¡¼­ ù ¹ø°·Î ¹ßÇ¥µÈ ºä³ëÀÇ ¿¬±¸´Â E2E ¸ðµ¨À» ±â¹ÝÀ¸·Î ±¹¹®»Ó ¾Æ´Ï¶ó ±¹¿µ¹®À» È¥¿ëÇÑ À½¼º¿¡¼­µµ °¡Àå ³ôÀº ¼º´ÉÀ» º¸ÀÌ´Â ¼­ºê¿öµå(sub-word, ÀÚ¿¬¾îó¸® ¾Ë°í¸®Áò¿¡¼­ Àü󸮷ΠÀÌ¿ëµÇ´Â ´ÜÀ§)¸¦ µµÃâÇÏ¿´À¸¸ç, ÀÚ¸ðÀ½, À½Àý Á¶ÇÕ, ¹ÙÀÌÆ®(byte) µî ´Ù¾çÇÑ ±¹¿µ¹® À½¼ºÀÎ½Ä ¸ðµ¨À» ºñ±³ ºÐ¼®Çß°í, ¹®ÀÚ ¿À·ùÀ²(Character Error Rate, CER), ´Ü¾î ¿À·ùÀ²(Word Error Rate, WER), ¹®Àå ¿À·ùÀ²(Sentence Error Rate, SER)À» ÇöÀúÇÏ°Ô °¨¼Ò½ÃÄ×´Ù.

´õ ³ª¾Æ°¡ ±¹³» º´¿øÀÇ Àǹ« ±â·Ï(medical record) µ¥ÀÌÅ͸¦ ±â¹ÝÀ¸·Î °ËÁõÇÔÀ¸·Î½á, ±¹³» ÀÇ·á ȯ°æ¿¡¼­ÀÇ ³ôÀº È°¿ëµµ¸¦ È®ÀÎÇß´Ù.

¶Ç ´Ù¸¥ ¿¬±¸´Â ÀÚµ¿ À½¼ºÀνÄ(Automatic Speech Recognition, ÀÌÇÏ ASR)¿¡ ½Å°æ¸Á ±¸Á¶ Ž»ö (Neural Architecture Search, NAS) ±â¼úÀ» Àû¿ëÇÑ »õ·Î¿î À½¼ºÀÎ½Ä ¹æ¹ýÀÎ EST(Evolved Speech-Transformer) ¸ðµ¨À» °í¾ÈÇÏ´Â ³»¿ëÀ» ´ã°íÀÖ´Ù.

ÇØ´ç ¸ðµ¨Àº ±âÁ¸ ¹æ½Ä ´ëºñ ³·Àº ´Ü¾î ¿À·ùÀ²(WER)·Î ³ôÀº Á¤È®µµ¸¦ ±â·ÏÇÏ´Â ÇÑÆí, ¸Þ¸ð¸® »ç¿ë·®Àº ÃÖ´ë 30%, ÇнÀ½Ã°£Àº ¾à 4% °¨¼Ò½ÃÄÑ ¿ì¼öÇÑ ¼º´ÉÀ» ÀÔÁõÇß´Ù.

º» ¿¬±¸ÀÇ ¼º´É°ËÁõÀº ¿µ¹® µ¥ÀÌÅͼÂ(Wall Street Journal)°ú ±¹¹® µ¥ÀÌÅͼÂ(Zeroth)À» ±â¹ÝÀ¸·Î ÁøÇàµÅ, ÇâÈÄ EST ¸ðµ¨Àº ¹æ´ëÇÑ ÀÇ·á¿ë¾î·Î ±¹¿µ¹®ÀÌ È¥ÀçµÈ ÀÇ·á ȯ°æ¿¡¼­µµ ³ôÀº ¼º´ÉÀ» º¸ÀÏ ¼ö ÀÖÀ» °ÍÀ¸·Î ±â´ëµÈ´Ù.

±è»ó±â ºä³ë À½¼ºÀνĺ»ºÎÀåÀº ¡°ºä³ëÀÇ ±â¼ú·ÂÀÌ Áý¾àµÈ ºä³ë¸Þµå µöASR¢âµµ ±¹³»»Ó ¾Æ´Ï¶ó ¼¼°è ÃÖ°í ¼öÁØÀÇ ¼º´ÉÀ» ÀÚ¶ûÇÑ´Ù¡±¸ç ¡°À̹ø ¿¬±¸¼º°ú¸¦ ±â¹ÝÀ¸·Î ºä³ë¸Þµå µöASR¢âÀ» °íµµÈ­ÇØ ÀÇ·áÇöÀåÀÇ È¿À²¼ºÀ» È¿°úÀûÀ¸·Î ³ôÀÏ ¼ö ÀÖµµ·Ï ±â¿©ÇÏ°Ú´Ù¡±°í ¸»Çß´Ù.

ÇÑÆí, ºä³ë¸Þµå µöASR¢âÀº ÀΰøÁö´ÉÀ» ±â¹ÝÀ¸·Î ¿µ»óÀÇÇаú/ÇÙÀÇÇаú/º´¸®°ú µî ´Ù¾çÇÑ ÀÇ·á ºÐ¾ß ³» ÀÇ·á ¹®¼­¸¦ ½Ç½Ã°£À¸·Î ¹®¼­È­ÇÏ´Â ÀÇ·á À½¼ºÀÎ½Ä ¼Ö·ç¼ÇÀÌ´Ù. ¼öõ ½Ã°£¿¡ ´ÞÇÏ´Â ±¹³» ÀÇ·á À½¼º µ¥ÀÌÅÍ ¼ö½Ê¸¸ °ÇÀ» ÇнÀÇØ, ±¹¿µ¹®ÀÌ È¥ÀçµÈ ÀÇÇÐ ¿ë¾î¸¦ ³ôÀº Á¤È®µµ·Î ó¸®ÇØ ±¹³» ÀÓ»ó ȯ°æ¿¡ ÃÖÀûÈ­µÈ °ÍÀÌ Æ¯Â¡ÀÌ´Ù. ÇöÀç ¼­¿ï¾Æ»êº´¿ø, ±¹±º¼öµµº´¿ø, ¿ëÀμ¼ºê¶õ½ºº´¿ø µî ±¹³» ÁÖ¿ä Áß¡¤´ëÇü º´¿ø¿¡ µµÀԵŠȰ¹ßÇÏ°Ô »ç¿ëµÇ°í ÀÖ´Ù.

[³ë¿ë¼® ±âÀÚ] ys339@daum.net
[¼ºÀκ´´º½º] cdpnews@cdpnews.co.kr  ±â»çÀÔ·Â 2020-10-28, 14:30
- Copyrights ¨Ï ¼ºÀκ´ ´º½º & cdpnews.co.kr, ¹«´Ü ÀüÀç ¹× Àç¹èÆ÷ ±ÝÁö -
±â»çÁ¦°ø [¼ºÀκ´ ´º½º]
Æ®À§ÅÍ ÆäÀ̽ººÏ
 ÀÌÇü·¡ °­µ¿°æÈñ´ëº´¿ø..
"Áß³â ÀÌÈÄ ³²¼ºµé, Àü
 ¼­µ¿¿ø ¹Ù¸¥¼¼»óº´¿øÀå
 ¶ó¼±¿µ ´ëÇѾÏÇÐȸ ÀÌ»çÀå
'°ý»ç ¸ñÁÖ¸§Å©¸² ÇÊÅ弦' ½ÃÁð2..
¼¼·Î ¸ñÁÖ¸§+°¡·Î ¸ñÁÖ¸§ °ü¸®¿¡ µµ¿ò Á¾±Ù´ç°Ç°­, 'ÇÊÅå Æ÷¹Ä¶ó' ¼ººÐ ÇÔÀ¯ Á¾±Ù´ç°Ç°­(´ëÇ¥ ±è..
»ó±ÞÁ¾ÇÕº´¿ø È® ¹Ù²ï´Ù
Á¦2Â÷ ±¹¹Î°Ç°­º¸Çè Á¾ÇÕ°èȹ
º¸°ÇÀÇ·á·Î º¸´Â Çѱ¹ÀÇ ÀÇ·áÀÇ Áú ¼öÁØ
'¼ö¼ú½Ç CCTV ¼³Ä¡' ³í¶õ
"źźÇÑ °¨¿°º´ ´ëÀÀ ü°è °®Ãç¾ß"
¡°ÀûÁ¤ ¼ö°¡ ±â¹Ý °³¿øȯ°æ °³¼± Àý½Ç¡±