Robot agents and Search Engine

´ëÀü ±¤¿ª½Ã À¯¼º±¸ ±Ãµ¿ 220
Ãæ³²´ëÇб³ ÄÄÇ»ÅͰøÇаú µ¥ÀÌŸº£À̽º ¿¬±¸½Ç
E-mail : bluefrog@flower.comeng.chungnam.ac.kr
URL : http://flower.comeng.chungnam.ac.kr/~bluefrog/
Abstract:
ÀÎÅÍ³×Æ® »ó¿¡ »êÀçÇÑ Á¤º¸°¡ ¹æ´ëÇØÁö°í WWW°¡ ±Þ°ÝÈ÷ ¹ßÀüÇϸ鼭 »ç¿ëÀÚµéÀº Á¤º¸°Ë»ö µµ±¸(tool)·Î¼­ ¼­Ä¡¿£Áø(search engine)À» ¸¹ÀÌ ÀÌ¿ëÇϰí ÀÖ´Ù. ÇöÀç Àü ¼¼°èÀûÀ¸·Î ¸¹Àº ¼­Ä¡¿£ÁøµéÀÌ µ¿ÀÛÇϰí ÀÖ°í, °¢Á¾ Á¤º¸¿¡ ´ëÇÑ µ¥ÀÌŸº£À̽º¸¦ ±¸ÃàÇϰí ÀÖ°í °è¼ÓÀûÀ¸·Î °»½ÅÇÔÀ¸·Î½á »ç¿ëÀÚ¿¡°Ô ÃÖ½ÅÀÇ Á¤º¸¸¦ Á¦°øÇÑ´Ù. ¼­Ä¡¿£ÁøÀº ·Îº¿ ¿¡ÀÌÀüÆ®(Robot agents)¶ó´Â À¥(Web)À» ¼øÈ¸(traverse)ÇÏ´Â ÇÁ·Î±×·¥¿¡ ÀÇÇØ Á¤º¸¸¦ ¼öÁýÇÑ´Ù. ·Îº¿ ¿¡ÀÌÀüÆ®´Â ÁöÁ¤ÇÑ URLÀ» ¼øÈ¸ÇÏ¸ç °¢ ȨÆäÀÌÁöµéÀÇ Á¤º¸¸¦ ¼öÁýÇÏ°í ¼öÁýµÈ Á¤º¸¿¡ ´ëÇØ¼­ ¼­Ä¡¿£ÁøÀº »ç¿ëÀÚ°¡ Æí¸®ÇÑ ¹æ¹ýÀ¸·Î °Ë»öÇÒ ¼ö ÀÖ´Â À妽º¸¦ Á¦°øÇÑ´Ù.

º» ¹ßÇ¥¿¡¼­´Â ·Îº¿ ¿¡ÀÌÀüÆ®ÀÇ Á¾·ù¿Í µ¿ÀÛ¿ø¸®, ±âº»ÀûÀÎ ±¸Á¶¿¡ ´ëÇÏ¿© »ìÆìº¸°í ¼­Ä¡¿£ÁøÀÌ ÀÌ ·Îº¿ ¿¡ÀÌÀüÆ®¸¦ ÀÌ¿ëÇÏ´Â ¹æ¹ý¿¡ ´ëÇÏ¿© ¼³¸íÇϰí ÈĹݺο¡´Â ÀÏÀÏÀÌ ¸¹Àº ¼­Ä¡¿£ÁøÀ» °Ë»öÇÒ ÇÊ¿ä¾øÀÌ ¿©·¯ ¼­Ä¡ ¿£ÁøµéÀ» µ¿½Ã¿¡ °Ë»öÇÒ ¼ö ÀÖ´Â À¥ ¸ÞŸ¼­Ä¡¿£ÁøÀÇ ±¸Çö¿¡ ´ëÇØ¼­ ¼³¸íÇϵµ·Ï ÇÑ´Ù.

Keywords:
SPIDER, Robot agents, ¼­Ä¡ ¿£Áø(Search Engine)

1. ¼­·Ð

ÃÖ±Ù¿¡ ÀÎÅÍ³×Æ®(Internet)ÀÇ Á¤º¸ÀÇ ¾ç°ú Á¾·ù, Á¤º¸ Á¦°øÀÚÀÇ ¼ö´Â ±Þ¼Óµµ·Î Áõ°¡µÇ°í ÀÖ´Â Ãß¼¼ÀÌ´Ù. ÀÌ·± ¹æ´ëÇÑ Á¤º¸¸¦ °®°í ÀÖ´Â ÀÎÅÍ³×Æ®¿¡¼­ °³ÀÎÀÌ ÇÊ¿ä·Î ÇÏ´Â Á¤º¸¸¦ ¼Õ½±°Ô ã´Â´Ù´Â °ÍÀº »ó´çÈ÷ ¾î·Á¿î ÀÏÀÌ µÇ¾ú´Ù. ƯÈ÷ ÃÖ±Ù µé¾î ÇÏÀÌÆÛÅØ½ºÆ®(Hypertext) ÇüÅÂÀÇ Á¤º¸ Á¶Á÷ ¹× ºê¶ó¿ì¡(browsing)ÀÌ °¡´ÉÇÑ WWW(World Wide Web)¸¦ ÀÌ¿ëÇÏ¿© Á¤º¸¸¦ Á¦°øÇÏ´Â »çÀÌÆ®(site)°¡ ±âÇϱ޼öÀûÀ¸·Î ´Ã¾î³ª°í ÀÖ´Â Ãß¼¼ÀÌ´Ù.

WWW¸¦ ÀÌ¿ëÇØ¼­ ÀÎÅÍ³×Æ® »ó¿¡ ³Î¸® ÆÛÁ® ÀÖ´Â Á¤º¸¸¦ »ç¿ëÀÚ¿¡°Ô ãÀ» ¼ö ÀÖµµ·Ï µµ¿ÍÁÖ´Â µµ±¸¸¦ ¼­Ä¡¿£ÁøÀ̶ó Çϰí ÇöÁ¦ Àü ¼¼°èÀûÀ¸·Î ¸¹Àº ¼­Ä¡¿£ÁøµéÀÌ Á¸ÀçÇϰí ÀÖÀ¸¸ç, °¢Á¾ Á¤º¸¿¡ ´ëÇÑ µ¥ÀÌŸº£À̽º(database)¸¦ ±¸ÃàÇϰí ÀÖ°í °è¼ÓÀûÀ¸·Î °»½ÅÇÔÀ¸·Î½á »ç¿ëÀÚ¿¡°Ô ÃÖ½ÅÀÇ Á¤º¸¸¦ Á¦°øÇÑ´Ù.

¼­Ä¡¿£ÁøµéÀº Á¤º¸ÀÇ º¸À¯ Ãø¸é¿¡¼­ º»´Ù¸é ´ë·« µÎ °¡Áö ÇüÅ·Π³ª´©¾î º¼ ¼ö°¡ ÀÖ´Ù.

·Îº¿ ¿¡ÀÌÀüÆ®¸¦ ÀÌ¿ëÇØ ÀڷḦ ¼öÁýÇÏ´Â ¼­Ä¡¿£ÁøÀÇ °æ¿ì´Â ÀڷḦ ¼öÁýÇÏ´Â ·Îº¿ ¿¡ÀÌÀüÆ®, ¼öÁýµÈ ÀڷḦ ÀúÀåÇÏ´Â µ¥ÀÌŸº£À̽º, ±×¸®°í »ç¿ëÀÚ°¡ ÁúÀÇ(Query)¸¦ ÇßÀ» ¶§ ÀڷḦ °Ë»öÇØÁÖ´Â IRS(Information Retrieval System : Á¤º¸°Ë»ö ½Ã½ºÅÛ)·Î ±¸¼ºµÈ´Ù. ±×¸®°í ´Ù¸¥ ¼­Ä¡¿£ÁøÀÇ Á¤º¸(µ¥ÀÌŸº£À̽º)¸¦ ÀÌ¿ëÇÏ´Â °ÍÀ» ¸ÞŸ¼­Ä¡¿£ÁøÀ̶ó°í Çϴµ¥, ¸ÞŸ¼­Ä¡¿£ÁøÀº ÀüüÀûÀ¸·Î ÁúÀǸ¦ °¢ ¼­Ä¡¿£Áø¿¡ º¸³»´Â ºÎºÐ°ú °Ë»öµÇ¾î¿Â °á°úµé¿¡ ´ëÇØ¼­ ÅëÇÕÇØ¼­ »ç¿ëÀÚ¿¡°Ô º¸¿©ÁÖ´Â ºÎºÐÀ¸·Î ±¸¼ºµÈ´Ù.

º» °íÀÇ ±¸¼ºÀº 2Àå¿¡¼­ Prosed Standard for Robot Exclusion¿¡ ´ëÇØ¼­ ¼³¸íÇϰí, 3Àå¿¡¼­´Â ·Îº¿ ¿¡ÀÌÀüÆ®¿¡ ´ëÇÑ Àü¹ÝÀûÀÎ »çÇ׵鿡 ´ëÇØ¼­ ¾Ë¾Æ º¸¾Ò°í, 4Àå¿¡¼­´Â À¥ ¸ÞŸ ¼­Ä¡ ¿£ÁøÀÇ ¼³°è ¹× ±¸Çö¿¡ ´ëÇØ¼­ ¾Ë¾Æ º¸¾Ò´Ù.

2. A Standard for Robot Exclusion

2.1 Çʿ伺

Wanderers ¶Ç´Â spiders¶ó°íµµ ºÒ¸®´Â WWW ·Îº¿Àº WWW»ó¿¡¼­ ¸µÅ©µÈ ÆäÀÌÁöµéÀº ¼øÈ¯ÀûÀ¸·Î °Ë»öÇÔ¿¡ ÀÇÇØ ¸¹Àº ÆäÀÌÁöµéÀ» ¼øÈ¸(traverse)ÇÏ´Â ÇÁ·Î±×·¥ÀÌ´Ù.

1993³â°ú 1994³â¿¡´Â ¿©·¯°¡Áö ÀÌÀ¯·Î WWW ¼­¹ö¿¡ ·Îº¿µéÀÌ ¹æ¹®ÇÏ´Â ÀÏÀÌ ÀÚÁÖ ¹ß»ýÇØ ¿Ô´Ù. ÀÌµé ·Îº¿Áß¿¡¼­´Â ºü¸¥ ¿ä±¸(request) ¶Ç´Â °è¼ÓÀûÀ¸·Î °°Àº È­ÀÏÀ» °Ë»öÇÔÀ¸·Î½á ¼­¹ö¸¦ È¥¶õ½º·´°Ô ÇÏ´Â Àϵµ ÀÖ¾ú´Ù. ±×¸®°í Àû´çÇÏÁö ¾ÊÀº WWW ¼­¹öÀÇ ºÎºÐµéÀ» °Ë»öÇѴٵ簡 ÀϽÃÀûÀÎ Á¤º¸ ¶Ç´Â ºÎÀÛ¿ë(side-effect)À» °¡Áú ¼ö ÀÖ´Â cgi-script¸¦ °Ë»öÇÏ´Â Àϵµ ¹ß»ýÇØ ¿Ô´Ù.

ÀÌ·¯ÇÑ Àϵé·Î ÀÎÇØ¼­ ¼­¹öÀÇ ¾î´Â ƯÁ¤ÇÑ ºÎºÐÀ» ·Îº¿µéÀÌ Á¢±ÙÇÏÁö ¸øÇϵµ·Ï ÀνĽÃÄÑÁÖ±â À§ÇÑ ¸ÞÄ«´ÏÁòÀ» È®¸³ÇÒ Çʿ䰡 ´ëµÎµÇ¾ú´Ù.

2.2 ¹æ¹ý

ÇÑ ¼­¹ö·ÎºÎÅÍ ·Îº¿À» ¹èÁ¦Çϱâ À§ÇØ »ç¿ëµÇ´Â ¹æ¹ýÀº ¼­¹ö¿¡ ·Îº¿¿¡ ´ëÇÑ Á¢±Ù Á¤Ã¥À» ¸í¼¼ÇÏ´Â È­ÀÏÀ» »ý¼ºÇÏ´Â °ÍÀÌ´Ù. ÀÌ È­ÀÏÀº HTTP¸¦ °æÀ¯ÇÏ¿© ·ÎÄà URL "/robots.txt"·Î Á¢±Ù °¡´ÉÇØ¾ß ÇÑ´Ù. ÀÌ È­ÀÏÀÇ ³»¿ëÀº ¾Æ·¡¿¡ ¸í¼¼µÇ¾î ÀÖ´Ù.

ÀÌ È­ÀÏ ¹æ¹ýÀº ÇöÁ¸ÇÏ´Â WWW ¼­¹ö¿¡ ½±°Ô ±¸ÇöµÉ ¼ö Àֱ⠶§¹®¿¡ ¼±ÅõǾîÁ³°í, ·Îº¿µéÀº ´ÜÁö ÇÑ ¹®¼­¸¸À» °Ë»öÇÔÀ¸·Î½á Á¢±Ù Á¤Ã¥À» ¾Ë¾Æ³¾ ¼ö ÀÖ´Ù.

ÀÌ "robots.txt" È­ÀÏ ¹æ¹ýÀÇ ´ÜÁ¡Àº ¼­¹ö¿¡ ÀÖ´Â °³ÀÎÀÇ ¹®¼­ ¼ÒÀ¯ÀÚ°¡ ¾Æ´Ï¶ó ¿ÀÁ÷ ¼­¹ö °ü¸®ÀÚ¸¸ÀÌ ÇÑ ¸®½ºÆ®¸¦ À¯ÁöÇÒ ¼ö ÀÖ´Ù´Â °ÍÀÌ´Ù. À̰ÍÀº ¹®¼­ ¼ÒÀ¯ÀÚÀÇ ¼ö¸¸Å­ "robots.txt"È­ÀÏÀ» ±¸¼ºÇϵµ·Ï ÇÏ´Â ³»ºÎó¸®ÀÇ ÀÇÇØ ÇØ°áµÇ¾îÁú ¼öµµ ÀÖ´Ù.

"/robots.txt" URLÀÇ ¼±Åÿ¡ ´ëÇÑ µ¿±â´Â ´ÙÀ½°ú °°´Ù.

2.3 Æ÷¸Ë

"/robots.txt"ÀÇ Æ÷¸Ë°ú Àǹ̴ ´ÙÀ½°ú °°´Ù.

ÀÌ È­ÀÏÀº Çϳª ÀÌ»óÀÇ ºí·©Å© ¶óÀÎ(CR, CR/NL, ¶Ç´Â NL¿¡ ÀÇÇØ ³¡³ª´Â)¿¡ ºÐ¸®µÇ´Â Çϳª ÀÌ»óÀÇ ·¹ÄÚµå(record)·Î ±¸¼ºµÈ´Ù. °¢ ·¹ÄÚµå´Â "<field>:<optionalspace><value><optionalspace>" ÇüÅÂÀÇ ¶óÀεéÀ» Æ÷ÇÔÇÑ´Ù. Çʵå À̸§Àº ´ë¼Ò¹®ÀÚ ±¸º°À» ÇÏÁö ¾Ê´Â´Ù.

ÁÖ¼®¹®Àº UNIXÀÇ bourne shellÀÇ »ç¿ë¹ýÀ» ÀÌ¿ëÇØ È­ÀÏ¿¡ Æ÷ÇÔÇÒ ¼ö ÀÖ´Ù. Áï, '#' ¹®ÀÚ¾ÕÀÇ °ø¹é°ú ±× ¶óÀÎ ³¡±îÁö ³ª¸ÓÁö ºÎºÐÀº ÁÖ¼®À¸·Î¼­ ¹«½ÃµÈ´Ù. ÁÖ¼®¹®¸¸À» Æ÷ÇÔÇÑ ¶óÀÎÀº ¿ÏÀüÈ÷ ¹«½ÃµÇ°í, ·¹ÄÚµå ¹üÀ§·Î ÀνĵÇÁö ¾Ê´Â´Ù.

·¹ÄÚµå´Â Çϳª ÀÌ»óÀÇ User-agent ¶óÀÎÀ¸·Î ½ÃÀÛÇϰí, Çϳª ÀÌ»óÀÇ Disallow ¶óÀÎÀÌ ¾Æ·¡¿¡ ¼³¸íµÈ °Íó·³ µû¸¥´Ù. ÀνÄÇÒ ¼ö ¾ø´Â Çì´õ´Â ¹«½ÃµÈ´Ù.

User-agent
ÀÌ ÇʵåÀÇ °ªÀº ·Îº¿ÀÇ À̸§ÀÌ°í ±× ·Îº¿µé¿¡ ´ëÇÑ Á¢±Ù Á¤Ã¥À» ³ªÅ¸³½´Ù.

Çϳª ÀÌ»óÀÇ User-agent Çʵ尡 Á¸ÀçÇÑ´Ù¸é ±× ·¹ÄÚµå´Â ÇϳªÀÌ»óÀÇ ·Îº¿µé¿¡ ´ëÇØ¼­ µ¿ÀÏÇÑ Á¢±Ù Á¤Ã¥À» ³ªÅ¸³½´Ù. Àû¾îµµ ÇÑ ·¹ÄÚµå´ç ÇÑ Çʵå´Â Á¸ÀçÇØ¾ßµÉ Çʿ䰡 ÀÖ´Ù.

±× ·Îº¿Àº ÀÌ Çʵ带 ÀÚÀ¯·Ó°Ô ÇØ¼®ÇÒ ¼ö ÀÖ°í ¹öÀü Á¤º¸¾øÀÌ À̸§ÀÇ ´ë¼Ò¹®ÀÚ ±¸º°¾ø´Â ºÎºÐ¹®ÀÚ¿­ ¸ÅÄ¡°¡ ±ÇÀåµÇ¾îÁø´Ù.

¸¸¾à °ªÀÌ '*'¶ó¸é ±× ·¹ÄÚµå´Â ´Ù¸¥ ·¹Äڵ弭 ¸ÅÄ¡µÇÁö ¾Ê´Â ·Îº¿µé¿¡ ´ëÇÑ µðÆúÆ® Á¢±Ù Á¤Ã¥À» ³ªÅ¸³½´Ù. "/robots.txt"È­ÀÏ¿¡ µÎ °³ÀÇ ±×·¯ÇÑ ·¹ÄÚµå´Â Çã¶ôµÇÁö ¾Ê´Â´Ù.

Disallow
ÀÌ ÇʵåÀÇ °ªÀº ¹æ¹®µÇ¾îÁú ¼ö ¾ø´Â ºÎºÐ URLÀ» ¸í¼¼ÇÑ´Ù. À̰ÍÀº Àüü ÆÐ½ºÀÏ ¼öµµ ÀÖ°í, ºÎºÐ ÆÐ½ºÀÏ ¼öµµ ÀÖ´Ù. ÀÌ °ªÀ¸·Î ½ÃÀÛÇÏ´Â URLÀº °Ë»öµÇ¾îÁú ¼ö ¾ø´Ù. ¿¹¸¦ µé¸é, Disallow: /help ´Â /help.html °ú /help/index.html ¸ðµÎ¿¡°Ô °Ë»öÀÌ Çã¶ôµÇÁö ¾Ê´Â´Ù. ¹Ý¸é¿¡, Disallow: /help/ ´Â /help/index.html Àº °Ë»öÀÌ Çã¶ôµÇÁö ¾ÊÁö¸¸, /help.html Àº °Ë»öÀÌ Çã¶ôµÈ´Ù.

ƯÁ¤ÇÑ °ªÀ» ÁöÁ¤ÇÏÁö ¾ÊÀ¸¸é ¸ðµç URLµéÀÌ °Ë»öµÇ¾îÁú ¼ö ÀÖ´Ù´Â °ÍÀ» ³ªÅ¸³½´Ù. Àû¾îµµ ÇϳªÀÇ Disallow Çʵ尡 ÇÑ ·¹Äڵ忡 Á¸ÀçÇØ¾ß ÇÑ´Ù.

ºó "/robots.txt"´Â ¸í½ÃÀûÀÎ Àǹ̸¦ °¡Áö°í ÀÖÁö ¾ÊÀ½À» ³ªÅ¸³»°í, ±×°ÍÀÌ Á¸ÀçÇÏÁö ¾Ê´Â °ÍÀ¸·Î¼­ °£ÁÖµÉ ¼ö ÀÖ´Ù. Áï, ¸ðµç ·Îº¿µéÀ» ȯ¿µÇÑ´Ù°í °í·ÁÇÏ¸é µÉ °ÍÀÌ´Ù.

Examples

´ÙÀ½ ¿¹´Â "/robots.txt"È­ÀÏÀÌ ·Îº¿µéÀÌ "/cyberworld/map/" ¶Ç´Â "/tmp/"·Î ½ÃÀÛÇÏ´Â URLÀ» ¹æ¹®ÇÏÁö ¸øÇϵµ·Ï ¸í¼¼ÇÑ´Ù.
# robots.txt for http://www.site.com/

User-agent: *
Disallow: /cyberworld/map/  # This is an infinite virtual URL space
Disallow: /tmp/		    # these will soon disappear


¾Æ·¡ÀÇ ¿¹´Â "/robots.txt"È­ÀÏÀÌ "cybermapper"¸¦ Á¦¿ÜÇÑ ¸ðµç ·Îº¿µéÀÌ "/cyberworld/map/"·Î ½ÃÀÛÇÏ´Â URLÀ» ¹æ¹®ÇÏÁö ¸øÇϵµ·Ï ¸í¼¼ÇÑ´Ù.
# robots.txt for http://www.site.com/

User-agent: *
Disallow: /cyberworld/map/  # This is an infinite virtual URL space

# Cybermapper knows where to go.
User-agent: cybermapper
Disallow:


¾Æ·¡ÀÇ ¿¹´Â ¸ðµç ·Îº¿µéÀÌ ÀÌ »çÀÌÆ®¸¦ ¹æ¹®ÇÏÁö ¸øÇϵµ·Ï ÇÑ´Ù.
# go away
User-agent: *
Disallow: /


3. ·Îº¿ ¿¡ÀÌÀüÆ®¿Í ¼­Ä¡ ¿£Áø

3.1 ·Îº¿ ¿¡ÀÌÀüÆ®ÀÇ »ç¿ë

·Îº¿µéÀº ´ÙÀ½°ú °°Àº ¸¹Àº À¯¿ëÇÑ ÀϵéÀ» ¼öÇàÇϴµ¥ »ç¿ëÇÒ ¼ö ÀÖ´Ù.
Åë°è ºÐ¼®
·Îº¿ÀÇ ¸ñÀûÁßÀÇ Çϳª´Â À¥ ¼­¹ö¸¦ ¹ß°ßÇϰųª ¼­¹öÀÇ ¼ö¸¦ ¼¼´Âµ¥ »ç¿ëµÉ ¼ö ÀÖ´Ù. ¼­¹ö´ç ¹®¼­ÀÇ Æò±Õ¼ö¸¦ Æ÷ÇÔÇØ¼­ ¾î¶² È­ÀÏ Å¸ÀÔÀÇ ºÐÆ÷, À¥ ÆäÀÌÁöµéÀÇ Æò±Õ »çÀÌÁî, »óÈ£ ¿¬°á¼ºÀÇ ±íÀÌ µî Åë°è¸¦ ³»´Âµ¥ »ç¿ëµÉ ¼ö ÀÖ´Ù.

À¯Áöº¸¼ö(Maintenance)
ÇÏÀÌÆÛÅØ½ºÆ® ±¸Á¶¸¦ À¯ÁöÇϴµ¥ ÁÖµÈ ¾î·Á¿òÁßÀÇ Çϳª°¡ ´Ù¸¥ ÆäÀÌÁö¿¡ ´ëÇÑ ·¹ÆÛ·±½º°¡ "Á×Àº ¸µÅ©(dead links)"°¡ µÇ´Â °ÍÀÌ´Ù. ÀÌ·¯ÇÑ °æ¿ì´Â ·¹ÆÛ·±½º µÇ¾îÁö°í ÀÖ´Â ÆäÀÌÁö°¡ ¿Å°ÜÁ³°Å³ª ¾ø¾îÁ³À» ¶§ ¹ß»ýÇÑ´Ù. ÇöÀç ÀÌ·± º¯È­¿¡ ´ëÇØ ÀÚ½ÅÀ» ÂüÁ¶Çϰí ÀÖ´Â ÆäÀÌÁöµéÀÇ °ü¸®ÀÚ¿¡°Ô ¹Ì¸® ¾Ë·ÁÁÖ´Â ÀϹÝÀûÀÎ ¸ÞÄ«´ÏÁòÀº ¾ø´Ù.

MOMSpider¿Í °°ÀÌ ·¹ÆÛ·±½º¸¦ ÀÔÁõ(verify)ÇÏ´Â ·Îº¿Àº À̵é Á×Àº ¸µÅ©(dead links)¸¦ ã´Âµ¥ µµ¿ï ¼ö ÀÖ°í, ÇÏÀÌÆÛÅØ½º ±¸Á¶ÀÇ À¯Áöº¸¼ö¿¡ µµ¿òÀ» ÁÙ ¼ö°¡ ÀÖ´Ù. ·Îº¿µéÀº ±¸Á¶»Ó¸¸ ¾Æ´Ï¶ó ³»¿ëÀ» À¯ÁöÇϴµ¥ µµ¿òÀ» ÁÙ ¼ö ÀÖÁö¸¸ ÀϹÝÀûÀÎ °ÍÀº ¾Æ´Ï´Ù.

¹Ì·¯¸µ(Mirroring)
¹Ì·¯¸µÀº FTP ¾ÆÄ«À̺ê(archives)¸¦ À¯ÁöÇÏ´Â ÀϹÝÀûÀÎ Å×Å©´ÐÀÌ´Ù. ¹Ì·¯´Â FTP¿¡ ÀÇÇØ¼­ ¼øÈ¯ÀûÀ¸·Î µð·ºÅ丮 Æ®¸®¸¦ ¿ÏÀüÈ÷ Ä«ÇÇÇϰí, º¯È­µÈ ¹®¼­µéÀ» °Ë»öÇÑ´Ù. À̰ÍÀº È£½ºÆ® ÆÄ¼Õ(host failure)¿¡ ´ëºñÇϱâ À§Çؼ­ °øÀ¯¿Í Áߺ¹¿¡ ´ëÇÑ ·Îµå(load)¸¦ Çã¶ôÇÏ´Â °ÍÀÌ°í º¸´Ù ºü¸£°í °ª½Ñ Á¢±Ù, ¿ÀÇÁ-¶óÀÎ(off-line) Á¢±ÙÀ» Çã¶ôÇÑ´Ù.

À¥¿¡¼­ÀÇ ¹Ì·¯¸µÀº ·Îº¿À¸·Î ±¸ÇöµÉ ¼ö ÀÖ´Ù. ·Îº¿µéÀº À¥ ÆäÀÌÁöµéÀÇ ¼­ºê Æ®¸®¸¦ °Ë»öÇÒ ¼ö ÀÖ°í ·ÎÄÿ¡ ÀúÀåÇÒ ¼ö ÀÖÁö¸¸ ´Ü¼øÈ÷ º¯È­µÈ ÆäÀÌÁöµéÀ» ¼öÁ¤(update)ÇÏ´Â ¿ëµµ°¡ ¾Æ´Ï´Ù. À¥¿¡¼­ÀÇ Ä«ÇÇµÈ ÆäÀÌÁöµéÀº ·¹ÆÛ·±½º°¡ ´Ù½Ã ¾²¿©Á®¾ß ÇÒ Çʿ䰡 ÀÖÀ» ¼ö ÀÖ°í, ¶Ç »ó´ëÀûÀ¸·Î ¾²¿©Áø ·¹ÆÛ·±½ºÀÇ °æ¿ì Àý´ë ¸µÅ©·Î º¯È¯µÇ¾îÁ®¾ß ÇÑ´Ù. ¼º´É»óÀÇ ÀÌÀ¯·Î ¹Ì·¯¸µ µµ±¸(tool)¿¡ ´ëÇÑ ¿ä±¸´Â ¸¹ÀÌ °¨¼ÒµÇ°í ÀÖ´Ù.

¸®¼Ò½º ¹ß°ß
¾Æ¸¶µµ ·Îº¿µéÀÇ °¡Àå Èï¹ÌÀÖ´Â ¾ÖÇø®ÄÉÀ̼ÇÀº ¸®¼Ò½º ¹ß°ßÀÇ »ç¿ë¿¡ ÀÖ´Ù. »ç¶÷ÀÌ Ã³¸®ÇÒ ¼ö ¾ø´Â ¸·´ëÇÑ ¾çÀÇ Á¤º¸¿¡ ´ëÇØ ÄÄÇ»ÅͰ¡ Çϵµ·Ï ÇÏ´Â °ÍÀº Èï¹ÌÀÖ´Â °ÍÀÌ°í ½ÇÁ¦·Î ¸î¸î ·Îº¿µéÀº À¥ÀÇ ¸¹Àº ºÎºÐÀ» ¿ä¾àÇϰí ÀÖ°í ¼­Ä¡ ¿£ÁøÀ» ÅëÇØ¼­ ÀÌµé °á°ú¸¦ °¡Áö°í ÀÖ´Â µ¥ÀÌŸº£À̽º¿¡ Á¢±ÙÀ» Á¦°øÇÑ´Ù.

À̰ÍÀº ´Ü¼øÈ÷ ºê¶ó¿ì¡¿¡ ÀÇÁ¸Çϱ⠺¸´Ù´Â À¥ À¯Àú°¡ Á¤º¸¸¦ ã´Âµ¥ ºê¶ó¿ì¡°ú ¼­ÄªÀ» ÇÔ²²ÇÒ ¼ö ÀÖ´Ù´Â °ÍÀ» ÀǹÌÇÑ´Ù. ½ÉÁö¾î µ¥ÀÌŸº£À̽º°¡ À¯Àú°¡ °Ë»öÇϱ⠿øÇÏ´Â Á¤È®ÇÑ ¾ÆÀÌÅÛÀ» Æ÷ÇÔÇϰí ÀÖÁö ¾Ê´Ù ÇÏ´õ¶óµµ °ü·ÃÀÖ´Â ÆäÀÌÁöµé¿¡ ´ëÇÑ ·¹ÆÛ·±½º¸¦ Æ÷ÇÔÇϰí ÀÖÀ» °ÍÀ̰í À¯Àú´Â Â÷·Ê´ë·Î ±× ¾ÆÀÌÅÛµéÀ» ÂüÁ¶ÇÒ ¼ö ÀÖ´Ù.

À̰ÍÀÇ ÀåÁ¡ÁßÀÇ Çϳª´Â ÁÖ±âÀûÀ¸·Î ÀÚµ¿ÀûÀ¸·Î µ¥ÀÌŸº£À̽º°¡ °»½ÅµÇ°í, µ¥ÀÌŸº£À̽º¿¡¼­ Á×Àº ¸µÅ©(dead links)´Â ¹ß°ßµÇ¾îÁö°í Á¦°ÅµÉ °ÍÀÌ´Ù.

º¹ÇÕÀûÀÎ »ç¿ë
ÇÑ ·Îº¿Àº À§ÀÇ ÀÏÁß¿¡¼­ Çϳª ÀÌ»óÀÇ ÀÏÀ» ¼öÇàÇÒ ¼ö ÀÖ´Ù. ¿¹¸¦ µé¸é RBSE Spider´Â ¸®¼Ò½º ¹ß°ß µ¥ÀÌŸº£À̽º(resource discovery database)¸¦ Á¦°øÇÒ »Ó¸¸ ¾Æ´Ï¶ó °Ë»öµÈ ¹®¼­µéÀÇ Åë°èºÐ¼®À» ÇÑ´Ù. ÀÌ·¯ÇÑ º¹ÇÕÀûÀÎ »ç¿ëÀº ºÒÇེ·´°Ôµµ ¾ÆÁ÷ µå¹® »óÅÂÀÌ´Ù.

3.2 ·Îº¿ÀÇ ¼øÈ¸¹æ¹ý

³ÐÀÌ-¿ì¼± ¼øÈ¸(breadth-first traversal)
»óÀ§ ·¹º§¿¡¼­ºÎÅÍ Á¦ÇÑµÈ ±íÀ̱îÁö º¸´Ù ³ÐÀº ±×¸®°í »óÀ§ ·¹º§ÀÇ ¹®¼­¿Í ¼­ºñ½ºÀÇ ÁýÇÕÀ» ã´Âµ¥ ÁÁ´Ù. Áï, ÇÑ ´ÙÅ¥¸ÕÆ®¿¡ ¿©·¯ ·¹ÆÛ·±½º°¡ ÀÖÀ» °æ¿ì °³°³ ·¹ÆÛ·±½ºµé¿¡ ´ëÇØ¼­ ¸ÕÀú °Ë»öÀ» ÇÏ°í ±× ´ÙÀ½ ÇÑ´Ü°è ±íÀÌ µé¾î°¡ °Ë»öÇÏ´Â ¹æ¹ýÀ¸·Î¼­ ¸®¼Ò½º ¹ß°ßÀ» À§Çؼ­ ÈξÀ ´õ ÁÁÀº ¹æ¹ýÀÌ´Ù.

±íÀÌ-¿ì¼± ¼øÈ¸(depth-first traversal)
¼øÈ¸·Î¼­ »õ·Î¿î »çÀÌÆ®¸¦ ã´Âµ¥ º¸´Ù ÁÁ´Ù. ÀÌ ¹æ¹ýÀº ÇÑ ´ÙÅ¥¸ÕÆ®¿¡ ¿©·¯ ·¹ÆÛ·±½º°¡ ÀÖÀ» °æ¿ì ÇÑ ·¹ÆÛ·±½º¿¡ ´ëÇØ¼­ °è¼Ó µû¶ó°¡¸é¼­ °Ë»öÇÏ´Â ¹æ¹ýÀÌ´Ù.

3.3 ¼­Ä¡ ¿£Áø¿¡¼­ÀÇ ·Îº¿ÀÇ ÀÌ¿ë

¼­Ä¡ ¿£Áø¿¡¼­ ÀڷḦ ¼öÁýÇϰí À妽ÌÇϴµ¥ ·Îº¿ ¿¡ÀÌÀüÆ®¸¦ ÀÌ¿ëÇÒ ¼ö ÀÖ´Ù. À̰ÍÀº ·Îº¿ÀÇ ÀÌ¿ë ¹æ¹ýÁß ¸®¼Ò½º ¹ß°ß Ãø¸éÀε¥, ¼­Ä¡ ¿£ÁøÀÌ ·Îº¿À» µ¿ÀÛ½ÃÄѼ­ °Ë»öµÈ Á¤º¸µéÀ» µ¥ÀÌŸº£À̽º¿¡ ÀúÀåÇϰí À妽ÌÇØ¼­ »ç¿ëÀÚµéÀÌ ÁúÀǸ¦ ÅëÇØ µ¥ÀÌŸº£À̽º·ÎºÎÅÍ Á¤º¸¸¦ °Ë»öÇÒ ¼ö ÀÖ°Ô ÇÑ´Ù. ¼­Ä¡ ¿¡ÁøÀº ·Îº¿À» ÁÖ±âÀûÀ¸·Î µ¿ÀÛ½ÃÄѼ­ º¯È­µÈ Á¤º¸¸¦ °»½ÅÇÏ°í »õ·Î¿î Á¤º¸¸¦ µ¥ÀÌŸº£À̽º¿¡ ÀúÀåÇÑ´Ù.

3.3.1 ¹®¼­ ¿ä¾à

ÀÓÀÇÀÇ À¥ ¹®¼­¸¦ À妽ºÇϱâ´Â ¸Å¿ì ¾î·Æ´Ù. ÃʱâÀÇ ·Îº¿µéÀº ¹®¼­ ŸÀÌÆ²°ú ¾ÞÄ¿(anchor) ÅØ½ºÆ®¸¦ °£´ÜÈ÷ ÀúÀåÇß´Ù. ÇÏÁö¸¸ »õ·Î¿î ·Îº¿µéÀº º¸´Ù Áøº¸µÈ ¸ÞÄ«´ÏÁòÀ» »ç¿ëÇÏ°í ³»¿ë Àüü¸¦ °í·ÁÇÑ´Ù.

ÀÌµé ¹æ¹ýµéÀº ÀϹÝÀûÀ¸·Î ÁÁÀº ¼ö´ÜÀ̰í, ¸ðµç À¥ ÆäÀÌÁöµé¿¡ ÀÚµ¿ÀûÀ¸·Î Àû¿ëµÇ¾îÁú ¼ö ÀÖ´Ù. ±×·¸Áö¸¸ ¼ÕÀ¸·Î À妽ÌÇÑ °Í ¸¸Å­ È¿À²ÀûÀÏ ¼ö ¾ø´Ù. HTMLÀº <META> ¸¦ ¸í¼¼ÇÔ¿¡ ÀÇÇØ ¹®¼­¿¡ ÀϹÝÀûÀÎ ¸ÞŸ Á¤º¸¸¦ µ¡ºÙÀÏ ¼ö ÀÖ´Â ±â´ÉÀ» Á¦°øÇÑ´Ù. ¿¹¸¦ µé¸é, "<meta name="Keywords" value="Ford Car Maintenance">¿Í °°´Ù. ±×·¯³ª, ÀÌ Å±×(tag)ÀÇ ¾ÖÆ®¸®ºäÆ®ÀÇ ¸í¼¼µÈ °ª¿¡ ´ëÇØ Àǹ̰¡ Á¤ÀǵǾî ÀÖÁö ¾Ê±â ¶§¹®¿¡ ±×°ÍÀ» ¹Þ¾ÆµéÀÏ °ÍÀÎÁö¿Í ±×°ÍÀÇ »ç¿ë¿©ºÎ¿¡ ´ëÇØ¼­´Â ¾öÁßÈ÷ Á¦ÇѵȴÙ.

À̰ÍÀº ÁúÀÇ¿Í °ü·ÃÇØ¼­ °Ë»öµÈ ¹®¼­µéÀ» º»´Ù¸é ³·Àº "Á¤È®µµ"¸¦ ³ªÅ¸³½´Ù. ºÒ¸®¾È ¿¬»êÀÚ(Boolean Operators), WAIS¿Í °°Àº °¡ÁßÈ­µÈ ¸ÅÄ¡(Weighted match) ¶Ç´Â relevance feedback°ú °°Àº Áøº¸µÈ ¹æ¹ýÀº ³·Àº Á¤È®µµ¸¦ °³¼±ÇÒ ¼ö ÀÖÁö¸¸ ÀÎÅÍ³Ý »óÀÇ Á¤º¸°¡ ¸·´ëÇÏ°Ô ´Ù¾çÇØÁö¹Ç·Î ÀÌ ¹®Á¦´Â °è¼ÓµÉ °ÍÀÌ´Ù.

4. À¥ ¸ÞŸ ¼­Ä¡ ¿£ÁøÀÇ ¼³°è ¹× ±¸Çö

Àü ¼¼°èÀûÀ¸·Î »êÀçÇÑ ¼­Ä¡ ¿£ÁøµéÀº ±× ¼ö°¡ ¸¹¾ÆÁü¿¡ µû¶ó ÀϰüµÇÁö ¸øÇÑ Á¤º¸¸¦ Á¦°øÇϰí Àְųª ¾î´À ƯÁ¤ÇÑ °÷¿¡ ÁýÁßµÈ Àüº¸¸¦ Á¦°øÇÏ´Â °æ¿ìµµ ÀÖ¾î »ç¿ëÀÚ°¡ ¿øÇÏ´Â Á¤º¸¸¦ ¾ò±â À§Çؼ­´Â ¸¹Àº ¼­Ä¡ ¿£ÁøµéÀ» ÀÏÀÏÀÌ Á¶»çÇØ¾ß ÇÏ°í °¢°¢ÀÇ ¼­Ä¡ ¿£ÁøµéÀÇ Æ¯¼ºÀ» ¾Ë¾Æ¾ß ÇÏ´Â ºÒÆíÇÔ Á¡ÀÌ ÀÖ´Ù.

µû¶ó¼­ º» °í¿¡¼­´Â »ç¿ëÀÚ°¡ ¸¹Àº ¼­Ä¡ ¿£ÁøµéÀ» ÀÏÀÏÈ÷ °Ë»öÇÒ ÇÊ¿ä¾øÀÌ ¼­Ä¡ ¿£ÁøµéÀ» ÅëÇÕÇÏ¿© º¸´Ù ½±°Ô »ç¿ëÇÒ ¼ö ÀÖµµ·Ï »ç¿ëÀÚ¿¡°Ô ÀϰüµÈ ÀÎÅÍÆäÀ̽º ¹× ÁúÀǸ¦ Á¦°øÇϰí ÁúÀÇ¿¡ ´ëÇÏ¿© °¡´ÉÇÑ ¸¹Àº °Ë»ö °á°ú¸¦ ÅëÀÏµÈ ÇüÅ·ΠÁ¦°øÇÒ ¼ö ÀÖ´Â À¥ ¸ÞŸ ¼­Ä¡ ¿£ÁøÀÇ ¼³°è¿Í ±¸Çö¿¡ ´ëÇØ¼­ ¾Ë¾Æº¸±â·Î ÇÑ´Ù.

4.1 À¥ ¸ÞŸ ¼­Ä¡ ¿£ÁøÀÇ ¼³°è½Ã °í·Á »çÇ×

4.1.1 ÁúÀÇÀÇ ÇüÅÂ

À¥ ¸ÞŸ ¼­Ä¡ ¿£ÁøÀº ¾î´À ƯÁ¤ ¿£Áø°ú´Â µ¶¸³ÀûÀÎ »õ·Î¿î ÁúÀÇ ÇüŸ¦ Á¤ÀÇÇÏ¿´´Âµ¥, ±× ÀÌÀ¯´Â »ç¿ëÀÚ°¡ º¸´Ù Æí¸®Çϰí, Àϰü¼ºÀÖ´Â ÁúÀǸ¦ »ç¿ëÇÒ ¼ö ÀÖµµ·Ï Çϰí, º» ½Ã½ºÅÛÀÌ ´ë»óÀ¸·Î Çϰí ÀÖ´Â °¢±â ´Ù¸¥ ÁúÀÇ ÇüŸ¦ °¡Áø ¼­Ä¡ ¿£Áøµé°ú µ¶¸³ÀûÀÎ Åõ¸í¼º(transparancy)À» Á¦°øÇϱâ À§Çؼ­ÀÌ´Ù.

º» ½Ã½ºÅÛÀÇ ÁúÀÇ¿¡¼­´Â ºÒ¸®¾È ¿¬»êÀÚ(boolean operator)¸¦ Áö¿øÇϴµ¥, ´©±¸µçÁö ½±°Ô »ç¿ëÇÒ ¼ö ÀÖ°í, »ç¿ëÀÚÀÇ Àǵµ¸¦ Á¤È®ÇÏ°Ô ³ªÅ¸³¾ ¼ö ÀÖ°í, º» ½Ã½ºÅÛ¿¡¼­ Á¤º¸ ¼öÁýÀÇ ´ë»óÀ¸·Î ÇÏ´Â ¼­Ä¡ ¿£Áøµé¿¡ Àû¿ëÇϱ⠽±±â ¶§¹®ÀÌ´Ù. º» ½Ã½ºÅÛ¿¡¼­ÀÇ ÁúÀÇÀÇ ¿¹´Â "Multimedia and Hypermedia or Database"ÀÏ ¼ö ÀÖ´Ù.

4.1.2 ÁúÀÇ Ã³¸® ¹æ¾È

º» ½Ã½ºÅÛ¿¡¼­´Â Á¤º¸ÀÇ ¼öÁýÀ» ´Ù¸¥ ¼­Ä¡ ¿£Áøµé¿¡ ÀÇÁ¸Çϱ⠶§¹®¿¡ ½Ã½ºÅÛ¿¡¼­ ÀԷ¹ÞÀº ÁúÀÇ¿¡ ´ëÇØ ´Ù¸¥ ¿£Áøµé¿¡ ÀûÇÕÇÑ ÇüÅ·Π¹Ù²Ù¾î ÁÖ¾î¾ß ÇÒ Çʿ䰡 »ý±ä´Ù.

ÁúÀÇÀÇ Ã³¸® °úÁ¤Àº ¸ÕÀú ÁúÀǸ¦ ÀÔ·Â ¹Þ°í ÁúÀÇÀÇ Á¤´ç¼º °Ë»ç¸¦ Æ÷ÇÔÇÑ ºÐ¼®ÀÌ ÀÌ·ç¾îÁö°í °¢ ¼­Ä¡ ¿£Áøº°·Î ¾²·¡µå¸¦ »ý¼ºÇÑ´Ù. ¾²·¡µå¿¡¼­ °¢ ¼­Ä¡ ¿£ÁøÀÇ Æ¯¼º¿¡ ¸Â´Â ÁúÀǸ¦ ¸¸µé¾î ³»°í ´ë»ó ¼­Ä¡ ¿£Áø¿¡ ÁúÀǸ¦ ¼öÇàÇÏ°í °Ë»ö °á°ú¸¦ ÅëÇÕÇØ »ç¿ëÀÚ¿¡°Ô º¸¿©ÁØ´Ù.

ÁúÀÇÀÇ ÇüÅ´ µÎ°¡Áö°¡ ÀÖÀ» ¼ö ÀÖ´Ù.

´ÜÀÏ ÅÒÀ» ´ë»ó ¼­Ä¡ ¿£Áø¿¡ ÁúÀÇÀÇ ÇüÅ·Πº¸³»´Â ¹æ¹ýÀº ´ë»ó ¼­Ä¡ ¿£Áø¿¡¼­ ¹®¼­µé¿¡ ¿ì¼± ¼øÀ§¸¦ Àû¿ëÇÏ´Â ·©Å·(ranking)±â¹ýÀ» Ȱ¿ëÇÒ ¼ö ¾ø´Ù´Â ´ÜÁ¡ÀÌ Àֱ⠶§¹®¿¡ »ç¿ëÀÚ¿¡°Ô º¸´Ù Á¤È®ÇÑ °á°ú¸¦ º¸¿©ÁÖ±â À§Çؼ­ º» ½Ã½ºÅÛ¿¡¼­´Â ¼­Ä¡ ¿£ÁøÀÇ Æ¯¼ºÀ̶ó ÇÒ ¼ö ÀÖ´Â ·©Å· ±â¹ýÀ» ÃæºÐÈ÷ Ȱ¿ëÇÏ´Â ÁúÀǹ®À» °ÅÀÇ ¼öÁ¤¾øÀÌ ´ë»ó ¼­Ä¡ ¿£Áø¿¡ ÁúÀÇÇÏ´Â ¹æ¹ýÀ» »ç¿ëÇÑ´Ù.

4.1.3 ¼º´É Çâ»óÀ» À§ÇÑ °í·Á »çÇ×

º» ½Ã½ºÅÛ¿¡¼­´Â ¿©·¯ ´ë»ó ¼­Ä¡ ¿£Áø¿¡ ÁúÀǸ¦ ÇØ¼­ ¾ò¾îÁø °á°ú¸¦ ÇÕº´ÇÏ´Â ¹æ¹ýÀ» »ç¿ëÇϴµ¥, ¿©·¯ ´ë»ó ¼­Ä¡ ¿£ÁøµéÀÌ ÀÖÀ» ¶§ ¿£Áøµé °¢°¢¿¡ ÁúÀǸ¦ ÇÒ ¼ö ÀÖ´Â ¹æ¹ýÀº µÎ°¡Áö°¡ ÀÖÀ» ¼ö ÀÖ´Ù. ÇϳªÀÇ ´ë»ó ¼­Ä¡ ¿£Áø¿¡ ÁúÀÇÇÏ´Â ½Ã°£¿¡ ¿©·¯ °³ÀÇ ¼­Ä¡ ¿£Áø¿¡ ÁúÀǸ¦ ÇØº¼ ¼ö ÀÖ´Â ¼º´É»óÀÇ ÀåÁ¡¶§¹®¿¡ º» ½Ã½ºÅÛ¿¡¼­´Â µÎ¹øÂ°ÀÇ ¹æ¹ýÀ» »ç¿ëÇÑ´Ù.

À̿Ͱ°ÀÌ ½Ã½ºÅÛÀÇ È¿À²À» ³ôÀ̱â À§Çؼ­ ¿©·¯ ´ë»ó ¿£Áøµé¿¡ µ¿½Ã¿¡ ÁúÀÇÇÏ´Â ¹æ¹ýÀ» »ç¿ëÇϴµ¥ À־µµ ¿©·¯°¡Áö ±¸Çö ¹æ¹ýÀÌ ÀÖÀ» ¼ö ÀÖÁö¸¸ º» ½Ã½ºÅÛ¿¡¼­´Â ¸ÖƼ¾²·¡µå(multi-thread)¸¦ »ç¿ëÇÑ´Ù. ±âÁ¸¿¡ ¸ÖƼ¾²·¡µå ¶óÀ̺귯¸®°¡ ÀÌ¹Ì Á¸ÀçÇØ¼­ ±¸ÇöÀÌ ¿ëÀÌÇϰí, Linght-Weight Process¸¦ »ç¿ëÇÔÀ¸·Î½á ¸Þ¸ð¸® °ü¸® Ãø¸é µî ½Ã½ºÅÛÀ» È¿À²ÀûÀ¸·Î »ç¿ëÇÒ ¼ö Àֱ⠶§¹®ÀÌ´Ù.

4.2 À¥ ¸ÞŸ ¼­Ä¡ ¿£ÁøÀÇ ¼³°è

4.2.1 Àüü ½Ã½ºÅÛÀÇ ¼³°è

[±×¸² 1 À¥ ¸ÞŸ ¼­Ä¡ ¿£ÁøÀÇ Àüü ºí·°µµ]

±×¸² 1Àº À¥ ¸ÞŸ ¼­Ä¡ ¿£ÁøÀÇ Àüü ºí·°µµÀÌ´Ù. º» ½Ã½ºÅÛÀº »ç¿ëÀÚ°¡ Á÷Á¢ ÁúÀǹ®À» ¼±ÅÃÇÔÀ¸·Î½á ÁúÀǸ¦ ÇÏ´Â ÇüÅÂ¿Í ÁÖÁ¦¾î(subject)¸¦ ¼±ÅÃÇÔÀ¸·Î½á ÁúÀǸ¦ ÇÏ´Â ÇüÅ·ΠµÎ°¡Áö·Î ÁúÀǸ¦ ÇÒ ¼ö°¡ ÀÖ´Ù. °á°ú¸¦ »ç¿ëÀÚ¿¡°Ô º¸¿©ÁÙ ¶§´Â ÁÖÁ¦¾î¸¦ ¼±ÅÃÇßÀ» °æ¿ì ÀÚü µ¥ÀÌŸº£À̽º¿¡ ÀúÀåµÈ Á¤º¸¸¦ ÀÌ¿ëÇÏ°í »ç¿ëÀÚ ÁúÀÇÀÇ °æ¿ì´Â ¿©·¯ ¼­Ä¡ ¿£Áøµé·ÎºÎÅÍ ±×¶§ ±×¶§ Á¤º¸¸¦ ¼öÁýÇÑ´Ù.

[±×¸² 2 Meta-Search EngineÀÇ ºí·°µµ]

À¥ ¸ÞŸ ¼­Ä¡ ¿£ÁøÀº ÀüüÀûÀ¸·Î µÎ ºÎºÐÀ¸·Î ³ª´µ¾îÁø´Ù. ù°´Â, »ç¿ëÀÚÀÇ ÁúÀǸ¦ ÀÔ·Â¹Þ¾Æ Ã³¸®ÇÏ´Â ¸ÞŸ¼­Ä¡¿£Áø(Meta-Search Engine)ºÎºÐ(±×¸² 2)À̰í, ´ÙÀ½Àº ÁÖÁ¦¿¡ ´ëÇØ¼­ °ü¸®¸¦ ¼öÇàÇÏ´Â ÁÖÁ¦ °ü¸®ÀÚ(Subject Manager)ºÎºÐ(±×¸² 3)ÀÌ´Ù. º» ½Ã½ºÅÛÀÇ ÀüüÀûÀÎ Àû¾÷ 󸮴 ÁúÀÇÀÇ ÀÔ·Â, ÁúÀÇÀÇ Ã³¸®(Á¤´ç¼º °Ë»ç, ÁúÀǺм±), ´ë»ó ¼­Ä¡ ¿£Áø¿¡ÀÇ ÁúÀÇ, Á¡¼öÀÇ Á¤±ÔÈ­(normalization), ÇÕº´°ú Àç·©Å·°ú °°Àº ÀÏ·ÃÀÇ ¼ø¼­¸¦ ÅëÇØ¼­ ÀÌ·ç¾îÁö°í, °¢ ó¸® ´Ü°è¸¶´Ù ÀÛ¾÷À» ó¸®ÇÒ ¼ö ÀÖ´Â ±¸¼º ¿ä¼Ò(Component)¸¦ °®´Â´Ù.

[±×¸² 3 SDI Manager¿Í Subject ManagerÀÇ ºí·°µµ]

4.2.2 °¢ ¸ðµâº° ¼³°è

¸ÞŸ ¼­Ä¡ ¿£Áø(Meta-Search Engine)
¸ÞŸ ¼­Ä¡ ¿£ÁøÀº º» ½Ã½ºÅÛ¿¡¼­ ÇÙ½ÉÀÌ µÇ´Â ºÎºÐÀ¸·Î¼­ »ç¿ëÀÚ ÁúÀÇÀÇ Ã³¸® ¹× µ¥ÀÌŸº£À̽º¿¡ ÀúÀåµÇ´Â Á¤º¸ÀÇ ¼öÁýÀ» ´ã´çÇÑ´Ù.

ÁúÀÇ ºÐ¼®±â(Query Analyzer)´Â ÁúÀÇ ÀÔ·Â, ÁúÀÇÀÇ Á¤´ç¼º °Ë»ç, ÁúÀÇÀÇ ºÐ¼® µî°ú °°Àº ÀÛ¾÷À» ÇÑ´Ù. ±×¸®°í ºÐ¼®µÈ ÁúÀǸ¦ ¾²·¡µå °ü¸®ÀÚ(Thread Manager)·Î Àü´ÞÇÑ´Ù.

¾²·¡µå °ü¸®ÀÚ´Â °¢ ´ë»ó ¼­Ä¡ ¿£Áø¿¡ ´ëÇÑ ÁúÀÇ¿¡ ´ëÇØ 󸮸¦ ÇØÁÖ´Â ºÎºÐÀ¸·Î ¾²·¡µå »ý¼º, ÁúÀÇÀÇ º¯Çü, °á°úÀÇ ºÐ¼® ¹× °á°úÀÇ »ý¼º, °á°úÀÇ ÅëÇÕ ¹× Àç·©Å·°ú °°Àº ÀÛ¾÷À» ¼öÇàÇÑ´Ù. ¶Ç ÁúÀǹ® º¯Çü±â(Query Fomulator), °á°ú »ý¼º±â(Result Generator), °á°ú ÅëÇÕ±â(Result Integrator) µîÀ» °®´Â´Ù.

ÁÖÁ¦¾î °ü¸®ÀÚ(Subject Manager)
ÁÖÁ¦¾î °ü¸®ÀÚ´Â »ç¿ëÀÚ°¡ ÁÖÁ¦¾î¸¦ ¼±ÅÃÇÔÀ¸·Î½á ÁúÀǸ¦ ÇÒ ¶§ À̸¦ ó¸®ÇÏ¿© ÁÖ´Â ¸ðµâÀÌ´Ù. ±¸¼º ¿ä¼Ò·Î´Â ÁúÀÇ ºÐ¼®±â(Query Analyzer), ÁúÀÇ ½ÇÇà±â(Query Executor), °á°ú »ý¼º±â(Result Fomatter), DB º¯°æ±â(DB Renewal Component) µîÀ» °®´Â´Ù.

DB º¯°æ±â´Â Ç×»ó ¸Þ¸ð¸®¿¡ »óÁÖÇØ ÀÖÀ¸¸é¼­ µ¥¸ó(Daemon)ÀÇ ¼º°ÝÀ» °¡Áø Actuator·ÎºÎÅÍ ½ÅÈ£¸¦ ¹ÞÀ¸¸é Search Result Database¸¦ »õ·Î¿î Á¤º¸·Î º¯°æÀ» ÇÏ°Ô µÈ´Ù. ÀÌ ¶§ ÁÖÁ¦ īŻ·Î±×¸¦ ÂüÁ¶Çؼ­ ½Ã½ºÅÛ ÁúÀǸ¦ ÇÏ°Ô µÇ´Âµ¥, º¯°æÇÒ ÁÖÁ¦¸¦ ¸ÞŸ ¼­Ä¡ ¿£Áø¿¡ ÁúÀÇÇÏ°í °á°ú´Â ´Ù½Ã Á¤º¸ º¯°æ±â·Î µé¾î¿Í SDI °ü¸®ÀÚ·Î º¸³»Áö°Ô µÈ´Ù.

SDI °ü¸®ÀÚ
SDI °ü¸®ÀÚ´Â »ç¿ëÀÚ°¡ ÁúÀǸ¦ ÇÏÁö ¾Ê¾Æµµ ÁÖ±âÀûÀ¸·Î ÀÚµ¿ÀûÀ¸·Î »õ·Î¿î Á¤º¸¸¦ µî·ÏµÈ ÇÁ·ÎÆÄÀÏ¿¡ ´ëÇØ¼­ ¸ÞÀÏÀ» ÅëÇØ¼­ º¸³»ÁÖ´Â ¿ªÇÒÀ» ÇÏ´Â °ÍÀ¸·Î¼­ ÇÁ·ÎÆÄÀÏ °ü¸®ÀÚ(profile manager), ºñ±³±â(comparator), ÇÊÅÍ(filter), Å뺸±â(alerter)µîÀÇ ±¸¼º ¿ä¼Ò¸¦ °¡Áö°í ÀÖ´Ù.

4.3 À¥ ¸ÞŸ ¼­Ä¡ ¿£ÁøÀÇ ±¸Çö

4.3.1 ÁúÀǹ® 󸮸¦ À§ÇÑ ¿¬»ê

º» ¸ÞŸ ¼­Ä¡ ¿£ÁøÀÎ CGI ÇÁ·Î±×·¥¿¡¼­´Â ÁúÀǹ®À» ó¸®Çϱâ À§ÇÑ ¿¬»êÀ¸·Î¼­ µðÄÚµå, ºÐ¼®, Á¤´ç¼º °Ë»ç¸¦ ÇÏ´Â ·çƾµéÀ» Á¦°øÇÑ´Ù.

µðÄÚµå ¿¬»êÀº ÀÎÄÚµåµÈ ÁúÀǹ®À» ÀÐ¾î µé¿© ÁúÀǹ®À» µðÄÚµåÇÏ°í µðÄÚµåµÈ ÁúÀǹ®À» ºÐ¼®Çϱâ À§ÇÑ ºÐ¼®±â¸¦ È£ÃâÇÑ´Ù. ºÐ¼® ¿¬»êÀº ÁúÀǹ®ÀÇ ¹®ÀÚ¿­À» ÆÄ½ÌÇÏ°í ¿¬»êÀÚ¿Í ÅÒÀ» ±¸ºÐÇÏ´Â ÀÛ¾÷À» ÇÑ´Ù. Á¤´ç¼º °Ë»ç ¿¬»êÀº ¹®ÀÚ¿­ÀÇ ¼ö, ÅÒ°ú ¿¬»êÀÚÀÇ ¹è¿­ µéÀ» ÂüÁ¶ÇØ Á¤´çÇÑ ÁúÀÇÀΰ¡¸¦ ÆÇ´ÜÇÑ´Ù.

4.3.2 ¾²·¡µå °ü¸®ÀÚÀÇ ±¸Çö

¾²·¡µå °ü¸®ÀÚ´Â ´ë»ó ¼­Ä¡ ¿£Áø À̸§°ú ½Ã°£À» Á¶ÇÕÇØ µ¿½Ã¿¡ ¿©·¯ »ç¶÷ÀÌ »ç¿ëÇÒ ¶§ ¼­·Î ´Ù¸¥ È­ÀϸíÀ» °¡Áöµµ·Ï È­ÀϸíÀ» ¸¸µé°í µ¹¾Æ¿Â °á°ú¿¡ ´ëÇØ¼­´Â ±×È­ÀÏ¿¡ ÀúÀåÀ» ÇÑ´Ù. ±×¸®°í POSIX thread ¶óÀ̺귯¸®¸¦ »ç¿ëÇØ ¾²·¡µå¸¦ ¸¸µé°í ÁúÀÇ »ý¼º±â¸¦ ÅëÇØ¼­ °¢ ¼­Ä¡ ¿£ÁøÀÇ Æ¯¼º¿¡ ¸Â´Â ÁúÀǹ®À» ¸¸µé°í get¶óÀ̺귯¸®, URL, ÁúÀǹ®, ¿É¼Ç µîÀ» Á¶ÇÕÇÑ ÁúÀÇ ½ºÆ®¸µÀ» ¸¸µé¾î ½Ã½ºÅÛ ÄÝÀ» ÅëÇØ¼­ ´ë»ó ¼­Ä¡ ¿£Áø¿¡ ÁúÀǸ¦ ÇÑ´Ù.

4.3.3 °á°ú »ý¼º±âÀÇ ±¸Çö

°¢°¢ÀÇ HTMLÇü½ÄÀÇ °á°ú È­ÀÏÀ» ºÐ¼®ÇØ URL, TITLE, WEIGHT µîÀ» ¸®½ºÆ® ÇüÅ·Π¿À¸§Â÷¼øÀ¸·Î ÀúÀåÇÑ´Ù. ÀÌ·¸°Ô ¾ò¾îÁø °á°úµéÀº ¼­Ä¡ ¿£Áø¸¶´Ù ´Ù¸¥ Á¡¼ö¸¦ °¡Áö°í Àֱ⠶§¹®¿¡ °á°úµéÀ» ÇÕº´Çϱâ À§Çؼ­´Â Á¡¼öÀÇ Á¤±ÔÈ­°¡ ÀÌ·ç¾îÁ®¾ß ÇÑ´Ù. º» ½Ã½ºÅÛÀº °¢ ¼­Ä¡ ¿£Áø¸¶´Ù ´Ù¸¥ Á¡¼ö¸¦ Á¤±ÔÈ­½Ã۱â À§Çؼ­ Combining Method¸¦ »ç¿ëÇϴµ¥, ÀÌ ¹æ¹ýÀº º» ½Ã½ºÅÛÀÌ ´ë»óÀ¸·Î ÇÏ´Â ¼­Ä¡ ¿£ÁøµéÀÇ Á¡¼ö »êÃâ ¹æ¹ýÀ̳ª ·©Å· ¹æ¹ýÀ» ¸ð¸£±â ¶§¹®¿¡ »ç¿ëÇÏ´Â ¹æ¹ýÀ¸·Î¼­ ¾Æ·¡ ¼ö½ÄÀ¸·Î ³ªÅ¸³¾ ¼ö ÀÖ´Ù.
	MinMax = (OldSim - MinimumSim) / (MaximumSim - MinimumSim)
	CombinedSum = SUM(IndividualSims)
À§ ½Ä¿¡¼­ MaximumSimÀº °á°ú¿¡¼­ °¡Àå ³ôÀº Á¡¼ö, MinimumSimÀº °¡Àå ³·Àº Á¡¼ö, OldSimÀº Çö Á¡¼ö¸¦ ³ªÅ¸³»´Âµ¥, Çö Á¡¼ö´Â °á°ú¸¦ ÅëÇÕÇϱâÀ§Çؼ­ MinMax °ªÀ¸·Î ´ëüµÇ¾îÁø´Ù. ±×¸®°í °¢°¢ÀÇ ¼­Ä¡ ¿£ÁøÀÇ Á¡¼ö(IndividualSims)¸¦ ´õÇØ¼­ CombinedSum°ªÀ» Á¤±ÔÈ­µÈ Á¡¼ö·Î ¾ò´Â´Ù.

4.3.4 °á°ú ÅëÇÕ±âÀÇ ±¸Çö

º» ½Ã½ºÅÛÀº InfoSeek, Lycos, WebCrawler, AliWeb µî 4°³ÀÇ ¼­Ä¡ ¿£Áø¿¡ ÁúÀǸ¦ ÇØ¼­ °á°ú¸¦ ¼öÁýÇϴµ¥, °á°ú¸¦ ÅëÇÕÇϱâ À§Çؼ­ °¢°¢ÀÇ ¼­Ä¡ ¿£Áø¿¡¼­ ³ª¿Â °á°úµé¿¡¼­ °°Àº URLÀÌ ÀÖÀ¸¸é Á¦°ÅÇϰí Á¡¼ö·Î¼­ CombinedSum°ªÀ» °®´Â´Ù. ÀÌ·¸°Ô ¾ò¾îÁø °á°ú´Â URL·Î Á¤·ÄµÈ °á°úÀ̱⠶§¹®¿¡ ´Ù½Ã Á¡¼ö¼øÀ¸·Î Á¤·ÄÇÏ¿© »ç¿ëÀÚ¿¡°Ô º¸¿© ÁØ´Ù.

4.3.5 ÁÖÁ¦¾î °ü¸®ÀÚÀÇ ±¸Çö

ÁÖÁ¦¾î °ü¸®ÀÚÀÇ ÁÖµÈ ¿ªÇÒÀº ÁÖÁ¦¾î ÁúÀǸ¦ ó¸®ÇÏ°í µ¥ÀÌŸº£À̽º¸¦ »õ·Î¿î Á¤º¸·Î °»½Å½Ã۴µ¥, µ¥ÀÌŸ ÀúÀå ¸ÞÄ«´ÏÁòÀ» º¸¸é µ¥ÀÌŸ°¡ µ¥ÀÌŸº£À̽º¸¦ »ç¿ëÇÒ ¸¸Å­ ¸¹Àº µ¥ÀÌŸ°¡ ¾Æ´Ï°í ¿ÀÈ÷·Á ¿À¹öÇìµå°¡ µÉ ¼ö ÀÖÀ¸¸ç ÀÏ¹Ý È­ÀÏÀÇ »ç¿ëÀÌ ±¸ÇöÇϱ⠽±°Ô ¶§¹®¿¡ µ¥ÀÌŸ¸¦ ÀúÀåÇÏ´Â ¸ÞŸ´ÏÁòÀ¸·Î È­ÀÏÀ» »ç¿ëÇÑ´Ù.

±×¸®°í ¿©·¯ °³ÀÇ ´Ü¾î¸¦ °¡Áø ÁÖÁ¦¾î¿¡ ´ëÇÑ Ã³¸®´Â AND ¿¬»êÀÚ·Î ´Ü¾îµéÀ» ¿¬°áÇÏ´Â ¹æ¹ýÀ» »ç¿ëÇÏ¿´´Ù.

5. °á·Ð

ÇöÀç ÀÎÅÍ³×Æ®´Â Á¤º¸ÀÇ ¾çÀÌ ¹æ´ëÇØÁö¸é¼­ »ç¿ëÀÚ°¡ ¿øÇÏ´Â Á¤º¸¸¦ Á¤È®È÷ ¼Õ½±°Ô ã°íÀÚ ÇÏ´Â ³ë·Âµµ Ä¿Á®¼­ À¥À» ÀÌ¿ëÇÑ ¼­Ä¡ ¿£Áø°ú ·Îº¿ ¿¡ÀÌÀüÆ®°¡ ³ªÅ¸³ª°Ô µÇ¾ú°í ¼­Ä¡ ¿£ÁøÀ» ÀÌ¿ëÇÏÁö ¾Ê°í ¿øÇÏ´Â Á¤º¸¸¦ ã´Â´Ù´Â °ÍÀº »ç½Ç»ó ¾î·Á¿î ÀÏÀÌ µÇ¾ú´Ù.

º»°í¿¡¼­´Â ÀÎÅÍ³×Æ® »ó¿¡¼­ Á¤º¸¸¦ ã´Â µµ±¸ÀÎ ¼­Ä¡ ¿£Áø°ú À¥¿¡¼­ °¢ ȨÆäÀÌÁöÀÇ Á¤º¸¸¦ ¼öÁýÇÏ´Â ÇÁ·Î±×·¥ÀÎ ·Îº¿ ¿¡ÀÌÀüÆ®¿¡ ´ëÇØ¼­ ¼­¹ö °ü¸®ÀÚ¿Í °³¹ßÀÚ Ãø¸é¿¡¼­ ¾Ë¾Æ º¸¾Ò°í ´Ù¸¥ ¼­Ä¡¿£ÁöµéÀÇ Á¤º¸¸¦ ÀÌ¿ëÇÏ´Â ¸ÞŸ¼­Ä¡¿£ÁøÀÇ ¼³°è¿Í ±¸Çö¿¡ ´ëÇØ¼­ ¾Ë¾Æ º¸¾Ò´Ù.

Âü°í¹®Çå(References)

[1] "http://info.webcrawler.com/mak/projects/robots/robots.html", World Wide Web Robots, Wanders, and Spiders

[2] ¹ÚÁ¤ÈÆ, "ÀÎÅÍ³×Æ® Á¤º¸ ÀÚ¿ø µ¥ÀÌŸº£À̽º ±¸Ãà ¹× Á¤º¸ ¹ß°ß ½Ã½ºÅÛ °³¹ß", ÃÖÁ¾¿¬±¸º¸°í¼­, ½Ã½ºÅÛ°øÇבּ¸¼Ò, 1995. 7

[3] ¹ÚÁ¤ÈÆ, Á¶Çö¼º, À̰­Âù, À̱Ôö, "ÀÎÅÍ³×Æ® Á¤º¸ ¹ß°ß ½Ã½ºÅÛÀÇ °³¹ß ¹× ±¸Çö", Á¤º¸°úÇÐȸ ³í¹®

[4] Joon Ho Lee, "Combining Multiple Evidence from Different Properties of Weighting Schemes", Cornell University

[5] Çѱ¹ÀüÀÚÅë½Å¿¬±¸¼Ò, ±â¼úÁ¤º¸¼¾ÅÍ, "¸ÖƼ¾²·¡µù ±â¹ý°ú µ¿Çâ(I, II)", ÁÖ°£ ±â¼úµ¿Çâ 93-30,31, 1993