Robot agents and Search Engine
´ëÀü ±¤¿ª½Ã À¯¼º±¸ ±Ãµ¿ 220
Ãæ³²´ëÇб³ ÄÄÇ»ÅͰøÇаú µ¥ÀÌŸº£À̽º ¿¬±¸½Ç
E-mail : bluefrog@flower.comeng.chungnam.ac.kr
URL :
http://flower.comeng.chungnam.ac.kr/~bluefrog/
- Abstract:
- ÀÎÅÍ³×Æ® »ó¿¡ »êÀçÇÑ Á¤º¸°¡ ¹æ´ëÇØÁö°í WWW°¡ ±Þ°ÝÈ÷ ¹ßÀüÇÏ¸é¼ »ç¿ëÀÚµéÀº Á¤º¸°Ë»ö µµ±¸(tool)·Î¼ ¼Ä¡¿£Áø(search engine)À» ¸¹ÀÌ ÀÌ¿ëÇϰí ÀÖ´Ù. ÇöÀç Àü ¼¼°èÀûÀ¸·Î ¸¹Àº ¼Ä¡¿£ÁøµéÀÌ µ¿ÀÛÇϰí ÀÖ°í, °¢Á¾ Á¤º¸¿¡ ´ëÇÑ µ¥ÀÌŸº£À̽º¸¦ ±¸ÃàÇϰí ÀÖ°í °è¼ÓÀûÀ¸·Î °»½ÅÇÔÀ¸·Î½á »ç¿ëÀÚ¿¡°Ô ÃÖ½ÅÀÇ Á¤º¸¸¦ Á¦°øÇÑ´Ù. ¼Ä¡¿£ÁøÀº ·Îº¿ ¿¡ÀÌÀüÆ®(Robot agents)¶ó´Â À¥(Web)À» ¼øÈ¸(traverse)ÇÏ´Â ÇÁ·Î±×·¥¿¡ ÀÇÇØ Á¤º¸¸¦ ¼öÁýÇÑ´Ù. ·Îº¿ ¿¡ÀÌÀüÆ®´Â ÁöÁ¤ÇÑ URLÀ» ¼øÈ¸ÇÏ¸ç °¢ ȨÆäÀÌÁöµéÀÇ Á¤º¸¸¦ ¼öÁýÇÏ°í ¼öÁýµÈ Á¤º¸¿¡ ´ëÇØ¼ ¼Ä¡¿£ÁøÀº »ç¿ëÀÚ°¡ Æí¸®ÇÑ ¹æ¹ýÀ¸·Î °Ë»öÇÒ ¼ö ÀÖ´Â À妽º¸¦ Á¦°øÇÑ´Ù.
º» ¹ßÇ¥¿¡¼´Â ·Îº¿ ¿¡ÀÌÀüÆ®ÀÇ Á¾·ù¿Í µ¿ÀÛ¿ø¸®, ±âº»ÀûÀÎ ±¸Á¶¿¡ ´ëÇÏ¿© »ìÆìº¸°í ¼Ä¡¿£ÁøÀÌ ÀÌ ·Îº¿ ¿¡ÀÌÀüÆ®¸¦ ÀÌ¿ëÇÏ´Â ¹æ¹ý¿¡ ´ëÇÏ¿© ¼³¸íÇϰí ÈĹݺο¡´Â ÀÏÀÏÀÌ ¸¹Àº ¼Ä¡¿£ÁøÀ» °Ë»öÇÒ ÇÊ¿ä¾øÀÌ ¿©·¯ ¼Ä¡ ¿£ÁøµéÀ» µ¿½Ã¿¡ °Ë»öÇÒ ¼ö ÀÖ´Â À¥ ¸ÞŸ¼Ä¡¿£ÁøÀÇ ±¸Çö¿¡ ´ëÇØ¼ ¼³¸íÇϵµ·Ï ÇÑ´Ù.
- Keywords:
- SPIDER, Robot agents, ¼Ä¡ ¿£Áø(Search Engine)
1. ¼·Ð
ÃÖ±Ù¿¡ ÀÎÅÍ³×Æ®(Internet)ÀÇ Á¤º¸ÀÇ ¾ç°ú Á¾·ù, Á¤º¸ Á¦°øÀÚÀÇ ¼ö´Â ±Þ¼Óµµ·Î Áõ°¡µÇ°í ÀÖ´Â Ãß¼¼ÀÌ´Ù. ÀÌ·± ¹æ´ëÇÑ Á¤º¸¸¦ °®°í ÀÖ´Â ÀÎÅÍ³×Æ®¿¡¼ °³ÀÎÀÌ ÇÊ¿ä·Î ÇÏ´Â Á¤º¸¸¦ ¼Õ½±°Ô ã´Â´Ù´Â °ÍÀº »ó´çÈ÷ ¾î·Á¿î ÀÏÀÌ µÇ¾ú´Ù. ƯÈ÷ ÃÖ±Ù µé¾î ÇÏÀÌÆÛÅØ½ºÆ®(Hypertext) ÇüÅÂÀÇ Á¤º¸ Á¶Á÷ ¹× ºê¶ó¿ì¡(browsing)ÀÌ °¡´ÉÇÑ WWW(World Wide Web)¸¦ ÀÌ¿ëÇÏ¿© Á¤º¸¸¦ Á¦°øÇÏ´Â »çÀÌÆ®(site)°¡ ±âÇϱ޼öÀûÀ¸·Î ´Ã¾î³ª°í ÀÖ´Â Ãß¼¼ÀÌ´Ù.
WWW¸¦ ÀÌ¿ëÇØ¼ ÀÎÅÍ³×Æ® »ó¿¡ ³Î¸® ÆÛÁ® ÀÖ´Â Á¤º¸¸¦ »ç¿ëÀÚ¿¡°Ô ãÀ» ¼ö ÀÖµµ·Ï µµ¿ÍÁÖ´Â µµ±¸¸¦ ¼Ä¡¿£ÁøÀ̶ó Çϰí ÇöÁ¦ Àü ¼¼°èÀûÀ¸·Î ¸¹Àº ¼Ä¡¿£ÁøµéÀÌ Á¸ÀçÇϰí ÀÖÀ¸¸ç, °¢Á¾ Á¤º¸¿¡ ´ëÇÑ µ¥ÀÌŸº£À̽º(database)¸¦ ±¸ÃàÇϰí ÀÖ°í °è¼ÓÀûÀ¸·Î °»½ÅÇÔÀ¸·Î½á »ç¿ëÀÚ¿¡°Ô ÃÖ½ÅÀÇ Á¤º¸¸¦ Á¦°øÇÑ´Ù.
¼Ä¡¿£ÁøµéÀº Á¤º¸ÀÇ º¸À¯ Ãø¸é¿¡¼ º»´Ù¸é ´ë·« µÎ °¡Áö ÇüÅ·Π³ª´©¾î º¼ ¼ö°¡ ÀÖ´Ù.
- ·Îº¿ ¿¡ÀÌÀüÆ®(Robot agents)¸¦ ÅëÇØ ÀڷḦ ¼öÁýÇϰųª »ç¿ëÀÚ°¡ Á¤º¸¸¦ µî·ÏÇÏ°Ô ÇÔÀ¸·Î½á ÀÚ±â ÀÚ½ÅÀÇ µ¥ÀÌŸº£À̽º¸¦ ±¸ÃàÇϰí ÀÖ´Â °æ¿ì
- ´Ù¸¥ ¼Ä¡ ¿£Áø¿¡¼ º¸À¯Çϰí ÀÖ´Â µ¥ÀÌŸº£À̽º¸¦ ÀÌ¿ëÇÏ¿© »ç¿ëÀÚ¿¡°Ô ¼ºñ½º¸¦ ÇÏ´Â ÇüÅÂ
·Îº¿ ¿¡ÀÌÀüÆ®¸¦ ÀÌ¿ëÇØ ÀڷḦ ¼öÁýÇÏ´Â ¼Ä¡¿£ÁøÀÇ °æ¿ì´Â ÀڷḦ ¼öÁýÇÏ´Â ·Îº¿ ¿¡ÀÌÀüÆ®, ¼öÁýµÈ ÀڷḦ ÀúÀåÇÏ´Â µ¥ÀÌŸº£À̽º, ±×¸®°í »ç¿ëÀÚ°¡ ÁúÀÇ(Query)¸¦ ÇßÀ»
¶§ ÀڷḦ °Ë»öÇØÁÖ´Â IRS(Information Retrieval System : Á¤º¸°Ë»ö ½Ã½ºÅÛ)·Î
±¸¼ºµÈ´Ù. ±×¸®°í ´Ù¸¥ ¼Ä¡¿£ÁøÀÇ Á¤º¸(µ¥ÀÌŸº£À̽º)¸¦ ÀÌ¿ëÇÏ´Â °ÍÀ»
¸ÞŸ¼Ä¡¿£ÁøÀ̶ó°í Çϴµ¥, ¸ÞŸ¼Ä¡¿£ÁøÀº ÀüüÀûÀ¸·Î ÁúÀǸ¦ °¢ ¼Ä¡¿£Áø¿¡ º¸³»´Â
ºÎºÐ°ú °Ë»öµÇ¾î¿Â °á°úµé¿¡ ´ëÇØ¼ ÅëÇÕÇØ¼ »ç¿ëÀÚ¿¡°Ô º¸¿©ÁÖ´Â ºÎºÐÀ¸·Î ±¸¼ºµÈ´Ù.
º» °íÀÇ ±¸¼ºÀº 2Àå¿¡¼ Prosed Standard for Robot Exclusion¿¡ ´ëÇØ¼ ¼³¸íÇϰí,
3Àå¿¡¼´Â ·Îº¿ ¿¡ÀÌÀüÆ®¿¡ ´ëÇÑ Àü¹ÝÀûÀÎ »çÇ׵鿡 ´ëÇØ¼ ¾Ë¾Æ º¸¾Ò°í, 4Àå¿¡¼´Â
À¥ ¸ÞŸ ¼Ä¡ ¿£ÁøÀÇ ¼³°è ¹× ±¸Çö¿¡ ´ëÇØ¼ ¾Ë¾Æ º¸¾Ò´Ù.
2. A Standard for Robot Exclusion
2.1 Çʿ伺
Wanderers ¶Ç´Â spiders¶ó°íµµ ºÒ¸®´Â WWW ·Îº¿Àº WWW»ó¿¡¼ ¸µÅ©µÈ ÆäÀÌÁöµéÀº
¼øÈ¯ÀûÀ¸·Î °Ë»öÇÔ¿¡ ÀÇÇØ ¸¹Àº ÆäÀÌÁöµéÀ» ¼øÈ¸(traverse)ÇÏ´Â ÇÁ·Î±×·¥ÀÌ´Ù.
1993³â°ú 1994³â¿¡´Â ¿©·¯°¡Áö ÀÌÀ¯·Î WWW ¼¹ö¿¡ ·Îº¿µéÀÌ ¹æ¹®ÇÏ´Â
ÀÏÀÌ ÀÚÁÖ ¹ß»ýÇØ ¿Ô´Ù. ÀÌµé ·Îº¿Áß¿¡¼´Â ºü¸¥ ¿ä±¸(request) ¶Ç´Â °è¼ÓÀûÀ¸·Î
°°Àº ÈÀÏÀ» °Ë»öÇÔÀ¸·Î½á ¼¹ö¸¦ È¥¶õ½º·´°Ô ÇÏ´Â Àϵµ ÀÖ¾ú´Ù.
±×¸®°í Àû´çÇÏÁö ¾ÊÀº WWW ¼¹öÀÇ ºÎºÐµéÀ» °Ë»öÇѴٵ簡 ÀϽÃÀûÀÎ Á¤º¸ ¶Ç´Â
ºÎÀÛ¿ë(side-effect)À» °¡Áú ¼ö ÀÖ´Â cgi-script¸¦ °Ë»öÇÏ´Â Àϵµ ¹ß»ýÇØ ¿Ô´Ù.
ÀÌ·¯ÇÑ Àϵé·Î ÀÎÇØ¼ ¼¹öÀÇ ¾î´Â ƯÁ¤ÇÑ ºÎºÐÀ» ·Îº¿µéÀÌ Á¢±ÙÇÏÁö ¸øÇϵµ·Ï
ÀνĽÃÄÑÁÖ±â À§ÇÑ ¸ÞÄ«´ÏÁòÀ» È®¸³ÇÒ Çʿ䰡 ´ëµÎµÇ¾ú´Ù.
2.2 ¹æ¹ý
ÇÑ ¼¹ö·ÎºÎÅÍ ·Îº¿À» ¹èÁ¦Çϱâ À§ÇØ »ç¿ëµÇ´Â ¹æ¹ýÀº ¼¹ö¿¡ ·Îº¿¿¡ ´ëÇÑ Á¢±Ù
Á¤Ã¥À» ¸í¼¼ÇÏ´Â ÈÀÏÀ» »ý¼ºÇÏ´Â °ÍÀÌ´Ù. ÀÌ ÈÀÏÀº HTTP¸¦ °æÀ¯ÇÏ¿© ·ÎÄà URL
"/robots.txt"·Î Á¢±Ù °¡´ÉÇØ¾ß ÇÑ´Ù. ÀÌ ÈÀÏÀÇ ³»¿ëÀº ¾Æ·¡¿¡ ¸í¼¼µÇ¾î ÀÖ´Ù.
ÀÌ ÈÀÏ ¹æ¹ýÀº ÇöÁ¸ÇÏ´Â WWW ¼¹ö¿¡ ½±°Ô ±¸ÇöµÉ ¼ö Àֱ⠶§¹®¿¡ ¼±ÅõǾîÁ³°í,
·Îº¿µéÀº ´ÜÁö ÇÑ ¹®¼¸¸À» °Ë»öÇÔÀ¸·Î½á Á¢±Ù Á¤Ã¥À» ¾Ë¾Æ³¾ ¼ö ÀÖ´Ù.
ÀÌ "robots.txt" ÈÀÏ ¹æ¹ýÀÇ ´ÜÁ¡Àº ¼¹ö¿¡ ÀÖ´Â °³ÀÎÀÇ ¹®¼ ¼ÒÀ¯ÀÚ°¡ ¾Æ´Ï¶ó
¿ÀÁ÷ ¼¹ö °ü¸®ÀÚ¸¸ÀÌ ÇÑ ¸®½ºÆ®¸¦ À¯ÁöÇÒ ¼ö ÀÖ´Ù´Â °ÍÀÌ´Ù. À̰ÍÀº ¹®¼ ¼ÒÀ¯ÀÚÀÇ
¼ö¸¸Å "robots.txt"ÈÀÏÀ» ±¸¼ºÇϵµ·Ï ÇÏ´Â ³»ºÎó¸®ÀÇ ÀÇÇØ ÇØ°áµÇ¾îÁú ¼öµµ ÀÖ´Ù.
"/robots.txt" URLÀÇ ¼±Åÿ¡ ´ëÇÑ µ¿±â´Â ´ÙÀ½°ú °°´Ù.
- ÈÀÏÀ̸§Àº ¸ðµç ¿î¿µÃ¼Á¦ÀÇ ÈÀÏÀ̸§ Á¦ÇÑ¿¡ ÀûÇÕÇØ¾ßÇÑ´Ù.
- ÈÀÏÀ̸§ È®ÀåÀº ¿©ºÐÀÇ ¼¹ö ±¸¼ºÀ» ¿ä±¸ÇÏÁö ¾Ê¾Æ¾ß ÇÑ´Ù.
- ÈÀÏÀ̸§Àº ±× ÈÀÏÀÇ ¸ñÀûÀ» ³ªÅ¸³»°í ±â¾ïÇϱ⿡ ½¬¿ö¾ß ÇÑ´Ù.
- ±âÁ¸ÀÇ ÈÀϰú Ãæµ¹ÀÌ Àû¾î¾ß¸¸ ÇÑ´Ù.
2.3 Æ÷¸Ë
"/robots.txt"ÀÇ Æ÷¸Ë°ú Àǹ̴ ´ÙÀ½°ú °°´Ù.
ÀÌ ÈÀÏÀº Çϳª ÀÌ»óÀÇ ºí·©Å© ¶óÀÎ(CR, CR/NL, ¶Ç´Â NL¿¡ ÀÇÇØ ³¡³ª´Â)¿¡ ºÐ¸®µÇ´Â
Çϳª ÀÌ»óÀÇ ·¹ÄÚµå(record)·Î ±¸¼ºµÈ´Ù. °¢ ·¹ÄÚµå´Â "<field>:<optionalspace><value><optionalspace>" ÇüÅÂÀÇ ¶óÀεéÀ» Æ÷ÇÔÇÑ´Ù. Çʵå À̸§Àº ´ë¼Ò¹®ÀÚ ±¸º°À» ÇÏÁö ¾Ê´Â´Ù.
ÁÖ¼®¹®Àº UNIXÀÇ bourne shellÀÇ »ç¿ë¹ýÀ» ÀÌ¿ëÇØ ÈÀÏ¿¡ Æ÷ÇÔÇÒ ¼ö ÀÖ´Ù. Áï, '#'
¹®ÀÚ¾ÕÀÇ °ø¹é°ú ±× ¶óÀÎ ³¡±îÁö ³ª¸ÓÁö ºÎºÐÀº ÁÖ¼®À¸·Î¼ ¹«½ÃµÈ´Ù. ÁÖ¼®¹®¸¸À»
Æ÷ÇÔÇÑ ¶óÀÎÀº ¿ÏÀüÈ÷ ¹«½ÃµÇ°í, ·¹ÄÚµå ¹üÀ§·Î ÀνĵÇÁö ¾Ê´Â´Ù.
·¹ÄÚµå´Â Çϳª ÀÌ»óÀÇ User-agent ¶óÀÎÀ¸·Î ½ÃÀÛÇϰí, Çϳª ÀÌ»óÀÇ
Disallow ¶óÀÎÀÌ ¾Æ·¡¿¡ ¼³¸íµÈ °Íó·³ µû¸¥´Ù. ÀνÄÇÒ ¼ö ¾ø´Â Çì´õ´Â
¹«½ÃµÈ´Ù.
- User-agent
-
ÀÌ ÇʵåÀÇ °ªÀº ·Îº¿ÀÇ À̸§ÀÌ°í ±× ·Îº¿µé¿¡ ´ëÇÑ Á¢±Ù Á¤Ã¥À» ³ªÅ¸³½´Ù.
Çϳª ÀÌ»óÀÇ User-agent Çʵ尡 Á¸ÀçÇÑ´Ù¸é ±× ·¹ÄÚµå´Â ÇϳªÀÌ»óÀÇ
·Îº¿µé¿¡ ´ëÇØ¼ µ¿ÀÏÇÑ Á¢±Ù Á¤Ã¥À» ³ªÅ¸³½´Ù. Àû¾îµµ ÇÑ ·¹ÄÚµå´ç ÇÑ Çʵå´Â
Á¸ÀçÇØ¾ßµÉ Çʿ䰡 ÀÖ´Ù.
±× ·Îº¿Àº ÀÌ Çʵ带 ÀÚÀ¯·Ó°Ô ÇØ¼®ÇÒ ¼ö ÀÖ°í ¹öÀü Á¤º¸¾øÀÌ À̸§ÀÇ ´ë¼Ò¹®ÀÚ
±¸º°¾ø´Â ºÎºÐ¹®ÀÚ¿ ¸ÅÄ¡°¡ ±ÇÀåµÇ¾îÁø´Ù.
¸¸¾à °ªÀÌ '*'¶ó¸é ±× ·¹ÄÚµå´Â ´Ù¸¥ ·¹ÄÚµå¼ ¸ÅÄ¡µÇÁö ¾Ê´Â ·Îº¿µé¿¡ ´ëÇÑ
µðÆúÆ® Á¢±Ù Á¤Ã¥À» ³ªÅ¸³½´Ù. "/robots.txt"ÈÀÏ¿¡ µÎ °³ÀÇ ±×·¯ÇÑ
·¹ÄÚµå´Â Çã¶ôµÇÁö ¾Ê´Â´Ù.
- Disallow
-
ÀÌ ÇʵåÀÇ °ªÀº ¹æ¹®µÇ¾îÁú ¼ö ¾ø´Â ºÎºÐ URLÀ» ¸í¼¼ÇÑ´Ù. À̰ÍÀº Àüü ÆÐ½ºÀÏ ¼öµµ
ÀÖ°í, ºÎºÐ ÆÐ½ºÀÏ ¼öµµ ÀÖ´Ù. ÀÌ °ªÀ¸·Î ½ÃÀÛÇÏ´Â URLÀº °Ë»öµÇ¾îÁú ¼ö ¾ø´Ù.
¿¹¸¦ µé¸é,
Disallow: /help ´Â /help.html °ú
/help/index.html ¸ðµÎ¿¡°Ô °Ë»öÀÌ Çã¶ôµÇÁö ¾Ê´Â´Ù. ¹Ý¸é¿¡,
Disallow: /help/ ´Â /help/index.html Àº °Ë»öÀÌ
Çã¶ôµÇÁö ¾ÊÁö¸¸, /help.html Àº °Ë»öÀÌ Çã¶ôµÈ´Ù.
ƯÁ¤ÇÑ °ªÀ» ÁöÁ¤ÇÏÁö ¾ÊÀ¸¸é ¸ðµç URLµéÀÌ °Ë»öµÇ¾îÁú ¼ö ÀÖ´Ù´Â °ÍÀ» ³ªÅ¸³½´Ù.
Àû¾îµµ ÇϳªÀÇ Disallow Çʵ尡 ÇÑ ·¹Äڵ忡 Á¸ÀçÇØ¾ß ÇÑ´Ù.
ºó "/robots.txt"´Â ¸í½ÃÀûÀÎ Àǹ̸¦ °¡Áö°í ÀÖÁö ¾ÊÀ½À» ³ªÅ¸³»°í,
±×°ÍÀÌ Á¸ÀçÇÏÁö ¾Ê´Â °ÍÀ¸·Î¼ °£ÁÖµÉ ¼ö ÀÖ´Ù. Áï, ¸ðµç ·Îº¿µéÀ» ȯ¿µÇÑ´Ù°í
°í·ÁÇÏ¸é µÉ °ÍÀÌ´Ù.
Examples
´ÙÀ½ ¿¹´Â "/robots.txt"ÈÀÏÀÌ ·Îº¿µéÀÌ "/cyberworld/map/" ¶Ç´Â "/tmp/"·Î
½ÃÀÛÇÏ´Â URLÀ» ¹æ¹®ÇÏÁö ¸øÇϵµ·Ï ¸í¼¼ÇÑ´Ù.
# robots.txt for http://www.site.com/
User-agent: *
Disallow: /cyberworld/map/ # This is an infinite virtual URL space
Disallow: /tmp/ # these will soon disappear
¾Æ·¡ÀÇ ¿¹´Â "/robots.txt"ÈÀÏÀÌ "cybermapper"¸¦ Á¦¿ÜÇÑ ¸ðµç ·Îº¿µéÀÌ
"/cyberworld/map/"·Î ½ÃÀÛÇÏ´Â URLÀ» ¹æ¹®ÇÏÁö ¸øÇϵµ·Ï ¸í¼¼ÇÑ´Ù.
# robots.txt for http://www.site.com/
User-agent: *
Disallow: /cyberworld/map/ # This is an infinite virtual URL space
# Cybermapper knows where to go.
User-agent: cybermapper
Disallow:
¾Æ·¡ÀÇ ¿¹´Â ¸ðµç ·Îº¿µéÀÌ ÀÌ »çÀÌÆ®¸¦ ¹æ¹®ÇÏÁö ¸øÇϵµ·Ï ÇÑ´Ù.
# go away
User-agent: *
Disallow: /
3. ·Îº¿ ¿¡ÀÌÀüÆ®¿Í ¼Ä¡ ¿£Áø
3.1 ·Îº¿ ¿¡ÀÌÀüÆ®ÀÇ »ç¿ë
·Îº¿µéÀº ´ÙÀ½°ú °°Àº ¸¹Àº À¯¿ëÇÑ ÀϵéÀ» ¼öÇàÇϴµ¥ »ç¿ëÇÒ ¼ö ÀÖ´Ù.
- Åë°è ºÐ¼®
-
·Îº¿ÀÇ ¸ñÀûÁßÀÇ Çϳª´Â À¥ ¼¹ö¸¦ ¹ß°ßÇϰųª ¼¹öÀÇ ¼ö¸¦ ¼¼´Âµ¥ »ç¿ëµÉ
¼ö ÀÖ´Ù. ¼¹ö´ç ¹®¼ÀÇ Æò±Õ¼ö¸¦ Æ÷ÇÔÇØ¼ ¾î¶² ÈÀÏ Å¸ÀÔÀÇ ºÐÆ÷,
À¥ ÆäÀÌÁöµéÀÇ Æò±Õ »çÀÌÁî, »óÈ£ ¿¬°á¼ºÀÇ ±íÀÌ µî Åë°è¸¦ ³»´Âµ¥ »ç¿ëµÉ
¼ö ÀÖ´Ù.
- À¯Áöº¸¼ö(Maintenance)
-
ÇÏÀÌÆÛÅØ½ºÆ® ±¸Á¶¸¦ À¯ÁöÇϴµ¥ ÁÖµÈ ¾î·Á¿òÁßÀÇ Çϳª°¡ ´Ù¸¥ ÆäÀÌÁö¿¡
´ëÇÑ ·¹ÆÛ·±½º°¡ "Á×Àº ¸µÅ©(dead links)"°¡ µÇ´Â °ÍÀÌ´Ù. ÀÌ·¯ÇÑ °æ¿ì´Â
·¹ÆÛ·±½º µÇ¾îÁö°í ÀÖ´Â ÆäÀÌÁö°¡ ¿Å°ÜÁ³°Å³ª ¾ø¾îÁ³À» ¶§ ¹ß»ýÇÑ´Ù.
ÇöÀç ÀÌ·± º¯È¿¡ ´ëÇØ ÀÚ½ÅÀ» ÂüÁ¶Çϰí ÀÖ´Â ÆäÀÌÁöµéÀÇ °ü¸®ÀÚ¿¡°Ô ¹Ì¸®
¾Ë·ÁÁÖ´Â ÀϹÝÀûÀÎ ¸ÞÄ«´ÏÁòÀº ¾ø´Ù.
MOMSpider¿Í °°ÀÌ ·¹ÆÛ·±½º¸¦ ÀÔÁõ(verify)ÇÏ´Â ·Îº¿Àº À̵é Á×Àº ¸µÅ©(dead
links)¸¦ ã´Âµ¥ µµ¿ï ¼ö ÀÖ°í, ÇÏÀÌÆÛÅØ½º ±¸Á¶ÀÇ À¯Áöº¸¼ö¿¡ µµ¿òÀ» ÁÙ
¼ö°¡ ÀÖ´Ù. ·Îº¿µéÀº ±¸Á¶»Ó¸¸ ¾Æ´Ï¶ó ³»¿ëÀ» À¯ÁöÇϴµ¥ µµ¿òÀ» ÁÙ ¼ö
ÀÖÁö¸¸ ÀϹÝÀûÀÎ °ÍÀº ¾Æ´Ï´Ù.
- ¹Ì·¯¸µ(Mirroring)
-
¹Ì·¯¸µÀº FTP ¾ÆÄ«À̺ê(archives)¸¦ À¯ÁöÇÏ´Â ÀϹÝÀûÀÎ Å×Å©´ÐÀÌ´Ù. ¹Ì·¯´Â
FTP¿¡ ÀÇÇØ¼ ¼øÈ¯ÀûÀ¸·Î µð·ºÅ丮 Æ®¸®¸¦ ¿ÏÀüÈ÷ Ä«ÇÇÇϰí,
º¯ÈµÈ ¹®¼µéÀ» °Ë»öÇÑ´Ù. À̰ÍÀº È£½ºÆ® ÆÄ¼Õ(host failure)¿¡ ´ëºñÇϱâ
À§Çؼ °øÀ¯¿Í Áߺ¹¿¡ ´ëÇÑ ·Îµå(load)¸¦ Çã¶ôÇÏ´Â °ÍÀÌ°í º¸´Ù ºü¸£°í
°ª½Ñ Á¢±Ù, ¿ÀÇÁ-¶óÀÎ(off-line) Á¢±ÙÀ» Çã¶ôÇÑ´Ù.
À¥¿¡¼ÀÇ ¹Ì·¯¸µÀº ·Îº¿À¸·Î ±¸ÇöµÉ ¼ö ÀÖ´Ù. ·Îº¿µéÀº À¥ ÆäÀÌÁöµéÀÇ ¼ºê
Æ®¸®¸¦ °Ë»öÇÒ ¼ö ÀÖ°í ·ÎÄÿ¡ ÀúÀåÇÒ ¼ö ÀÖÁö¸¸ ´Ü¼øÈ÷ º¯ÈµÈ ÆäÀÌÁöµéÀ»
¼öÁ¤(update)ÇÏ´Â ¿ëµµ°¡ ¾Æ´Ï´Ù. À¥¿¡¼ÀÇ Ä«ÇÇµÈ ÆäÀÌÁöµéÀº ·¹ÆÛ·±½º°¡
´Ù½Ã ¾²¿©Á®¾ß ÇÒ Çʿ䰡 ÀÖÀ» ¼ö ÀÖ°í, ¶Ç »ó´ëÀûÀ¸·Î ¾²¿©Áø ·¹ÆÛ·±½ºÀÇ
°æ¿ì Àý´ë ¸µÅ©·Î º¯È¯µÇ¾îÁ®¾ß ÇÑ´Ù. ¼º´É»óÀÇ ÀÌÀ¯·Î ¹Ì·¯¸µ µµ±¸(tool)¿¡
´ëÇÑ ¿ä±¸´Â ¸¹ÀÌ °¨¼ÒµÇ°í ÀÖ´Ù.
- ¸®¼Ò½º ¹ß°ß
-
¾Æ¸¶µµ ·Îº¿µéÀÇ °¡Àå Èï¹ÌÀÖ´Â ¾ÖÇø®ÄÉÀ̼ÇÀº ¸®¼Ò½º ¹ß°ßÀÇ »ç¿ë¿¡ ÀÖ´Ù.
»ç¶÷ÀÌ Ã³¸®ÇÒ ¼ö ¾ø´Â ¸·´ëÇÑ ¾çÀÇ Á¤º¸¿¡ ´ëÇØ ÄÄÇ»ÅͰ¡ Çϵµ·Ï ÇÏ´Â
°ÍÀº Èï¹ÌÀÖ´Â °ÍÀÌ°í ½ÇÁ¦·Î ¸î¸î ·Îº¿µéÀº À¥ÀÇ ¸¹Àº ºÎºÐÀ» ¿ä¾àÇϰí
ÀÖ°í ¼Ä¡ ¿£ÁøÀ» ÅëÇØ¼ ÀÌµé °á°ú¸¦ °¡Áö°í ÀÖ´Â µ¥ÀÌŸº£À̽º¿¡
Á¢±ÙÀ» Á¦°øÇÑ´Ù.
À̰ÍÀº ´Ü¼øÈ÷ ºê¶ó¿ì¡¿¡ ÀÇÁ¸Çϱ⠺¸´Ù´Â À¥ À¯Àú°¡ Á¤º¸¸¦ ã´Âµ¥
ºê¶ó¿ì¡°ú ¼ÄªÀ» ÇÔ²²ÇÒ ¼ö ÀÖ´Ù´Â °ÍÀ» ÀǹÌÇÑ´Ù. ½ÉÁö¾î µ¥ÀÌŸº£À̽º°¡
À¯Àú°¡ °Ë»öÇϱ⠿øÇÏ´Â Á¤È®ÇÑ ¾ÆÀÌÅÛÀ» Æ÷ÇÔÇϰí ÀÖÁö ¾Ê´Ù ÇÏ´õ¶óµµ
°ü·ÃÀÖ´Â ÆäÀÌÁöµé¿¡ ´ëÇÑ ·¹ÆÛ·±½º¸¦ Æ÷ÇÔÇϰí ÀÖÀ» °ÍÀ̰í À¯Àú´Â
Â÷·Ê´ë·Î ±× ¾ÆÀÌÅÛµéÀ» ÂüÁ¶ÇÒ ¼ö ÀÖ´Ù.
À̰ÍÀÇ ÀåÁ¡ÁßÀÇ Çϳª´Â ÁÖ±âÀûÀ¸·Î ÀÚµ¿ÀûÀ¸·Î µ¥ÀÌŸº£À̽º°¡ °»½ÅµÇ°í,
µ¥ÀÌŸº£À̽º¿¡¼ Á×Àº ¸µÅ©(dead links)´Â ¹ß°ßµÇ¾îÁö°í Á¦°ÅµÉ °ÍÀÌ´Ù.
- º¹ÇÕÀûÀÎ »ç¿ë
-
ÇÑ ·Îº¿Àº À§ÀÇ ÀÏÁß¿¡¼ Çϳª ÀÌ»óÀÇ ÀÏÀ» ¼öÇàÇÒ ¼ö ÀÖ´Ù. ¿¹¸¦ µé¸é
RBSE Spider´Â ¸®¼Ò½º ¹ß°ß µ¥ÀÌŸº£À̽º(resource discovery database)¸¦
Á¦°øÇÒ »Ó¸¸ ¾Æ´Ï¶ó °Ë»öµÈ ¹®¼µéÀÇ Åë°èºÐ¼®À» ÇÑ´Ù. ÀÌ·¯ÇÑ º¹ÇÕÀûÀÎ
»ç¿ëÀº ºÒÇེ·´°Ôµµ ¾ÆÁ÷ µå¹® »óÅÂÀÌ´Ù.
3.2 ·Îº¿ÀÇ ¼øÈ¸¹æ¹ý
- ³ÐÀÌ-¿ì¼± ¼øÈ¸(breadth-first traversal)
-
»óÀ§ ·¹º§¿¡¼ºÎÅÍ Á¦ÇÑµÈ ±íÀ̱îÁö º¸´Ù ³ÐÀº ±×¸®°í »óÀ§ ·¹º§ÀÇ ¹®¼¿Í
¼ºñ½ºÀÇ ÁýÇÕÀ» ã´Âµ¥ ÁÁ´Ù. Áï, ÇÑ ´ÙÅ¥¸ÕÆ®¿¡ ¿©·¯ ·¹ÆÛ·±½º°¡ ÀÖÀ»
°æ¿ì °³°³ ·¹ÆÛ·±½ºµé¿¡ ´ëÇØ¼ ¸ÕÀú °Ë»öÀ» ÇÏ°í ±× ´ÙÀ½ ÇÑ´Ü°è ±íÀÌ
µé¾î°¡ °Ë»öÇÏ´Â ¹æ¹ýÀ¸·Î¼ ¸®¼Ò½º ¹ß°ßÀ» À§Çؼ ÈξÀ ´õ ÁÁÀº
¹æ¹ýÀÌ´Ù.
- ±íÀÌ-¿ì¼± ¼øÈ¸(depth-first traversal)
-
¼øÈ¸·Î¼ »õ·Î¿î »çÀÌÆ®¸¦ ã´Âµ¥ º¸´Ù ÁÁ´Ù. ÀÌ ¹æ¹ýÀº ÇÑ ´ÙÅ¥¸ÕÆ®¿¡
¿©·¯ ·¹ÆÛ·±½º°¡ ÀÖÀ» °æ¿ì ÇÑ ·¹ÆÛ·±½º¿¡ ´ëÇØ¼ °è¼Ó µû¶ó°¡¸é¼ °Ë»öÇÏ´Â
¹æ¹ýÀÌ´Ù.
3.3 ¼Ä¡ ¿£Áø¿¡¼ÀÇ ·Îº¿ÀÇ ÀÌ¿ë
¼Ä¡ ¿£Áø¿¡¼ ÀڷḦ ¼öÁýÇϰí À妽ÌÇϴµ¥ ·Îº¿ ¿¡ÀÌÀüÆ®¸¦ ÀÌ¿ëÇÒ ¼ö ÀÖ´Ù.
À̰ÍÀº ·Îº¿ÀÇ ÀÌ¿ë ¹æ¹ýÁß ¸®¼Ò½º ¹ß°ß Ãø¸éÀε¥, ¼Ä¡ ¿£ÁøÀÌ ·Îº¿À»
µ¿ÀÛ½ÃÄѼ °Ë»öµÈ Á¤º¸µéÀ» µ¥ÀÌŸº£À̽º¿¡ ÀúÀåÇϰí À妽ÌÇØ¼ »ç¿ëÀÚµéÀÌ
ÁúÀǸ¦ ÅëÇØ µ¥ÀÌŸº£À̽º·ÎºÎÅÍ Á¤º¸¸¦ °Ë»öÇÒ ¼ö ÀÖ°Ô ÇÑ´Ù.
¼Ä¡ ¿¡ÁøÀº ·Îº¿À» ÁÖ±âÀûÀ¸·Î µ¿ÀÛ½ÃÄѼ º¯ÈµÈ Á¤º¸¸¦ °»½ÅÇÏ°í »õ·Î¿î
Á¤º¸¸¦ µ¥ÀÌŸº£À̽º¿¡ ÀúÀåÇÑ´Ù.
3.3.1 ¹®¼ ¿ä¾à
ÀÓÀÇÀÇ À¥ ¹®¼¸¦ À妽ºÇϱâ´Â ¸Å¿ì ¾î·Æ´Ù. ÃʱâÀÇ ·Îº¿µéÀº ¹®¼ ŸÀÌÆ²°ú
¾ÞÄ¿(anchor) ÅØ½ºÆ®¸¦ °£´ÜÈ÷ ÀúÀåÇß´Ù. ÇÏÁö¸¸ »õ·Î¿î ·Îº¿µéÀº º¸´Ù Áøº¸µÈ
¸ÞÄ«´ÏÁòÀ» »ç¿ëÇÏ°í ³»¿ë Àüü¸¦ °í·ÁÇÑ´Ù.
ÀÌµé ¹æ¹ýµéÀº ÀϹÝÀûÀ¸·Î ÁÁÀº ¼ö´ÜÀ̰í, ¸ðµç À¥ ÆäÀÌÁöµé¿¡ ÀÚµ¿ÀûÀ¸·Î Àû¿ëµÇ¾îÁú
¼ö ÀÖ´Ù. ±×·¸Áö¸¸ ¼ÕÀ¸·Î À妽ÌÇÑ °Í ¸¸Å È¿À²ÀûÀÏ ¼ö ¾ø´Ù. HTMLÀº <META>
¸¦ ¸í¼¼ÇÔ¿¡ ÀÇÇØ ¹®¼¿¡ ÀϹÝÀûÀÎ ¸ÞŸ Á¤º¸¸¦ µ¡ºÙÀÏ ¼ö ÀÖ´Â ±â´ÉÀ» Á¦°øÇÑ´Ù.
¿¹¸¦ µé¸é, "<meta name="Keywords" value="Ford Car Maintenance">¿Í °°´Ù.
±×·¯³ª, ÀÌ Å±×(tag)ÀÇ ¾ÖÆ®¸®ºäÆ®ÀÇ ¸í¼¼µÈ °ª¿¡ ´ëÇØ Àǹ̰¡ Á¤ÀǵǾî ÀÖÁö
¾Ê±â ¶§¹®¿¡ ±×°ÍÀ» ¹Þ¾ÆµéÀÏ °ÍÀÎÁö¿Í ±×°ÍÀÇ »ç¿ë¿©ºÎ¿¡ ´ëÇØ¼´Â ¾öÁßÈ÷ Á¦ÇѵȴÙ.
À̰ÍÀº ÁúÀÇ¿Í °ü·ÃÇØ¼ °Ë»öµÈ ¹®¼µéÀ» º»´Ù¸é ³·Àº "Á¤È®µµ"¸¦ ³ªÅ¸³½´Ù. ºÒ¸®¾È
¿¬»êÀÚ(Boolean Operators), WAIS¿Í °°Àº °¡ÁßÈµÈ ¸ÅÄ¡(Weighted match) ¶Ç´Â
relevance feedback°ú °°Àº Áøº¸µÈ ¹æ¹ýÀº ³·Àº Á¤È®µµ¸¦ °³¼±ÇÒ ¼ö ÀÖÁö¸¸ ÀÎÅͳÝ
»óÀÇ Á¤º¸°¡ ¸·´ëÇÏ°Ô ´Ù¾çÇØÁö¹Ç·Î ÀÌ ¹®Á¦´Â °è¼ÓµÉ °ÍÀÌ´Ù.
4. À¥ ¸ÞŸ ¼Ä¡ ¿£ÁøÀÇ ¼³°è ¹× ±¸Çö
Àü ¼¼°èÀûÀ¸·Î »êÀçÇÑ ¼Ä¡ ¿£ÁøµéÀº ±× ¼ö°¡ ¸¹¾ÆÁü¿¡ µû¶ó ÀϰüµÇÁö ¸øÇÑ Á¤º¸¸¦
Á¦°øÇϰí Àְųª ¾î´À ƯÁ¤ÇÑ °÷¿¡ ÁýÁßµÈ Àüº¸¸¦ Á¦°øÇÏ´Â °æ¿ìµµ ÀÖ¾î »ç¿ëÀÚ°¡
¿øÇÏ´Â Á¤º¸¸¦ ¾ò±â À§Çؼ´Â ¸¹Àº ¼Ä¡ ¿£ÁøµéÀ» ÀÏÀÏÀÌ Á¶»çÇØ¾ß ÇÏ°í °¢°¢ÀÇ
¼Ä¡ ¿£ÁøµéÀÇ Æ¯¼ºÀ» ¾Ë¾Æ¾ß ÇÏ´Â ºÒÆíÇÔ Á¡ÀÌ ÀÖ´Ù.
µû¶ó¼ º» °í¿¡¼´Â »ç¿ëÀÚ°¡ ¸¹Àº ¼Ä¡ ¿£ÁøµéÀ» ÀÏÀÏÈ÷ °Ë»öÇÒ ÇÊ¿ä¾øÀÌ ¼Ä¡
¿£ÁøµéÀ» ÅëÇÕÇÏ¿© º¸´Ù ½±°Ô »ç¿ëÇÒ ¼ö ÀÖµµ·Ï »ç¿ëÀÚ¿¡°Ô ÀϰüµÈ ÀÎÅÍÆäÀ̽º ¹×
ÁúÀǸ¦ Á¦°øÇϰí ÁúÀÇ¿¡ ´ëÇÏ¿© °¡´ÉÇÑ ¸¹Àº °Ë»ö °á°ú¸¦ ÅëÀÏµÈ ÇüÅ·ΠÁ¦°øÇÒ ¼ö
ÀÖ´Â À¥ ¸ÞŸ ¼Ä¡ ¿£ÁøÀÇ ¼³°è¿Í ±¸Çö¿¡ ´ëÇØ¼ ¾Ë¾Æº¸±â·Î ÇÑ´Ù.
4.1 À¥ ¸ÞŸ ¼Ä¡ ¿£ÁøÀÇ ¼³°è½Ã °í·Á »çÇ×
4.1.1 ÁúÀÇÀÇ ÇüÅÂ
À¥ ¸ÞŸ ¼Ä¡ ¿£ÁøÀº ¾î´À ƯÁ¤ ¿£Áø°ú´Â µ¶¸³ÀûÀÎ »õ·Î¿î ÁúÀÇ ÇüŸ¦ Á¤ÀÇÇÏ¿´´Âµ¥,
±× ÀÌÀ¯´Â »ç¿ëÀÚ°¡ º¸´Ù Æí¸®Çϰí, Àϰü¼ºÀÖ´Â ÁúÀǸ¦ »ç¿ëÇÒ ¼ö ÀÖµµ·Ï Çϰí, º»
½Ã½ºÅÛÀÌ ´ë»óÀ¸·Î Çϰí ÀÖ´Â °¢±â ´Ù¸¥ ÁúÀÇ ÇüŸ¦ °¡Áø ¼Ä¡ ¿£Áøµé°ú µ¶¸³ÀûÀÎ
Åõ¸í¼º(transparancy)À» Á¦°øÇϱâ À§ÇؼÀÌ´Ù.
º» ½Ã½ºÅÛÀÇ ÁúÀÇ¿¡¼´Â ºÒ¸®¾È ¿¬»êÀÚ(boolean operator)¸¦ Áö¿øÇϴµ¥, ´©±¸µçÁö
½±°Ô »ç¿ëÇÒ ¼ö ÀÖ°í, »ç¿ëÀÚÀÇ Àǵµ¸¦ Á¤È®ÇÏ°Ô ³ªÅ¸³¾ ¼ö ÀÖ°í, º» ½Ã½ºÅÛ¿¡¼
Á¤º¸ ¼öÁýÀÇ ´ë»óÀ¸·Î ÇÏ´Â ¼Ä¡ ¿£Áøµé¿¡ Àû¿ëÇϱ⠽±±â ¶§¹®ÀÌ´Ù. º» ½Ã½ºÅÛ¿¡¼ÀÇ
ÁúÀÇÀÇ ¿¹´Â "Multimedia and Hypermedia or Database"ÀÏ ¼ö ÀÖ´Ù.
4.1.2 ÁúÀÇ Ã³¸® ¹æ¾È
º» ½Ã½ºÅÛ¿¡¼´Â Á¤º¸ÀÇ ¼öÁýÀ» ´Ù¸¥ ¼Ä¡ ¿£Áøµé¿¡ ÀÇÁ¸Çϱ⠶§¹®¿¡ ½Ã½ºÅÛ¿¡¼
ÀԷ¹ÞÀº ÁúÀÇ¿¡ ´ëÇØ ´Ù¸¥ ¿£Áøµé¿¡ ÀûÇÕÇÑ ÇüÅ·Π¹Ù²Ù¾î ÁÖ¾î¾ß ÇÒ Çʿ䰡 »ý±ä´Ù.
ÁúÀÇÀÇ Ã³¸® °úÁ¤Àº ¸ÕÀú ÁúÀǸ¦ ÀÔ·Â ¹Þ°í ÁúÀÇÀÇ Á¤´ç¼º °Ë»ç¸¦ Æ÷ÇÔÇÑ ºÐ¼®ÀÌ
ÀÌ·ç¾îÁö°í °¢ ¼Ä¡ ¿£Áøº°·Î ¾²·¡µå¸¦ »ý¼ºÇÑ´Ù. ¾²·¡µå¿¡¼ °¢ ¼Ä¡ ¿£ÁøÀÇ Æ¯¼º¿¡
¸Â´Â ÁúÀǸ¦ ¸¸µé¾î ³»°í ´ë»ó ¼Ä¡ ¿£Áø¿¡ ÁúÀǸ¦ ¼öÇàÇÏ°í °Ë»ö °á°ú¸¦ ÅëÇÕÇØ
»ç¿ëÀÚ¿¡°Ô º¸¿©ÁØ´Ù.
ÁúÀÇÀÇ ÇüÅ´ µÎ°¡Áö°¡ ÀÖÀ» ¼ö ÀÖ´Ù.
- ´ÜÀÏ ÅÒÀ¸·Î ÁúÀǸ¦ ÇÏ´Â ¹æ¹ý
- ¿¬»êÀÚ±îÁö Æ÷ÇÔÇØ ÁúÀǸ¦ ÇÏ´Â ¹æ¹ý
´ÜÀÏ ÅÒÀ» ´ë»ó ¼Ä¡ ¿£Áø¿¡ ÁúÀÇÀÇ ÇüÅ·Πº¸³»´Â ¹æ¹ýÀº ´ë»ó ¼Ä¡ ¿£Áø¿¡¼
¹®¼µé¿¡ ¿ì¼± ¼øÀ§¸¦ Àû¿ëÇÏ´Â ·©Å·(ranking)±â¹ýÀ» Ȱ¿ëÇÒ ¼ö ¾ø´Ù´Â ´ÜÁ¡ÀÌ ÀÖ±â
¶§¹®¿¡ »ç¿ëÀÚ¿¡°Ô º¸´Ù Á¤È®ÇÑ °á°ú¸¦ º¸¿©ÁÖ±â À§Çؼ º» ½Ã½ºÅÛ¿¡¼´Â ¼Ä¡ ¿£ÁøÀÇ
Ư¼ºÀ̶ó ÇÒ ¼ö ÀÖ´Â ·©Å· ±â¹ýÀ» ÃæºÐÈ÷ Ȱ¿ëÇÏ´Â ÁúÀǹ®À» °ÅÀÇ ¼öÁ¤¾øÀÌ ´ë»ó ¼Ä¡
¿£Áø¿¡ ÁúÀÇÇÏ´Â ¹æ¹ýÀ» »ç¿ëÇÑ´Ù.
4.1.3 ¼º´É Çâ»óÀ» À§ÇÑ °í·Á »çÇ×
º» ½Ã½ºÅÛ¿¡¼´Â ¿©·¯ ´ë»ó ¼Ä¡ ¿£Áø¿¡ ÁúÀǸ¦ ÇØ¼ ¾ò¾îÁø °á°ú¸¦ ÇÕº´ÇÏ´Â ¹æ¹ýÀ»
»ç¿ëÇϴµ¥, ¿©·¯ ´ë»ó ¼Ä¡ ¿£ÁøµéÀÌ ÀÖÀ» ¶§ ¿£Áøµé °¢°¢¿¡ ÁúÀǸ¦ ÇÒ ¼ö ÀÖ´Â
¹æ¹ýÀº µÎ°¡Áö°¡ ÀÖÀ» ¼ö ÀÖ´Ù.
- °°Àº ÁúÀǸ¦ °¢ ¿£Áø¿¡ ´ëÇØ¼ Çϳª¾¿ Çϳª¾¿ ÇÏ´Â ÇüÅÂ
- °¢ ´ë»ó ¼Ä¡ ¿£Áøµé¿¡ µ¿½Ã¿¡ ÁúÀǸ¦ ÇÏ´Â ¹æ¹ý
ÇϳªÀÇ ´ë»ó ¼Ä¡ ¿£Áø¿¡ ÁúÀÇÇÏ´Â ½Ã°£¿¡ ¿©·¯ °³ÀÇ ¼Ä¡ ¿£Áø¿¡ ÁúÀǸ¦ ÇØº¼ ¼ö
ÀÖ´Â ¼º´É»óÀÇ ÀåÁ¡¶§¹®¿¡ º» ½Ã½ºÅÛ¿¡¼´Â µÎ¹øÂ°ÀÇ ¹æ¹ýÀ» »ç¿ëÇÑ´Ù.
À̿Ͱ°ÀÌ ½Ã½ºÅÛÀÇ È¿À²À» ³ôÀ̱â À§Çؼ ¿©·¯ ´ë»ó ¿£Áøµé¿¡ µ¿½Ã¿¡ ÁúÀÇÇÏ´Â ¹æ¹ýÀ»
»ç¿ëÇϴµ¥ À־µ ¿©·¯°¡Áö ±¸Çö ¹æ¹ýÀÌ ÀÖÀ» ¼ö ÀÖÁö¸¸ º» ½Ã½ºÅÛ¿¡¼´Â
¸ÖƼ¾²·¡µå(multi-thread)¸¦ »ç¿ëÇÑ´Ù. ±âÁ¸¿¡ ¸ÖƼ¾²·¡µå ¶óÀ̺귯¸®°¡ À̹Ì
Á¸ÀçÇØ¼ ±¸ÇöÀÌ ¿ëÀÌÇϰí, Linght-Weight Process¸¦ »ç¿ëÇÔÀ¸·Î½á ¸Þ¸ð¸® °ü¸® Ãø¸é
µî ½Ã½ºÅÛÀ» È¿À²ÀûÀ¸·Î »ç¿ëÇÒ ¼ö Àֱ⠶§¹®ÀÌ´Ù.
4.2 À¥ ¸ÞŸ ¼Ä¡ ¿£ÁøÀÇ ¼³°è
4.2.1 Àüü ½Ã½ºÅÛÀÇ ¼³°è

[±×¸² 1 À¥ ¸ÞŸ ¼Ä¡ ¿£ÁøÀÇ Àüü ºí·°µµ]
±×¸² 1Àº À¥ ¸ÞŸ ¼Ä¡ ¿£ÁøÀÇ Àüü ºí·°µµÀÌ´Ù. º» ½Ã½ºÅÛÀº »ç¿ëÀÚ°¡ Á÷Á¢ ÁúÀǹ®À»
¼±ÅÃÇÔÀ¸·Î½á ÁúÀǸ¦ ÇÏ´Â ÇüÅÂ¿Í ÁÖÁ¦¾î(subject)¸¦ ¼±ÅÃÇÔÀ¸·Î½á ÁúÀǸ¦ ÇÏ´Â
ÇüÅ·ΠµÎ°¡Áö·Î ÁúÀǸ¦ ÇÒ ¼ö°¡ ÀÖ´Ù. °á°ú¸¦ »ç¿ëÀÚ¿¡°Ô º¸¿©ÁÙ ¶§´Â ÁÖÁ¦¾î¸¦
¼±ÅÃÇßÀ» °æ¿ì ÀÚü µ¥ÀÌŸº£À̽º¿¡ ÀúÀåµÈ Á¤º¸¸¦ ÀÌ¿ëÇÏ°í »ç¿ëÀÚ ÁúÀÇÀÇ °æ¿ì´Â
¿©·¯ ¼Ä¡ ¿£Áøµé·ÎºÎÅÍ ±×¶§ ±×¶§ Á¤º¸¸¦ ¼öÁýÇÑ´Ù.

[±×¸² 2 Meta-Search EngineÀÇ ºí·°µµ]
À¥ ¸ÞŸ ¼Ä¡ ¿£ÁøÀº ÀüüÀûÀ¸·Î µÎ ºÎºÐÀ¸·Î ³ª´µ¾îÁø´Ù. ù°´Â, »ç¿ëÀÚÀÇ ÁúÀǸ¦
ÀÔ·Â¹Þ¾Æ Ã³¸®ÇÏ´Â ¸ÞŸ¼Ä¡¿£Áø(Meta-Search Engine)ºÎºÐ(±×¸² 2)À̰í, ´ÙÀ½Àº
ÁÖÁ¦¿¡ ´ëÇØ¼ °ü¸®¸¦ ¼öÇàÇÏ´Â ÁÖÁ¦ °ü¸®ÀÚ(Subject Manager)ºÎºÐ(±×¸² 3)ÀÌ´Ù.
º» ½Ã½ºÅÛÀÇ ÀüüÀûÀÎ Àû¾÷ 󸮴 ÁúÀÇÀÇ ÀÔ·Â, ÁúÀÇÀÇ Ã³¸®(Á¤´ç¼º °Ë»ç, ÁúÀǺм±), ´ë»ó ¼Ä¡ ¿£Áø¿¡ÀÇ ÁúÀÇ, Á¡¼öÀÇ Á¤±ÔÈ(normalization), ÇÕº´°ú Àç·©Å·°ú °°Àº
ÀÏ·ÃÀÇ ¼ø¼¸¦ ÅëÇØ¼ ÀÌ·ç¾îÁö°í, °¢ ó¸® ´Ü°è¸¶´Ù ÀÛ¾÷À» ó¸®ÇÒ ¼ö ÀÖ´Â ±¸¼º
¿ä¼Ò(Component)¸¦ °®´Â´Ù.

[±×¸² 3 SDI Manager¿Í Subject ManagerÀÇ ºí·°µµ]
4.2.2 °¢ ¸ðµâº° ¼³°è
- ¸ÞŸ ¼Ä¡ ¿£Áø(Meta-Search Engine)
-
¸ÞŸ ¼Ä¡ ¿£ÁøÀº º» ½Ã½ºÅÛ¿¡¼ ÇÙ½ÉÀÌ µÇ´Â ºÎºÐÀ¸·Î¼ »ç¿ëÀÚ ÁúÀÇÀÇ Ã³¸®
¹× µ¥ÀÌŸº£À̽º¿¡ ÀúÀåµÇ´Â Á¤º¸ÀÇ ¼öÁýÀ» ´ã´çÇÑ´Ù.
ÁúÀÇ ºÐ¼®±â(Query Analyzer)´Â ÁúÀÇ ÀÔ·Â, ÁúÀÇÀÇ Á¤´ç¼º °Ë»ç, ÁúÀÇÀÇ ºÐ¼®
µî°ú °°Àº ÀÛ¾÷À» ÇÑ´Ù. ±×¸®°í ºÐ¼®µÈ ÁúÀǸ¦ ¾²·¡µå °ü¸®ÀÚ(Thread
Manager)·Î Àü´ÞÇÑ´Ù.
¾²·¡µå °ü¸®ÀÚ´Â °¢ ´ë»ó ¼Ä¡ ¿£Áø¿¡ ´ëÇÑ ÁúÀÇ¿¡ ´ëÇØ 󸮸¦ ÇØÁÖ´Â
ºÎºÐÀ¸·Î ¾²·¡µå »ý¼º, ÁúÀÇÀÇ º¯Çü, °á°úÀÇ ºÐ¼® ¹× °á°úÀÇ »ý¼º, °á°úÀÇ
ÅëÇÕ ¹× Àç·©Å·°ú °°Àº ÀÛ¾÷À» ¼öÇàÇÑ´Ù. ¶Ç ÁúÀǹ® º¯Çü±â(Query
Fomulator), °á°ú »ý¼º±â(Result Generator), °á°ú ÅëÇÕ±â(Result
Integrator) µîÀ» °®´Â´Ù.
- ÁÖÁ¦¾î °ü¸®ÀÚ(Subject Manager)
-
ÁÖÁ¦¾î °ü¸®ÀÚ´Â »ç¿ëÀÚ°¡ ÁÖÁ¦¾î¸¦ ¼±ÅÃÇÔÀ¸·Î½á ÁúÀǸ¦ ÇÒ ¶§ À̸¦
ó¸®ÇÏ¿© ÁÖ´Â ¸ðµâÀÌ´Ù. ±¸¼º ¿ä¼Ò·Î´Â ÁúÀÇ ºÐ¼®±â(Query Analyzer),
ÁúÀÇ ½ÇÇà±â(Query Executor), °á°ú »ý¼º±â(Result Fomatter), DB
º¯°æ±â(DB Renewal Component) µîÀ» °®´Â´Ù.
DB º¯°æ±â´Â Ç×»ó ¸Þ¸ð¸®¿¡ »óÁÖÇØ ÀÖÀ¸¸é¼ µ¥¸ó(Daemon)ÀÇ ¼º°ÝÀ» °¡Áø
Actuator·ÎºÎÅÍ ½ÅÈ£¸¦ ¹ÞÀ¸¸é Search Result Database¸¦ »õ·Î¿î Á¤º¸·Î
º¯°æÀ» ÇÏ°Ô µÈ´Ù. ÀÌ ¶§ ÁÖÁ¦ īŻ·Î±×¸¦ ÂüÁ¶Çؼ ½Ã½ºÅÛ ÁúÀǸ¦ ÇϰÔ
µÇ´Âµ¥, º¯°æÇÒ ÁÖÁ¦¸¦ ¸ÞŸ ¼Ä¡ ¿£Áø¿¡ ÁúÀÇÇÏ°í °á°ú´Â ´Ù½Ã Á¤º¸
º¯°æ±â·Î µé¾î¿Í SDI °ü¸®ÀÚ·Î º¸³»Áö°Ô µÈ´Ù.
- SDI °ü¸®ÀÚ
-
SDI °ü¸®ÀÚ´Â »ç¿ëÀÚ°¡ ÁúÀǸ¦ ÇÏÁö ¾Ê¾Æµµ ÁÖ±âÀûÀ¸·Î ÀÚµ¿ÀûÀ¸·Î »õ·Î¿î
Á¤º¸¸¦ µî·ÏµÈ ÇÁ·ÎÆÄÀÏ¿¡ ´ëÇØ¼ ¸ÞÀÏÀ» ÅëÇØ¼ º¸³»ÁÖ´Â ¿ªÇÒÀ» ÇÏ´Â
°ÍÀ¸·Î¼ ÇÁ·ÎÆÄÀÏ °ü¸®ÀÚ(profile manager), ºñ±³±â(comparator),
ÇÊÅÍ(filter), Å뺸±â(alerter)µîÀÇ ±¸¼º ¿ä¼Ò¸¦ °¡Áö°í ÀÖ´Ù.
4.3 À¥ ¸ÞŸ ¼Ä¡ ¿£ÁøÀÇ ±¸Çö
4.3.1 ÁúÀǹ® 󸮸¦ À§ÇÑ ¿¬»ê
º» ¸ÞŸ ¼Ä¡ ¿£ÁøÀÎ CGI ÇÁ·Î±×·¥¿¡¼´Â ÁúÀǹ®À» ó¸®Çϱâ À§ÇÑ ¿¬»êÀ¸·Î¼ µðÄÚµå,
ºÐ¼®, Á¤´ç¼º °Ë»ç¸¦ ÇÏ´Â ·çƾµéÀ» Á¦°øÇÑ´Ù.
µðÄÚµå ¿¬»êÀº ÀÎÄÚµåµÈ ÁúÀǹ®À» ÀÐ¾î µé¿© ÁúÀǹ®À» µðÄÚµåÇÏ°í µðÄÚµåµÈ ÁúÀǹ®À»
ºÐ¼®Çϱâ À§ÇÑ ºÐ¼®±â¸¦ È£ÃâÇÑ´Ù. ºÐ¼® ¿¬»êÀº ÁúÀǹ®ÀÇ ¹®ÀÚ¿À» ÆÄ½ÌÇÏ°í ¿¬»êÀÚ¿Í
ÅÒÀ» ±¸ºÐÇÏ´Â ÀÛ¾÷À» ÇÑ´Ù. Á¤´ç¼º °Ë»ç ¿¬»êÀº ¹®ÀÚ¿ÀÇ ¼ö, ÅÒ°ú ¿¬»êÀÚÀÇ ¹è¿
µéÀ» ÂüÁ¶ÇØ Á¤´çÇÑ ÁúÀÇÀΰ¡¸¦ ÆÇ´ÜÇÑ´Ù.
4.3.2 ¾²·¡µå °ü¸®ÀÚÀÇ ±¸Çö
¾²·¡µå °ü¸®ÀÚ´Â ´ë»ó ¼Ä¡ ¿£Áø À̸§°ú ½Ã°£À» Á¶ÇÕÇØ µ¿½Ã¿¡ ¿©·¯ »ç¶÷ÀÌ »ç¿ëÇÒ ¶§
¼·Î ´Ù¸¥ ÈÀϸíÀ» °¡Áöµµ·Ï ÈÀϸíÀ» ¸¸µé°í µ¹¾Æ¿Â °á°ú¿¡ ´ëÇØ¼´Â ±×ÈÀÏ¿¡
ÀúÀåÀ» ÇÑ´Ù. ±×¸®°í POSIX thread ¶óÀ̺귯¸®¸¦ »ç¿ëÇØ ¾²·¡µå¸¦ ¸¸µé°í ÁúÀÇ
»ý¼º±â¸¦ ÅëÇØ¼ °¢ ¼Ä¡ ¿£ÁøÀÇ Æ¯¼º¿¡ ¸Â´Â ÁúÀǹ®À» ¸¸µé°í get¶óÀ̺귯¸®,
URL, ÁúÀǹ®, ¿É¼Ç µîÀ» Á¶ÇÕÇÑ ÁúÀÇ ½ºÆ®¸µÀ» ¸¸µé¾î ½Ã½ºÅÛ ÄÝÀ» ÅëÇØ¼ ´ë»ó
¼Ä¡ ¿£Áø¿¡ ÁúÀǸ¦ ÇÑ´Ù.
4.3.3 °á°ú »ý¼º±âÀÇ ±¸Çö
°¢°¢ÀÇ HTMLÇü½ÄÀÇ °á°ú ÈÀÏÀ» ºÐ¼®ÇØ URL, TITLE, WEIGHT µîÀ» ¸®½ºÆ® ÇüÅ·Î
¿À¸§Â÷¼øÀ¸·Î ÀúÀåÇÑ´Ù. ÀÌ·¸°Ô ¾ò¾îÁø °á°úµéÀº ¼Ä¡ ¿£Áø¸¶´Ù ´Ù¸¥ Á¡¼ö¸¦ °¡Áö°í
Àֱ⠶§¹®¿¡ °á°úµéÀ» ÇÕº´Çϱâ À§Çؼ´Â Á¡¼öÀÇ Á¤±ÔȰ¡ ÀÌ·ç¾îÁ®¾ß ÇÑ´Ù.
º» ½Ã½ºÅÛÀº °¢ ¼Ä¡ ¿£Áø¸¶´Ù ´Ù¸¥ Á¡¼ö¸¦ Á¤±ÔȽÃ۱â À§Çؼ Combining Method¸¦
»ç¿ëÇϴµ¥, ÀÌ ¹æ¹ýÀº º» ½Ã½ºÅÛÀÌ ´ë»óÀ¸·Î ÇÏ´Â ¼Ä¡ ¿£ÁøµéÀÇ Á¡¼ö »êÃâ ¹æ¹ýÀ̳ª
·©Å· ¹æ¹ýÀ» ¸ð¸£±â ¶§¹®¿¡ »ç¿ëÇÏ´Â ¹æ¹ýÀ¸·Î¼ ¾Æ·¡ ¼ö½ÄÀ¸·Î ³ªÅ¸³¾ ¼ö ÀÖ´Ù.
MinMax = (OldSim - MinimumSim) / (MaximumSim - MinimumSim)
CombinedSum = SUM(IndividualSims)
À§ ½Ä¿¡¼ MaximumSimÀº °á°ú¿¡¼ °¡Àå ³ôÀº Á¡¼ö, MinimumSimÀº °¡Àå ³·Àº Á¡¼ö,
OldSimÀº Çö Á¡¼ö¸¦ ³ªÅ¸³»´Âµ¥, Çö Á¡¼ö´Â °á°ú¸¦ ÅëÇÕÇϱâÀ§Çؼ MinMax °ªÀ¸·Î
´ëüµÇ¾îÁø´Ù. ±×¸®°í °¢°¢ÀÇ ¼Ä¡ ¿£ÁøÀÇ Á¡¼ö(IndividualSims)¸¦ ´õÇØ¼
CombinedSum°ªÀ» Á¤±ÔÈµÈ Á¡¼ö·Î ¾ò´Â´Ù.
4.3.4 °á°ú ÅëÇÕ±âÀÇ ±¸Çö
º» ½Ã½ºÅÛÀº InfoSeek, Lycos, WebCrawler, AliWeb µî 4°³ÀÇ ¼Ä¡ ¿£Áø¿¡ ÁúÀǸ¦
ÇØ¼ °á°ú¸¦ ¼öÁýÇϴµ¥, °á°ú¸¦ ÅëÇÕÇϱâ À§Çؼ °¢°¢ÀÇ ¼Ä¡ ¿£Áø¿¡¼ ³ª¿Â
°á°úµé¿¡¼ °°Àº URLÀÌ ÀÖÀ¸¸é Á¦°ÅÇϰí Á¡¼ö·Î¼ CombinedSum°ªÀ» °®´Â´Ù.
ÀÌ·¸°Ô ¾ò¾îÁø °á°ú´Â URL·Î Á¤·ÄµÈ °á°úÀ̱⠶§¹®¿¡ ´Ù½Ã Á¡¼ö¼øÀ¸·Î Á¤·ÄÇÏ¿©
»ç¿ëÀÚ¿¡°Ô º¸¿© ÁØ´Ù.
4.3.5 ÁÖÁ¦¾î °ü¸®ÀÚÀÇ ±¸Çö
ÁÖÁ¦¾î °ü¸®ÀÚÀÇ ÁÖµÈ ¿ªÇÒÀº ÁÖÁ¦¾î ÁúÀǸ¦ ó¸®ÇÏ°í µ¥ÀÌŸº£À̽º¸¦ »õ·Î¿î Á¤º¸·Î
°»½Å½Ã۴µ¥, µ¥ÀÌŸ ÀúÀå ¸ÞÄ«´ÏÁòÀ» º¸¸é µ¥ÀÌŸ°¡ µ¥ÀÌŸº£À̽º¸¦ »ç¿ëÇÒ ¸¸Å
¸¹Àº µ¥ÀÌŸ°¡ ¾Æ´Ï°í ¿ÀÈ÷·Á ¿À¹öÇìµå°¡ µÉ ¼ö ÀÖÀ¸¸ç ÀÏ¹Ý ÈÀÏÀÇ »ç¿ëÀÌ ±¸ÇöÇϱâ
½±°Ô ¶§¹®¿¡ µ¥ÀÌŸ¸¦ ÀúÀåÇÏ´Â ¸ÞŸ´ÏÁòÀ¸·Î ÈÀÏÀ» »ç¿ëÇÑ´Ù.
±×¸®°í ¿©·¯ °³ÀÇ ´Ü¾î¸¦ °¡Áø ÁÖÁ¦¾î¿¡ ´ëÇÑ Ã³¸®´Â AND ¿¬»êÀÚ·Î ´Ü¾îµéÀ» ¿¬°áÇÏ´Â
¹æ¹ýÀ» »ç¿ëÇÏ¿´´Ù.
5. °á·Ð
ÇöÀç ÀÎÅÍ³×Æ®´Â Á¤º¸ÀÇ ¾çÀÌ ¹æ´ëÇØÁö¸é¼ »ç¿ëÀÚ°¡ ¿øÇÏ´Â Á¤º¸¸¦ Á¤È®È÷ ¼Õ½±°Ô
ã°íÀÚ ÇÏ´Â ³ë·Âµµ Ä¿Á®¼ À¥À» ÀÌ¿ëÇÑ ¼Ä¡ ¿£Áø°ú ·Îº¿ ¿¡ÀÌÀüÆ®°¡ ³ªÅ¸³ª°Ô
µÇ¾ú°í ¼Ä¡ ¿£ÁøÀ» ÀÌ¿ëÇÏÁö ¾Ê°í ¿øÇÏ´Â Á¤º¸¸¦ ã´Â´Ù´Â °ÍÀº »ç½Ç»ó ¾î·Á¿î ÀÏÀÌ
µÇ¾ú´Ù.
º»°í¿¡¼´Â ÀÎÅÍ³×Æ® »ó¿¡¼ Á¤º¸¸¦ ã´Â µµ±¸ÀÎ ¼Ä¡ ¿£Áø°ú À¥¿¡¼ °¢ ȨÆäÀÌÁöÀÇ
Á¤º¸¸¦ ¼öÁýÇÏ´Â ÇÁ·Î±×·¥ÀÎ ·Îº¿ ¿¡ÀÌÀüÆ®¿¡ ´ëÇØ¼ ¼¹ö °ü¸®ÀÚ¿Í °³¹ßÀÚ Ãø¸é¿¡¼
¾Ë¾Æ º¸¾Ò°í ´Ù¸¥ ¼Ä¡¿£ÁöµéÀÇ Á¤º¸¸¦ ÀÌ¿ëÇÏ´Â ¸ÞŸ¼Ä¡¿£ÁøÀÇ ¼³°è¿Í ±¸Çö¿¡
´ëÇØ¼ ¾Ë¾Æ º¸¾Ò´Ù.
Âü°í¹®Çå(References)
[1] "http://info.webcrawler.com/mak/projects/robots/robots.html", World Wide Web Robots, Wanders, and Spiders
[2] ¹ÚÁ¤ÈÆ, "ÀÎÅÍ³×Æ® Á¤º¸ ÀÚ¿ø µ¥ÀÌŸº£À̽º ±¸Ãà ¹× Á¤º¸ ¹ß°ß ½Ã½ºÅÛ °³¹ß", ÃÖÁ¾¿¬±¸º¸°í¼, ½Ã½ºÅÛ°øÇבּ¸¼Ò, 1995. 7
[3] ¹ÚÁ¤ÈÆ, Á¶Çö¼º, À̰Âù, À̱Ôö, "ÀÎÅÍ³×Æ® Á¤º¸ ¹ß°ß ½Ã½ºÅÛÀÇ °³¹ß ¹× ±¸Çö",
Á¤º¸°úÇÐȸ ³í¹®
[4] Joon Ho Lee, "Combining Multiple Evidence from Different Properties of Weighting Schemes", Cornell University
[5] Çѱ¹ÀüÀÚÅë½Å¿¬±¸¼Ò, ±â¼úÁ¤º¸¼¾ÅÍ, "¸ÖƼ¾²·¡µù ±â¹ý°ú µ¿Çâ(I, II)", ÁÖ°£ ±â¼úµ¿Çâ 93-30,31, 1993