Protein classification and functional assignment

(by Kay Hofmann)

 

ƯÁ¤ÇÑ ±¸Á¶³ª ±â´ÉÀûÀÎ ¿ä¼ÒµéÀ» °¡¸®Å°´Â ¾Æ¹Ì³ë»ê ¼­¿­ ¸ðƼºêµéÀÇ ¿©·¯ °¡Áö Áý´ÜµéÀÌ Á¸ÀçÇÑ´Ù. »õ·Î È®ÀÎµÈ ¼­¿­À» °¡Áö°í ÀÌ·¯ÇÑ Áý´Üµé¿¡ ´ëÇÑ Web-based °Ë»öÀ» ½Ç½ÃÇϸé Ÿ´ç¼ºÀÖ´Â ±â´ÉÀû ¿¹ÃøÀ» ÇÒ ¼ö ÀÖ´Ù.

 

        ´Ù¾çÇÑ °Ô³ð°ú cDNA ¼­¿­ºÐ¼® »ç¾÷µéÀÌ ³î¶ó¿î ¼Óµµ·Î »õ·Î¿î ¼­¿­ÀÚ·áµéÀ» ¹æÃâÇϰí ÀÖ¾î À̵鿡 ´ëÇÑ ´ë±Ô¸ðÀÇ ±â´ÉÀû ºÐ·ù°¡ ÇÊ¿äÇØÁö°í ÀÖ´Ù. ÀÛÀº ±Ô¸ð·Î¼­´Â º¸ÅëÀÇ ºÐÀÚ»ý¹°ÇÐÀڵ鵵 ±â´É¿¡ °üÇÑ Á¤º¸°¡ ¾ø´Â »õ·Î¿î ¼­¿­µé°ú ´ë¸éÇϰí ÀÖ´Ù. »õ·Î È®ÀÎµÈ À¯ÀüÀÚ°¡ Àü»çÁ¶ÀýÀÎÀÚ, ¼¼Æ÷°ñ°Ý ´Ü¹éÁú, ¶Ç´Â ´ë»ç°úÁ¤ÀÇ È¿¼Ò¿¡ ´ëÇÑ Á¤º¸¸¦ ´ã°íÀÖ´ÂÁö¿¡ °üÇÑ ¾î¶² ÈùÆ®¶óµµ ½ÇÇèÀûÀÎ °á°ú¸¦ ÇØ¼®Çϴµ¥ µµ¿òÀ» ÁÙ °ÍÀÌ¸ç °è¼ÓµÇ´Â ¿¬±¸¿¡ ¹æÇâÀ» Á¦½ÃÇÒ ¼ö ÀÖÀ» °ÍÀÌ´Ù.

 

Protein versus domain classification

        ÀÌ Áú¹®¿¡ ´äÇϴµ¥ ù ¹øÂ° ´Ü°è´Â BLAST³ª À¯»çÇÑ ÇÁ·Î±×·¥À» »ç¿ëÇÑ µ¥ÀÌÅͺ£À̽º °Ë»öÀÌ´Ù. ÀߵǸé BLAST °á°ú´Â query ´Ü¹éÁúÀÇ Àüü ±æÀÌ¿¡ °ÉÃÄ Àß ¿¬±¸µÈ ´Ü¹éÁú°ú À¯»ç¼ºÀ» º¸¿©ÁÙ °ÍÀÌ´Ù. ÃÖ¾ÇÀÇ °æ¿ì´Â ¾Æ¹«·± ¿¬°üµµ º¸¿©ÁÖÁö ¾ÊÀ» °ÍÀÌ´Ù. ½ÇÁ¦·Î °¡Àå ºó¹øÇÑ °á°ú´Â ºÎºÐÀûÀ¸·Î¸¸ ´Ü¹éÁúµé(´ëºÎºÐ ±× Ư¼ºÀÌ ¹àÇôÁöÁö ¾ÊÀº)¿¡ ÀÏÄ¡¸¦ º¸ÀÌ°í ³ª¸ÓÁö ºÎºÐÀº Àǽɽº·¯¿î »óÅ·Π³ª¿À´Â °ÍÀÌ´Ù.

        ÀÌ·¯ÇÑ È¥¶õÀÇ ´ëºÎºÐÀº °ü·ÃµÈ ´Ü¹éÁúµéÀÇ modular architecture¿¡ ±âÀÎÇÑ´Ù. ¾Ë·ÁÁø 3-D ´Ü¹éÁú ±¸Á¶µéÀÇ ºÐ¼®Àº ´ëºÎºÐ ´Ù¼öÀÇ folding unitµéÀ» Æ÷ÇÔÇϰí ÀÖÀ½À» º¸¿©ÁØ´Ù. °¢ ´ÜÀ§´Â domainÀ̶ó ºÒ¸®¸ç ±× ÀÚ½ÅÀÇ ¼Ò¼ö¼º Áß½ÉÀ» °¡Áö°í, ³»ºÎÀûÀ¸·Î Àܱâ¿Í Àܱ⠰£ÀÇ Á¢Ã˵éÀ» ¸¸Á·½Ã۰í ÀÖ´Ù. ÀÌ·¯ÇÑ Á¶°ÇµéÀ» ÃæÁ·½Ã۱â À§Çؼ­´Â µ¶¸³ÀûÀÎ µµ¸ÞÀεéÀº ±Ý¼ÓÀÌ¿ÂÀ̳ª ÀÌȲȭ°¡±³¸¦ °¡ÁöÁö ¾Ê´Â ÇÑ ÃÖ¼ÒÇÑ 50°³ Á¤µµÀÇ ÀܱâµéÀ» °¡Á®¾ß¸¸ ÇÑ´Ù. ´Ü¹éÁú ¼­¿­µéÀÇ ºÐ¼®Àº ÀÌ·¯ÇÑ ±¸Á¶Àû °³³äÀ» ¸¸Á·½ÃÄÑÁØ´Ù; ¼­¿­ ½ÖµéÀº ÀÚÁÖ ±¹ºÎÀÎ À¯»ç¼ºÀ» º¸¿©ÁÖ°í, ³ª¸ÓÁö´Â ¿ÏÀüÈ÷ ´Ù¸¥ °ÍÀ» º¸¿©ÁØ´Ù. ÀÌ·¯ÇÑ ¼ÒÀ§ »óµ¿¼º µµ¸ÞÀÎ (homology domain) µé¿¡¼­ foldingÀÇ µ¶¸³¼ºÀº ½ÇÇèÀûÀ¸·Î Áõ¸íµÇÁö´Â ¾Ê¾Ò´Ù. ±×·¯³ª ±×µéÀÇ ½ÇÁ¦·Î ÀüÈİü°è·Î µ¶¸³¼º (context independence)À» º¸¿©ÁØ´Ù; Áï, À̵éÀº ¿©·¯ °¡Áö µµ¸ÞÀÎ ¹èÄ¡¿¡¼­ ³ªÅ¸³ª¸ç ´Ù¸¥ ´Ü¹éÁú¿¡¼­´Â ÁߴܵÇÁö ¾ÊÀº ¼­¿­¿¡ »ðÀÔµÈ »óÅ·Π¹ß°ßµÈ´Ù.

        ´Ü¹éÁú ºÐ·ù¸¦ ³íÀÇÇÒ ¶§¸é »óµ¿¼º µµ¸ÞÀε鵵 ÀÚÁÖ µ¶¸³ÀûÀÎ ±â´ÉµéÀ» °¡Áö°í ÀÖ´Ù´Â °ÍÀ» ÁÖ¸ñÇØ¾ßÇÑ´Ù. ¾î¶² µµ¸ÞÀεéÀº È¿¼ÒȰ¼ºÀ» °¡Áö°í, ¾î¶² °ÍÀº ÀÛÀº Àü·ÉºÐÀÚµé°ú °áÇÕÇϸç, ´Ù¸¥ °ÍµéÀº DNA, RNA, ¶Ç´Â ´Ü¹éÁú°ú °áÇÕÇÑ´Ù. Multidomain ´Ü¹éÁúÀÇ °æ¿ì´Â µû¶ó¼­ Çϳª ÀÌ»óÀÇ ±â´ÉÀ» °¡Áö¸ç Çϳª ÀÌ»óÀÇ ´Ü¹éÁú Áý´ÜÀ̳ª ºÎ·ù¿¡ ¼ÓÇÑ´Ù. ÀÌ·± ÀÌÀ¯·Î ´Ü¹éÁúÀ» ±â´ÉÀûÀ¸·Î ºÐ·ùÇÏ´Â ÇöÀçÀÇ Á¢±ÙÀº Àüü ´Ü¹éÁúÀÌ ¾Æ´Ï¶ó µµ¸ÞÀο¡ ÁýÁߵǾî ÀÖ´Ù.

 

Tools for superfamily assignment

        ¿©·¯ ¿¬±¸Áý´ÜµéÀº ´Ü¹éÁú ¼­¿­µéÀ» Áý´Ü (families)°ú ÃÊÁý´Ü (superfamilies)·Î ±¸ºÐÇϱâ À§ÇØ ³ë·ÂÇØ¿Ô´Ù. ¿©·¯ °¡Áö Á¢±ÙµéÀº ±× ÀÚµ¿È­ÀÇ Á¤µµ, Æ÷°ý¼º, ¿ÏÀüÇÑ ´Ü¹éÁúÀ̳ª µµ¸ÞÀο¡ÀÇ ÃÊÁ¡°ú »ç¿ëµÈ ¹æ¹ý¿¡¼­ ´Ù¸£´Ù. ÀÌ·¯ÇÑ ³ë·ÂµéÀÇ ÀϺδ ÇöÁ¸ÇÏ´Â ¼­¿­ÀÚ·áµéÀ» ºÐ·ùÇϴµ¥ ÁýÁߵǰí ÀÖ´Ù. ´Ù¸¥ °ÍµéÀº ÇÑ ´Ü°è ´õ ³ª¾Æ°¡ ¼­¿­ Áý´Üµé·ÎºÎÅÍ ÇʼöÀûÀΠƯ¼ºµéÀ» ÃßÃâÇϰí À̰͵éÀ» µµ¸ÞÀÎÀ̳ª motif descriptorµéÀÇ ÇüÅ·ΠÀúÀåÇϰí ÀÖ´Ù. DescriptorµéÀº »ç¿ëÀÚ°¡ Á¦°øÇÑ ´Ü¹éÁú ¼­¿­µéÀ» °¡Áö°í °Ë»öÇϴµ¥ »ç¿ëÇÒ ¼ö ÀÖ´Ù. ÀÌ·¯ÇÑ °Ë»öµéÀÇ ³ôÀº Á¤¹Ðµµ´Â ¹ÌÈ®ÀÎ ´Ü¹éÁúµéÀÇ ±â´ÉÀûÀÎ ÁöÁ¤¿¡ °¡Àå À¯¿ëÇÑ °ÍÀ¸·Î Áõ¸íµÇ¾ú´Ù. µ¿½ÃÀûÀÎ °³¹ß·Î´Â ´Ü¹éÁú 3-D ±¸Á¶µéÀÇ ºÐ·ùÀÌ´Ù.

        °¡Àå ³Î¸® ¾²ÀÌ´Â ÁýÇÕµé Áß ¾î¶² °ÍÀº ´Ü¹éÁúµéÀÇ modular ¼ºÁúÀ» Á¸ÁßÇÏ´Â °ÍÀ¸·Î °ð ³íÀÇµÉ °ÍÀÌ´Ù. ÇØ´çÇÏ´Â WWW ÁÖ¼Ò´Â URL Box¿¡ ±â¼úµÇ¾î ÀÖÀ¸¸ç, ´ëºÎºÐÀÇ °ü·ÃµÈ µ¥ÀÌÅͺ£À̽º¿Í °Ë»öµµ±¸µµ ftp·Î ¹ÞÀ» ¼ö ÀÖ´Ù (Ç¥ 1).

        PROSITE pattern library´Â ±â´ÉÀûÀ¸·Î Áß¿äÇÑ ´Ü¹éÁú ¸ðƼºêµé¿¡ ´ëÇÑ descriptorµéÀ» ¼öÁýÇϴµ¥ ÀÖ¾î ¼±µÎ¿ªÇÒÀ» ÇÑ °Íµé Áß ÇϳªÀÌ´Ù. À̰ÍÀº ÇÑ ´Ü¹éÁú Áý´Ü¿¡¼­ °¡Àå Àß º¸Á¸µÈ Àܱâµé¿¡¸¸ ÁßÁ¡À» µÎ´Â regular expression syntax¿¡ ±Ù°ÅÇϰí ÀÖ´Ù. ÇϳªÀÇ PROSITE À¯Çü (pattern)Àº ÇϳªÀÇ ¿ÏÀüÇÑ µµ¸ÞÀÎ ¶Ç´Â ´Ü¹éÁúÀ» ¹¦»çÇÏ´Â °ÍÀÌ ¾Æ´Ï¶ó È¿¼ÒÀÇ Ã˸ÅÀÚ¸®¿Í °°Àº ±â´ÉÀûÀ¸·Î °¡Àå Áß¿äÇÑ ÀܱâµéÀÇ Á¶ÇÕµéÀ» È®ÀÎÇϰíÀÚ ³ë·ÂÇϰí ÀÖ´Ù. PROSITE expression K-x(1,2)-[DE]´Â ÇϳªÀÇ lysine ÀܱⰡ Çϳª ¶Ç´Â µÎ °³ÀÇ ¹«ÀÛÀ§ÀûÀÎ Àܱâµé (x), ±×¸®°í D ¶Ç´Â E°¡ µÚµû¸¥´Ù´Â °ÍÀ» Ç¥½ÃÇÑ´Ù. À¯ÇüÀº ÁÖ¾îÁø ¼­¿­¿¡ Á¸ÀçÇϰųª Á¸ÀçÇÏÁö ¾Ê´Â °ÍÀ¸·Î ¹ß°ßµÉ ¼ö ÀÖ´Ù; Áß°£ score´Â ¾ø´Ù. ÇöÀç PROSITE pattern library´Â 1292°³ÀÇ entry¸¦ Æ÷ÇÔÇϰí ÀÖÀ¸¸ç µû¶ó¼­ °¡Àå Æ÷°ýÀûÀÎ ÁýÇÕÀÌ´Ù. Ãß°¡ÀûÀÎ º¸³Ê½º·Î ¸ðµç ¸ðƼºêµéÀº °ü·ÃµÈ ¹®ÇåÀÇ ±â·ÏÀÌ ¿¬°áµÇ¾î ÀÖ´Ù. ±×·¯³ª PROSITEÀÇ syntax´Â ¸Å¿ì ¹æ»êµÈ ´Ü¹éÁú Áý´ÜµéÀ» ³ªÅ¸³»±â¿¡´Â ³Ê¹« À¶Å뼺ÀÌ ¾ø´Ù. ±× ¿Ü¿¡µµ ¸¹Àº ªÀº À¯ÇüµéÀº ¿À´Ã³¯ÀÇ Å« ´Ü¹éÁú µ¥ÀÌÅͺ£À̽º¿¡¼­ Åë°èÀûÀ¸·Î ÀǹÌÀÖ´Â matchµéÀ» À̲ø¾î³»±â¿¡ ÃæºÐÇÑ Á¤º¸¸¦ °¡ÁöÁö ¸øÇϰí ÀÖ´Ù. µû¶ó¼­ µ¥ÀÌÅͺ£À̽º °Ë»öÀ» ¼öÇàÇÒ ¶§ false positive hitµéÀÌ ³ª¿Ã °ÍÀ¸·Î ¿¹»óµÇ¸ç µû¶ó¼­ ¸Å¿ì Á¶½ÉÇÏ¿©¾ß¸¸ ÇÑ´Ù.

        ÀÌ·¯ÇÑ ¹®Á¦µéÀ» ±Øº¹Çϱâ À§Çؼ­´Â PROSITE pattern library´Â 1995³â ÀÌ·¡ PROSITE profile library·Î ÁõÁøµÇ¾î¿Ô´Ù. ÀϹÝÈ­µÈ profileµéÀº sequence-to-sequence ºñ±³¿Í ÇÑ ¼­¿­¿¡ ´ëÇÑ regular expressionÀÇ matching »çÀÌ¿¡ Áß°£ÀûÀÎ À§Ä¡¿¡ ÀÖ´Ù. ÇÑ ´Ü¹éÁú Áý´Ü ³»ÀÇ Àß º¸Á¸µÈ À§Ä¡µéÀº alignment scoreÀÇ °è»ê¿¡¼­ ³ôÀº Á¡¼ö¸¦ ¹Þ´Â ¹Ý¸é ´ú º¸Á¸µÈ À§Ä¡µéÀº ¿ÏÀüÈ÷ ¹«½ÃµÇ´Â ´ë½Å¿¡ ³·Àº Á¡¼ö¸¦ ¹Þ´Â´Ù. PROSITE profileµéÀº °¡´ÉÇÑ ¿ÏÀüÇÑ µµ¸ÞÀεéÀ» Æ÷ÇÔÇÏ·Á°í ³ë·ÂÇϰí ÀÖ´Ù. ±× üÀç´Â ºñ·Ï °Ë»ö¿¡ »ç¿ëµÇ´Â ÇÁ·Î±×·¥µéÀÌ ´Ù¸£±â´Â ÇÏÁö¸¸ generalized PROSITE üÀç¿¡ Àû¿ëµÇ¾î ÀÖ´Ù. °¢ sequence-to-profile match´Â score¸¦ ¹Þ°í, À̰ÍÀº Åë°èÀûÀ¸·Î ½Å·Ú¼ºÀÖ´Â °ªÀ¸·Î ÀüȯµÈ´Ù. µÎ°¡Áö ´Ù¸¥ cutoff valueµéÀº ¸Å¿ì ÀǹÌÀÖ´Â ¶Ç´Â °æ°è»óÀÇ matchµé °¢°¢¿¡ ´ëÇÏ¿© ƯÀÌÀûÀÌ´Ù. PROSITE library¿¡¼­ profileµéÀº patternµéÀÌ ½ÇÆÐÇÏ´Â °æ¿ì¿¡ ÁÖ·Î »ç¿ëµÈ´Ù. ÇöÀç PROSITE¿¡´Â ´ÜÁö 56°³ÀÇ profileµéÀÌ Á¸ÀçÇϸç Ãß°¡ÀûÀ¸·Î 300°³°¡ prerelease »óÅ¿¡ ÀÖ´Ù; À̵éÀº °Ë»öµÇ°Å³ª ´Ù¿î·ÎµåµÉ ¼ö ÀÖÀ¸³ª ÀûÀýÇÑ ¼³¸íÀº ¿¬°áµÇ¾î ÀÖÁö ¾Ê´Ù.

        ProDom µ¥ÀÌÅͺ£À̽º´Â ¿ÏÀüÇÑ ´Ü¹éÁú µµ¸ÞÀε鿡 ´ëÇÑ ÃÖÃÊÀÇ Æ÷°ýÀûÀÎ ÁýÇÕÀ̾ú´Ù. À̰ÍÀº SWISS-PROT·ÎºÎÅÍ ¿ÏÀüÈ÷ ÀÚµ¿ÀûÀÎ ¹æ¹ýÀ¸·Î ±¸¼ºµÇ¾ú´Ù. ±× °á°ú µµ¸ÞÀεéÀº cluster numberµé·Î¸¸ Ç¥½ÃµÇ¾î ÀÖ°í, ¾î¶² »ý¹°ÇÐÀû ±â´Éµµ ¼³¸íµÇ¾îÀÖÁö ¾Ê´Ù. ´õ±º´Ù³ª ÀÚµ¿ÀûÀ¸·Î °áÁ¤µÈ µµ¸ÞÀÎ ¿µ¿ªµéÀº ½Å·ÚÇÒ ¼ö ¾øÀ¸¸ç ¿¬°üµÈ °Ë»ö ¹æ¹ýµéµµ º°·Î Á¤¹ÐÇÏÁö ¸øÇÏ´Ù.

        PfamÀº ProDom¿¡¼­ ÁøÈ­ÇÑ °ÍÀ¸·Î °³³äÀûÀ¸·Î PROSITE profileµé°ú ¿¬°üµÈ HMMµéÀÇ ÁýÇÕÀÌ´Ù. Pfam ¸ðµ¨µéÀº ÀüÇüÀûÀ¸·Î ¿ÏÀüÇÑ ´Ü¹éÁú µµ¸ÞÀε鿡 °ÉÃÄ ÀÖÀ¸¸ç HMMER package³ª Web-based server·Î °Ë»öµÉ ¼ö ÀÖ´Ù. ÇöÀçÀÇ ¹öÀüÀº Pfam(2.1)·Î 527°³ÀÇ ¸ðµ¨µéÀ» Æ÷ÇÔÇϰí ÀÖ´Ù; °ð ³ª¿Ã ´ÙÀ½ ¹öÀü (3.0)¿¡¼­´Â ±× ¼ýÀÚ°¡ 806°³·Î Áõ°¡ÇÒ °ÍÀÌ´Ù. PROSITE profile°ú À¯»çÇÏ°Ô Pfam ¸ðµ¨µéÀº ºÐ¸íÇÑ homologµé·ÎºÎÅÍ Ãâ¹ßÇÏ¿© Á¡Â÷ÀûÀ¸·Î ¸Õ Áý´ÜµéÀÇ ±¸¼º¿øµéÀ» Æ÷ÇÔ½ÃŰ¸é¼­ ¹Ýº¹ÀûÀ¸·Î Á¤·ÃµÈ´Ù.  rµéÀÇ information-rich descriptorµé ¶§¹®¿¡ µÎ°¡Áö ÁýÇÕµéÀº ´Ù¸¥ ¹æ¹ýÀ¸·Î´Â µå¹°°Ô ¹ß°ßµÇ´Â ´Ü¹éÁú ¸ðƼºêÀÇ ¸Å¿ì ¸Õ ¿¹µµ °ËÃâÇÑ´Ù. PROSITE¿Í´Â ´ëÁ¶ÀûÀ¸·Î Pfam entryµéÀº semi-automaticÇÏ°Ô »ý¼ºµÇ°í, À̰ÍÀº ºñ±³Àû ³·Àº Á¤¹Ðµµ¸¦ º¸¿©ÁÖÁö¸¸ °³Á¤°úÁ¤Àº º¸´Ù ½±´Ù. Pfam documentationÀº ÃÖ¼ÒÇÑÀÌÁö¸¸ ÀÚÁÖ »óÀÀÇÏ´Â PROSITE entry¿¡ ´ëÇÑ ¿¬°áÀÌ Æ÷ÇԵǾî ÀÖ´Ù. Pfam ¸ðµ¨µé°ú PROSITE profileµéÀº »óÈ£ÀüȯÀÌ ÀÌ·ç¾îÁú ¼ö ÀÖ°í, Á¶ÇÕ °Ë»öÀÌ °¡´ÉÇÏ´Ù. SMART µ¥ÀÌÅͺ£À̽º´Â ½ÅÈ£Àü´Þ¿¡ Æ÷ÇÔµÈ ´Ü¹éÁú µµ¸ÞÀε鿡 ÃÊÁ¡À» ¸ÂÃá 181°³ÀÇ HMMµéÀÇ µ¶¸³ÀûÀÎ ÁýÇÕÀÌ´Ù.

        BLOCKS¿Í PRINTS´Â ¿©·¯ °¡Áö ªÀº ungapped multiple alignment ÀýÆíµé¿¡ ÀÇÇÑ ´Ü¹éÁú ¶Ç´Â µµ¸ÞÀÎ Áý´ÜµéÀ» ³ªÅ¸³»´Â ¸ðƼºê µ¥ÀÌÅͺ£À̽ºÀÌ´Ù. BLOCKSÀÇ ÇöÀç ÆÇ (10.1)Àº 972°³ÀÇ Áý´ÜµéÀ» Æ÷ÇÔÇϰí ÀÖÀ¸¸ç, À̵éÀº PROSITE patternµé·ÎºÎÅÍ À¯·¡ÇÏ¿´´Ù. PRINTS (19.0)´Â ÇöÀç 925°³ÀÇ Áý´ÜµéÀ» Æ÷ÇÔÇϰí ÀÖÀ¸¸ç, À̵é Áß ÀϺδ PROSITE entryµé·ÎºÎÅÍ ´Ù¸¥ °ÍµéÀº µ¶¸³ÀûÀ¸·Î À¯µµµÈ °ÍÀÌ´Ù. PRINTS ¸ðƼºêµé ¿ª½Ã ¹Ýº¹ÀûÀ¸·Î Á¤·ÃµÇ¾î BLOCKS¿¡ ºñÇØ Áõ°¡µÈ Á¤¹Ðµµ¸¦ º¸ÀδÙ. PRINTSÀÇ Æ¯º°ÇÑ °­Á¡Àº PROSITE¿¡ ºñ°ßÇÒ ¼ö ÀÖ´Â entryµéÀÇ Ç³ºÎÇÑ ¼³¸íÀÌ´Ù. ±× À¯»çÇÑ ±¸Á¶ ¶§¹®¿¡ BLOCKS¿Í PRINTS´Â µ¿ÀÏÇÑ ÇÁ·Î±×·¥À¸·Î °Ë»öµÉ ¼ö ÀÖÀ¸¸ç ¾î¶² Web server´Â µÎ°¡Áö¿¡ ´ëÇÑ °Ë»öÀ» µ¿½Ã¿¡ Á¦°øÇÑ´Ù.

 

What next?

        À§¿¡¼­ ¼³¸íÇÑ superfamily ºÐ·ù¿¡ ´ëÇÑ ºñ±³¸¦ ÀÐ°í³ª¸é 'BLAST ´ë½Å¿¡ domain µ¥ÀÌÅͺ£À̽º¸¦ °Ë»öÇØ¾ß¸¸ ÇÏ´ÂÁö' ¶Ç´Â '¾î¶² µ¥ÀÌÅͺ£À̽º¸¦ »ç¿ëÇØ¾ßÇÒ Áö' ¹°¾î¿Ã °ÍÀÌ´Ù. ±× ´ë´äÀº °£´ÜÇÏ´Ù. °¡´ÉÇÑ BLAST¸¦ Æ÷ÇÔÇÏ¿© ¸ðµç °ÍÀ» »ç¿ëÇØ¾ß ÇÑ´Ù´Â °ÍÀÌ´Ù. µµ¸ÞÀÎ µ¥ÀÌÅͺ£À̽ºµéÀº »ó´çÈ÷ ÁßøµÇÁö¸¸ ±×µéÀº ¸ðµÎ Ưº°ÇÑ ÀåÁ¡À» °¡Áö°í ÀÖ´Ù. µû¶ó¼­ ½ÅÈ£Àü´Þ¿¡¼­ Áß¿äÇÑ µµ¸ÞÀεéÀº PROSITE profileµéÀ̳ª SMART¿¡¼­ ¹ß°ßµÉ °¡´É¼ºÀÌ ³ô°í; PfamÀº ¼¼Æ÷¿Ü µµ¸ÞÀεé, PROSITE patternµéÀº Ȱ¼ºÀÚ¸® ¸ðƼºê¿¡ ÀÇÇØ ºÐ·ùµÈ È¿¼Ò Áý´ÜµéÀ» È®ÀÎÇϴµ¥ ÁÁ´Ù. µµ¸ÞÀÎ µ¥ÀÌÅͺ£À̽ºµéÀÌ ÁßøµÇ´Â °æ¿ì¶óµµ, ºÐ¸íÇÑ ¹Ýº¹Àº ºÐ·ùÀÇ ½Å·Úµµ¸¦ ³ô¿©ÁØ´Ù. µ¿ÀÏÇÑ query ´Ü¹éÁúÀ» »ç¿ëÇÏ¿´À» ¶§ ¼¼°¡Áö ´Ù¸¥ ºÐ·ù serverµéÀÇ Ãâ·ÂÀÌ ±×¸² 1¿¡ º¸¿©Á® ÀÖ´Ù.

±×¸² 1. Example output from three Web-based domain identification servers, using the same protein (human Vav oncogene. SWISS-PROT VAV_HUMAN) as the query. (a) The output of the PROSITE profile server at the SWISS Institute for Experimental Cancer Research (ISREC). Hit list¿¡¼­ µµ¸ÞÀÎ À̸§µéÀº Ãß°¡ÀûÀÎ Á¤º¸¿¡ ¿¬°áµÇ¾î ÀÖ´Ù. (b) The output of the SMART server at the European Molecular Biology Laboratory (EMBL). »ö±òÀÌ Ä¥ÇØÁø »óÀÚµéÀº µµ¸ÞÀÎ Á¤º¸¿Í ¿¬°áµÇ¾î ÀÖ´Ù. (c) The graphical output of the Pfam server at Washington University. ¿ø·¡ÀÇ °Ë»ö¿¡¼­ ³ª¿À´Â Ãß°¡ÀûÀÎ Á¤º¸¸¦ Á¦°øÇÏ´Â textual outputÀº »èÁ¦µÇ¾î ÀÖ´Ù.

 

 

        ÁúÀûÀÎ Æò°¡±âÁØÀ¸·Î¼­ À̿밡´ÉÇÑ µµ¸ÞÀÎ descriptorµéÀÇ ¼ö´Â °ú¼ÒÆò°¡ µÇ¾î¼­´Â ¾ÈµÈ´Ù. ¿Ö³ÄÇÏ¸é µ¥ÀÌÅͺ£À̽ºµé°ú ¿¬°üµÈ °Ë»ö¹æ¹ýµéÀº ÀϹݼº°ú Á¤¹Ðµµ¿¡ À־ ´Ù¸£±â ¶§¹®ÀÌ´Ù. ¿¹¸¦ µé¾î PROSITE profileµéÀÇ ºñ±³Àû ÀûÀº prerelease library´Â 70°³ÀÇ ¸Å¿ì ÀǹÌÀÖ´Â µµ¸ÞÀÎ matchµéÀ» ¾î¶² °Í°úµµ À¯»ç¼ºÀÌ ¾ø´Â °ÍÀ¸·Î ºÐ·ùµÈ È¿¸ðÀÇ 880°³ À¯ÀüÀÚ Áß¿¡¼­ ¹ß°ßÇÏ¿´´Ù. Pfam 3.0Àº 36°³ÀÇ matchµéÀ» º¸°íÇÏ¿´°í, ¹Ý¸é PROSITE pattern collectionÀº 114°³¸¦ ã¾ÒÀ¸³ª ±× ´ëºÎºÐÀº ¾Æ¸¶µµ false positiveÀ̾ú´Ù.

        ¿©±â¼­ ÃæºÐÈ÷ ³íÀÇµÉ ¼ö´Â ¾øÁö¸¸ Ãß°¡ÀûÀÎ ¹®Á¦´Â superfamily ºÐ·ù¸¦ Á¤·ÃÇÏ´Â °ÍÀÌ´Ù. ´ëºÎºÐÀÇ ¸ðƼºê µ¥ÀÌÅͺ£À̽º´Â °¡´ÉÇÑ ÀϹÝÀûÀÌ µÇ·Á°í ³ë·ÂÇϰí ÀÖ´Ù. ¿¹¸¦ µé¾î glucose transporter¿¡ ´ëÇÑ entry¸¦ ¹ß°ßÇÏ·Á°í Çϱ⺸´Ù´Â sugar transporter ¸ðƼºê³ª ¶Ç´Â °¡´ÉÇÏ´Ù¸é º¸´Ù ÀϹÝÀûÀÎ transporter Áý´Ü¿¡ ´ëÇÑ °ÍÀ» ±â´ëÇÒ °ÍÀÌ´Ù. ÀÌ·¯ÇÑ º¸°í°¡ ³ª¿Â ÈÄ¿¡ ¾î¶² Á¾·ùÀÇ transporter¿¡ ¼ÓÇÏ´ÂÁö ¿¹ÃøÇÒ ¼ö ÀÖ´Â ºÐ·ù systemÀÌ ¹Ù¶÷Á÷ÇÒ °ÍÀÌ´Ù. ºÒÇàÇϰԵµ ¾ÆÁ÷ ±×·± systemÀº ¾ø´Ù. ´Ü¹éÁúÀÇ Á¤È®ÇÑ ±â´ÉÀ» ¿¹ÃøÇÏ´Â °¡Àå °¡´É¼º ÀÖ´Â Á¢±ÙÀº ´Ù¸¥ Á¾¿¡¼­ ¹àÇôÁø ortholog¸¦ ã´Â °ÍÀÌ´Ù. ¿ì¸®°¡ ºÒ¿ÏÀüÇÏ°Ô ºÐ¼®µÈ °Ô³ðµéÀ» °¡Áö°í ÀÏÇØ¾ßÇÏ´Â ÇÑ real ortholog´Â ¾Ë·ÁÁöÁö ¾ÊÀº ä °¡Àå ÁÁÀº database hit´Â ¿¬°üµÈ ±×·¯³ª ´Ù¸¥ ±â´ÉÀ» °¡Áö´Â Àß º¸Á¸µÈ paralogÀÏ °ÍÀÌ´Ù. ¸¸¾à database¿¡¼­ÀÇ °¡Àå ÁÁÀº match°¡ 'glucose transporter, brain isoform'À̶ó¸é ±× ¼­¿­ÀÌ ´Ù¸¥ transporter¿¡ ºñÇØ ºÐ¸íÈ÷ glucose transporter¿Í °¡±î¿îÁö¸¦ »ìÆìº¸¾Æ¾ßÇÒ °ÍÀÌ´Ù. ³Ê¹« ÀÚ¼¼ÇÑ ¿¹ÃøÀ» ÇÏ´Â °ÍÀº ¹Ù¶÷Á÷ÇÏÁö ¾Ê´Ù: query°¡ glucose transporterÀÇ brain isoformÀ̶ó°í °á·ÐÁþ´Â °ÍÀº ³Ê¹« °úÀåµÈ °ÍÀÌ´Ù. ¿ÏÀüÈ÷ ÀÚµ¿È­µÈ ¿¹°ß systemÀº ÀÌ·¯ÇÑ À߸ø¿¡ Ãë¾àÇϰí, database¿¡´Â À߸ø À§ÀÓµÈ ¼­¿­µéÀÌ ¸¹ÀÌ Æ÷ÇԵǾî ÀÖ´Ù.

        Domain database °Ë»öµé, BLAST °Ë»öµé ±×¸®°í subfamily classificationÀÇ Á¶ÇÕÀ» »ç¿ëÇÏ´Â °ÍÀÌ ÇϳªÀÇ ¼­¿­À» ºÐ¼®Çϴµ¥ ³Ê¹« ¸¹Àº ³ë·ÂÀ» ±â¿ïÀÌ´Â °Íó·³ º¸ÀÏÁöµµ ¸ð¸¥´Ù. ±×·¯³ª ´Ü¹éÁúÀÇ ±â´ÉÀ» È®ÀÎÇϱâ À§ÇÏ¿© ½ÇÇèÀ¸·Î ¸î ´ÞÀÇ ½Ã°£À» º¸³»´Â °Íº¸´Ù´Â ÄÄÇ»ÅÍ¿¡¼­ ¸î ½Ã°£À» º¸³»´Â °ÍÀÌ °¡Ä¡ÀÖ´Â ÀÏÀÏÁö ¸ð¸¥´Ù.