2. »óµ¿¼º °Ë»ö (homology search)

1. ½ÇÇè¸ñÇ¥
Áö³­ ¹Ý¼¼±â µ¿¾È ¸¹Àº ´Ü¹éÁú°ú À¯ÀüÀÚ ¼­¿­¿¡ ´ëÇÑ Á¤º¸°¡ ÃàÀûµÇ¾ú´Ù. ƯÈ÷ ÃÖ±Ù 10¿©³â°£ ÁýÁßÀûÀ¸·Î ÀÌ·ç¾îÁø °Ô³ðºÐ¼®À» ÅëÇØ »ç¶÷À» ºñ·ÔÇÑ ¸¹Àº »ý¹°Ã¼µéÀÇ À¯ÀüÁ¤º¸°¡ ¹àÇôÁ³´Ù. ÀÌ¿Í °°ÀÌ ±âÁ¸¿¡ ¾Ë·ÁÁø À¯ÀüÀÚ³ª ´Ü¹éÁú ¼­¿­Á¤º¸ÀÇ µ¥ÀÌÅͺ£À̽º¿¡¼­ À¯»çÇÑ ¼­¿­À» °Ë»öÇÏ´Â ÀÛ¾÷À» »óµ¿¼º °Ë»öÀ̶ó°í ÇÑ´Ù. ÀÌ·¯ÇÑ °Ë»öÀ» ÅëÇØ ¾ò¾îÁö´Â ÀÌ¹Ì È®ÀÎµÈ ¼­¿­µé°úÀÇ À¯»ç¼ºÀº ´Ù¾çÇÑ Á¤º¸¸¦ Á¦°øÇÑ´Ù.
»óµ¿¼º °Ë»öÀº À¯»ç¼º °Ë»ö (similarity search)À̶ó´Â ¸»°ú È¥¿ëÇÏ¿© »ç¿ëÇϱ⵵ ÇÑ´Ù.  ÀϹÝÀûÀ¸·Î DNAº¸´Ù´Â ´Ü¹éÁú ¼­¿­¿¡ ´ëÇÑ »óµ¿¼º ºÐ¼®¿¡ À¯¿ëÇÏ°Ô ÀÌ¿ëµÈ´Ù.

ÀÌ ½ÇÇè¿¡¼­´Â Áö³­ ÁÖ¿¡ ¾ò¾îÁø ´Ü¹éÁú ¼­¿­À» °¡Áö°í »óµ¿¼º °Ë»öÀ» ½Ç½ÃÇÏ¿© ¾î¶² ´Ü¹éÁúÀÎÁö¸¦ È®ÀÎÇÏ´Â °úÁ¤¿¡ ´ëÇÏ¿© ¹è¿î´Ù. ÀÌ ½ÇÇè¿¡¼­´Â ÀÌ¹Ì ¾Ë·ÁÁø ¼­¿­ÀÌ ÁÖ¾îÁ³±â ¶§¹®¿¡ ´ç¿¬È÷ ÀÌ¿Í µ¿ÀÏÇÑ ¼­¿­ÀÇ ´Ü¹éÁúÀÌ Ã£¾ÆÁüÀ¸·Î½á ¾î¶² ´Ü¹éÁúÀÇ ¼­¿­ÀÎÁö ½±°Ô ¾Ë¾Æ³¾ ¼ö ÀÖ´Ù. ¸¸¾à Áö±Ý±îÁö ¾Ë·ÁÁöÁö ¾ÊÀº »õ·Î¿î ´Ü¹éÁúÀÇ °æ¿ì¶óµµ ±âÁ¸¿¡ ¾Ë·ÁÁø ´Ü¹éÁú ¼­¿­°úÀÇ À¯»ç¼ºÀ» ÅëÇØ ±× ´Ü¹éÁúÀÇ ±â´ÉÀ» À¯ÃßÇÒ ¼ö ÀÖ´Ù.  ´Ü¹éÁúÀÇ ÀÏÂ÷±¸Á¶´Â »ïÂ÷¿ø±¸Á¶¸¦ °áÁ¤Çϱ⠶§¹®¿¡ °°Àº Ȱ¼º ¶Ç´Â ±â´ÉÀ» °¡Áö´Â ´Ü¹éÁúµéÀº ¼­¿­»óÀÇ À¯»ç¼ºÀ» °¡Áø´Ù.  ¼­¿­»óÀÇ À¯»ç¼ºÀ̶õ Àüü ¼­¿­ÀÇ ±æÀ̰¡ ºñ½ÁÇÏ°í ±× ¾Æ¹Ì³ë»ê ÀܱâµéÀÇ À¯»ç¼ºÀÌ 10% ÀÌ»óÀÎ °æ¿ì¿¡ ÇØ´çÇϸç, ÀÌ·¯ÇÑ ´Ü¹éÁúµéÀº »óµ¿ ´Ü¹éÁú (homologous protein ¶Ç´Â homolog)À̶ó ºÒ¸°´Ù.  

2. ½ÇÇè³»¿ë
    Áö³­ ½Ã°£¿¡ ¾ò¾îÁø ´Ü¹éÁú ¼­¿­À» °¡Áö°í »óµ¿¼º ºÐ¼®°ú ´ÙÁ߹迭À» ½Ç½ÃÇÑ´Ù.
    »óµ¿¼º ºÐ¼®¿¡¼­´Â NCBI À¥¿¡¼­ Blast search ¿ä·ÉÀ» ¹è¿î´Ù.
µ¥ÀÌÅͺ£À̽º¸¦ °Ë»öÇϴµ¥ ¾î¶² ÇÁ·Î±×·¥À» »ç¿ëÇÒ °ÍÀΰ¡¿¡ ´ëÇØ¼­´Â ³íÀïÀÇ ¿©Áö°¡ ¸¹À¸¸ç »õ·Ó°Ô °³¹ßµÈ ÇÁ·Î±×·¥µéÀÌ °è¼Ó ³ª¿À°í Àֱ⠶§¹®¿¡ ¼±ÅÃÇϴµ¥ ¾î·Á¿òÀÌ ¸¹´Ù.  »ç¿ëÇÒ ÇÁ·Î±×·¥À» ¼±ÅÃÇÑ ÈÄ¿¡µµ ÇÁ·Î±×·¥ÀÇ ÆÄ¶ó¹ÌÅÍ °ªµéÀ» ´Ù½Ã ¼±ÅÃÇØ¾ß ÇÏ°í °Ë»ö °á°úµµ ÇØ¼®ÇÒ ¼ö ÀÖ¾î¾ß ÇÑ´Ù. ÀÌ·¯ÇÑ ¹®Á¦µéÀ» ±Øº¹Çϱâ À§Çؼ­ »óµ¿¼º °Ë»öÀÇ ÇÁ·Î±×·¥ ¿ø¸®¿Í Á¾·ùÀÇ ±âº»ÀûÀÎ Áö½ÄÀ» °¡Áö´Â °ÍÀÌ ÇÊ¿äÇÏÁö¸¸ ¿©±â¼­´Â NCBI¿¡¼­ Á¦°øÇÏ´Â Blast search¸¦ Áß½ÉÀ¸·Î ±âº»ÀûÀÎ ³»¿ë¸¸ ´Ù·çµµ·Ï ÇϰڴÙ.  (º¸´Ù ÀÚ¼¼È÷ ¾Ë°í ½ÍÀº »ç¶÷Àº Ãß°¡ÀڷḦ Àо±â ¹Ù¶õ´Ù).
Blast search: Sequence alignments provide a powerful way to compare novel sequences with previously characterized genes. Both functional and evolutionary information can be inferred from well designed queries and alignments. BLAST 2.0, (Basic Local Alignment Search Tool), provides a method for rapid searching of nucleotide and protein databases. Since the BLAST algorithm detects local as well as global alignments, regions of similarity embedded in otherwise unrelated proteins can be detected. Both types of similarity may provide important clues to the function of uncharacterized proteins.  

   °Ë»ö ¿ä·É
   (1) »óµ¿¼º °Ë»ö ½Ã
query ¼­¿­·Î »ç¿ëÇÒ ¼ö ÀÖ´Â °ÍÀº ¿°±â³ª ¾Æ¹Ì³ë»ê ¼­¿­ÀÌ´Ù. Áï, DNA³ª ´Ü¹éÁú ¼­¿­ÀÌ´Ù. Query ¼­¿­Àº ¹Ýµå½Ã Áö³­ ½Ã°£¿¡ º¸¿©ÁØ Fasta formÀ¸·Î ÁÖ¾îÁ®¾ß¸¸ ÇÑ´Ù.
   (2) DNA³ª ´Ü¹éÁú ¼­¿­Àº °¢±â ´Ù¸¥ ¸ñÀûÀ¸·Î »ç¿ëµÈ´Ù. »óµ¿¼º °Ë»ö¿¡ ÁÖ·Î »ç¿ëµÇ´Â °ÍÀº ´Ü¹éÁú ¼­¿­À̰í, DNA ¼­¿­Àº µ¿ÀÏÇÑ ¼­¿­À̳ª ¹ÐÁ¢ÇÏ°Ô ¿¬°üµÈ °ÍµéÀ» ã´Âµ¥ À¯¿ëÇÏ´Ù.
 
   (3) »ç¿ëµÇ´Â µ¥ÀÌÅͺ£À̽º¿¡´Â ¿©·¯ °¡Áö°¡ ÀÖ°í °è¼Ó Áõ°¡ÇÑ´Ù. ´Ù¾çÇÑ ºÐ¼®À» Çϱâ À§Çؼ­´Â À̵鿡 ´ëÇÏ¿© ¾Ë°í ÀÖ¾î¾ß ÇÏÁö¸¸ ±âº»ÀûÀ¸·Î´Â nucleotide database ÀÎ nr°ú protein databaseÀÎ pdb ¶Ç´Â swissprot ÀÌ ÀÌ¿ëµÈ´Ù.  ¾î¶² database¸¦ ¼±ÅÃÇÏ´À³Ä¿¡ µû¶ó ¾ò¾îÁö´Â ÀÚ·áÀÇ ¾ç°ú ±×¿¡ µû¸¥ ¼Ò¿ä½Ã°£ÀÌ ´Þ¶óÁø´Ù.

±âº»ÀûÀÎ »ç¿ë¿øÄ¢Àº ´ÙÀ½ Ç¥¿Í °°´Ù.  

Ç¥ 1. BLAST¿¡¼­ °¡´ÉÇÑ °Ë»öµéa

program

query

database

comparison

common use

blastn
nucleotide blast

DNA

DNA

DNA level

Seek identical DNA sequences and splicing patterns

blastp
protein blast

protein

protein

protein level

Find homologous proteins

blastx

DNA

protein

protein level

Analyze new DNA to find genes and seek homologous proteins

tblastn

protein

DNA

protein level

Search for genes in unannotated DNA

tblastx

DNA

DNA

protein level

Discover gene structure

a FASTA¿¡¼­µµ À¯»çÇÑ °Ë»öÀÌ ÀÌ·ç¾îÁø´Ù.

     (4) NCBI¿¡¼­ Á¦°øÇÏ´Â Blast search¿¡¼­´Â ±âº»ÀûÀÎ ¼³Á¤°ªÀÌ »ç¿ëµÇÁö¸¸,  ¿©·¯ °¡Áö º¯¼öµéÀ» ÀÓÀÇ·Î ÀÔ·ÂÇÒ ¼öµµ ÀÖ´Ù. ´Ù¸¸ ÀԷ°ª¿¡ ´ëÇÑ ¿øÄ¢Àº ¾øÀ¸¸ç, ½ÃÇàÂø¿À¸¦ ÅëÇØ º¸´Ù À¯¿ëÇÑ °á°ú¸¦ ¾òÀ» ¼öµµ ÀÖ´Ù. BlastÀÇ »ç¿ë¿ä·ÉÀº NCBI À¥¿¡¼­µµ ¹è¿ï ¼ö ÀÖ´Ù; BLAST Tutorial. ¶ÇÇÑ ±âº»ÀûÀÎ Àǹ®»çÇ׿¡ ´ëÇØ¼­´Â º°µµÀÇ ¼³¸íµµ ÁÖ¾îÁ® ÀÖ´Ù: Frequently asked questions. ¸î°¡Áö ±âº»ÀûÀÎ Á¡¿¡ ´ëÇØ¼­´Â Ãß°¡ÀÚ·á2 ¸¦ Àо±â ¹Ù¶õ´Ù.

   °Ë»ö°úÁ¤: NCBI¿¡¼­ÀÇ °Ë»ö¿ä·ÉÀ» ´Ü°èº°·Î ±â¼úÇÏ¿´´Ù.
   (1) ¿À¸¥Æí â¿¡¼­ BLAST¸¦ Ŭ¸¯ÇÑ´Ù.
   (2) Basic BLAST ÇÏ´Ü¿¡ ÀÖ´Â protein blast¸¦ Ŭ¸¯ÇÑ´Ù.
   (3) Enter Query Sequence â¿¡ Áö³­ ½Ã°£¿¡ ¾ò¾îÁø ´Ü¹éÁú ¼­¿­À» Ä«ÇÇÇÏ¿© ³Ö´Â´Ù.
   (4) Choose Search Set Ã¢ÀÇ Database¿¡ Non-redundant protein sequence (nr)ÀÌ º¸ÀÏ °ÍÀÌ´Ù. À̰ÍÀ» ´Ù¸¥ °ÍÀ¸·Î ¹Ù²Ü ¼öµµ ÀÖÁö¸¸ ÁÖ¾îÁø´ë·Î »ç¿ëÇÑ´Ù.
   (5) ÇÏ´Ü¿¡ BLAST¸¦ Ŭ¸¯ÇÑ´Ù.
   (6) Àá½Ã ÈÄ Ã¢ÀÌ ¹Ù²î¸é¼­ °á°ú (Graphic Summary, Descriptions, Alignments)¸¦ º¸¿©ÁØ´Ù.
   (7) Descriptions¿¡¼­ ù ¹øÂ° ¼­¿­¿¡ ÁÖ¸ñÇ϶ó. E value°¡ 0.0À̶ó¸é µ¿ÀÏÇÑ ¼­¿­À» ÀǹÌÇÑ´Ù. (0ÀÇ °ªÀº ¹«ÀÛÀ§ÀûÀ¸·Î ã¾ÆÁú °¡´É¼ºÀÌ ¾øÀ½À» ÀǹÌÇÑ´Ù)
   (8) ´õ ¾Æ·¡·Î ³»·Á°¡¸é ã¾ÆÁø ¼­¿­¿¡ ´ëÇÑ Á¤º¸¿Í ´õºÒ¾î ÀÔ·ÂÇÑ ¼­¿­ (Query)°ú ã¾ÆÁø ¼­¿­ (Sbjct)ÀÇ ¹è¿­°á°ú¸¦ º¸¿©ÁØ´Ù. 100% ÀÏÄ¡ÇÏ´Â ¼­¿­ÀÎÁö È®ÀÎÇϰí, ÀÌ ¼­¿­ÀÌ ¾î¶² »ý¹°Ã¼ÀÇ ¾î¶² ´Ü¹éÁú¿¡ ´ëÇÑ °ÍÀÎÁö ±â·ÏÇÑ´Ù.
   (9) ¾Æ·¡·Î ³»·Á°¥¼ö·Ï À¯»ç¼ºÀÌ ¶³¾îÁö´Â ´Ü¹éÁú ¼­¿­µéÀ» º¸¿©ÁÙ °ÍÀÌ´Ù. ÀÏÄ¡Çϴ ù ¹øÂ° ¼­¿­°ú ´õºÒ¾î À̵é Áß 5°¡ÁöÀÇ ¼­¿­À» °ñ¶ó¼­ °¡Àå ¿ÞÆí¿¡ º¸¿©ÁÖ´Â ¹Ú½º¸¦ üũÇÑ´Ù.
   (10) À©µµ¿ì âÀÇ Á¦ÀÏ ÇÏ´ÜÀ¸·Î À̵¿Çϸé Get selected sequences°¡ º¸ÀÏ °ÍÀÌ´Ù. À̰ÍÀ» Ŭ¸¯ÇÏ¸é »õ·Î¿î °á°ú âÀÌ ¿­¸°´Ù. ÀÌµé °¢°¢¿¡¼­ FASTA¸¦ Ŭ¸¯Çϸé FASTA formatÀÇ ¼­¿­À» º¸¿©ÁØ´Ù. ¶Ç´Â ¾ÕºÎºÐÀÇ ¹Ú½º¸¦ üũÇÑ ÈÄ Disaplay Settingd¿¡¼­ FASTA¸¦ Ŭ¸¯Çϸé ÇѲ¨¹ø¿¡ º¸¿©ÁØ´Ù.
   (11) °¢°¢ÀÇ FASTA formatÀ» ¸Þ¸ðÀå¿¡¼­ ÇϳªÀÇ txt ÆÄÀÏ·Î ÀúÀåÇÑ´Ù. À̶§ > µÚÀÇ À̸§À» 10ÀÚ À̳»ÀÇ °£·«ÇÑ À̸§À¸·Î ¹Ù²Ù´Â °ÍÀÌ ÁÁ´Ù. ´ÙÁ߹迭¿¡¼­ Çã¿ëµÇ´Â ±ÛÀÚ¼ö¿¡ Á¦ÇÑÀÌ Àֱ⠶§¹®ÀÌ´Ù. °¢°¢ÀÇ ¼­¿­¿¡ ´ëÇØ¼­´Â ¾î¶² »ý¹°Ã¼ÀÇ °ÍÀÎÁö º°µµ·Î ±â·ÏÇØµÐ´Ù.

FASTA formatÀÇ ¿¹ (´ë¼Ò¹®ÀÚ´Â »ó°ü¾øÀ½)
>Droso
MRHIILITGAGKGIGKAIALEFA------------------------
>Human
MKHILLITGAGKGIGRAIALEFA-----------------------
>Mouse
KVLAIVTGASKGFGKAIAQEIVK-----------------------

     »óµ¿¼º ºÐ¼®À» ÅëÇØ ¾ò¾îÁø ´Ü¹éÁú ¼­¿­À» °¡Áö°í GenomeNet À¥¿¡¼­ ´ÙÁ߹迭À» ½Ç½ÃÇÑ´Ù. Blast °Ë»ö¿¡¼­´Â query ¼­¿­°ú À¯»ç¼ºÀ» °¡Áø ¼­¿­ °£ÀÇ °ü°è ¸¸À» º¸¿©ÁØ´Ù. ¼ÒÀ§ ¦¹è¿­ (pairwiase alignment) ¸¸À» º¸¿©ÁÖ´Â °ÍÀÌ´Ù. ´ÙÁ߹迭À̶õ 2°³ ÀÌ»óÀÇ ´Ü¹éÁú ¶Ç´Â ÇÙ»ê ¼­¿­µéÀÇ À¯»ç¼ºÀ» ºñ±³ÇÏ¿© ¹è¿­ÇÏ´Â °ÍÀ» °¡¸®Å²´Ù. ÀÌ ¹æ¹ýÀº Blast °Ë»öÀ» ÅëÇØ ¾ò¾îÁø ¸¹Àº À¯»ç¼­¿­µéÀ» ¼­·Î ºñ±³ÇÔÀ¸·Î½á ¾î¶² ¿¬°üÀÌ ÀÖ´ÂÁö¸¦ ¾Ë ¼ö ÀÖ°Ô ÇØÁØ´Ù.  ´ÙÁ߹迭¿¡ °¡Àå ¸¹ÀÌ »ç¿ëµÇ´Â ÇÁ·Î±×·¥Àº ClustalWÀÌ´Ù. À̰ÍÀº À¥»çÀÌÆ®¸¦ ÅëÇØ ¼öÇàÇÒ ¼öµµ ÀÖ°í, ÇÁ·Î±×·¥À» ´Ù¿î¹Þ¾Æ °³ÀÎ ÄÄÇ»ÅÍ¿¡¼­µµ »ç¿ëÇÒ ¼ö ÀÖ´Ù.  ClustalW¿¡¼­´Â ¿ì¼± ¸ðµç ¼­¿­µéÀ» µÎ °³¾¿ ¹è¿­Çϴ ¦¹è¿­À» ½Ç½ÃÇϰí, ±× °á°ú¸¦ Åä´ë·Î dendrogramÀ» ±¸¼ºÇÑ´Ù. À̰ÍÀ» Åä´ë·Î ÃÖÁ¾ÀûÀ¸·Î ´ÙÁ߹迭À» ½Ç½ÃÇÏ¿© ±× °á°ú¸¦ º¸¿©ÁØ´Ù.
ÀÌ ½ÇÇè¿¡¼­´Â ÀϺ»
GenomeNet¿¡¼­ Á¦°øÇÏ´Â ClustalW¸¦ »ç¿ëÇÏ¿© ´ÙÁ߹迭À» ½Ç½ÃÇÏ´Â ¿ä·É¿¡ ´ëÇÏ¿© ¹è¿î´Ù. GenomeNet Bioinformatics Tools¿¡¼­ CLUSTALW¸¦ Ŭ¸¯ÇÏ¸é ¿øÇÏ´Â È­¸éÀÌ ¿­¸°´Ù. ÁÖ¾îÁø â¿¡ FASTA formatÀÇ ¼­¿­À» ¸ðµÎ º¹»çÇÏ¿© ºÙ¿©³ÖÀº´Ù. DNA ÀÎÁö protein ÀÎÁö¸¦ ±¸ºÐÇØ¾ßÇÏÁö¸¸ ´Ü¹éÁú ¼­¿­ÀÇ °æ¿ì ¼³Á¤°ªµéÀ» ±×´ë·Î »ç¿ëÇÏ¿©µµ ¹«¹æÇÏ´Ù. Execute multiple alignment¸¦ ´©¸£¸é  Àá½ÃÈÄ °á°ú¸¦ º¸¿©ÁØ´Ù. °¢ ¼­¿­°£ÀÇ »óµ¿¼ºÀÇ Á¤µµ¸¦ %°ªÀ¸·Î ¾Ë ¼ö ÀÖÀ¸¸ç, ¹è¿­µÈ ¹è¿­µÈ °á°ú¸¦ 4°¡Áö µî±ÞÀÇ Ç¥½Ã·Î º¸¿©ÁØ´Ù. °á°úº¸±â

     ÀÚ½ÅÀÇ PC¿¡ ClustalW¸¦ ¼³Ä¡ÇÏ¿© ¿©·¯ °¡Áö Á¶°ÇµéÀ» º¯È­½ÃŰ¸é¼­ ÇÁ·Î±×·¥À» µ¹¸± ¼öµµ ÀÖ´Ù. °ü½ÉÀÌ ÀÖ´Â »ç¶÷Àº µ¶ÀÚÀûÀ¸·Î ÇØº¼ ¼ö ÀÖµµ·Ï »ç¿ë ¿ä·ÉÀ» ±â¼úÇØ³õ¾Ò´Ù. ¶ÇÇÑ ´ÙÁ߹迭 °á°ú¸¦ Genedoc ÇÁ·Î±×·¥À» ÀÌ¿ëÇÏ¿© º¼ ¼öµµ ÀÖ´Ù. ClustalW¿Í Genedoc »ç¿ë¿ä·É

 
3. °úÁ¦¹°
(1) ´ÙÀ½°ú °°Àº Ç¥¸¦ ÀÛ¼ºÇÑ´Ù. 

¼­¿­¸í

 ´Ü¹éÁú¸í

¾Æ¹Ì³ë»ê Àܱâ¼ö

À¯»ç¼º (%)

»ý¹°Á¾

»ý¹°Á¾ÀÇ Æ¯¼º

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 (2) ´ÙÁ߹迭 °á°ú¸¦ ±×¸²À¸·Î Ä«ÇÇÇÏ¿© ÷ºÎÇÑ´Ù. (Print ScreenÀ» ÅëÇØ ¹è¿­µÈ ºÎºÐ¸¸ ±×¸²À¸·Î ÀúÀå)