2. »óµ¿¼º °Ë»ö (homology search)
1.
½ÇÇè¸ñÇ¥
Áö³
¹Ý¼¼±â µ¿¾È ¸¹Àº ´Ü¹éÁú°ú À¯ÀüÀÚ ¼¿¿¡ ´ëÇÑ Á¤º¸°¡ ÃàÀûµÇ¾ú´Ù. ƯÈ÷ ÃÖ±Ù 10¿©³â°£
ÁýÁßÀûÀ¸·Î ÀÌ·ç¾îÁø °Ô³ðºÐ¼®À» ÅëÇØ »ç¶÷À» ºñ·ÔÇÑ ¸¹Àº »ý¹°Ã¼µéÀÇ À¯ÀüÁ¤º¸°¡
¹àÇôÁ³´Ù. ÀÌ¿Í °°ÀÌ ±âÁ¸¿¡ ¾Ë·ÁÁø À¯ÀüÀÚ³ª ´Ü¹éÁú ¼¿Á¤º¸ÀÇ µ¥ÀÌÅͺ£À̽º¿¡¼
À¯»çÇÑ ¼¿À» °Ë»öÇÏ´Â ÀÛ¾÷À» »óµ¿¼º °Ë»öÀ̶ó°í ÇÑ´Ù. ÀÌ·¯ÇÑ °Ë»öÀ» ÅëÇØ ¾ò¾îÁö´Â
ÀÌ¹Ì È®ÀÎµÈ ¼¿µé°úÀÇ À¯»ç¼ºÀº ´Ù¾çÇÑ Á¤º¸¸¦ Á¦°øÇÑ´Ù. »óµ¿¼º °Ë»öÀº À¯»ç¼º °Ë»ö (similarity search)À̶ó´Â
¸»°ú È¥¿ëÇÏ¿© »ç¿ëÇϱ⵵ ÇÑ´Ù. ÀϹÝÀûÀ¸·Î
DNAº¸´Ù´Â ´Ü¹éÁú ¼¿¿¡ ´ëÇÑ »óµ¿¼º ºÐ¼®¿¡ À¯¿ëÇÏ°Ô ÀÌ¿ëµÈ´Ù.
ÀÌ ½ÇÇè¿¡¼´Â Áö³ ÁÖ¿¡ ¾ò¾îÁø ´Ü¹éÁú ¼¿À» °¡Áö°í »óµ¿¼º °Ë»öÀ» ½Ç½ÃÇÏ¿© ¾î¶² ´Ü¹éÁúÀÎÁö¸¦ È®ÀÎÇÏ´Â °úÁ¤¿¡ ´ëÇÏ¿© ¹è¿î´Ù. ÀÌ ½ÇÇè¿¡¼´Â ÀÌ¹Ì ¾Ë·ÁÁø ¼¿ÀÌ ÁÖ¾îÁ³±â ¶§¹®¿¡ ´ç¿¬È÷ ÀÌ¿Í µ¿ÀÏÇÑ ¼¿ÀÇ ´Ü¹éÁúÀÌ Ã£¾ÆÁüÀ¸·Î½á ¾î¶² ´Ü¹éÁúÀÇ ¼¿ÀÎÁö ½±°Ô ¾Ë¾Æ³¾ ¼ö ÀÖ´Ù. ¸¸¾à Áö±Ý±îÁö ¾Ë·ÁÁöÁö ¾ÊÀº »õ·Î¿î ´Ü¹éÁúÀÇ °æ¿ì¶óµµ ±âÁ¸¿¡ ¾Ë·ÁÁø ´Ü¹éÁú ¼¿°úÀÇ À¯»ç¼ºÀ» ÅëÇØ ±× ´Ü¹éÁúÀÇ ±â´ÉÀ» À¯ÃßÇÒ ¼ö ÀÖ´Ù. ´Ü¹éÁúÀÇ ÀÏÂ÷±¸Á¶´Â »ïÂ÷¿ø±¸Á¶¸¦ °áÁ¤Çϱ⠶§¹®¿¡ °°Àº Ȱ¼º ¶Ç´Â ±â´ÉÀ» °¡Áö´Â ´Ü¹éÁúµéÀº ¼¿»óÀÇ À¯»ç¼ºÀ» °¡Áø´Ù. ¼¿»óÀÇ À¯»ç¼ºÀ̶õ Àüü ¼¿ÀÇ ±æÀ̰¡ ºñ½ÁÇÏ°í ±× ¾Æ¹Ì³ë»ê ÀܱâµéÀÇ À¯»ç¼ºÀÌ 10% ÀÌ»óÀÎ °æ¿ì¿¡ ÇØ´çÇϸç, ÀÌ·¯ÇÑ ´Ü¹éÁúµéÀº »óµ¿ ´Ü¹éÁú (homologous protein ¶Ç´Â homolog)À̶ó ºÒ¸°´Ù.
2.
½ÇÇè³»¿ë
Áö³ ½Ã°£¿¡ ¾ò¾îÁø ´Ü¹éÁú ¼¿À» °¡Áö°í
»óµ¿¼º ºÐ¼®°ú ´ÙÁß¹è¿À» ½Ç½ÃÇÑ´Ù.
»óµ¿¼º ºÐ¼®¿¡¼´Â NCBI À¥¿¡¼ Blast search ¿ä·ÉÀ» ¹è¿î´Ù. µ¥ÀÌÅͺ£À̽º¸¦
°Ë»öÇϴµ¥ ¾î¶² ÇÁ·Î±×·¥À» »ç¿ëÇÒ °ÍÀΰ¡¿¡ ´ëÇØ¼´Â ³íÀïÀÇ ¿©Áö°¡ ¸¹À¸¸ç »õ·Ó°Ô
°³¹ßµÈ ÇÁ·Î±×·¥µéÀÌ °è¼Ó ³ª¿À°í Àֱ⠶§¹®¿¡ ¼±ÅÃÇϴµ¥ ¾î·Á¿òÀÌ ¸¹´Ù. »ç¿ëÇÒ
ÇÁ·Î±×·¥À» ¼±ÅÃÇÑ ÈÄ¿¡µµ ÇÁ·Î±×·¥ÀÇ ÆÄ¶ó¹ÌÅÍ °ªµéÀ» ´Ù½Ã ¼±ÅÃÇØ¾ß ÇÏ°í °Ë»ö
°á°úµµ ÇØ¼®ÇÒ ¼ö ÀÖ¾î¾ß ÇÑ´Ù. ÀÌ·¯ÇÑ ¹®Á¦µéÀ» ±Øº¹Çϱâ À§Çؼ »óµ¿¼º
°Ë»öÀÇ ÇÁ·Î±×·¥ ¿ø¸®¿Í Á¾·ùÀÇ ±âº»ÀûÀÎ Áö½ÄÀ» °¡Áö´Â °ÍÀÌ ÇÊ¿äÇÏÁö¸¸ ¿©±â¼´Â
NCBI¿¡¼ Á¦°øÇÏ´Â Blast search¸¦ Áß½ÉÀ¸·Î ±âº»ÀûÀÎ ³»¿ë¸¸ ´Ù·çµµ·Ï ÇϰڴÙ. (º¸´Ù ÀÚ¼¼È÷ ¾Ë°í
½ÍÀº »ç¶÷Àº Ãß°¡ÀڷḦ Àо±â ¹Ù¶õ´Ù).
Blast search: Sequence alignments
provide a powerful way to compare novel sequences with previously characterized
genes. Both functional and evolutionary information can be inferred from well
designed queries and alignments. BLAST 2.0, (Basic Local Alignment Search Tool), provides
a method for rapid searching of nucleotide and protein databases. Since the
BLAST algorithm detects local as well as global alignments, regions of similarity
embedded in otherwise unrelated proteins can be detected. Both types of similarity
may provide important clues to the function of uncharacterized proteins.
°Ë»ö ¿ä·É
(1)
»óµ¿¼º °Ë»ö ½Ã query ¼¿·Î
»ç¿ëÇÒ ¼ö ÀÖ´Â °ÍÀº ¿°±â³ª ¾Æ¹Ì³ë»ê ¼¿ÀÌ´Ù.
Áï, DNA³ª ´Ü¹éÁú ¼¿ÀÌ´Ù. Query ¼¿Àº ¹Ýµå½Ã Áö³ ½Ã°£¿¡ º¸¿©ÁØ Fasta formÀ¸·Î ÁÖ¾îÁ®¾ß¸¸ ÇÑ´Ù.
(2) DNA³ª ´Ü¹éÁú ¼¿Àº °¢±â
´Ù¸¥ ¸ñÀûÀ¸·Î »ç¿ëµÈ´Ù. »óµ¿¼º °Ë»ö¿¡ ÁÖ·Î »ç¿ëµÇ´Â °ÍÀº ´Ü¹éÁú ¼¿À̰í, DNA
¼¿Àº µ¿ÀÏÇÑ ¼¿À̳ª ¹ÐÁ¢ÇÏ°Ô ¿¬°üµÈ °ÍµéÀ» ã´Âµ¥ À¯¿ëÇÏ´Ù.
(3) »ç¿ëµÇ´Â
µ¥ÀÌÅͺ£À̽º¿¡´Â ¿©·¯ °¡Áö°¡ ÀÖ°í °è¼Ó Áõ°¡ÇÑ´Ù. ´Ù¾çÇÑ ºÐ¼®À» Çϱâ À§Çؼ´Â
À̵鿡 ´ëÇÏ¿© ¾Ë°í ÀÖ¾î¾ß ÇÏÁö¸¸ ±âº»ÀûÀ¸·Î´Â nucleotide database ÀÎ nr°ú protein
databaseÀÎ pdb ¶Ç´Â swissprot ÀÌ ÀÌ¿ëµÈ´Ù. ¾î¶² database¸¦ ¼±ÅÃÇÏ´À³Ä¿¡
µû¶ó ¾ò¾îÁö´Â ÀÚ·áÀÇ ¾ç°ú ±×¿¡ µû¸¥ ¼Ò¿ä½Ã°£ÀÌ ´Þ¶óÁø´Ù.
±âº»ÀûÀÎ »ç¿ë¿øÄ¢Àº ´ÙÀ½ Ç¥¿Í °°´Ù.
Ç¥ 1. BLAST¿¡¼ °¡´ÉÇÑ °Ë»öµéa |
||||
program |
query |
database |
comparison |
common use |
blastn |
DNA |
DNA |
DNA level |
Seek identical DNA sequences and splicing patterns |
blastp |
protein |
protein |
protein level |
Find homologous proteins |
blastx |
DNA |
protein |
protein level |
Analyze new DNA to find genes and seek homologous proteins |
tblastn |
protein |
DNA |
protein level |
Search for genes in unannotated DNA |
tblastx |
DNA |
DNA |
protein level |
Discover gene structure |
a FASTA¿¡¼µµ À¯»çÇÑ °Ë»öÀÌ ÀÌ·ç¾îÁø´Ù. |
(4) NCBI¿¡¼ Á¦°øÇÏ´Â Blast search¿¡¼´Â ±âº»ÀûÀÎ ¼³Á¤°ªÀÌ »ç¿ëµÇÁö¸¸, ¿©·¯ °¡Áö º¯¼öµéÀ» ÀÓÀÇ·Î ÀÔ·ÂÇÒ ¼öµµ ÀÖ´Ù. ´Ù¸¸ ÀԷ°ª¿¡ ´ëÇÑ ¿øÄ¢Àº ¾øÀ¸¸ç, ½ÃÇàÂø¿À¸¦ ÅëÇØ º¸´Ù À¯¿ëÇÑ °á°ú¸¦ ¾òÀ» ¼öµµ ÀÖ´Ù. BlastÀÇ »ç¿ë¿ä·ÉÀº NCBI À¥¿¡¼µµ ¹è¿ï ¼ö ÀÖ´Ù; BLAST Tutorial. ¶ÇÇÑ ±âº»ÀûÀÎ Àǹ®»çÇ׿¡ ´ëÇØ¼´Â º°µµÀÇ ¼³¸íµµ ÁÖ¾îÁ® ÀÖ´Ù: Frequently asked questions. ¸î°¡Áö ±âº»ÀûÀÎ Á¡¿¡ ´ëÇØ¼´Â Ãß°¡ÀÚ·á2 ¸¦ Àо±â ¹Ù¶õ´Ù.
°Ë»ö°úÁ¤:
NCBI¿¡¼ÀÇ °Ë»ö¿ä·ÉÀ» ´Ü°èº°·Î ±â¼úÇÏ¿´´Ù.
(1) ¿À¸¥Æí
â¿¡¼ BLAST¸¦ Ŭ¸¯ÇÑ´Ù.
(2) Basic BLAST ÇÏ´Ü¿¡ ÀÖ´Â protein
blast¸¦ Ŭ¸¯ÇÑ´Ù.
(3) Enter Query Sequence â¿¡ Áö³ ½Ã°£¿¡
¾ò¾îÁø ´Ü¹éÁú ¼¿À» Ä«ÇÇÇÏ¿© ³Ö´Â´Ù.
(4) Choose Search
Set âÀÇ Database¿¡ Non-redundant protein sequence (nr)ÀÌ º¸ÀÏ °ÍÀÌ´Ù.
À̰ÍÀ» ´Ù¸¥ °ÍÀ¸·Î ¹Ù²Ü ¼öµµ ÀÖÁö¸¸ ÁÖ¾îÁø´ë·Î »ç¿ëÇÑ´Ù.
(5)
ÇÏ´Ü¿¡ BLAST¸¦ Ŭ¸¯ÇÑ´Ù.
(6) Àá½Ã ÈÄ Ã¢ÀÌ ¹Ù²î¸é¼ °á°ú
(Graphic Summary, Descriptions, Alignments)¸¦ º¸¿©ÁØ´Ù.
(7)
Descriptions¿¡¼ ù ¹øÂ° ¼¿¿¡ ÁÖ¸ñÇ϶ó. E value°¡ 0.0À̶ó¸é µ¿ÀÏÇÑ ¼¿À»
ÀǹÌÇÑ´Ù. (0ÀÇ °ªÀº ¹«ÀÛÀ§ÀûÀ¸·Î ã¾ÆÁú °¡´É¼ºÀÌ ¾øÀ½À» ÀǹÌÇÑ´Ù)
(8)
´õ ¾Æ·¡·Î ³»·Á°¡¸é ã¾ÆÁø ¼¿¿¡ ´ëÇÑ Á¤º¸¿Í ´õºÒ¾î ÀÔ·ÂÇÑ ¼¿ (Query)°ú ã¾ÆÁø
¼¿ (Sbjct)ÀÇ ¹è¿°á°ú¸¦ º¸¿©ÁØ´Ù. 100% ÀÏÄ¡ÇÏ´Â ¼¿ÀÎÁö È®ÀÎÇϰí, ÀÌ ¼¿ÀÌ
¾î¶² »ý¹°Ã¼ÀÇ ¾î¶² ´Ü¹éÁú¿¡ ´ëÇÑ °ÍÀÎÁö ±â·ÏÇÑ´Ù.
(9) ¾Æ·¡·Î
³»·Á°¥¼ö·Ï À¯»ç¼ºÀÌ ¶³¾îÁö´Â ´Ü¹éÁú ¼¿µéÀ» º¸¿©ÁÙ °ÍÀÌ´Ù. ÀÏÄ¡Çϴ ù ¹øÂ°
¼¿°ú ´õºÒ¾î À̵é Áß 5°¡ÁöÀÇ ¼¿À» °ñ¶ó¼ °¡Àå ¿ÞÆí¿¡ º¸¿©ÁÖ´Â ¹Ú½º¸¦ üũÇÑ´Ù.
(10) À©µµ¿ì âÀÇ Á¦ÀÏ ÇÏ´ÜÀ¸·Î À̵¿Çϸé Get selected
sequences°¡ º¸ÀÏ °ÍÀÌ´Ù. À̰ÍÀ» Ŭ¸¯ÇÏ¸é »õ·Î¿î °á°ú âÀÌ ¿¸°´Ù. ÀÌµé °¢°¢¿¡¼
FASTA¸¦ Ŭ¸¯Çϸé FASTA formatÀÇ ¼¿À» º¸¿©ÁØ´Ù. ¶Ç´Â ¾ÕºÎºÐÀÇ ¹Ú½º¸¦ üũÇÑ
ÈÄ Disaplay Settingd¿¡¼ FASTA¸¦ Ŭ¸¯Çϸé ÇѲ¨¹ø¿¡ º¸¿©ÁØ´Ù.
(11)
°¢°¢ÀÇ FASTA formatÀ» ¸Þ¸ðÀå¿¡¼ ÇϳªÀÇ txt ÆÄÀÏ·Î ÀúÀåÇÑ´Ù. À̶§ >
µÚÀÇ À̸§À» 10ÀÚ À̳»ÀÇ °£·«ÇÑ À̸§À¸·Î ¹Ù²Ù´Â °ÍÀÌ ÁÁ´Ù. ´ÙÁ߹迿¡¼ Çã¿ëµÇ´Â
±ÛÀÚ¼ö¿¡ Á¦ÇÑÀÌ Àֱ⠶§¹®ÀÌ´Ù. °¢°¢ÀÇ ¼¿¿¡ ´ëÇØ¼´Â ¾î¶² »ý¹°Ã¼ÀÇ °ÍÀÎÁö º°µµ·Î
±â·ÏÇØµÐ´Ù.
FASTA
formatÀÇ ¿¹ (´ë¼Ò¹®ÀÚ´Â »ó°ü¾øÀ½)
>Droso
MRHIILITGAGKGIGKAIALEFA------------------------
>Human
MKHILLITGAGKGIGRAIALEFA-----------------------
>Mouse
KVLAIVTGASKGFGKAIAQEIVK-----------------------
»óµ¿¼º ºÐ¼®À» ÅëÇØ ¾ò¾îÁø ´Ü¹éÁú ¼¿À» °¡Áö°í GenomeNet À¥¿¡¼ ´ÙÁß¹è¿À» ½Ç½ÃÇÑ´Ù.
Blast °Ë»ö¿¡¼´Â query ¼¿°ú À¯»ç¼ºÀ» °¡Áø ¼¿ °£ÀÇ °ü°è ¸¸À» º¸¿©ÁØ´Ù.
¼ÒÀ§ ¦¹è¿ (pairwiase alignment) ¸¸À» º¸¿©ÁÖ´Â °ÍÀÌ´Ù. ´ÙÁß¹è¿À̶õ 2°³ ÀÌ»óÀÇ
´Ü¹éÁú ¶Ç´Â ÇÙ»ê ¼¿µéÀÇ À¯»ç¼ºÀ» ºñ±³ÇÏ¿© ¹è¿ÇÏ´Â °ÍÀ» °¡¸®Å²´Ù. ÀÌ ¹æ¹ýÀº
Blast °Ë»öÀ» ÅëÇØ ¾ò¾îÁø ¸¹Àº À¯»ç¼¿µéÀ» ¼·Î ºñ±³ÇÔÀ¸·Î½á ¾î¶² ¿¬°üÀÌ ÀÖ´ÂÁö¸¦
¾Ë ¼ö ÀÖ°Ô ÇØÁØ´Ù. ´ÙÁ߹迿¡ °¡Àå ¸¹ÀÌ »ç¿ëµÇ´Â ÇÁ·Î±×·¥Àº ClustalWÀÌ´Ù. À̰ÍÀº À¥»çÀÌÆ®¸¦
ÅëÇØ ¼öÇàÇÒ ¼öµµ ÀÖ°í, ÇÁ·Î±×·¥À» ´Ù¿î¹Þ¾Æ °³ÀÎ ÄÄÇ»ÅÍ¿¡¼µµ »ç¿ëÇÒ ¼ö ÀÖ´Ù.
ClustalW¿¡¼´Â ¿ì¼± ¸ðµç ¼¿µéÀ» µÎ °³¾¿ ¹è¿Çϴ ¦¹è¿À» ½Ç½ÃÇϰí,
±× °á°ú¸¦ Åä´ë·Î dendrogramÀ» ±¸¼ºÇÑ´Ù. À̰ÍÀ» Åä´ë·Î ÃÖÁ¾ÀûÀ¸·Î ´ÙÁß¹è¿À»
½Ç½ÃÇÏ¿© ±× °á°ú¸¦ º¸¿©ÁØ´Ù.
ÀÌ ½ÇÇè¿¡¼´Â ÀϺ» GenomeNet¿¡¼
Á¦°øÇÏ´Â ClustalW¸¦ »ç¿ëÇÏ¿© ´ÙÁß¹è¿À» ½Ç½ÃÇÏ´Â ¿ä·É¿¡ ´ëÇÏ¿© ¹è¿î´Ù. GenomeNet
Bioinformatics Tools¿¡¼ CLUSTALW¸¦ Ŭ¸¯ÇÏ¸é ¿øÇϴ ȸéÀÌ ¿¸°´Ù. ÁÖ¾îÁø â¿¡ FASTA
formatÀÇ ¼¿À» ¸ðµÎ º¹»çÇÏ¿© ºÙ¿©³ÖÀº´Ù. DNA ÀÎÁö protein ÀÎÁö¸¦ ±¸ºÐÇØ¾ßÇÏÁö¸¸
´Ü¹éÁú ¼¿ÀÇ °æ¿ì ¼³Á¤°ªµéÀ» ±×´ë·Î »ç¿ëÇÏ¿©µµ ¹«¹æÇÏ´Ù. Execute multiple alignment¸¦ ´©¸£¸é
Àá½ÃÈÄ °á°ú¸¦ º¸¿©ÁØ´Ù. °¢ ¼¿°£ÀÇ »óµ¿¼ºÀÇ Á¤µµ¸¦
%°ªÀ¸·Î ¾Ë ¼ö ÀÖÀ¸¸ç, ¹è¿µÈ ¹è¿µÈ °á°ú¸¦ 4°¡Áö µî±ÞÀÇ Ç¥½Ã·Î º¸¿©ÁØ´Ù. °á°úº¸±â
ÀÚ½ÅÀÇ PC¿¡ ClustalW¸¦ ¼³Ä¡ÇÏ¿© ¿©·¯ °¡Áö Á¶°ÇµéÀ» º¯È½ÃŰ¸é¼ ÇÁ·Î±×·¥À» µ¹¸± ¼öµµ ÀÖ´Ù. °ü½ÉÀÌ ÀÖ´Â »ç¶÷Àº µ¶ÀÚÀûÀ¸·Î ÇØº¼ ¼ö ÀÖµµ·Ï »ç¿ë ¿ä·ÉÀ» ±â¼úÇØ³õ¾Ò´Ù. ¶ÇÇÑ ´ÙÁß¹è¿ °á°ú¸¦ Genedoc ÇÁ·Î±×·¥À» ÀÌ¿ëÇÏ¿© º¼ ¼öµµ ÀÖ´Ù. ClustalW¿Í Genedoc »ç¿ë¿ä·É
3. °úÁ¦¹°
(1) ´ÙÀ½°ú °°Àº Ç¥¸¦ ÀÛ¼ºÇÑ´Ù.
¼¿¸í |
´Ü¹éÁú¸í |
¾Æ¹Ì³ë»ê Àܱâ¼ö |
À¯»ç¼º (%) |
»ý¹°Á¾ |
»ý¹°Á¾ÀÇ Æ¯¼º |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(2) ´ÙÁß¹è¿ °á°ú¸¦ ±×¸²À¸·Î Ä«ÇÇÇÏ¿© ÷ºÎÇÑ´Ù. (Print ScreenÀ» ÅëÇØ ¹è¿µÈ ºÎºÐ¸¸ ±×¸²À¸·Î ÀúÀå)