1. Smith-Waterman
¾Ë°í¸®Áò
1-1. Dynamic programming ¾Ë°í¸®Áò
Dynamic programmingÀº Àü»êÇÐÀÇ ¾Ë°í¸®Áò ÁßÀÇ ÇÑ À¯ÇüÀ¸·Î, ÀÏ´Ü °¡Àå °£´ÜÇÑ ÇØ´äÀ» ¾Ë°í ÀÖ°í, ±× ÇØ´äÀ» ÀÌ¿ëÇØ Á¡Á¡ ´õ Àüü·Î È®Àå ½ÃÄÑ ³ª°¡¸é¼ ¸¶Áö¸· ´ë´äÀ» ¾ò´Â °æ¿ì¿¡ ÀÌ¿ëµÇ´Â ¾Ë°í¸®ÁòÀÌ´Ù. Áï °¡Àå °£´ÜÇÑ s¿Í tÀÇ Ã¹ ¹øÂ° ¼¿ÀÇ ÀûÀýÇÑ ¹è¿¿¡ ´ëÇÑ ÇØ´äÀ» ½±°Ô ¾Ë ¼ö ÀÖ°í, ±× °ªÀ» ±Ù°Å·Î ÇÏ¿© ÇØ´äÀ» Á¡Á¡ È®Àå ½ÃÄÑ Àüü ¼¿ÀÇ ÀûÀýÇÑ ¹è¿À» ±¸ÇÏ´Â °ÍÀÌ´Ù.
´ÙÀ½ µÎ°³ÀÇ ¼¿·Î ¿¹¸¦ µé¾îº¸ÀÚ.
s= AGCACAGA, t=ACACACTA
¿©±â¼ s¿Í t¸¦ °¢°¢ Çà·ÄÀÇ ÃàÀ¸·Î Çϰí unit cost model(ÀÏÄ¡=0, ġȯ, »ðÀÔ, »èÁ¦=1)À» Àû¿ëÇÏ¿© °¢°¢ÀÇ Çà·ÄÀÇ Ç×µéÀ» ä¿ö³ª°¡¸é ´ÙÀ½°ú °°Àº Çà·ÄÀ» ¸¸µé ¼ö ÀÖ´Ù.
¿À¸¥ÂÊ ±×¸²Àº °Å¸® Çà·Ä (distance matrix)¿¡¼
ÃÖ¼Ò°ªÀ» ³ªÅ¸³»´Â Çà·Î¸¦ Ç¥½Ã ÇÑ °ÍÀÌ´Ù.
¼¿
s¿¡ ´ëÇÏ¿© ´ë°¢¼±Àº ÀÏÄ¡ ȤÀº
ġȯÀ», ¼öÆò¼±Àº »ðÀÔÀ»,
¼öÁ÷¼±À» »èÁ¦¸¦ ³ªÅ¸³½´Ù.
´ë°¢¼±¿¡ ÀÇÇØ Ç¥½ÃµÈ Çà·Î¿¡
ÀÇÇØ s¿Í t¸¦ ¹è¿ÇÏ¸é ´ÙÀ½°ú °°´Ù.
s=AGCACAC-A
t=A-CACACTA
¶§¶§·Î ÀûÀýÇÑ ¹è¿À» À§ÇÑ ÃÖ¼ÒÇÑÀÇ Çà·Î´Â ´Ü ÇÑ °³°¡ ¾Æ´Ï°í ¿©·¯ °³°¡ µÉ ¼ö ÀÖ´Ù.
Dynamic ProgrammingÀ» ÀÌ¿ëÇÏ¿© ÀÓÀÇÀÇ ¼¿°ú µ¥ÀÌÅÍ º£À̽º¿¡ ÀúÀåµÈ ¼¿µéÀ» ºñ±³ÇÏ´Â ¹æ¹ýÀ» Smith-Waterman ¾Ë°í¸®ÁòÀ̶ó ÇÑ´Ù. ÇöÀç ÀÌ ¾Ë°í¸®ÁòÀ» ÀÌ¿ëÇÏ¿© À¯»ç¼º °Ë»ö ¼ºñ½º¸¦ Á¦°øÇÏ´Â °÷Àº EBIÀÇ BLITZ¿Í Bic-sw Database Searches°¡ ÀÖ°í Weizmann Institute of ScienceÀÇ BIOCCELERATOR´Â ÀüÀÚ ¿ìÆíÀ» ÅëÇØ °á°ú¸¦ Á¦°øÇÏ´Â ¼ºñ½º¸¦ ÇÑ´Ù.
1-2. Bic-sw Database Searches
Smith-Waterman ¾Ë°í¸®ÁòÀ» ÀÌ¿ëÇÑ °Ë»ö ÇÁ·Î±×·¥À¸·Î EBI¿¡¼ Á¦°øÇÏ´Â Bic-sw Database Searches°¡ ÀÖ´Ù. ¼ºñ½º ÆäÀÌÁö (http://www2.ebi.ac.uk/Bic-sw/)¿¡ °¡¼ ¼¿À» ÀÔ·ÂÇϸé WEB ȤÀº e-mailÀ» ÅëÇØ °Ë»ö °á°ú¸¦ º¸³»ÁØ´Ù. Bic-sw´Â interactive access¸¦ ¿ä±¸Çصµ ÀÏÀÌ ¹Ù»Ú¸é ÀÚµ¿ÀûÀ¸·Î ÀüÀÚ ¿ìÆíÀ¸·Î º¸³»Áֱ⠶§¹®¿¡ access mode¿¡ °ü°è¾øÀÌ ¹Ýµå½Ã ÀüÀÚ ¿ìÆí ÁÖ¼Ò¸¦ ±âÀÔÇØ¾ß ÇÑ´Ù.
°Ë»ö ÆÄ¶ó¹ÌÅÍ´Â ´ÙÀ½°ú °°´Ù.
YOUR
EMAIL : °Ë»ö °á°ú¸¦ ¹Þ±â À§ÇÑ
ÀüÀÚ ¿ìÆí ÁÖ¼Ò¸¦ ÀÔ·ÂÇÏ´Â °÷
SEARCH TITLE : °Ë»ö Á¦¸ñÀ» Àû´Â °÷
RESULT: °á°ú¸¦ ¹Ù·Î º¼ °ÍÀΰ¡ ÀüÀÚ ¿ìÆíÀ» ÅëÇØ ¹ÞÀ» °ÍÀΰ¡¸¦ Á¤ÇÏ´Â
°÷
DATABASE : Bic-sw´Â ´ÙÀ½ÀÇ µ¥ÀÌÅÍ º£À̽º¸¦ Á¦°øÇÑ´Ù.
swall |
non-redundant protein database |
Swissprot |
SWISS-PROT protein database |
Swnew |
updated to SWISS-PROT |
Trembl |
TREMBL ( Translated EMBL) |
Tremblnew |
TREMBLNEW (Translated EMBL updates) |
Swall |
SWISS-PROT + TREMBL + SWISSNEW + TREMBLENEW |
GAPWEIGHT : ¹è¿À» ÇÒ ¶§ ù
¹øÂ° »ý±â´Â gap¿¡ ´ëÇÑ °¨Á¡À» Á¤ÇÏ´Â °÷À¸·Î ±âº»°ªÀº 15ÀÌ´Ù.
LENWEIGHT : ¹è¿À» ÇÒ ¶§ ¿¬¼ÓÀûÀ¸·Î
»ý±â´Â gap¿¡ ´ëÇÑ °¨Á¡À» Á¤ÇÏ´Â °÷ÀÌ´Ù. ±âº»°ªÀº 1ÀÌ´Ù.
QUERYGAP : ÀÔ·ÂÇÑ ¼¿¿¡¼
ù ¹øÂ° »ý±â´Â gap¿¡ ´ëÇÑ °¨Á¡À» Á¤ÇÒ ¼ö ÀÖ´Ù.
QUERYLEN : ÀÔ·ÂÇÑ ¼¿¿¡¼
¿¬¼ÓÀûÀ¸·Î »ý±â´Â gap¿¡ ´ëÇÑ °¨Á¡À» Á¤ÇÒ ¼ö ÀÖ´Ù.
MATRIX : ÃøÁ¤ Çà·ÄÀ» Á¤ÇÒ
¼ö ÀÖ´Ù. ±âº»°ªÀº BLOSUM62ÀÌ´Ù.
SHOW NUMBER OF ALIGNMENTS : °á°ú
Ãâ·ÂÆÄÀÏ¿¡¼ ¹è¿Çؼ º¸¿©ÁÖ´Â ¼¿µéÀÇ ¼ö¸¦ Á¤ÇÒ ¼ö ÀÖ´Ù.
SHOW NUMBER OF SCORES : °á°ú
Ãâ·Â ÆÄÀÏ¿¡¼ »óÀ§ ¸î °³±îÁöÀÇ score¸¦ º¸¿©ÁÖ´Â °¡¸¦ Á¤ÇÒ ¼ö ÀÖ´Ù.
LOWEST Z-SCORE MIN LIST TO REPORT : z-score°¡ ÁöÁ¤ÇÑ °ª ÀÌ»óÀÌ µÇ´Â
list¸¸ º¸¿©ÁÖ°Ô Á¤ÇÒ ¼ö ÀÖ´Ù.
SHOW MINIMUM QUALITY SCORE : Ãâ·Â
ÆÄÀÏ¿¡ ¾²¿©Áö´Â °á°úÀÇ minimum quality¸¦ Á¤ÇÒ ¼ö ÀÖ´Ù.
NORMALISATION TYPE : Z score¸¦
±æÀÌ¿¡ µû¶ó normalization ÇÏ´Â ¹æ¹ýÀ» Á¤ÇÒ ¼ö ÀÖ´Ù. LOG´Â logarithmic normalizationÀ» ÀǹÌÇϰí z-score¿Í
E-value¸¦ ¾Ë°í ½ÍÀ¸¸é stat¸¦
¼±ÅÃÇÑ´Ù. ±âº»°ªÀº normalizationÀ» ÇÏÁö ¾Ê´Â °ÍÀÌ´Ù.
DO AVERAGING OF SCORES : Sequence composition¿¡ µû¸¥ quality score¸¦ Á¶Á¤ÇÒ ¼ö ÀÖ´Â °÷ÀÌ´Ù.
ORDER OUTPUT BY OVERLAPS QUALITY : overlap optionÀ» ÁÖ¸é °á°ú¿¡¼
alignmentÇÒ ¶§ overlapÀÌ
»ý±â´Â ºÎºÐ¿¡ °¨Á¡À» ÁÖ°Ô µÈ´Ù.