FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8939, 291 aa 1>>>pF1KB8939 291 - 291 aa - 291 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.6186+/-0.000851; mu= 3.7296+/- 0.052 mean_var=257.5476+/-53.951, 0's: 0 Z-trim(116.3): 34 B-trim: 941 in 1/51 Lambda= 0.079918 statistics sampled from 16886 (16914) to 16886 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.825), E-opt: 0.2 (0.52), width: 16 Scan time: 3.000 The best scores are: opt bits E(32554) CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 ( 291) 2013 244.2 8.6e-65 CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 ( 284) 1453 179.6 2.3e-45 CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 ( 332) 976 124.7 9.3e-29 CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 ( 246) 954 122.0 4.4e-28 CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 ( 781) 869 112.7 8.7e-25 CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 ( 739) 744 98.3 1.8e-20 >>CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 (291 aa) initn: 2013 init1: 2013 opt: 2013 Z-score: 1276.7 bits: 244.2 E(32554): 8.6e-65 Smith-Waterman score: 2013; 100.0% identity (100.0% similar) in 291 aa overlap (1-291:1-291) 10 20 30 40 50 60 pF1KB8 MSMLPTFGFTQEQVACVCEVLQQGGNIERLGRFLWSLPACEHLHKNESVLKAKAVVAFHR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 MSMLPTFGFTQEQVACVCEVLQQGGNIERLGRFLWSLPACEHLHKNESVLKAKAVVAFHR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 GNFRELYKILESHQFSPHNHAKLQQLWLKAHYIEAEKLRGRPLGAVGKYRVRRKFPLPRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 GNFRELYKILESHQFSPHNHAKLQQLWLKAHYIEAEKLRGRPLGAVGKYRVRRKFPLPRS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 IWDGEETSYCFKEKSRSVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRRQRDR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 IWDGEETSYCFKEKSRSVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRRQRDR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 AAEAKERENNENSNSNSHNPLNGSGKSVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 AAEAKERENNENSNSNSHNPLNGSGKSVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGL 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 PSLHSLGHPPGPSAVPVPVPGGGGADPLQHHHGLQDSILNPMSANLVDLGS ::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 PSLHSLGHPPGPSAVPVPVPGGGGADPLQHHHGLQDSILNPMSANLVDLGS 250 260 270 280 290 >>CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 (284 aa) initn: 1400 init1: 1310 opt: 1453 Z-score: 927.8 bits: 179.6 E(32554): 2.3e-45 Smith-Waterman score: 1456; 74.7% identity (87.0% similar) in 300 aa overlap (1-291:1-284) 10 20 30 40 50 60 pF1KB8 MSMLPTFGFTQEQVACVCEVLQQGGNIERLGRFLWSLPACEHLHKNESVLKAKAVVAFHR :::::.::::::::::::::::::::.:::::::::::::.::::::::::::::::::: CCDS97 MSMLPSFGFTQEQVACVCEVLQQGGNLERLGRFLWSLPACDHLHKNESVLKAKAVVAFHR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 GNFRELYKILESHQFSPHNHAKLQQLWLKAHYIEAEKLRGRPLGAVGKYRVRRKFPLPRS :::::::::::::::::::: :::::::::::.::::::::::::::::::::::::::. CCDS97 GNFRELYKILESHQFSPHNHPKLQQLWLKAHYVEAEKLRGRPLGAVGKYRVRRKFPLPRT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 IWDGEETSYCFKEKSRSVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRRQRDR ::::::::::::::::.::::::::::::::::::::::::::::::::::::::::::: CCDS97 IWDGEETSYCFKEKSRGVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRRQRDR 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 AAEAKERENNENSNSNSH-----NPLNGSGKSVLGSSEDEKTPSGTPDHSSSSPALLLSP :::::::::.::.::.:. .::.: :: ...:::.: .: .::..: .:::. CCDS97 AAEAKERENTENNNSSSNKQNQLSPLEG-GKPLMSSSEEEFSPPQSPDQNS---VLLLQG 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 PPPGLPSLHSLGHPPGPSAVPVPVPGGGGADP---LQ-HHHGLQDSILNPMSANLVDLGS ..:: . . .:: ...: :: :.: ::::.:.:....:::::: CCDS97 ---------NMGHARSSN---YSLPGLTASQPSHGLQTHQHQLQDSLLGPLTSSLVDLGS 240 250 260 270 280 >>CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 (332 aa) initn: 973 init1: 804 opt: 976 Z-score: 629.8 bits: 124.7 E(32554): 9.3e-29 Smith-Waterman score: 976; 61.2% identity (83.6% similar) in 232 aa overlap (1-228:79-309) 10 20 30 pF1KB8 MSMLPTFGFTQEQVACVCEVLQQGGNIERL : .:::..:. :::: :::.:.. :.:::: CCDS18 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL 50 60 70 80 90 100 40 50 60 70 80 pF1KB8 GRFLWSLP----ACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQL :::::::: ::: ..:.::.:.:.:::::: ::::.::.:::.:.:. ..:.::: . CCDS18 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM 110 120 130 140 150 160 90 100 110 120 130 140 pF1KB8 WLKAHYIEAEKLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHN ::.::: ::::::::::: : :::::.::::::.:::::. ..::::..::.::::: .. CCDS18 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD 170 180 190 200 210 220 150 160 170 180 190 200 pF1KB8 PYPSPREKRELAEATGLTTTQVSNWFKNRRQRDRAAEAKERENNENSNSNSHNPLNGSGK :::.: .:::::.::::: :::.::::::::::::: ::.: ... . .. : : CCDS18 PYPNPSKKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGC 230 240 250 260 270 280 210 220 230 240 250 260 pF1KB8 SVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGLPSLHSLGHPPGPSAVPVPVPGGGGAD . ::.:. .: ...: : :: CCDS18 PTHGSAESPST-AASPTTSVSSLTERADTGTSILSVTSSDSECDV 290 300 310 320 330 >>CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 (246 aa) initn: 948 init1: 790 opt: 954 Z-score: 617.7 bits: 122.0 E(32554): 4.4e-28 Smith-Waterman score: 954; 58.1% identity (82.6% similar) in 241 aa overlap (1-234:1-238) 10 20 30 40 50 pF1KB8 MSMLPTFGFTQEQVACVCEVLQQGGNIERLGRFLWSLP----ACEHLHKNESVLKAKAVV : .:: ..:. .::: :::.:...:..::::::::::: ::: :.::::::.:.:.: CCDS97 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWSLPVAPAACEALNKNESVLRARAIV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB8 AFHRGNFRELYKILESHQFSPHNHAKLQQLWLKAHYIEAEKLRGRPLGAVGKYRVRRKFP ::: ::.::::.:::.:.:. ..::::: :::.::: ::::::::::: : :::::.::: CCDS97 AFHGGNYRELYHILENHKFTKESHAKLQALWLEAHYQEAEKLRGRPLGPVDKYRVRKKFP 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB8 LPRSIWDGEETSYCFKEKSRSVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRR :::.:::::. ..::::..: .::::: ..:::.: .:::::.::::: :::.::::::: CCDS97 LPRTIWDGEQKTHCFKERTRHLLREWYLQDPYPNPSKKRELAQATGLTPTQVGNWFKNRR 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB8 QRDRAAEAKERENNENSNSNSHNPLNGSGKS---VLGSSEDEKTPSGTPDHSSSSPALLL :::::: ::.: ... ...: : . : . ::: . .:... . .... :. . CCDS97 QRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVLGVA---TSPAASLSSKAATSAISI 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 SPPPPGLPSLHSLGHPPGPSAVPVPVPGGGGADPLQHHHGLQDSILNPMSANLVDLGS . CCDS97 TSSDSECDI 240 >>CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 (781 aa) initn: 890 init1: 863 opt: 869 Z-score: 558.5 bits: 112.7 E(32554): 8.7e-25 Smith-Waterman score: 874; 50.0% identity (70.5% similar) in 302 aa overlap (7-290:106-404) 10 20 30 pF1KB8 MSMLPTFGFTQEQVACVCEVLQQGGNIERLGRFLWS ..:. ..::::::.::::::..::.::::: CCDS97 AAGAAADQVQLHSELLGRHHHAAAAAAQTPLAFSPDHVACVCEALQQGGNLDRLARFLWS 80 90 100 110 120 130 40 50 60 70 80 90 pF1KB8 LPACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQLWLKAHYIEAE :: . :. :::.:::.:.::::.: . :::.:::::.: :: ::::: ::.: ::: CCDS97 LPQSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQQLWYKARYTEAE 140 150 160 170 180 190 100 110 120 130 140 150 pF1KB8 KLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHNPYPSPREKRE . :::::::: :::.::::::::.::::::: ::::::::..:.: : .: :::: :::. CCDS97 RARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYKQNRYPSPAEKRH 200 210 220 230 240 250 160 170 180 190 200 210 pF1KB8 LAEATGLTTTQVSNWFKNRRQRDRAAEAKERENNENSNSNSHNPLNGSGKSVLGSSEDEK ::. :::. ::::::::::::::: . ... ..: .... ...:. :. . CCDS97 LAKITGLSLTQVSNWFKNRRQRDRNPSETQSKSESDGNPSTEDE-SSKGHEDLSPHPLSS 260 270 280 290 300 310 220 230 240 250 260 270 pF1KB8 TPSGTPDHSSSS---PALLLSPPPPGLPSLHSLGHPPGPSAVPV---PVPGGGGADPLQH . .: . : :: :. . . . :: : : . : ::. :: .:.. .: CCDS97 SSDGITNLSLSSHMEPVYMQQIGNAKI-SLSSSGVLLNGSLVPASTSPVFLNGNS-FIQG 320 330 340 350 360 370 280 290 pF1KB8 HHGL----------QDSILNP--MSANLVDLGS :. : ::: ::.:.:. : CCDS97 PSGVILNGLNVGNTQAVALNPPKMSSNIVSNGISMTDILGSTSQDVKEFKVLQSSANSAT 380 390 400 410 420 430 CCDS97 TTSYSPSVPVSFPGLIPSTEVKREGIQTVASQDGGSVVTFTTPVQINQYGIVQIPNSGAN 440 450 460 470 480 490 >>CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 (739 aa) initn: 808 init1: 730 opt: 744 Z-score: 480.9 bits: 98.3 E(32554): 1.8e-20 Smith-Waterman score: 767; 44.9% identity (67.7% similar) in 316 aa overlap (5-286:81-393) 10 20 30 pF1KB8 MSMLPT-FGFTQEQVACVCEVLQQGGNIERLGRF :: . :. ::::::::.: :.:. ::.:: CCDS12 GAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRF 60 70 80 90 100 110 40 50 60 70 80 90 pF1KB8 LWSLPACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQLWLKAHYI : .:: :.:. .. ::.:.:.:::.::.. :::..:::. : .:: ::.:.:.:.: CCDS12 LGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYH 120 130 140 150 160 170 100 110 120 130 140 150 pF1KB8 EAEKLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHNPYPSPRE :::. ::: :::: :::.:.:::::..::::::: :::::.::..:. : : ::.: : CCDS12 EAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDE 180 190 200 210 220 230 160 170 180 190 200 pF1KB8 KRELAEATGLTTTQVSNWFKNRRQRDR------AAEAKERENN---ENSNSNSHNPLNGS ::.:: :::. ::::::::::::::: : .: ..: :. .: : . :. . CCDS12 KRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLERG 240 250 260 270 280 290 210 220 230 240 pF1KB8 GKSVLGSSEDEKT--------PSGTPDHSS-----------SSPALLLSPPPPGLPSLHS . : . . . . :. : :: .:::.::. : . .: . CCDS12 AAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGL-A 300 310 320 330 340 250 260 270 280 290 pF1KB8 LGHPPGPSAVPVPVPGGGGADPLQHH-HGLQDS----ILNPMSANLVDLGS ::. . : :. . ::::: : : .: ... .:.:..... CCDS12 LGE--ASSLGPLLLTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKG 350 360 370 380 390 400 CCDS12 AQVAAPGPALGEEVLGPLAQVVPGPPTAATFPLPPGPVPAVAAPQVVPLSPPPGYPTGLS 410 420 430 440 450 460 291 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 00:47:11 2016 done: Sat Nov 5 00:47:11 2016 Total Scan time: 3.000 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]