FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9704, 332 aa 1>>>pF1KB9704 332 - 332 aa - 332 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.2803+/-0.00114; mu= 11.5602+/- 0.069 mean_var=334.4832+/-69.877, 0's: 0 Z-trim(113.4): 58 B-trim: 0 in 0/52 Lambda= 0.070127 statistics sampled from 13991 (14039) to 13991 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.759), E-opt: 0.2 (0.431), width: 16 Scan time: 2.580 The best scores are: opt bits E(32554) CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 ( 332) 2259 241.9 5.4e-64 CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 ( 246) 1354 150.1 1.7e-36 CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 ( 291) 965 110.9 1.3e-24 CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 ( 284) 934 107.7 1.1e-23 CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 ( 781) 740 88.8 1.5e-17 CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 ( 739) 729 87.7 3.2e-17 >>CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 (332 aa) initn: 2259 init1: 2259 opt: 2259 Z-score: 1262.3 bits: 241.9 E(32554): 5.4e-64 Smith-Waterman score: 2259; 99.7% identity (99.7% similar) in 332 aa overlap (1-332:1-332) 10 20 30 40 50 60 pF1KB9 MVFRSPLDLYSSHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 MVFRSPLDLYSSHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 GAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 GAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 ACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 ACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 RGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKCELA :::::::::::::::::::::::::::::::::::::::::::::::::::::::: ::: CCDS18 RGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKRELA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 QATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGCPTHGSAESPSTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 QATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGCPTHGSAESPSTA 250 260 270 280 290 300 310 320 330 pF1KB9 ASPTTSVSSLTERADTGTSILSVTSSDSECDV :::::::::::::::::::::::::::::::: CCDS18 ASPTTSVSSLTERADTGTSILSVTSSDSECDV 310 320 330 >>CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 (246 aa) initn: 1375 init1: 1268 opt: 1354 Z-score: 768.7 bits: 150.1 E(32554): 1.7e-36 Smith-Waterman score: 1354; 78.3% identity (90.9% similar) in 254 aa overlap (79-332:1-246) 50 60 70 80 90 100 pF1KB9 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL ::::: :::::.:::.:::::::.::.::: CCDS97 MFQLPILNFSPQQVAGVCETLEESGDVERL 10 20 30 110 120 130 140 150 160 pF1KB9 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM :::::::::::.::::.::.::.:::::.:::: ::.:.:::::::::::::::.::::. CCDS97 GRFLWSLPVAPAACEALNKNESVLRARAIVAFHGGNYRELYHILENHKFTKESHAKLQAL 40 50 60 70 80 90 170 180 190 200 210 220 pF1KB9 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD :::::::::::::::::::::::::::::::::::::::::::::::::: ::::::::: CCDS97 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRHLLREWYLQD 100 110 120 130 140 150 230 240 250 260 270 280 pF1KB9 PYPNPSKKCELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGC :::::::: ::::::::::::::::::::::::::::::::::.:... .. :.: : CCDS97 PYPNPSKKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQQQVLSQGSGRALRAEG- 160 170 180 190 200 290 300 310 320 330 pF1KB9 PTHGSAESPSTAASPTTSVSSLTERADTGTSILSVTSSDSECDV :. : ..:.::..:.:: ..:: .:.::::::::. CCDS97 --DGTPEVLGVATSPAASLSS-----KAATSAISITSSDSECDI 210 220 230 240 >>CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 (291 aa) initn: 962 init1: 793 opt: 965 Z-score: 555.3 bits: 110.9 E(32554): 1.3e-24 Smith-Waterman score: 965; 60.8% identity (83.2% similar) in 232 aa overlap (79-309:1-228) 50 60 70 80 90 100 pF1KB9 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL : .:::..:. :::: :::.:.. :.:::: CCDS18 MSMLPTFGFTQEQVACVCEVLQQGGNIERL 10 20 30 110 120 130 140 150 160 pF1KB9 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM :::::::: ::: ..:.::.:.:.:::::: ::::.::.:::.:.:. ..:.::: . CCDS18 GRFLWSLP----ACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQL 40 50 60 70 80 170 180 190 200 210 220 pF1KB9 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD ::.::: ::::::::::: : :::::.::::::.:::::. ..::::..::.::::: .. CCDS18 WLKAHYIEAEKLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHN 90 100 110 120 130 140 230 240 250 260 270 280 pF1KB9 PYPNPSKKCELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGC :::.: .: :::.::::: :::.::::::::::::: ::.: ... . .. : : CCDS18 PYPSPREKRELAEATGLTTTQVSNWFKNRRQRDRAAEAKERENNENSNSNSHNPLNGSGK 150 160 170 180 190 200 290 300 310 320 330 pF1KB9 PTHGSAESPST-AASPTTSVSSLTERADTGTSILSVTSSDSECDV . ::.:. .: ...: : :: CCDS18 SVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGLPSLHSLGHPPGPSAVPVPVPGGGGAD 210 220 230 240 250 260 >>CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 (284 aa) initn: 926 init1: 763 opt: 934 Z-score: 538.4 bits: 107.7 E(32554): 1.1e-23 Smith-Waterman score: 934; 57.8% identity (79.1% similar) in 244 aa overlap (79-317:1-239) 50 60 70 80 90 100 pF1KB9 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL : .::...:. :::: :::.:.. :..::: CCDS97 MSMLPSFGFTQEQVACVCEVLQQGGNLERL 10 20 30 110 120 130 140 150 160 pF1KB9 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM :::::::: ::. ..:.::.:.:.:::::: ::::.::.:::.:.:. ..: ::: . CCDS97 GRFLWSLP----ACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQL 40 50 60 70 80 170 180 190 200 210 220 pF1KB9 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD ::.::: ::::::::::: : :::::.::::::::::::. ..::::..:..::::: .. CCDS97 WLKAHYVEAEKLRGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHN 90 100 110 120 130 140 230 240 250 260 270 280 pF1KB9 PYPNPSKKCELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMR----SLA :::.: .: :::.::::: :::.::::::::::::: ::.: . . . :. . : CCDS97 PYPSPREKRELAEATGLTTTQVSNWFKNRRQRDRAAEAKERENTENNNSSSNKQNQLSPL 150 160 170 180 190 200 290 300 310 320 330 pF1KB9 EPGCPTHGSAESP-STAASPTTSVSSLTERADTGTSILSVTSSDSECDV : : : .:.: : :: . : : ... : CCDS97 EGGKPLMSSSEEEFSPPQSPDQN-SVLLLQGNMGHARSSNYSLPGLTASQPSHGLQTHQH 210 220 230 240 250 260 CCDS97 QLQDSLLGPLTSSLVDLGS 270 280 >>CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 (781 aa) initn: 782 init1: 602 opt: 740 Z-score: 428.3 bits: 88.8 E(32554): 1.5e-17 Smith-Waterman score: 745; 44.4% identity (67.6% similar) in 293 aa overlap (42-325:56-326) 20 30 40 50 60 70 pF1KB9 SHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAGGAGGGGGGGSR : :. ... .: :. :..:.:... . CCDS97 SEGQEAHREVAGGAAVGLSPPAPAPFPLEPGDAATAAARVSGEEGAVAAAAAGAAADQVQ 30 40 50 60 70 80 80 90 100 110 120 pF1KB9 APPEELSMF--------QLPTLNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPGACE : :. : : : :::..:: :::.:.. :...::.::::::: . CCDS97 LHSELLGRHHHAAAAAAQTP-LAFSPDHVACVCEALQQGGNLDRLARFLWSLP----QSD 90 100 110 120 130 140 130 140 150 160 170 180 pF1KB9 AINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKLRGR . .::.:.:::.:::: : . .:: :::.:.: . .: :: .: .:.: :::. ::: CCDS97 LLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQQLWYKARYTEAERARGR 150 160 170 180 190 200 190 200 210 220 230 240 pF1KB9 PLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKCELAQAT ::: :::::.:.::::::::::::. ..::::..:. :.: : :. ::.:..: .::. : CCDS97 PLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYKQNRYPSPAEKRHLAKIT 210 220 230 240 250 260 250 260 270 280 290 300 pF1KB9 GLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEP-GCPTHGSAESPSTAAS ::. :::.::::::::::: .:: .: .: : : :.:. :. . CCDS97 GLSLTQVSNWFKNRRQRDR-------------NPSETQSKSESDGNP---STEDESSKGH 270 280 290 300 310 320 330 pF1KB9 PTTSVSSLTERADTGTSILSVTSSDSECDV : :. .: : . ::..: CCDS97 EDLSPHPLSSSSD-GITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPASTSPVF 310 320 330 340 350 360 >>CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 (739 aa) initn: 761 init1: 535 opt: 729 Z-score: 422.5 bits: 87.7 E(32554): 3.2e-17 Smith-Waterman score: 743; 46.2% identity (68.8% similar) in 292 aa overlap (42-330:44-315) 20 30 40 50 60 70 pF1KB9 SHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAGGAGGGGGGGSR : :....:.: ::...:: : :. : :: CCDS12 AGGEAVAAAAATEEEEEEARQLLQTLQAAEGEAAAAAGAGAGAAAAGAEGPGSPGVPGS- 20 30 40 50 60 70 80 90 100 110 120 130 pF1KB9 APPEELSMFQLPT-LNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPGACEAINKHES ::: : . :: : ::::::: :::.: ..: ::.::: .:: : : . . CCDS12 -PPEAAS--EPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGALPPA----ERLRGSDP 80 90 100 110 120 140 150 160 170 180 190 pF1KB9 ILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKLRGRPLGPVDK .:::::.:::. :.. .::..::.. : :. :: ..:.:.:.:::. ::: :: ::: CCDS12 VLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYHEAERARGRALGAVDK 130 140 150 160 170 180 200 210 220 230 240 250 pF1KB9 YRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKCELAQATGLTPTQV ::.:::::::.::::::. ..:::::.:. :. : . ::.:..: .:: :::. ::: CCDS12 YRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDEKRRLATLTGLSLTQV 190 200 210 220 230 240 260 270 280 290 300 pF1KB9 GNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGCPT--HGSAESPSTAASPTTSVS .:::::::::::..:. : . .: .. : :: :..:: .. :: CCDS12 SNWFKNRRQRDRTGAG---------GGAPCKSESD-GNPTTEDESSRSPEDLERGAAPVS 250 260 270 280 290 310 320 330 pF1KB9 SLTERADTGTSILSVTSSDSECDV . : : :. .:. :. . : CCDS12 A--EAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLALGEA 300 310 320 330 340 350 332 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 18:26:05 2016 done: Fri Nov 4 18:26:05 2016 Total Scan time: 2.580 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]