FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9704, 332 aa
1>>>pF1KB9704 332 - 332 aa - 332 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.2803+/-0.00114; mu= 11.5602+/- 0.069
mean_var=334.4832+/-69.877, 0's: 0 Z-trim(113.4): 58 B-trim: 0 in 0/52
Lambda= 0.070127
statistics sampled from 13991 (14039) to 13991 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.759), E-opt: 0.2 (0.431), width: 16
Scan time: 2.580
The best scores are: opt bits E(32554)
CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 ( 332) 2259 241.9 5.4e-64
CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 ( 246) 1354 150.1 1.7e-36
CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 ( 291) 965 110.9 1.3e-24
CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 ( 284) 934 107.7 1.1e-23
CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 ( 781) 740 88.8 1.5e-17
CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 ( 739) 729 87.7 3.2e-17
>>CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 (332 aa)
initn: 2259 init1: 2259 opt: 2259 Z-score: 1262.3 bits: 241.9 E(32554): 5.4e-64
Smith-Waterman score: 2259; 99.7% identity (99.7% similar) in 332 aa overlap (1-332:1-332)
10 20 30 40 50 60
pF1KB9 MVFRSPLDLYSSHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 MVFRSPLDLYSSHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 GAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 GAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 ACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 ACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 RGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKCELA
:::::::::::::::::::::::::::::::::::::::::::::::::::::::: :::
CCDS18 RGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKRELA
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 QATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGCPTHGSAESPSTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 QATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGCPTHGSAESPSTA
250 260 270 280 290 300
310 320 330
pF1KB9 ASPTTSVSSLTERADTGTSILSVTSSDSECDV
::::::::::::::::::::::::::::::::
CCDS18 ASPTTSVSSLTERADTGTSILSVTSSDSECDV
310 320 330
>>CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 (246 aa)
initn: 1375 init1: 1268 opt: 1354 Z-score: 768.7 bits: 150.1 E(32554): 1.7e-36
Smith-Waterman score: 1354; 78.3% identity (90.9% similar) in 254 aa overlap (79-332:1-246)
50 60 70 80 90 100
pF1KB9 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL
::::: :::::.:::.:::::::.::.:::
CCDS97 MFQLPILNFSPQQVAGVCETLEESGDVERL
10 20 30
110 120 130 140 150 160
pF1KB9 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM
:::::::::::.::::.::.::.:::::.:::: ::.:.:::::::::::::::.::::.
CCDS97 GRFLWSLPVAPAACEALNKNESVLRARAIVAFHGGNYRELYHILENHKFTKESHAKLQAL
40 50 60 70 80 90
170 180 190 200 210 220
pF1KB9 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD
:::::::::::::::::::::::::::::::::::::::::::::::::: :::::::::
CCDS97 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRHLLREWYLQD
100 110 120 130 140 150
230 240 250 260 270 280
pF1KB9 PYPNPSKKCELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGC
:::::::: ::::::::::::::::::::::::::::::::::.:... .. :.: :
CCDS97 PYPNPSKKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQQQVLSQGSGRALRAEG-
160 170 180 190 200
290 300 310 320 330
pF1KB9 PTHGSAESPSTAASPTTSVSSLTERADTGTSILSVTSSDSECDV
:. : ..:.::..:.:: ..:: .:.::::::::.
CCDS97 --DGTPEVLGVATSPAASLSS-----KAATSAISITSSDSECDI
210 220 230 240
>>CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 (291 aa)
initn: 962 init1: 793 opt: 965 Z-score: 555.3 bits: 110.9 E(32554): 1.3e-24
Smith-Waterman score: 965; 60.8% identity (83.2% similar) in 232 aa overlap (79-309:1-228)
50 60 70 80 90 100
pF1KB9 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL
: .:::..:. :::: :::.:.. :.::::
CCDS18 MSMLPTFGFTQEQVACVCEVLQQGGNIERL
10 20 30
110 120 130 140 150 160
pF1KB9 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM
:::::::: ::: ..:.::.:.:.:::::: ::::.::.:::.:.:. ..:.::: .
CCDS18 GRFLWSLP----ACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQL
40 50 60 70 80
170 180 190 200 210 220
pF1KB9 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD
::.::: ::::::::::: : :::::.::::::.:::::. ..::::..::.::::: ..
CCDS18 WLKAHYIEAEKLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHN
90 100 110 120 130 140
230 240 250 260 270 280
pF1KB9 PYPNPSKKCELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGC
:::.: .: :::.::::: :::.::::::::::::: ::.: ... . .. : :
CCDS18 PYPSPREKRELAEATGLTTTQVSNWFKNRRQRDRAAEAKERENNENSNSNSHNPLNGSGK
150 160 170 180 190 200
290 300 310 320 330
pF1KB9 PTHGSAESPST-AASPTTSVSSLTERADTGTSILSVTSSDSECDV
. ::.:. .: ...: : ::
CCDS18 SVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGLPSLHSLGHPPGPSAVPVPVPGGGGAD
210 220 230 240 250 260
>>CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 (284 aa)
initn: 926 init1: 763 opt: 934 Z-score: 538.4 bits: 107.7 E(32554): 1.1e-23
Smith-Waterman score: 934; 57.8% identity (79.1% similar) in 244 aa overlap (79-317:1-239)
50 60 70 80 90 100
pF1KB9 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL
: .::...:. :::: :::.:.. :..:::
CCDS97 MSMLPSFGFTQEQVACVCEVLQQGGNLERL
10 20 30
110 120 130 140 150 160
pF1KB9 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM
:::::::: ::. ..:.::.:.:.:::::: ::::.::.:::.:.:. ..: ::: .
CCDS97 GRFLWSLP----ACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQL
40 50 60 70 80
170 180 190 200 210 220
pF1KB9 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD
::.::: ::::::::::: : :::::.::::::::::::. ..::::..:..::::: ..
CCDS97 WLKAHYVEAEKLRGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHN
90 100 110 120 130 140
230 240 250 260 270 280
pF1KB9 PYPNPSKKCELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMR----SLA
:::.: .: :::.::::: :::.::::::::::::: ::.: . . . :. . :
CCDS97 PYPSPREKRELAEATGLTTTQVSNWFKNRRQRDRAAEAKERENTENNNSSSNKQNQLSPL
150 160 170 180 190 200
290 300 310 320 330
pF1KB9 EPGCPTHGSAESP-STAASPTTSVSSLTERADTGTSILSVTSSDSECDV
: : : .:.: : :: . : : ... :
CCDS97 EGGKPLMSSSEEEFSPPQSPDQN-SVLLLQGNMGHARSSNYSLPGLTASQPSHGLQTHQH
210 220 230 240 250 260
CCDS97 QLQDSLLGPLTSSLVDLGS
270 280
>>CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 (781 aa)
initn: 782 init1: 602 opt: 740 Z-score: 428.3 bits: 88.8 E(32554): 1.5e-17
Smith-Waterman score: 745; 44.4% identity (67.6% similar) in 293 aa overlap (42-325:56-326)
20 30 40 50 60 70
pF1KB9 SHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAGGAGGGGGGGSR
: :. ... .: :. :..:.:... .
CCDS97 SEGQEAHREVAGGAAVGLSPPAPAPFPLEPGDAATAAARVSGEEGAVAAAAAGAAADQVQ
30 40 50 60 70 80
80 90 100 110 120
pF1KB9 APPEELSMF--------QLPTLNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPGACE
: :. : : : :::..:: :::.:.. :...::.::::::: .
CCDS97 LHSELLGRHHHAAAAAAQTP-LAFSPDHVACVCEALQQGGNLDRLARFLWSLP----QSD
90 100 110 120 130 140
130 140 150 160 170 180
pF1KB9 AINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKLRGR
. .::.:.:::.:::: : . .:: :::.:.: . .: :: .: .:.: :::. :::
CCDS97 LLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQQLWYKARYTEAERARGR
150 160 170 180 190 200
190 200 210 220 230 240
pF1KB9 PLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKCELAQAT
::: :::::.:.::::::::::::. ..::::..:. :.: : :. ::.:..: .::. :
CCDS97 PLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYKQNRYPSPAEKRHLAKIT
210 220 230 240 250 260
250 260 270 280 290 300
pF1KB9 GLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEP-GCPTHGSAESPSTAAS
::. :::.::::::::::: .:: .: .: : : :.:. :. .
CCDS97 GLSLTQVSNWFKNRRQRDR-------------NPSETQSKSESDGNP---STEDESSKGH
270 280 290 300
310 320 330
pF1KB9 PTTSVSSLTERADTGTSILSVTSSDSECDV
: :. .: : . ::..:
CCDS97 EDLSPHPLSSSSD-GITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPASTSPVF
310 320 330 340 350 360
>>CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 (739 aa)
initn: 761 init1: 535 opt: 729 Z-score: 422.5 bits: 87.7 E(32554): 3.2e-17
Smith-Waterman score: 743; 46.2% identity (68.8% similar) in 292 aa overlap (42-330:44-315)
20 30 40 50 60 70
pF1KB9 SHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAGGAGGGGGGGSR
: :....:.: ::...:: : :. : ::
CCDS12 AGGEAVAAAAATEEEEEEARQLLQTLQAAEGEAAAAAGAGAGAAAAGAEGPGSPGVPGS-
20 30 40 50 60 70
80 90 100 110 120 130
pF1KB9 APPEELSMFQLPT-LNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPGACEAINKHES
::: : . :: : ::::::: :::.: ..: ::.::: .:: : : . .
CCDS12 -PPEAAS--EPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGALPPA----ERLRGSDP
80 90 100 110 120
140 150 160 170 180 190
pF1KB9 ILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKLRGRPLGPVDK
.:::::.:::. :.. .::..::.. : :. :: ..:.:.:.:::. ::: :: :::
CCDS12 VLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYHEAERARGRALGAVDK
130 140 150 160 170 180
200 210 220 230 240 250
pF1KB9 YRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKCELAQATGLTPTQV
::.:::::::.::::::. ..:::::.:. :. : . ::.:..: .:: :::. :::
CCDS12 YRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDEKRRLATLTGLSLTQV
190 200 210 220 230 240
260 270 280 290 300
pF1KB9 GNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGCPT--HGSAESPSTAASPTTSVS
.:::::::::::..:. : . .: .. : :: :..:: .. ::
CCDS12 SNWFKNRRQRDRTGAG---------GGAPCKSESD-GNPTTEDESSRSPEDLERGAAPVS
250 260 270 280 290
310 320 330
pF1KB9 SLTERADTGTSILSVTSSDSECDV
. : : :. .:. :. . :
CCDS12 A--EAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLALGEA
300 310 320 330 340 350
332 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 18:26:05 2016 done: Fri Nov 4 18:26:05 2016
Total Scan time: 2.580 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]