FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9871, 490 aa
1>>>pF1KB9871 490 - 490 aa - 490 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.2645+/-0.00098; mu= -2.7553+/- 0.058
mean_var=408.5914+/-90.387, 0's: 0 Z-trim(116.6): 698 B-trim: 0 in 0/53
Lambda= 0.063450
statistics sampled from 16385 (17203) to 16385 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.805), E-opt: 0.2 (0.528), width: 16
Scan time: 3.740
The best scores are: opt bits E(32554)
CCDS5372.1 SP8 gene_id:221833|Hs108|chr7 ( 490) 3389 324.3 1.9e-88
CCDS43555.1 SP8 gene_id:221833|Hs108|chr7 ( 508) 3389 324.3 1.9e-88
CCDS46453.1 SP9 gene_id:100131390|Hs108|chr2 ( 484) 1512 152.5 9.8e-37
CCDS73475.1 SP7 gene_id:121340|Hs108|chr12 ( 413) 808 87.9 2.2e-17
CCDS44897.1 SP7 gene_id:121340|Hs108|chr12 ( 431) 808 88.0 2.3e-17
CCDS11520.1 SP6 gene_id:80320|Hs108|chr17 ( 376) 757 83.2 5.3e-16
CCDS44898.1 SP1 gene_id:6667|Hs108|chr12 ( 778) 682 76.7 1e-13
CCDS8857.1 SP1 gene_id:6667|Hs108|chr12 ( 785) 682 76.7 1e-13
CCDS5373.1 SP4 gene_id:6671|Hs108|chr7 ( 784) 663 75.0 3.3e-13
CCDS33322.1 SP5 gene_id:389058|Hs108|chr2 ( 398) 653 73.7 4.1e-13
CCDS46452.1 SP3 gene_id:6670|Hs108|chr2 ( 713) 657 74.4 4.6e-13
CCDS2254.1 SP3 gene_id:6670|Hs108|chr2 ( 781) 657 74.4 4.9e-13
CCDS10025.1 KLF13 gene_id:51621|Hs108|chr15 ( 288) 581 67.0 3.2e-11
>>CCDS5372.1 SP8 gene_id:221833|Hs108|chr7 (490 aa)
initn: 3389 init1: 3389 opt: 3389 Z-score: 1701.5 bits: 324.3 E(32554): 1.9e-88
Smith-Waterman score: 3389; 100.0% identity (100.0% similar) in 490 aa overlap (1-490:1-490)
10 20 30 40 50 60
pF1KB9 MLAATCNKIGSPSPSPSSLSDSSSSFGKGFHPWKRSSSSSSASCNVVGSSLSSFGVSGAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MLAATCNKIGSPSPSPSSLSDSSSSFGKGFHPWKRSSSSSSASCNVVGSSLSSFGVSGAS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 RNGGSSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSLTSSSAAAAAAAAAAAASSSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 RNGGSSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSLTSSSAAAAAAAAAAAASSSP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 FANDYSVFQAPGVSGGSGGGGGGGGGGSSAHSQDGSHQPVFISKVHTSVDGLQGIYPRVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 FANDYSVFQAPGVSGGSGGGGGGGGGGSSAHSQDGSHQPVFISKVHTSVDGLQGIYPRVG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 MAHPYESWFKPSHPGLGAAGEVGSAGASSWWDVGAGWIDVQNPNSAAALPGSLHPAAGGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MAHPYESWFKPSHPGLGAAGEVGSAGASSWWDVGAGWIDVQNPNSAAALPGSLHPAAGGL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 QTSLHSPLGGYNSDYSGLSHSAFSSGASSHLLSPAGQHLMDGFKPVLPGSYPDSAPSPLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QTSLHSPLGGYNSDYSGLSHSAFSSGASSHLLSPAGQHLMDGFKPVLPGSYPDSAPSPLA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 GAGGSMLSAGPSAPLGGSPRSSARRYSGRATCDCPNCQEAERLGPAGASLRRKGLHSCHI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GAGGSMLSAGPSAPLGGSPRSSARRYSGRATCDCPNCQEAERLGPAGASLRRKGLHSCHI
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 PGCGKVYGKTSHLKAHLRWHTGERPFVCNWLFCGKRFTRSDELQRHLRTHTGEKRFACPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PGCGKVYGKTSHLKAHLRWHTGERPFVCNWLFCGKRFTRSDELQRHLRTHTGEKRFACPV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB9 CNKRFMRSDHLSKHVKTHSGGGGGGGSAGSGSGGKKGSDTDSEHSAAGSPPCHSPELLQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 CNKRFMRSDHLSKHVKTHSGGGGGGGSAGSGSGGKKGSDTDSEHSAAGSPPCHSPELLQP
430 440 450 460 470 480
490
pF1KB9 PEPGHRNGLE
::::::::::
CCDS53 PEPGHRNGLE
490
>>CCDS43555.1 SP8 gene_id:221833|Hs108|chr7 (508 aa)
initn: 3389 init1: 3389 opt: 3389 Z-score: 1701.3 bits: 324.3 E(32554): 1.9e-88
Smith-Waterman score: 3389; 100.0% identity (100.0% similar) in 490 aa overlap (1-490:19-508)
10 20 30 40
pF1KB9 MLAATCNKIGSPSPSPSSLSDSSSSFGKGFHPWKRSSSSSSA
::::::::::::::::::::::::::::::::::::::::::
CCDS43 MATSLLGEEPRLGSTPLAMLAATCNKIGSPSPSPSSLSDSSSSFGKGFHPWKRSSSSSSA
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB9 SCNVVGSSLSSFGVSGASRNGGSSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSLTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SCNVVGSSLSSFGVSGASRNGGSSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSLTS
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB9 SSAAAAAAAAAAAASSSPFANDYSVFQAPGVSGGSGGGGGGGGGGSSAHSQDGSHQPVFI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SSAAAAAAAAAAAASSSPFANDYSVFQAPGVSGGSGGGGGGGGGGSSAHSQDGSHQPVFI
130 140 150 160 170 180
170 180 190 200 210 220
pF1KB9 SKVHTSVDGLQGIYPRVGMAHPYESWFKPSHPGLGAAGEVGSAGASSWWDVGAGWIDVQN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SKVHTSVDGLQGIYPRVGMAHPYESWFKPSHPGLGAAGEVGSAGASSWWDVGAGWIDVQN
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB9 PNSAAALPGSLHPAAGGLQTSLHSPLGGYNSDYSGLSHSAFSSGASSHLLSPAGQHLMDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PNSAAALPGSLHPAAGGLQTSLHSPLGGYNSDYSGLSHSAFSSGASSHLLSPAGQHLMDG
250 260 270 280 290 300
290 300 310 320 330 340
pF1KB9 FKPVLPGSYPDSAPSPLAGAGGSMLSAGPSAPLGGSPRSSARRYSGRATCDCPNCQEAER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 FKPVLPGSYPDSAPSPLAGAGGSMLSAGPSAPLGGSPRSSARRYSGRATCDCPNCQEAER
310 320 330 340 350 360
350 360 370 380 390 400
pF1KB9 LGPAGASLRRKGLHSCHIPGCGKVYGKTSHLKAHLRWHTGERPFVCNWLFCGKRFTRSDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LGPAGASLRRKGLHSCHIPGCGKVYGKTSHLKAHLRWHTGERPFVCNWLFCGKRFTRSDE
370 380 390 400 410 420
410 420 430 440 450 460
pF1KB9 LQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHVKTHSGGGGGGGSAGSGSGGKKGSDTDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHVKTHSGGGGGGGSAGSGSGGKKGSDTDS
430 440 450 460 470 480
470 480 490
pF1KB9 EHSAAGSPPCHSPELLQPPEPGHRNGLE
::::::::::::::::::::::::::::
CCDS43 EHSAAGSPPCHSPELLQPPEPGHRNGLE
490 500
>>CCDS46453.1 SP9 gene_id:100131390|Hs108|chr2 (484 aa)
initn: 1415 init1: 1000 opt: 1512 Z-score: 773.0 bits: 152.5 E(32554): 9.8e-37
Smith-Waterman score: 1678; 58.7% identity (74.1% similar) in 491 aa overlap (1-478:19-444)
10 20 30 40
pF1KB9 MLAATCNKIGSPSPSPSSLSDSSSSFGKG-FHPWKRSSSSSS
::::::::::. :: ..: .::. :.:: ::::::::::
CCDS46 MATSILGEEPRFGTTPLAMLAATCNKIGNTSPL-TTLPESSA-FAKGGFHPWKRSSSS--
10 20 30 40 50
50 60 70 80 90 100
pF1KB9 ASCNVVGSSLSSFGVSGASRNGGSSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSLT
::. :::::.:.:. .:: .:.. :....:: .: .... :: :::::
CCDS46 --CNL-GSSLSGFAVA----TGGRGSGGLAGGSGAANSAFCLAST-----SPTSSAFSSD
60 70 80 90 100
110 120 130 140 150 160
pF1KB9 SSSAAAAAAAAAAAASSSPFANDYSVFQAPGVSGGSGGGGGGGGGGSSAHSQDGSHQPVF
.. . .:::::::. ::: .:: : .:
CCDS46 YGGLFSNSAAAAAAAA--------------GVSPQEAGG-----------------QSAF
110 120 130
170 180 190 200 210
pF1KB9 ISKVHTSVDGLQGIYPRVGMAHPYESWFKPSHPGLGAAGEVGSAGASSWWDVGAG---WI
::::::.. .:.:::::::::::::.: . . ::::: ...::::::: .. :.
CCDS46 ISKVHTTA--ADGLYPRVGMAHPYESWYKSGFHSTLAAGEVTNGAASSWWDVHSSPGSWL
140 150 160 170 180 190
220 230 240 250 260 270
pF1KB9 DVQNPNSAAALPGSLHPAAGGLQTSLHSPLGGYNSDYSGLSHSAFSS-------GASSHL
.:::: :..: .::: .:. :.:::: :: :: :.:.:.:::::: .:.:::
CCDS46 EVQNP--AGGLQSSLH--SGAPQASLHSQLGTYNPDFSSLTHSAFSSTGLGSSAAAASHL
200 210 220 230 240
280 290 300 310 320
pF1KB9 LSPAGQHLM--DGFKPVLPGSYPDSAPSPLAGAGGSMLSAGPSAPLGGSPRSSARRYSGR
:: . :::. :::::::: :: ::. . :.:...:.:.. .: ::: ::::::::
CCDS46 LSTS-QHLLAQDGFKPVLP-SYSDSSAAVAAAAASAMISGAAAAAAGGSSARSARRYSGR
250 260 270 280 290 300
330 340 350 360 370 380
pF1KB9 ATCDCPNCQEAERLGPAGASLRRKGLHSCHIPGCGKVYGKTSHLKAHLRWHTGERPFVCN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 ATCDCPNCQEAERLGPAGASLRRKGLHSCHIPGCGKVYGKTSHLKAHLRWHTGERPFVCN
310 320 330 340 350 360
390 400 410 420 430 440
pF1KB9 WLFCGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHVKTHSGGGGGGGSAG
:::::::::::::::::::::::::::::::::::::::::::::.:::.:::::
CCDS46 WLFCGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHIKTHNGGGGG-----
370 380 390 400 410 420
450 460 470 480 490
pF1KB9 SGSGGKKGSDTDSEHSAAGSPPCHSPELLQPPEPGHRNGLE
:::::.:.. : .: .::.:.
CCDS46 -----KKGSDSDTDASNLETPRSESPDLILHDSGVSAARAAAAAAAAAAAAAAAASAGGK
430 440 450 460 470
>>CCDS73475.1 SP7 gene_id:121340|Hs108|chr12 (413 aa)
initn: 758 init1: 702 opt: 808 Z-score: 425.5 bits: 87.9 E(32554): 2.2e-17
Smith-Waterman score: 982; 40.6% identity (64.5% similar) in 431 aa overlap (72-490:4-412)
50 60 70 80 90 100
pF1KB9 ASCNVVGSSLSSFGVSGASRNGGSSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSLT
:: . .... . :: . : . .. .:.
CCDS73 MLTAACSKFGGSSPLRDSTTLGKAGTKKPYSVG
10 20 30
110 120 130 140 150
pF1KB9 SSSAAAAAAAAAAAASSSPFANDYSVFQAPGVSGGSGGGGGGGGGGSSAHS---QDGSHQ
:. .:. . . : : ::.. ... .:. : . .: .. .:: :...
CCDS73 SDLSASKTMGDAYPA---PFTSTNGLL-SPAGSPPAPTSGYANDYPPFSHSFPGPTGTQD
40 50 60 70 80
160 170 180 190 200 210
pF1KB9 P-VFISKVHTSVDGLQGIYPRVGMAHPYESWFKPS-HPGLGAAGEVGSAGASSWWDV--G
: ... : :.: : : ..: . :.::: ::.: . : :. . : :.. . :::. :
CCDS73 PGLLVPKGHSSSDCLPSVYTSLDMTHPYGSWYKAGIHAGI-SPGP-GNT-PTPWWDMHPG
90 100 110 120 130 140
220 230 240 250 260 270
pF1KB9 AGWIDVQNPNSAAALPGSLHPAAGGLQTSLHSPLGGYNSDYSGLSHSAFSSGASSHLLSP
..:. . ... .: :.: :. : : :. : : ::.. :. . . . :::.:
CCDS73 GNWLG-GGQGQGDGLQGTL-PT-GPAQPPLNPQLPTYPSDFAPLNPAPY---PAPHLLQP
150 160 170 180 190 200
280 290 300 310 320 330
pF1KB9 AGQHLM--DGFKPVLPGSYPDSAPSPLAGAGGSMLSAGPSAPLGGSPRSSARRYSGRATC
. ::.. : .:: :. . : :.::. : :. .:. .:. .::..:
CCDS73 GPQHVLPQDVYKPKAVGN-----SGQLEGSGGAKPPRGASTGGSGGYGGSG---AGRSSC
210 220 230 240 250
340 350 360 370 380 390
pF1KB9 DCPNCQEAERLGPAGASLRRKGLHSCHIPGCGKVYGKTSHLKAHLRWHTGERPFVCNWLF
::::::: :::: :.:.::.: .::::::::::::::.::::::::::::::::::::::
CCDS73 DCPNCQELERLGAAAAGLRKKPIHSCHIPGCGKVYGKASHLKAHLRWHTGERPFVCNWLF
260 270 280 290 300 310
400 410 420 430 440 450
pF1KB9 CGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHVKTHSGGGGGGGSAGS--
:::::::::::.::.:::: ::.:.: .:.::: :::::::: .::. : : .:
CCDS73 CGKRFTRSDELERHVRTHTREKKFTCLLCSKRFTRSDHLSKHQRTHGEPGPGPPPSGPKE
320 330 340 350 360 370
460 470 480 490
pF1KB9 -GSGGKKGSDTDSEHSAAGSPPCHSPELLQPPEPGHRNGLE
: : . : . :. .. : .:: : . : ::
CCDS73 LGEGRSTGEEEASQTPRPSASPA-TPEKAPGGSPEQSNLLEI
380 390 400 410
>>CCDS44897.1 SP7 gene_id:121340|Hs108|chr12 (431 aa)
initn: 758 init1: 702 opt: 808 Z-score: 425.3 bits: 88.0 E(32554): 2.3e-17
Smith-Waterman score: 993; 40.5% identity (64.3% similar) in 440 aa overlap (63-490:13-430)
40 50 60 70 80 90
pF1KB9 WKRSSSSSSASCNVVGSSLSSFGVSGASRNGGSSSAAAAAAAAAAAAAALVSDSFSCGGS
:.: : .:: . .... . :: . : .
CCDS44 MASSLLEEEVHYGSSPLAMLTAACSKFGGSSPLRDSTTLGKA
10 20 30 40
100 110 120 130 140 150
pF1KB9 PGSSAFSLTSSSAAAAAAAAAAAASSSPFANDYSVFQAPGVSGGSGGGGGGGGGGSSAHS
.. .:. :. .:. . . : : ::.. ... .:. : . .: .. .::
CCDS44 GTKKPYSVGSDLSASKTMGDAYPA---PFTSTNGLL-SPAGSPPAPTSGYANDYPPFSHS
50 60 70 80 90
160 170 180 190 200
pF1KB9 ---QDGSHQP-VFISKVHTSVDGLQGIYPRVGMAHPYESWFKPS-HPGLGAAGEVGSAGA
:...: ... : :.: : : ..: . :.::: ::.: . : :. . : :..
CCDS44 FPGPTGTQDPGLLVPKGHSSSDCLPSVYTSLDMTHPYGSWYKAGIHAGI-SPGP-GNT-P
100 110 120 130 140 150
210 220 230 240 250 260
pF1KB9 SSWWDV--GAGWIDVQNPNSAAALPGSLHPAAGGLQTSLHSPLGGYNSDYSGLSHSAFSS
. :::. :..:. . ... .: :.: :. : : :. : : ::.. :. . . .
CCDS44 TPWWDMHPGGNWLG-GGQGQGDGLQGTL-PT-GPAQPPLNPQLPTYPSDFAPLNPAPYPA
160 170 180 190 200 210
270 280 290 300 310 320
pF1KB9 GASSHLLSPAGQHLM--DGFKPVLPGSYPDSAPSPLAGAGGSMLSAGPSAPLGGSPRSSA
:::.:. ::.. : .:: :. . : :.::. : :. .:. .:.
CCDS44 ---PHLLQPGPQHVLPQDVYKPKAVGN-----SGQLEGSGGAKPPRGASTGGSGGYGGSG
220 230 240 250 260
330 340 350 360 370 380
pF1KB9 RRYSGRATCDCPNCQEAERLGPAGASLRRKGLHSCHIPGCGKVYGKTSHLKAHLRWHTGE
.::..:::::::: :::: :.:.::.: .::::::::::::::.:::::::::::::
CCDS44 ---AGRSSCDCPNCQELERLGAAAAGLRKKPIHSCHIPGCGKVYGKASHLKAHLRWHTGE
270 280 290 300 310 320
390 400 410 420 430 440
pF1KB9 RPFVCNWLFCGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHVKTHSGGGG
::::::::::::::::::::.::.:::: ::.:.: .:.::: :::::::: .::. :
CCDS44 RPFVCNWLFCGKRFTRSDELERHVRTHTREKKFTCLLCSKRFTRSDHLSKHQRTHGEPGP
330 340 350 360 370 380
450 460 470 480 490
pF1KB9 GGGSAGS---GSGGKKGSDTDSEHSAAGSPPCHSPELLQPPEPGHRNGLE
: .: : : . : . :. .. : .:: : . : ::
CCDS44 GPPPSGPKELGEGRSTGEEEASQTPRPSASPA-TPEKAPGGSPEQSNLLEI
390 400 410 420 430
>>CCDS11520.1 SP6 gene_id:80320|Hs108|chr17 (376 aa)
initn: 920 init1: 571 opt: 757 Z-score: 400.7 bits: 83.2 E(32554): 5.3e-16
Smith-Waterman score: 884; 45.0% identity (64.3% similar) in 353 aa overlap (118-458:36-356)
90 100 110 120 130 140
pF1KB9 SCGGSPGSSAFSLTSSSAAAAAAAAAAAASSSPFANDYSVFQAPGVSGGSGGGGGGGGGG
.:: :.:: :: .. :
CCDS11 CGSLGSQHTEAPHASPPRLDLQPLQTYQGHTSPEAGDYPSPLQPGEL--QSLPLGPEVDF
10 20 30 40 50 60
150 160 170 180 190 200
pF1KB9 SSAHSQDGSHQPVFISKVHTSVDGLQGIYPRV---GMAHPYESWFKPSHPGLGAAGEVGS
:... :. . : .... : . .. :.: :::::.:.::: .: ::
CCDS11 SQGYELPGASSRVTCEDLESDSPLAPGPFSKLLQPDMSHHYESWFRPTHPG----AEDGS
70 80 90 100 110
210 220 230 240 250 260
pF1KB9 AGASSWWDV--GAGWIDVQNPNSAAALPGSLHPAAGGLQTSLHSPLGGYNSDYSGLSHSA
:::. :..:.:. . ..: . :: :: :.::..: ::: .:.. :
CCDS11 -----WWDLHPGTSWMDLPHTQGALTSPG--HP--GALQAGL----GGYVGDHQ---LCA
120 130 140 150 160
270 280 290 300 310
pF1KB9 FSSGASSHLLSPA--GQHLM---DGFKPVLPGSYPDSAPSPLAGAGGSMLSAGPSAPLGG
.: : :: ::::. :: : .: . :.: : .:. : . : :.
CCDS11 PPPHPHAHHLLPAAGGQHLLGPPDGAK-ALEVAAPESQ-----GLDSSL--DGAARPKGS
170 180 190 200 210
320 330 340 350 360 370
pF1KB9 SPRSSARRYSGRATCDCPNCQEAERLG-PAGASL-RRKGLHSCHIPGCGKVYGKTSHLKA
: :. : ::...: :::: :::::: : : . ..: ::.::::::::.:.:::::::
CCDS11 --RRSVPRSSGQTVCRCPNCLEAERLGAPCGPDGGKKKHLHNCHIPGCGKAYAKTSHLKA
220 230 240 250 260 270
380 390 400 410 420 430
pF1KB9 HLRWHTGERPFVCNWLFCGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHV
:::::.:.::::::::::::::::::::::::.:::: :.: : ::.. :::::::.::.
CCDS11 HLRWHSGDRPFVCNWLFCGKRFTRSDELQRHLQTHTGTKKFPCAVCSRVFMRSDHLAKHM
280 290 300 310 320 330
440 450 460 470 480 490
pF1KB9 KTHSGGGGGGGSAGSGSGGKKGSDTDSEHSAAGSPPCHSPELLQPPEPGHRNGLE
::: :. ...:.:: : :.
CCDS11 KTHEGAKEEAAGAASGEGKAGGAVEPPGGKGKREAEGSVAPSN
340 350 360 370
>>CCDS44898.1 SP1 gene_id:6667|Hs108|chr12 (778 aa)
initn: 820 init1: 579 opt: 682 Z-score: 359.9 bits: 76.7 E(32554): 1e-13
Smith-Waterman score: 726; 33.6% identity (60.3% similar) in 473 aa overlap (36-470:266-733)
10 20 30 40 50 60
pF1KB9 CNKIGSPSPSPSSLSDSSSSFGKGFHPWKRSSSSSSASCNVVGSSLSSFGVSGASR-NGG
:... . : ..: : :. ::.. ..:
CCDS44 NNVLSGQTQYVTNVPVALNGNITLLPVNSVSAATLTPSSQAVTISSSGSQESGSQPVTSG
240 250 260 270 280 290
70 80 90 100 110 120
pF1KB9 SSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSL----TSSSAAAAAAAAAAAASSSP
.. ..:. ... :..... ... : . . .: ... ::.:... . . . :.
CCDS44 TTISSASLVSSQASSSSFFTNANSYSTTTTTSNMGIMNFTTSGSSGTNSQGQTPQRVSGL
300 310 320 330 340 350
130 140 150 160 170
pF1KB9 FANDYSVFQAPGVSGGSGGGGGGGGGGSSAHSQDGSH--QPVFISKVHTSVDGLQGIYPR
..: .: .:::: .: : .. ..:. . :: .. . ....::. :
CCDS44 QGSDALNIQQNQTSGGSLQAGQQKEGEQNQQTQQQQILIQPQLV-QGGQALQALQAA-PL
360 370 380 390 400 410
180 190 200 210 220
pF1KB9 VGMAHPYESWFK-----------P-SHPGLGAAGEVGSAGASSWWDVGAGWIDVQNPNSA
:.. .. . : : : . . :: : :: . ..::::..
CCDS44 SGQTFTTQAISQETLQNLQLQAVPNSGPIIIRTPTVGPNGQVSWQTLQLQNLQVQNPQAQ
420 430 440 450 460 470
230 240 250 260 270
pF1KB9 AALPGSLHPAAGGLQTSLHS---PLGGYNSDYSG---LSHSAFSS--GASSHLLSPAGQ-
. . .. .. : .: .. :... : .: .. . .:: : .. :: :
CCDS44 TITLAPMQGVSLGQTSSSNTTLTPIASAASIPAGTVTVNAAQLSSMPGLQTINLSALGTS
480 490 500 510 520 530
280 290 300 310 320
pF1KB9 ----HLMDGFKPVLPGSYPDS--APSPLAGAGGSMLSAGPSAPLGG--SP--RSSARRYS
: ..:. :. .. : . : : ::::. . .. : :: . .: : .
CCDS44 GIQVHPIQGL-PLAIANAPGDHGAQLGLHGAGGDGIHDDTAGGEEGENSPDAQPQAGRRT
540 550 560 570 580 590
330 340 350 360 370 380
pF1KB9 GRATCDCPNCQEAERLGPAGASLRRKGLHSCHIPGCGKVYGKTSHLKAHLRWHTGERPFV
: .: :: :...: : .: ..: : ::: ::::::::::::.::::::::::::.
CCDS44 RREACTCPYCKDSEGRG-SGDPGKKKQ-HICHIQGCGKVYGKTSHLRAHLRWHTGERPFM
600 610 620 630 640 650
390 400 410 420 430 440
pF1KB9 CNWLFCGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHVKTHSGGGGGGGS
:.: .:::::::::::::: :::::::.:::: : ::::::::::::.:::.. :: :
CCDS44 CTWSYCGKRFTRSDELQRHKRTHTGEKKFACPECPKRFMRSDHLSKHIKTHQNKKGGPGV
660 670 680 690 700 710
450 460 470 480 490
pF1KB9 AGSGSGGKKGSDTDSEHSAAGSPPCHSPELLQPPEPGHRNGLE
: : . : . :: :....:
CCDS44 ALSVGTLPLDSGAGSEGSGTATPSALITTNMVAMEAICPEGIARLANSGINVMQVADLQS
720 730 740 750 760 770
>>CCDS8857.1 SP1 gene_id:6667|Hs108|chr12 (785 aa)
initn: 820 init1: 579 opt: 682 Z-score: 359.9 bits: 76.7 E(32554): 1e-13
Smith-Waterman score: 726; 33.6% identity (60.3% similar) in 473 aa overlap (36-470:273-740)
10 20 30 40 50 60
pF1KB9 CNKIGSPSPSPSSLSDSSSSFGKGFHPWKRSSSSSSASCNVVGSSLSSFGVSGASR-NGG
:... . : ..: : :. ::.. ..:
CCDS88 NNVLSGQTQYVTNVPVALNGNITLLPVNSVSAATLTPSSQAVTISSSGSQESGSQPVTSG
250 260 270 280 290 300
70 80 90 100 110 120
pF1KB9 SSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSL----TSSSAAAAAAAAAAAASSSP
.. ..:. ... :..... ... : . . .: ... ::.:... . . . :.
CCDS88 TTISSASLVSSQASSSSFFTNANSYSTTTTTSNMGIMNFTTSGSSGTNSQGQTPQRVSGL
310 320 330 340 350 360
130 140 150 160 170
pF1KB9 FANDYSVFQAPGVSGGSGGGGGGGGGGSSAHSQDGSH--QPVFISKVHTSVDGLQGIYPR
..: .: .:::: .: : .. ..:. . :: .. . ....::. :
CCDS88 QGSDALNIQQNQTSGGSLQAGQQKEGEQNQQTQQQQILIQPQLV-QGGQALQALQAA-PL
370 380 390 400 410 420
180 190 200 210 220
pF1KB9 VGMAHPYESWFK-----------P-SHPGLGAAGEVGSAGASSWWDVGAGWIDVQNPNSA
:.. .. . : : : . . :: : :: . ..::::..
CCDS88 SGQTFTTQAISQETLQNLQLQAVPNSGPIIIRTPTVGPNGQVSWQTLQLQNLQVQNPQAQ
430 440 450 460 470 480
230 240 250 260 270
pF1KB9 AALPGSLHPAAGGLQTSLHS---PLGGYNSDYSG---LSHSAFSS--GASSHLLSPAGQ-
. . .. .. : .: .. :... : .: .. . .:: : .. :: :
CCDS88 TITLAPMQGVSLGQTSSSNTTLTPIASAASIPAGTVTVNAAQLSSMPGLQTINLSALGTS
490 500 510 520 530 540
280 290 300 310 320
pF1KB9 ----HLMDGFKPVLPGSYPDS--APSPLAGAGGSMLSAGPSAPLGG--SP--RSSARRYS
: ..:. :. .. : . : : ::::. . .. : :: . .: : .
CCDS88 GIQVHPIQGL-PLAIANAPGDHGAQLGLHGAGGDGIHDDTAGGEEGENSPDAQPQAGRRT
550 560 570 580 590
330 340 350 360 370 380
pF1KB9 GRATCDCPNCQEAERLGPAGASLRRKGLHSCHIPGCGKVYGKTSHLKAHLRWHTGERPFV
: .: :: :...: : .: ..: : ::: ::::::::::::.::::::::::::.
CCDS88 RREACTCPYCKDSEGRG-SGDPGKKKQ-HICHIQGCGKVYGKTSHLRAHLRWHTGERPFM
600 610 620 630 640 650
390 400 410 420 430 440
pF1KB9 CNWLFCGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHVKTHSGGGGGGGS
:.: .:::::::::::::: :::::::.:::: : ::::::::::::.:::.. :: :
CCDS88 CTWSYCGKRFTRSDELQRHKRTHTGEKKFACPECPKRFMRSDHLSKHIKTHQNKKGGPGV
660 670 680 690 700 710
450 460 470 480 490
pF1KB9 AGSGSGGKKGSDTDSEHSAAGSPPCHSPELLQPPEPGHRNGLE
: : . : . :: :....:
CCDS88 ALSVGTLPLDSGAGSEGSGTATPSALITTNMVAMEAICPEGIARLANSGINVMQVADLQS
720 730 740 750 760 770
>>CCDS5373.1 SP4 gene_id:6671|Hs108|chr7 (784 aa)
initn: 689 init1: 599 opt: 663 Z-score: 350.5 bits: 75.0 E(32554): 3.3e-13
Smith-Waterman score: 671; 32.3% identity (57.5% similar) in 492 aa overlap (27-470:281-758)
10 20 30 40 50
pF1KB9 MLAATCNKIGSPSPSPSSLSDSSSSFGKGFHPWKRSSSSSSASCNVVGSSLSSFGV
:. .: ..:..: . ..:.. ..
CCDS53 AQVVTTLPINIGGVTLALPVINNVAAGGGTGQVGQPAATADSGTSNGNQLVSTPTNTTTS
260 270 280 290 300 310
60 70 80 90 100 110
pF1KB9 SGASRNGGSSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSLTSSSAAAAAAAAAAAA
... .. :::.. ...:... .. ::.. ... :. : . .::: . . . ::
CCDS53 ASTMPESPSSSTTCTTTASTSLTS---SDTLVSSADTGQYASTSASSSERTIEESQTPAA
320 330 340 350 360
120 130 140 150 160 170
pF1KB9 SSSPFANDYSVFQAPGVSGGSGGGGGGGGG---GSSAHSQDGSHQPV--FISKVHTSVDG
. : :.. : .: :..... ... :. .: .:: .:. . .
CCDS53 TESE-AQSSSQLQPNGMQNAQDQSNSLQQVQIVGQPILQQIQIQQPQQQIIQAIPPQSFQ
370 380 390 400 410 420
180 190 200 210 220
pF1KB9 LQ-GIYPRVGMAHPYES-WFKPSHPG--LGAAGEVGSAGASSWWDVGAGWI----DVQNP
:: : .. . .: .. .. .: : : . .: :: : . : ..:
CCDS53 LQSGQTIQTIQQQPLQNVQLQAVNPTQVLIRAPTLTPSGQISWQTVQVQNIQSLSNLQVQ
430 440 450 460 470 480
230 240 250 260
pF1KB9 NSAAALPGSLHP--AAGGLQTSLHSPLGGYNSDYSGLSHSAFSS----------------
:.. . .. : ..:: . .:.. .. . :. . ..:
CCDS53 NAGLSQQLTITPVSSSGGTTLAQIAPVAVAGAPIT-LNTAQLASVPNLQTVSVANLGAAG
490 500 510 520 530 540
270 280 290 300 310
pF1KB9 ----GASSHLLSPAGQHL-MDGFKPVLPGSYPDSAPSPLAGAGGSMLSAGPSAP------
:. . : :::. .:: : : .. :: .: .: . . : .:
CCDS53 VQVQGVPVTITSVAGQQQGQDGVK-VQQATI---APVTVAVGGIANATIGAVSPDQLTQV
550 560 570 580 590 600
320 330 340 350 360
pF1KB9 --LGGSPRSSARRYSG----RATCDCPNCQEAERLGPAGASLRRKGLHSCHIPGCGKVYG
:. :. . : :..:.::::.:.: : .. .: : ::: :::::::
CCDS53 HLQQGQQTSDQEVQPGKRLRRVACSCPNCREGE--GRGSNEPGKKKQHICHIEGCGKVYG
610 620 630 640 650
370 380 390 400 410 420
pF1KB9 KTSHLKAHLRWHTGERPFVCNWLFCGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRS
:::::.::::::::::::.:::.::::::::::::::: ::::::::: :: :.::::::
CCDS53 KTSHLRAHLRWHTGERPFICNWMFCGKRFTRSDELQRHRRTHTGEKRFECPECSKRFMRS
660 670 680 690 700 710
430 440 450 460 470 480
pF1KB9 DHLSKHVKTHSGGGGGGGSAGSGSGGKKGSDTDSEHSAAGSPPCHSPELLQPPEPGHRNG
::::::::::.. ::: . . ..:. : : . :::
CCDS53 DHLSKHVKTHQNKKGGGTALAIVTSGELDS---SVTEVLGSPRIVTVAAISQDSNPATPN
720 730 740 750 760 770
490
pF1KB9 LE
CCDS53 VSTNMEEF
780
>>CCDS33322.1 SP5 gene_id:389058|Hs108|chr2 (398 aa)
initn: 651 init1: 597 opt: 653 Z-score: 349.0 bits: 73.7 E(32554): 4.1e-13
Smith-Waterman score: 669; 53.2% identity (65.1% similar) in 218 aa overlap (222-438:179-378)
200 210 220 230 240 250
pF1KB9 SHPGLGAAGEVGSAGASSWWDVGAGWIDVQNPNSAAA-LPGSLHPAAGGLQTSLHSPLGG
.:: : :: : ::. . : .:
CCDS33 YAAQAALPPGYSNLLPPPPPPPPPPTCRQLSPNPAPDDLPWWSIPQAGAGPGASGVPGSG
150 160 170 180 190 200
260 270 280 290 300 310
pF1KB9 YNSDYSGLSHSAFSSGASSHLLSPAGQHLMDGFKPVLPGSYPDSAPSPLAGAGGSMLSAG
.. .: : : ::. . :. :. :. :: : . : .: ..:..
CCDS33 LSGACAGAPH-APRFPASAAAAAAAAAALQRGL--VLGPSDFAQYQSQIA----ALLQT-
210 220 230 240 250 260
320 330 340 350 360 370
pF1KB9 PSAPLGGSPRSSARRYSGRATCDCPNCQEAERLGPAGASLRRKGLHSCHIPGCGKVYGKT
.:::... : : : ::::: : : : .: : ::.::::::::::
CCDS33 -KAPLAATARRCRR-------CRCPNCQAAG--GAPEAEPGKKKQHVCHVPGCGKVYGKT
270 280 290 300 310
380 390 400 410 420 430
pF1KB9 SHLKAHLRWHTGERPFVCNWLFCGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRSDH
::::::::::::::::::::::::: ::::::::::::::::::::::: :.::::::::
CCDS33 SHLKAHLRWHTGERPFVCNWLFCGKSFTRSDELQRHLRTHTGEKRFACPECGKRFMRSDH
320 330 340 350 360 370
440 450 460 470 480 490
pF1KB9 LSKHVKTHSGGGGGGGSAGSGSGGKKGSDTDSEHSAAGSPPCHSPELLQPPEPGHRNGLE
:.::::::
CCDS33 LAKHVKTHQNKKLKVAEAGVKREDARDL
380 390
490 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 19:54:42 2016 done: Fri Nov 4 19:54:43 2016
Total Scan time: 3.740 Total Display time: 0.060
Function used was FASTA [36.3.4 Apr, 2011]