FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA0438, 708 aa
1>>>pF1KSDA0438 708 - 708 aa - 708 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.0760+/-0.00093; mu= 12.9470+/- 0.056
mean_var=148.2296+/-29.917, 0's: 0 Z-trim(110.9): 76 B-trim: 0 in 0/50
Lambda= 0.105343
statistics sampled from 11905 (11976) to 11905 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.714), E-opt: 0.2 (0.368), width: 16
Scan time: 4.250
The best scores are: opt bits E(32554)
CCDS4099.1 PJA2 gene_id:9867|Hs108|chr5 ( 708) 4813 743.7 2.2e-214
CCDS35316.1 PJA1 gene_id:64219|Hs108|chrX ( 588) 1210 196.0 1.3e-49
CCDS14393.1 PJA1 gene_id:64219|Hs108|chrX ( 643) 1210 196.0 1.4e-49
CCDS14392.1 PJA1 gene_id:64219|Hs108|chrX ( 455) 1160 188.3 2.1e-47
>>CCDS4099.1 PJA2 gene_id:9867|Hs108|chr5 (708 aa)
initn: 4813 init1: 4813 opt: 4813 Z-score: 3962.2 bits: 743.7 E(32554): 2.2e-214
Smith-Waterman score: 4813; 99.9% identity (100.0% similar) in 708 aa overlap (1-708:1-708)
10 20 30 40 50 60
pF1KSD MSQYTEKEPAAMDQESGKAVWPKPAGGYQTITGRRYGRRHAYVSFKPCMTRHERSLGRAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 MSQYTEKEPAAMDQESGKAVWPKPAGGYQTITGRRYGRRHAYVSFKPCMTRHERSLGRAG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD DDYEVLELDDVPKENSSGSSPLDQVDSSLPSEPIFEKSETEIPTCGSALNQTTESSQSFV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 DDYEVLELDDVPKENSSGSSPLDQVDSSLPSEPIFEKSETEIPTCGSALNQTTESSQSFV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD AVHHSEEGRDTLGSSTNLHNHSEGEYIPGACSASSVQNGIALVHTDSYDPDGKHGEDNDH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 AVHHSEEGRDTLGSSTNLHNHSEGEYIPGACSASSVQNGIALVHTDSYDPDGKHGEDNDH
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD LQLSAEVVEGSRYQESLGNTVFELENREAEAYTGLSPPVPSFNCEVRDEFEELDSVPLVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 LQLSAEVVEGSRYQESLGNTVFELENREAEAYTGLSPPVPSFNCEVRDEFEELDSVPLVK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD SSAGDTEFVHQNSQEIQRSSQDEMVSTKQQNNTSQERQTEHSPEDAACGPGHICSERNTN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::.:::
CCDS40 SSAGDTEFVHQNSQEIQRSSQDEMVSTKQQNNTSQERQTEHSPEDAACGPGHICSEQNTN
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD DREKNHGSSPEQVVRPKVRKLISSSQVDQETGFNRHEAKQRSVQRWREALEVEESGSDDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 DREKNHGSSPEQVVRPKVRKLISSSQVDQETGFNRHEAKQRSVQRWREALEVEESGSDDL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD LIKCEEYDGEHDCMFLDPPYSRVITQRETENNQMTSESGATAGRQEVDNTFWNGCGDYYQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 LIKCEEYDGEHDCMFLDPPYSRVITQRETENNQMTSESGATAGRQEVDNTFWNGCGDYYQ
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD LYDKDEDSSECSDGEWSASLPHRFSGTEKDQSSSDESWETLPGKDENEPELQSDSSGPEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 LYDKDEDSSECSDGEWSASLPHRFSGTEKDQSSSDESWETLPGKDENEPELQSDSSGPEE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD ENQELSLQEGEQTSLEEGEIPWLQYNEVNESSSDEGNEPANEFAQPAFMLDGNNNLEDDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 ENQELSLQEGEQTSLEEGEIPWLQYNEVNESSSDEGNEPANEFAQPAFMLDGNNNLEDDS
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD SVSEDLDVDWSLFDGFADGLGVAEAISYVDPQFLTYMALEERLAQAMETALAHLESLAVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 SVSEDLDVDWSLFDGFADGLGVAEAISYVDPQFLTYMALEERLAQAMETALAHLESLAVD
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD VEVANPPASKESIDGLPETLVLEDHTAIGQEQCCPICCSEYIKDDIATELPCHHFFHKPC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 VEVANPPASKESIDGLPETLVLEDHTAIGQEQCCPICCSEYIKDDIATELPCHHFFHKPC
610 620 630 640 650 660
670 680 690 700
pF1KSD VSIWLQKSGTCPVCRRHFPPAVIEASAAPSSEPDPDAPPSNDSIAEAP
::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 VSIWLQKSGTCPVCRRHFPPAVIEASAAPSSEPDPDAPPSNDSIAEAP
670 680 690 700
>>CCDS35316.1 PJA1 gene_id:64219|Hs108|chrX (588 aa)
initn: 1353 init1: 1090 opt: 1210 Z-score: 1003.9 bits: 196.0 E(32554): 1.3e-49
Smith-Waterman score: 1624; 46.9% identity (67.9% similar) in 605 aa overlap (107-680:4-586)
80 90 100 110 120 130
pF1KSD SGSSPLDQVDSSLPSEPIFEKSETEIPTCGSALNQTTESSQS-FVAVHHSEEGRDTLGSS
:: .:::. :.: : ....: . .. :..
CCDS35 MHRSAPSQTTKRSRSPFSTTRRSWDDSESSGTN
10 20 30
140 150 160 170 180 190
pF1KSD TNLHNHSEGEYIPGACSASSVQNGIALVHTDSYDPDGKHGEDNDHLQLSAEVVEGSRYQE
:. :.. ..: : ::. . :.: : ::: : .. : .. . .....
CCDS35 LNIDNEDYSRYPPREYRASGSRRGMAYGHIDSYGADDSEEEGAGPVERPPVRGKTGKFKD
40 50 60 70 80 90
200 210 220 230 240 250
pF1KSD SLGNTVFELENREAEAYTGLSPPVPSFNCEVRDEFEELDSVPLVKSSAGDTEFVHQNSQE
. ... : . :.. .: : ::. .::.: ..:: :: .. ::. ..:. :.:
CCDS35 ---DKLYDPE-KGARSLAGPPPHFSSFSRDVREERDKLDPVPAARCSASRADFLPQSSVA
100 110 120 130 140
260 270 280 290 300 310
pF1KSD IQRSSQDEMVSTKQQNNTSQERQTEHSPEDAACGPGHICSERNTNDREKNHGSSPEQVVR
: ::. .... . ... .::. .. : . .: ::. :.. :. : :::
CCDS35 SQSSSEGKLAT--KGDSSERERREQNLPARPSRAPVSICG-----GGENTSKSAEEPVVR
150 160 170 180 190 200
320 330 340 350 360 370
pF1KSD PKVRKLISSSQVDQETGFNRHEAKQ--RSVQRWREALEVEESGSDDLLIKCEEYDGEHDC
::.:.: : . : . :. . . .:..:::.. . .:. :: : .. :: .
CCDS35 PKIRNLASPNCVKPKIFFDTDDDDDMPHSTSRWRDTANDNEGHSDGL---ARRGRGESSS
210 220 230 240 250
380 390 400 410 420 430
pF1KSD MFLDPPYSRVITQRETENNQMTSESGATAGRQEVDNTFWNGCGDYYQLYDKDEDSSECSD
. .: : . .::....:. :. : .: ::. :::. :.: :: :
CCDS35 GYPEPKYPE--DKREARSDQVKPEKVPRRRRTMADPDFWTHSDDYYKYCDEDSDS----D
260 270 280 290 300 310
440 450 460 470
pF1KSD GEWSASLPHRFSGTEKDQSSSDESWETLPGKDENEPELQS------DSSGPE--------
:: :.: ... . :. ::: :::::::::.: :: . : ::
CCDS35 KEWIAALRRKYRSREQTLSSSGESWETLPGKEEREPPQAKVSASTGTSPGPGASASAGAG
320 330 340 350 360 370
480 490 500 510 520
pF1KSD -------------EENQELSLQEGEQTSLEEGEIPWLQYNEVNESSSDEGNEPANEFAQP
:: .: :::: ::.::::::::::::.: :.:::. :. ..:. ::
CCDS35 AGASAGSNGSNYLEEVREPSLQE-EQASLEEGEIPWLQYHE-NDSSSEGDNDSGHELMQP
380 390 400 410 420 430
530 540 550 560 570 580
pF1KSD A-FMLDGNNNLEDDSSVSEDLDVDWSLFDGFADGLGVAEAISYVDPQFLTYMALEERLAQ
. :::::::::::::::::::.::::::::::::::::::::::::::::::::::::::
CCDS35 GVFMLDGNNNLEDDSSVSEDLEVDWSLFDGFADGLGVAEAISYVDPQFLTYMALEERLAQ
440 450 460 470 480 490
590 600 610 620 630 640
pF1KSD AMETALAHLESLAVDVEVANPPASKESIDGLPETLVLEDHTAIGQEQCCPICCSEYIKDD
:::::::::::::::::::::::::::::.::: :: ::: :.:::.:::::::::.: .
CCDS35 AMETALAHLESLAVDVEVANPPASKESIDALPEILVTEDHGAVGQEMCCPICCSEYVKGE
500 510 520 530 540 550
650 660 670 680 690 700
pF1KSD IATELPCHHFFHKPCVSIWLQKSGTCPVCRRHFPPAVIEASAAPSSEPDPDAPPSNDSIA
.::::::::.:::::::::::::::::::: :::
CCDS35 VATELPCHHYFHKPCVSIWLQKSGTCPVCRCMFPPPL
560 570 580
pF1KSD EAP
>>CCDS14393.1 PJA1 gene_id:64219|Hs108|chrX (643 aa)
initn: 1567 init1: 1090 opt: 1210 Z-score: 1003.4 bits: 196.0 E(32554): 1.4e-49
Smith-Waterman score: 1782; 45.4% identity (65.7% similar) in 700 aa overlap (12-680:1-641)
10 20 30 40 50 60
pF1KSD MSQYTEKEPAAMDQESGKAVWPKPAGGYQTITGRRYGRRHAYVSFKPCMTRHERSLGRAG
: :::.: :::.:.::::. ::::::::::::::.: ...::
CCDS14 MGQESSKPVWPNPTGGYQSNTGRRYGRRHAYVSFRPPTSQRER------
10 20 30 40
70 80 90 100 110
pF1KSD DDYEVLELDDVPKENSSGSSPLDQVDSSLPSEPIFEKSETEIPTCGSALNQTTESSQS-F
. :. .:...:.: :: .:::. :.: :
CCDS14 ----------------------------IASQ---RKTNSEVPMHRSAPSQTTKRSRSPF
50 60 70
120 130 140 150 160 170
pF1KSD VAVHHSEEGRDTLGSSTNLHNHSEGEYIPGACSASSVQNGIALVHTDSYDPDGKHGEDND
....: . .. :.. :. :.. ..: : ::. . :.: : ::: : .. :
CCDS14 STTRRSWDDSESSGTNLNIDNEDYSRYPPREYRASGSRRGMAYGHIDSYGADDSEEEGAG
80 90 100 110 120 130
180 190 200 210 220 230
pF1KSD HLQLSAEVVEGSRYQESLGNTVFELENREAEAYTGLSPPVPSFNCEVRDEFEELDSVPLV
.. . ..... . ... : . :.. .: : ::. .::.: ..:: :: .
CCDS14 PVERPPVRGKTGKFKD---DKLYDPE-KGARSLAGPPPHFSSFSRDVREERDKLDPVPAA
140 150 160 170 180
240 250 260 270 280 290
pF1KSD KSSAGDTEFVHQNSQEIQRSSQDEMVSTKQQNNTSQERQTEHSPEDAACGPGHICSERNT
. ::. ..:. :.: : ::. .... . ... .::. .. : . .: ::.
CCDS14 RCSASRADFLPQSSVASQSSSEGKLAT--KGDSSERERREQNLPARPSRAPVSICG----
190 200 210 220 230 240
300 310 320 330 340 350
pF1KSD NDREKNHGSSPEQVVRPKVRKLISSSQVDQETGFNRHEAKQ--RSVQRWREALEVEESGS
:.. :. : :::::.:.: : . : . :. . . .:..:::.. . .:. :
CCDS14 -GGENTSKSAEEPVVRPKIRNLASPNCVKPKIFFDTDDDDDMPHSTSRWRDTANDNEGHS
250 260 270 280 290 300
360 370 380 390 400 410
pF1KSD DDLLIKCEEYDGEHDCMFLDPPYSRVITQRETENNQMTSESGATAGRQEVDNTFWNGCGD
: : . . :: . . .: : . .::....:. :. : .: ::. :
CCDS14 DGLARRGR---GESSSGYPEPKYPE--DKREARSDQVKPEKVPRRRRTMADPDFWTHSDD
310 320 330 340 350
420 430 440 450 460 470
pF1KSD YYQLYDKDEDSSECSDGEWSASLPHRFSGTEKDQSSSDESWETLPGKDENEPELQS----
::. :.: :: : :: :.: ... . :. ::: :::::::::.: :: .
CCDS14 YYKYCDEDSDS----DKEWIAALRRKYRSREQTLSSSGESWETLPGKEEREPPQAKVSAS
360 370 380 390 400 410
480 490 500 510
pF1KSD --DSSGPE---------------------EENQELSLQEGEQTSLEEGEIPWLQYNEVNE
: :: :: .: :::: ::.::::::::::::.: :.
CCDS14 TGTSPGPGASASAGAGAGASAGSNGSNYLEEVREPSLQE-EQASLEEGEIPWLQYHE-ND
420 430 440 450 460 470
520 530 540 550 560
pF1KSD SSSDEGNEPANEFAQPA-FMLDGNNNLEDDSSVSEDLDVDWSLFDGFADGLGVAEAISYV
:::. :. ..:. ::. :::::::::::::::::::.::::::::::::::::::::::
CCDS14 SSSEGDNDSGHELMQPGVFMLDGNNNLEDDSSVSEDLEVDWSLFDGFADGLGVAEAISYV
480 490 500 510 520 530
570 580 590 600 610 620
pF1KSD DPQFLTYMALEERLAQAMETALAHLESLAVDVEVANPPASKESIDGLPETLVLEDHTAIG
:::::::::::::::::::::::::::::::::::::::::::::.::: :: ::: :.:
CCDS14 DPQFLTYMALEERLAQAMETALAHLESLAVDVEVANPPASKESIDALPEILVTEDHGAVG
540 550 560 570 580 590
630 640 650 660 670 680
pF1KSD QEQCCPICCSEYIKDDIATELPCHHFFHKPCVSIWLQKSGTCPVCRRHFPPAVIEASAAP
::.:::::::::.: ..::::::::.:::::::::::::::::::: :::
CCDS14 QEMCCPICCSEYVKGEVATELPCHHYFHKPCVSIWLQKSGTCPVCRCMFPPPL
600 610 620 630 640
690 700
pF1KSD SSEPDPDAPPSNDSIAEAP
>>CCDS14392.1 PJA1 gene_id:64219|Hs108|chrX (455 aa)
initn: 1472 init1: 1090 opt: 1160 Z-score: 964.4 bits: 188.3 E(32554): 2.1e-47
Smith-Waterman score: 1393; 53.6% identity (70.5% similar) in 448 aa overlap (270-680:18-453)
240 250 260 270 280 290
pF1KSD KSSAGDTEFVHQNSQEIQRSSQDEMVSTKQQNNTSQERQTEH---SPEDAACGPGHICSE
:.::... .: : . . .: :.
CCDS14 MGQESSKPVWPNPTGGYQSNTGRRYGRRHAYVSFRPPTSQRERIASQ
10 20 30 40
300 310 320 330 340 350
pF1KSD RNTNDREKNHGSSPEQVVRPKVRKLISSSQV---DQE---TGFNRHEAKQRSVQRWREAL
:.::.. : :.: :... . :. .:... :.: :..: . :..:::..
CCDS14 RKTNSEVPMHRSAPSQTTK-RSRSPFSTTRRSWDDSESSGTNLNIDNEDYSSTSRWRDTA
50 60 70 80 90 100
360 370 380 390 400 410
pF1KSD EVEESGSDDLLIKCEEYDGEHDCMFLDPPYSRVITQRETENNQMTSESGATAGRQEVDNT
. .:. :: : .. :: . . .: : . .::....:. :. : .:
CCDS14 NDNEGHSDGL---ARRGRGESSSGYPEPKYPE--DKREARSDQVKPEKVPRRRRTMADPD
110 120 130 140 150 160
420 430 440 450 460 470
pF1KSD FWNGCGDYYQLYDKDEDSSECSDGEWSASLPHRFSGTEKDQSSSDESWETLPGKDENEPE
::. :::. :.: :: : :: :.: ... . :. ::: :::::::::.: ::
CCDS14 FWTHSDDYYKYCDEDSDS----DKEWIAALRRKYRSREQTLSSSGESWETLPGKEEREPP
170 180 190 200 210
480 490 500
pF1KSD LQS------DSSGPE---------------------EENQELSLQEGEQTSLEEGEIPWL
. : :: :: .: :::: ::.::::::::::
CCDS14 QAKVSASTGTSPGPGASASAGAGAGASAGSNGSNYLEEVREPSLQE-EQASLEEGEIPWL
220 230 240 250 260 270
510 520 530 540 550 560
pF1KSD QYNEVNESSSDEGNEPANEFAQPA-FMLDGNNNLEDDSSVSEDLDVDWSLFDGFADGLGV
::.: :.:::. :. ..:. ::. :::::::::::::::::::.:::::::::::::::
CCDS14 QYHE-NDSSSEGDNDSGHELMQPGVFMLDGNNNLEDDSSVSEDLEVDWSLFDGFADGLGV
280 290 300 310 320 330
570 580 590 600 610 620
pF1KSD AEAISYVDPQFLTYMALEERLAQAMETALAHLESLAVDVEVANPPASKESIDGLPETLVL
::::::::::::::::::::::::::::::::::::::::::::::::::::.::: ::
CCDS14 AEAISYVDPQFLTYMALEERLAQAMETALAHLESLAVDVEVANPPASKESIDALPEILVT
340 350 360 370 380 390
630 640 650 660 670 680
pF1KSD EDHTAIGQEQCCPICCSEYIKDDIATELPCHHFFHKPCVSIWLQKSGTCPVCRRHFPPAV
::: :.:::.:::::::::.: ..::::::::.:::::::::::::::::::: :::
CCDS14 EDHGAVGQEMCCPICCSEYVKGEVATELPCHHYFHKPCVSIWLQKSGTCPVCRCMFPPPL
400 410 420 430 440 450
690 700
pF1KSD IEASAAPSSEPDPDAPPSNDSIAEAP
708 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 18:32:29 2016 done: Thu Nov 3 18:32:30 2016
Total Scan time: 4.250 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]