FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0438, 708 aa 1>>>pF1KSDA0438 708 - 708 aa - 708 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.0760+/-0.00093; mu= 12.9470+/- 0.056 mean_var=148.2296+/-29.917, 0's: 0 Z-trim(110.9): 76 B-trim: 0 in 0/50 Lambda= 0.105343 statistics sampled from 11905 (11976) to 11905 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.714), E-opt: 0.2 (0.368), width: 16 Scan time: 4.250 The best scores are: opt bits E(32554) CCDS4099.1 PJA2 gene_id:9867|Hs108|chr5 ( 708) 4813 743.7 2.2e-214 CCDS35316.1 PJA1 gene_id:64219|Hs108|chrX ( 588) 1210 196.0 1.3e-49 CCDS14393.1 PJA1 gene_id:64219|Hs108|chrX ( 643) 1210 196.0 1.4e-49 CCDS14392.1 PJA1 gene_id:64219|Hs108|chrX ( 455) 1160 188.3 2.1e-47 >>CCDS4099.1 PJA2 gene_id:9867|Hs108|chr5 (708 aa) initn: 4813 init1: 4813 opt: 4813 Z-score: 3962.2 bits: 743.7 E(32554): 2.2e-214 Smith-Waterman score: 4813; 99.9% identity (100.0% similar) in 708 aa overlap (1-708:1-708) 10 20 30 40 50 60 pF1KSD MSQYTEKEPAAMDQESGKAVWPKPAGGYQTITGRRYGRRHAYVSFKPCMTRHERSLGRAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 MSQYTEKEPAAMDQESGKAVWPKPAGGYQTITGRRYGRRHAYVSFKPCMTRHERSLGRAG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD DDYEVLELDDVPKENSSGSSPLDQVDSSLPSEPIFEKSETEIPTCGSALNQTTESSQSFV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 DDYEVLELDDVPKENSSGSSPLDQVDSSLPSEPIFEKSETEIPTCGSALNQTTESSQSFV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD AVHHSEEGRDTLGSSTNLHNHSEGEYIPGACSASSVQNGIALVHTDSYDPDGKHGEDNDH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 AVHHSEEGRDTLGSSTNLHNHSEGEYIPGACSASSVQNGIALVHTDSYDPDGKHGEDNDH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD LQLSAEVVEGSRYQESLGNTVFELENREAEAYTGLSPPVPSFNCEVRDEFEELDSVPLVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 LQLSAEVVEGSRYQESLGNTVFELENREAEAYTGLSPPVPSFNCEVRDEFEELDSVPLVK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD SSAGDTEFVHQNSQEIQRSSQDEMVSTKQQNNTSQERQTEHSPEDAACGPGHICSERNTN ::::::::::::::::::::::::::::::::::::::::::::::::::::::::.::: CCDS40 SSAGDTEFVHQNSQEIQRSSQDEMVSTKQQNNTSQERQTEHSPEDAACGPGHICSEQNTN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD DREKNHGSSPEQVVRPKVRKLISSSQVDQETGFNRHEAKQRSVQRWREALEVEESGSDDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 DREKNHGSSPEQVVRPKVRKLISSSQVDQETGFNRHEAKQRSVQRWREALEVEESGSDDL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD LIKCEEYDGEHDCMFLDPPYSRVITQRETENNQMTSESGATAGRQEVDNTFWNGCGDYYQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 LIKCEEYDGEHDCMFLDPPYSRVITQRETENNQMTSESGATAGRQEVDNTFWNGCGDYYQ 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD LYDKDEDSSECSDGEWSASLPHRFSGTEKDQSSSDESWETLPGKDENEPELQSDSSGPEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 LYDKDEDSSECSDGEWSASLPHRFSGTEKDQSSSDESWETLPGKDENEPELQSDSSGPEE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD ENQELSLQEGEQTSLEEGEIPWLQYNEVNESSSDEGNEPANEFAQPAFMLDGNNNLEDDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 ENQELSLQEGEQTSLEEGEIPWLQYNEVNESSSDEGNEPANEFAQPAFMLDGNNNLEDDS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD SVSEDLDVDWSLFDGFADGLGVAEAISYVDPQFLTYMALEERLAQAMETALAHLESLAVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 SVSEDLDVDWSLFDGFADGLGVAEAISYVDPQFLTYMALEERLAQAMETALAHLESLAVD 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD VEVANPPASKESIDGLPETLVLEDHTAIGQEQCCPICCSEYIKDDIATELPCHHFFHKPC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 VEVANPPASKESIDGLPETLVLEDHTAIGQEQCCPICCSEYIKDDIATELPCHHFFHKPC 610 620 630 640 650 660 670 680 690 700 pF1KSD VSIWLQKSGTCPVCRRHFPPAVIEASAAPSSEPDPDAPPSNDSIAEAP :::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 VSIWLQKSGTCPVCRRHFPPAVIEASAAPSSEPDPDAPPSNDSIAEAP 670 680 690 700 >>CCDS35316.1 PJA1 gene_id:64219|Hs108|chrX (588 aa) initn: 1353 init1: 1090 opt: 1210 Z-score: 1003.9 bits: 196.0 E(32554): 1.3e-49 Smith-Waterman score: 1624; 46.9% identity (67.9% similar) in 605 aa overlap (107-680:4-586) 80 90 100 110 120 130 pF1KSD SGSSPLDQVDSSLPSEPIFEKSETEIPTCGSALNQTTESSQS-FVAVHHSEEGRDTLGSS :: .:::. :.: : ....: . .. :.. CCDS35 MHRSAPSQTTKRSRSPFSTTRRSWDDSESSGTN 10 20 30 140 150 160 170 180 190 pF1KSD TNLHNHSEGEYIPGACSASSVQNGIALVHTDSYDPDGKHGEDNDHLQLSAEVVEGSRYQE :. :.. ..: : ::. . :.: : ::: : .. : .. . ..... CCDS35 LNIDNEDYSRYPPREYRASGSRRGMAYGHIDSYGADDSEEEGAGPVERPPVRGKTGKFKD 40 50 60 70 80 90 200 210 220 230 240 250 pF1KSD SLGNTVFELENREAEAYTGLSPPVPSFNCEVRDEFEELDSVPLVKSSAGDTEFVHQNSQE . ... : . :.. .: : ::. .::.: ..:: :: .. ::. ..:. :.: CCDS35 ---DKLYDPE-KGARSLAGPPPHFSSFSRDVREERDKLDPVPAARCSASRADFLPQSSVA 100 110 120 130 140 260 270 280 290 300 310 pF1KSD IQRSSQDEMVSTKQQNNTSQERQTEHSPEDAACGPGHICSERNTNDREKNHGSSPEQVVR : ::. .... . ... .::. .. : . .: ::. :.. :. : ::: CCDS35 SQSSSEGKLAT--KGDSSERERREQNLPARPSRAPVSICG-----GGENTSKSAEEPVVR 150 160 170 180 190 200 320 330 340 350 360 370 pF1KSD PKVRKLISSSQVDQETGFNRHEAKQ--RSVQRWREALEVEESGSDDLLIKCEEYDGEHDC ::.:.: : . : . :. . . .:..:::.. . .:. :: : .. :: . CCDS35 PKIRNLASPNCVKPKIFFDTDDDDDMPHSTSRWRDTANDNEGHSDGL---ARRGRGESSS 210 220 230 240 250 380 390 400 410 420 430 pF1KSD MFLDPPYSRVITQRETENNQMTSESGATAGRQEVDNTFWNGCGDYYQLYDKDEDSSECSD . .: : . .::....:. :. : .: ::. :::. :.: :: : CCDS35 GYPEPKYPE--DKREARSDQVKPEKVPRRRRTMADPDFWTHSDDYYKYCDEDSDS----D 260 270 280 290 300 310 440 450 460 470 pF1KSD GEWSASLPHRFSGTEKDQSSSDESWETLPGKDENEPELQS------DSSGPE-------- :: :.: ... . :. ::: :::::::::.: :: . : :: CCDS35 KEWIAALRRKYRSREQTLSSSGESWETLPGKEEREPPQAKVSASTGTSPGPGASASAGAG 320 330 340 350 360 370 480 490 500 510 520 pF1KSD -------------EENQELSLQEGEQTSLEEGEIPWLQYNEVNESSSDEGNEPANEFAQP :: .: :::: ::.::::::::::::.: :.:::. :. ..:. :: CCDS35 AGASAGSNGSNYLEEVREPSLQE-EQASLEEGEIPWLQYHE-NDSSSEGDNDSGHELMQP 380 390 400 410 420 430 530 540 550 560 570 580 pF1KSD A-FMLDGNNNLEDDSSVSEDLDVDWSLFDGFADGLGVAEAISYVDPQFLTYMALEERLAQ . :::::::::::::::::::.:::::::::::::::::::::::::::::::::::::: CCDS35 GVFMLDGNNNLEDDSSVSEDLEVDWSLFDGFADGLGVAEAISYVDPQFLTYMALEERLAQ 440 450 460 470 480 490 590 600 610 620 630 640 pF1KSD AMETALAHLESLAVDVEVANPPASKESIDGLPETLVLEDHTAIGQEQCCPICCSEYIKDD :::::::::::::::::::::::::::::.::: :: ::: :.:::.:::::::::.: . CCDS35 AMETALAHLESLAVDVEVANPPASKESIDALPEILVTEDHGAVGQEMCCPICCSEYVKGE 500 510 520 530 540 550 650 660 670 680 690 700 pF1KSD IATELPCHHFFHKPCVSIWLQKSGTCPVCRRHFPPAVIEASAAPSSEPDPDAPPSNDSIA .::::::::.:::::::::::::::::::: ::: CCDS35 VATELPCHHYFHKPCVSIWLQKSGTCPVCRCMFPPPL 560 570 580 pF1KSD EAP >>CCDS14393.1 PJA1 gene_id:64219|Hs108|chrX (643 aa) initn: 1567 init1: 1090 opt: 1210 Z-score: 1003.4 bits: 196.0 E(32554): 1.4e-49 Smith-Waterman score: 1782; 45.4% identity (65.7% similar) in 700 aa overlap (12-680:1-641) 10 20 30 40 50 60 pF1KSD MSQYTEKEPAAMDQESGKAVWPKPAGGYQTITGRRYGRRHAYVSFKPCMTRHERSLGRAG : :::.: :::.:.::::. ::::::::::::::.: ...:: CCDS14 MGQESSKPVWPNPTGGYQSNTGRRYGRRHAYVSFRPPTSQRER------ 10 20 30 40 70 80 90 100 110 pF1KSD DDYEVLELDDVPKENSSGSSPLDQVDSSLPSEPIFEKSETEIPTCGSALNQTTESSQS-F . :. .:...:.: :: .:::. :.: : CCDS14 ----------------------------IASQ---RKTNSEVPMHRSAPSQTTKRSRSPF 50 60 70 120 130 140 150 160 170 pF1KSD VAVHHSEEGRDTLGSSTNLHNHSEGEYIPGACSASSVQNGIALVHTDSYDPDGKHGEDND ....: . .. :.. :. :.. ..: : ::. . :.: : ::: : .. : CCDS14 STTRRSWDDSESSGTNLNIDNEDYSRYPPREYRASGSRRGMAYGHIDSYGADDSEEEGAG 80 90 100 110 120 130 180 190 200 210 220 230 pF1KSD HLQLSAEVVEGSRYQESLGNTVFELENREAEAYTGLSPPVPSFNCEVRDEFEELDSVPLV .. . ..... . ... : . :.. .: : ::. .::.: ..:: :: . CCDS14 PVERPPVRGKTGKFKD---DKLYDPE-KGARSLAGPPPHFSSFSRDVREERDKLDPVPAA 140 150 160 170 180 240 250 260 270 280 290 pF1KSD KSSAGDTEFVHQNSQEIQRSSQDEMVSTKQQNNTSQERQTEHSPEDAACGPGHICSERNT . ::. ..:. :.: : ::. .... . ... .::. .. : . .: ::. CCDS14 RCSASRADFLPQSSVASQSSSEGKLAT--KGDSSERERREQNLPARPSRAPVSICG---- 190 200 210 220 230 240 300 310 320 330 340 350 pF1KSD NDREKNHGSSPEQVVRPKVRKLISSSQVDQETGFNRHEAKQ--RSVQRWREALEVEESGS :.. :. : :::::.:.: : . : . :. . . .:..:::.. . .:. : CCDS14 -GGENTSKSAEEPVVRPKIRNLASPNCVKPKIFFDTDDDDDMPHSTSRWRDTANDNEGHS 250 260 270 280 290 300 360 370 380 390 400 410 pF1KSD DDLLIKCEEYDGEHDCMFLDPPYSRVITQRETENNQMTSESGATAGRQEVDNTFWNGCGD : : . . :: . . .: : . .::....:. :. : .: ::. : CCDS14 DGLARRGR---GESSSGYPEPKYPE--DKREARSDQVKPEKVPRRRRTMADPDFWTHSDD 310 320 330 340 350 420 430 440 450 460 470 pF1KSD YYQLYDKDEDSSECSDGEWSASLPHRFSGTEKDQSSSDESWETLPGKDENEPELQS---- ::. :.: :: : :: :.: ... . :. ::: :::::::::.: :: . CCDS14 YYKYCDEDSDS----DKEWIAALRRKYRSREQTLSSSGESWETLPGKEEREPPQAKVSAS 360 370 380 390 400 410 480 490 500 510 pF1KSD --DSSGPE---------------------EENQELSLQEGEQTSLEEGEIPWLQYNEVNE : :: :: .: :::: ::.::::::::::::.: :. CCDS14 TGTSPGPGASASAGAGAGASAGSNGSNYLEEVREPSLQE-EQASLEEGEIPWLQYHE-ND 420 430 440 450 460 470 520 530 540 550 560 pF1KSD SSSDEGNEPANEFAQPA-FMLDGNNNLEDDSSVSEDLDVDWSLFDGFADGLGVAEAISYV :::. :. ..:. ::. :::::::::::::::::::.:::::::::::::::::::::: CCDS14 SSSEGDNDSGHELMQPGVFMLDGNNNLEDDSSVSEDLEVDWSLFDGFADGLGVAEAISYV 480 490 500 510 520 530 570 580 590 600 610 620 pF1KSD DPQFLTYMALEERLAQAMETALAHLESLAVDVEVANPPASKESIDGLPETLVLEDHTAIG :::::::::::::::::::::::::::::::::::::::::::::.::: :: ::: :.: CCDS14 DPQFLTYMALEERLAQAMETALAHLESLAVDVEVANPPASKESIDALPEILVTEDHGAVG 540 550 560 570 580 590 630 640 650 660 670 680 pF1KSD QEQCCPICCSEYIKDDIATELPCHHFFHKPCVSIWLQKSGTCPVCRRHFPPAVIEASAAP ::.:::::::::.: ..::::::::.:::::::::::::::::::: ::: CCDS14 QEMCCPICCSEYVKGEVATELPCHHYFHKPCVSIWLQKSGTCPVCRCMFPPPL 600 610 620 630 640 690 700 pF1KSD SSEPDPDAPPSNDSIAEAP >>CCDS14392.1 PJA1 gene_id:64219|Hs108|chrX (455 aa) initn: 1472 init1: 1090 opt: 1160 Z-score: 964.4 bits: 188.3 E(32554): 2.1e-47 Smith-Waterman score: 1393; 53.6% identity (70.5% similar) in 448 aa overlap (270-680:18-453) 240 250 260 270 280 290 pF1KSD KSSAGDTEFVHQNSQEIQRSSQDEMVSTKQQNNTSQERQTEH---SPEDAACGPGHICSE :.::... .: : . . .: :. CCDS14 MGQESSKPVWPNPTGGYQSNTGRRYGRRHAYVSFRPPTSQRERIASQ 10 20 30 40 300 310 320 330 340 350 pF1KSD RNTNDREKNHGSSPEQVVRPKVRKLISSSQV---DQE---TGFNRHEAKQRSVQRWREAL :.::.. : :.: :... . :. .:... :.: :..: . :..:::.. CCDS14 RKTNSEVPMHRSAPSQTTK-RSRSPFSTTRRSWDDSESSGTNLNIDNEDYSSTSRWRDTA 50 60 70 80 90 100 360 370 380 390 400 410 pF1KSD EVEESGSDDLLIKCEEYDGEHDCMFLDPPYSRVITQRETENNQMTSESGATAGRQEVDNT . .:. :: : .. :: . . .: : . .::....:. :. : .: CCDS14 NDNEGHSDGL---ARRGRGESSSGYPEPKYPE--DKREARSDQVKPEKVPRRRRTMADPD 110 120 130 140 150 160 420 430 440 450 460 470 pF1KSD FWNGCGDYYQLYDKDEDSSECSDGEWSASLPHRFSGTEKDQSSSDESWETLPGKDENEPE ::. :::. :.: :: : :: :.: ... . :. ::: :::::::::.: :: CCDS14 FWTHSDDYYKYCDEDSDS----DKEWIAALRRKYRSREQTLSSSGESWETLPGKEEREPP 170 180 190 200 210 480 490 500 pF1KSD LQS------DSSGPE---------------------EENQELSLQEGEQTSLEEGEIPWL . : :: :: .: :::: ::.:::::::::: CCDS14 QAKVSASTGTSPGPGASASAGAGAGASAGSNGSNYLEEVREPSLQE-EQASLEEGEIPWL 220 230 240 250 260 270 510 520 530 540 550 560 pF1KSD QYNEVNESSSDEGNEPANEFAQPA-FMLDGNNNLEDDSSVSEDLDVDWSLFDGFADGLGV ::.: :.:::. :. ..:. ::. :::::::::::::::::::.::::::::::::::: CCDS14 QYHE-NDSSSEGDNDSGHELMQPGVFMLDGNNNLEDDSSVSEDLEVDWSLFDGFADGLGV 280 290 300 310 320 330 570 580 590 600 610 620 pF1KSD AEAISYVDPQFLTYMALEERLAQAMETALAHLESLAVDVEVANPPASKESIDGLPETLVL ::::::::::::::::::::::::::::::::::::::::::::::::::::.::: :: CCDS14 AEAISYVDPQFLTYMALEERLAQAMETALAHLESLAVDVEVANPPASKESIDALPEILVT 340 350 360 370 380 390 630 640 650 660 670 680 pF1KSD EDHTAIGQEQCCPICCSEYIKDDIATELPCHHFFHKPCVSIWLQKSGTCPVCRRHFPPAV ::: :.:::.:::::::::.: ..::::::::.:::::::::::::::::::: ::: CCDS14 EDHGAVGQEMCCPICCSEYVKGEVATELPCHHYFHKPCVSIWLQKSGTCPVCRCMFPPPL 400 410 420 430 440 450 690 700 pF1KSD IEASAAPSSEPDPDAPPSNDSIAEAP 708 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 18:32:29 2016 done: Thu Nov 3 18:32:30 2016 Total Scan time: 4.250 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]