FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1893, 798 aa
1>>>pF1KA1893 798 - 798 aa - 798 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 14.1461+/-0.00047; mu= -22.6173+/- 0.029
mean_var=471.7759+/-97.869, 0's: 0 Z-trim(121.9): 99 B-trim: 0 in 0/57
Lambda= 0.059048
statistics sampled from 39038 (39141) to 39038 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.743), E-opt: 0.2 (0.459), width: 16
Scan time: 11.970
The best scores are: opt bits E(85289)
NP_443131 (OMIM: 611239) G protein-regulated induc (1008) 5023 443.1 2.9e-123
NP_001121180 (OMIM: 208250,604283) proteoglycan 4 (1363) 378 47.4 0.00049
NP_005798 (OMIM: 208250,604283) proteoglycan 4 iso (1404) 378 47.4 0.0005
XP_005257115 (OMIM: 114000,120150,130000,130060,16 (1374) 373 47.0 0.00066
XP_005257116 (OMIM: 114000,120150,130000,130060,16 (1158) 357 45.6 0.0015
XP_011522643 (OMIM: 114000,120150,130000,130060,16 (1398) 359 45.8 0.0015
NP_000081 (OMIM: 120180,130020,130050) collagen al (1466) 352 45.2 0.0024
NP_000079 (OMIM: 114000,120150,130000,130060,16620 (1464) 349 45.0 0.0029
XP_011536691 (OMIM: 601234) PREDICTED: nascent pol (2078) 352 45.3 0.0032
XP_006719476 (OMIM: 601234) PREDICTED: nascent pol (2082) 352 45.3 0.0032
XP_006719477 (OMIM: 601234) PREDICTED: nascent pol (2082) 352 45.3 0.0032
XP_006719475 (OMIM: 601234) PREDICTED: nascent pol (2082) 352 45.3 0.0032
>>NP_443131 (OMIM: 611239) G protein-regulated inducer o (1008 aa)
initn: 4989 init1: 4989 opt: 5023 Z-score: 2334.0 bits: 443.1 E(85289): 2.9e-123
Smith-Waterman score: 5023; 96.1% identity (97.3% similar) in 789 aa overlap (1-788:1-788)
10 20 30 40 50 60
pF1KA1 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQDGSLGAGSSAMRDYCPSQQKASPAPPRHT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_443 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQDGSLGAGSSAMRDYCPSQQKASPAPPRHT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 PDQSPGMESRHRSPSGAGEGASCSDGPRGSLACPSPTCFSPQESPSKETLEAHGASISGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_443 PDQSPGMESRHRSPSGAGEGASCSDGPRGSLACPSPTCFSPQESPSKETLEAHGASISGT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 PEATTSGKPEPVSSVKTEPKSSDDRNPMFLEKMDFKSSKQADSTSIGKEDPGSSRKADPM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_443 PEATTSGKPEPVSSVKTEPKSSDDRNPMFLEKMDFKSSKQADSTSIGKEDPGSSRKADPM
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 FTGKAEPEILGKGDPVAPGRMDPMTVRKEDLGSLGKVDPLCSSKTYTVSPRKEDPGSLRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_443 FTGKAEPEILGKGDPVAPGRMDPMTVRKEDLGSLGKVDPLCSSKTYTVSPRKEDPGSLRK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 VDPVSSDKVDPVFPRKEEPRYSGKEHPVSSEKVAPTSAEKVDLVLSGKRDPGPSGKADPV
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::.
NP_443 VDPVSSDKVDPVFPRKEEPRYSGKEHPVSSEKVAPTSAEKVDLVLSGKRDPGPSGKADPM
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 PLESMDSASTGKTEPGLLGKLIPGSSGKNGPVSSGTGAPGSLGRLDPTCLGMADPASVGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_443 PLESMDSASTGKTEPGLLGKLIPGSSGKNGPVSSGTGAPGSLGRLDPTCLGMADPASVGN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 VETVPATKEDSRFLGKMDPASSGEGRPVSGHTDTTASAKTDLTSLKNVDPMSSGKVDPVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_443 VETVPATKEDSRFLGKMDPASSGEGRPVSGHTDTTASAKTDLTSLKNVDPMSSGKVDPVS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 LGKMDPMCSGKPELLSPGQAERVSVGKAGTVSPGKEDPVSSRREDPISAGSRKTSSEKVN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_443 LGKMDPMCSGKPELLSPGQAERVSVGKAGTVSPGKEDPVSSRREDPISAGSRKTSSEKVN
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 PESSGKTNPVSSGPGDPRSLGTAGPPSAVKAEPATGGKGDPLSSEKAGLVASGKAAPTAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_443 PESSGKTNPVSSGPGDPRSLGTAGPPSAVKAEPATGGKGDPLSSEKAGLVASGKAAPTAS
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 GKAEPLAVGKEDPVSKGKADAGPSGQGDSVSIGKVVSTPGKTVPVPSGKVDPVSLGKAEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_443 GKAEPLAVGKEDPVSKGKADAGPSGQGDSVSIGKVVSTPGKTVPVPSGKVDPVSLGKAEA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 IPEGKVGSLPLEKGSPVTTTKADPRASGKAQPQSGGKAETKLPGQEGAAAPGEAGAVCLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_443 IPEGKVGSLPLEKGSPVTTTKADPRASGKAQPQSGGKAETKLPGQEGAAAPGEAGAVCLK
610 620 630 640 650 660
670 680 690 700 710 720
pF1KA1 KETPQASEKVDPGSCRKAEPLASGKGEPVSLGKADSAPSRKTESPSLGKVVPLSLEKTKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_443 KETPQASEKVDPGSCRKAEPLASGKGEPVSLGKADSAPSRKTESPSLGKVVPLSLEKTKP
670 680 690 700 710 720
730 740 750 760 770
pF1KA1 SSSSRQLDRKALGSARSPEGARGSEGR-QASARPVPRAAAECAPAAVLLAGGTHGRVICP
::::::::::::::::::::::::::: . .:.:: . : : :.:.. : ::
NP_443 SSSSRQLDRKALGSARSPEGARGSEGRVEPKAEPVSSTEASSLGQKDLEAAGAE-RSPCP
730 740 750 760 770
780 790
pF1KA1 HFVRPSFRPSQAPFLITGP
. . : :
NP_443 EAAAPPPGPRTRDNFTKAPSWEASAPPPPREDAGTQAGAQACVSVAVSPMSPQDGAGGSA
780 790 800 810 820 830
>>NP_001121180 (OMIM: 208250,604283) proteoglycan 4 isof (1363 aa)
initn: 141 init1: 74 opt: 378 Z-score: 193.5 bits: 47.4 E(85289): 0.00049
Smith-Waterman score: 460; 21.5% identity (48.3% similar) in 810 aa overlap (3-792:336-1079)
10 20 30
pF1KA1 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQD
: ..:: . ..: : ::. :
NP_001 PKEPTPTTPKEPASTTPKEPTPTTIKSAPTTPKEPAPTTTKSAPTTPKEPAPTTTKEPAP
310 320 330 340 350 360
40 50 60 70 80 90
pF1KA1 GSLGAGS-SAMRDYCPSQQKASPAPPRHTPDQSPGMESRHRSPSGAGEGASCSDGPRGSL
. . .. .. :. :..:. :.. .: .. .:. : : . :.
NP_001 TTPKEPAPTTTKEPAPTTTKSAPTTPKEPAPTTP----KKPAPTTPKEPAPTT--PKE--
370 380 390 400 410
100 110 120 130 140 150
pF1KA1 ACPSPTCFSPQESPSKETLEAHGASISGTPEATTSGKPEPVSSVKTEPKSSDDRNPMFLE
:.:: .:.: :. : : : :: .: :.. : : . . :
NP_001 --PTPT--TPKE-PAPTTKE---------PAPTTPKEPAPTAPKKPAPTTPKEPAPT-TP
420 430 440 450 460
160 170 180 190 200 210
pF1KA1 KMDFKSSKQADSTSIGKEDPGSSRKADPMFTGKAEPEILGKGDPVAPGRMDPMTVRKEDL
: .. . : . :: .. :. : : . : :. :..: . .: :...
NP_001 KEPAPTTTKEPSPTTPKEPAPTTTKSAPTTTKEPAPTTT-KSAPTTPKEPSPTTTKEPAP
470 480 490 500 510 520
220 230 240 250 260 270
pF1KA1 GSLGKVDPLCSSKTYTVSPRKEDPGSLRKVDPVSSDKVDPVFPRKEEPRYSGKEHPVSSE
. . : .: ..:.. : . .. :... : :. :.. : . :.. .
NP_001 TTPKEPAPTTPKKPAPTTPKEPAPTTPKEPAPTTTKKPAPTTPKEPAPTTPKETAPTTPK
530 540 550 560 570 580
280 290 300 310 320 330
pF1KA1 KVAPTSAEKVDLVLSGKRDPGPSGKADPVPLESMDSASTGKTEPGLLGKLIPGSSGKNGP
:..::. :: :. . . :.:. . .: . . : ::. : ... : :
NP_001 KLTPTTPEK--LAPTTPEKPAPTTPEELAPTTPEEPTPTTPEEPA---PTTPKAAAPNTP
590 600 610 620 630
340 350 360 370 380 390
pF1KA1 VSSGTGAPGSLGRLDPTCLGMADPASVGNVETVPATKEDSRFLGKMDPASSGEGRPVSGH
. .: .:. .:: . ::.:.: . . .:: . .:. .
NP_001 KEPAPTTPK-----EPAPTTPKEPAPTTPKETAPTTPKGTAPTTLKEPAPTTPKKPAPKE
640 650 660 670 680 690
400 410 420 430 440 450
pF1KA1 -TDTTASAKTDLTSLKNVDPMSSGKVDPVSLGKMDPMCSGKPELLSPGQAERVSVGKAGT
. ::.. :. :: : . : . . :.. . : .: .: . ... . .
NP_001 LAPTTTKEPTSTTSDKPA-PTTPKGTAPTTPKEPAPTTPKEPAPTTPKGTAPTTLKEPAP
700 710 720 730 740 750
460 470 480 490 500 510
pF1KA1 VSPGKEDPVSSRREDPISAGSRKTSSEKVNPESSGKTNPVSSGPGDPRSLGTAGPPSAVK
..: : :. .. . : .:.:.: : . .: :.. : .: .: . :
NP_001 TTPKK--PAPKELAPTTTKGPTSTTSDKPAPTTPKETAPTT--PKEP------APTTPKK
760 770 780 790 800
520 530 540 550 560 570
pF1KA1 AEPATGGKGDPLSSEKAGLVASGKAAPTASGKAEPLAVGKEDPVSKGKADAGPSGQGDSV
:.: : .:: :.. ::.. :: .. : : . .: :. ..
NP_001 PAPTTPETPPPTTSE----VST----PTTT--KEPTTIHKSPDESTPELSAEPTPKALEN
810 820 830 840 850
580 590 600 610 620
pF1KA1 SIGK----VVSTPGKTVP-VPSGKVDPVSLGKAEAIPEGKVGSLPLEKGSPVTTTKA-DP
: . ...::. : : . . : .. .. :: ... . : . .:: :. .
NP_001 SPKEPGVPTTKTPAATKPEMTTTAKDKTTERDLRTTPETTTAAPKMTKETATTTEKTTES
860 870 880 890 900 910
630 640 650 660 670 680
pF1KA1 RASGKAQPQSGGKAETKLPGQ-EGAAAPGEAGAVCLKKETPQASEKVD-PGSCRKAEPLA
. .. . .. .. : . . : : :.: ..: .. : : . :
NP_001 KITATTTQVTSTTTQDTTPFKITTLKTTTLAPKVTTTKKTITTTEIMNKPEETAKPKDRA
920 930 940 950 960 970
690 700 710 720 730
pF1KA1 SG-KGEPVSLGKADSAPSRKTESPSLGKVVPLSLEKTKPSSSSRQLDRKALGSARSPE--
.. :. . : .:: .: : . :..: ..: : . . :.. .. ::
NP_001 TNSKATTPKPQKPTKAP-KKPTSTKKPKTMP-RVRKPKTTPTPRKM------TSTMPELN
980 990 1000 1010 1020
740 750 760 770 780 790
pF1KA1 -GARGSEGR-QASARP--VPRAA-AECAPAAVLLAGGTHGRVICPH-FVRPS-FRPSQAP
.: .:. :...:: .: . .: : . :::..:.. :: ..:: : : .:
NP_001 PTSRIAEAMLQTTTRPNQTPNSKLVEVNPKSED-AGGAEGET--PHMLLRPHVFMPEVTP
1030 1040 1050 1060 1070
pF1KA1 FLITGP
NP_001 DMDYLPRVPNQGIIINPMLSDETNICNGKPVDGLTTLRNGTLVAFRGHYFWMLSPFSPPS
1080 1090 1100 1110 1120 1130
>>NP_005798 (OMIM: 208250,604283) proteoglycan 4 isoform (1404 aa)
initn: 141 init1: 74 opt: 378 Z-score: 193.3 bits: 47.4 E(85289): 0.0005
Smith-Waterman score: 460; 21.5% identity (48.3% similar) in 810 aa overlap (3-792:377-1120)
10 20 30
pF1KA1 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQD
: ..:: . ..: : ::. :
NP_005 PKEPTPTTPKEPASTTPKEPTPTTIKSAPTTPKEPAPTTTKSAPTTPKEPAPTTTKEPAP
350 360 370 380 390 400
40 50 60 70 80 90
pF1KA1 GSLGAGS-SAMRDYCPSQQKASPAPPRHTPDQSPGMESRHRSPSGAGEGASCSDGPRGSL
. . .. .. :. :..:. :.. .: .. .:. : : . :.
NP_005 TTPKEPAPTTTKEPAPTTTKSAPTTPKEPAPTTP----KKPAPTTPKEPAPTT--PKE--
410 420 430 440 450
100 110 120 130 140 150
pF1KA1 ACPSPTCFSPQESPSKETLEAHGASISGTPEATTSGKPEPVSSVKTEPKSSDDRNPMFLE
:.:: .:.: :. : : : :: .: :.. : : . . :
NP_005 --PTPT--TPKE-PAPTTKE---------PAPTTPKEPAPTAPKKPAPTTPKEPAPT-TP
460 470 480 490 500
160 170 180 190 200 210
pF1KA1 KMDFKSSKQADSTSIGKEDPGSSRKADPMFTGKAEPEILGKGDPVAPGRMDPMTVRKEDL
: .. . : . :: .. :. : : . : :. :..: . .: :...
NP_005 KEPAPTTTKEPSPTTPKEPAPTTTKSAPTTTKEPAPTTT-KSAPTTPKEPSPTTTKEPAP
510 520 530 540 550 560
220 230 240 250 260 270
pF1KA1 GSLGKVDPLCSSKTYTVSPRKEDPGSLRKVDPVSSDKVDPVFPRKEEPRYSGKEHPVSSE
. . : .: ..:.. : . .. :... : :. :.. : . :.. .
NP_005 TTPKEPAPTTPKKPAPTTPKEPAPTTPKEPAPTTTKKPAPTTPKEPAPTTPKETAPTTPK
570 580 590 600 610 620
280 290 300 310 320 330
pF1KA1 KVAPTSAEKVDLVLSGKRDPGPSGKADPVPLESMDSASTGKTEPGLLGKLIPGSSGKNGP
:..::. :: :. . . :.:. . .: . . : ::. : ... : :
NP_005 KLTPTTPEK--LAPTTPEKPAPTTPEELAPTTPEEPTPTTPEEPA---PTTPKAAAPNTP
630 640 650 660 670
340 350 360 370 380 390
pF1KA1 VSSGTGAPGSLGRLDPTCLGMADPASVGNVETVPATKEDSRFLGKMDPASSGEGRPVSGH
. .: .:. .:: . ::.:.: . . .:: . .:. .
NP_005 KEPAPTTPK-----EPAPTTPKEPAPTTPKETAPTTPKGTAPTTLKEPAPTTPKKPAPKE
680 690 700 710 720 730
400 410 420 430 440 450
pF1KA1 -TDTTASAKTDLTSLKNVDPMSSGKVDPVSLGKMDPMCSGKPELLSPGQAERVSVGKAGT
. ::.. :. :: : . : . . :.. . : .: .: . ... . .
NP_005 LAPTTTKEPTSTTSDKPA-PTTPKGTAPTTPKEPAPTTPKEPAPTTPKGTAPTTLKEPAP
740 750 760 770 780 790
460 470 480 490 500 510
pF1KA1 VSPGKEDPVSSRREDPISAGSRKTSSEKVNPESSGKTNPVSSGPGDPRSLGTAGPPSAVK
..: : :. .. . : .:.:.: : . .: :.. : .: .: . :
NP_005 TTPKK--PAPKELAPTTTKGPTSTTSDKPAPTTPKETAPTT--PKEP------APTTPKK
800 810 820 830 840
520 530 540 550 560 570
pF1KA1 AEPATGGKGDPLSSEKAGLVASGKAAPTASGKAEPLAVGKEDPVSKGKADAGPSGQGDSV
:.: : .:: :.. ::.. :: .. : : . .: :. ..
NP_005 PAPTTPETPPPTTSE----VST----PTTT--KEPTTIHKSPDESTPELSAEPTPKALEN
850 860 870 880 890
580 590 600 610 620
pF1KA1 SIGK----VVSTPGKTVP-VPSGKVDPVSLGKAEAIPEGKVGSLPLEKGSPVTTTKA-DP
: . ...::. : : . . : .. .. :: ... . : . .:: :. .
NP_005 SPKEPGVPTTKTPAATKPEMTTTAKDKTTERDLRTTPETTTAAPKMTKETATTTEKTTES
900 910 920 930 940 950
630 640 650 660 670 680
pF1KA1 RASGKAQPQSGGKAETKLPGQ-EGAAAPGEAGAVCLKKETPQASEKVD-PGSCRKAEPLA
. .. . .. .. : . . : : :.: ..: .. : : . :
NP_005 KITATTTQVTSTTTQDTTPFKITTLKTTTLAPKVTTTKKTITTTEIMNKPEETAKPKDRA
960 970 980 990 1000 1010
690 700 710 720 730
pF1KA1 SG-KGEPVSLGKADSAPSRKTESPSLGKVVPLSLEKTKPSSSSRQLDRKALGSARSPE--
.. :. . : .:: .: : . :..: ..: : . . :.. .. ::
NP_005 TNSKATTPKPQKPTKAP-KKPTSTKKPKTMP-RVRKPKTTPTPRKM------TSTMPELN
1020 1030 1040 1050 1060
740 750 760 770 780 790
pF1KA1 -GARGSEGR-QASARP--VPRAA-AECAPAAVLLAGGTHGRVICPH-FVRPS-FRPSQAP
.: .:. :...:: .: . .: : . :::..:.. :: ..:: : : .:
NP_005 PTSRIAEAMLQTTTRPNQTPNSKLVEVNPKSED-AGGAEGET--PHMLLRPHVFMPEVTP
1070 1080 1090 1100 1110 1120
pF1KA1 FLITGP
NP_005 DMDYLPRVPNQGIIINPMLSDETNICNGKPVDGLTTLRNGTLVAFRGHYFWMLSPFSPPS
1130 1140 1150 1160 1170 1180
>>XP_005257115 (OMIM: 114000,120150,130000,130060,166200 (1374 aa)
initn: 165 init1: 84 opt: 373 Z-score: 191.2 bits: 47.0 E(85289): 0.00066
Smith-Waterman score: 429; 26.8% identity (47.8% similar) in 761 aa overlap (47-775:285-976)
20 30 40 50 60 70
pF1KA1 SSPPGPRPTAFFCPQDGSLGAGSSAMRDYCPSQQKASP----APPRHTPDQSPGMESRHR
:. . .:: :: . : :: ..:
XP_005 LPGTAGLPGMKGHRGFSGLDGAKGDAGPAGPKGEPGSPGENGAPGQMGPRGLPGERGRPG
260 270 280 290 300 310
80 90 100 110 120
pF1KA1 SPSGAG----EGASCSDGPRGSLACPSPTCFSPQESPSKETLEAHGASISGTPEATTS--
.:. :: .::. . :: : . .: : : .: .: : :... .
XP_005 APGPAGARGNDGATGAAGPPGPTGPAGPPGF-PGAVGAKGEAGPQGPRGSEGPQGVRGEP
320 330 340 350 360 370
130 140 150 160 170 180
pF1KA1 GKPEPVSSVKTEPKSSDDRNPMFLEKMDFKSSKQADSTSIGKEDPGSSRKADPMFTGKAE
: : :.... . . : .: :... : . . . ::. . :. :
XP_005 GPPGPAGAAGPAGNPGADGQP------GAKGANGAPGIAGAPGFPGARGPSGPQGPGGPP
380 390 400 410 420
190 200 210 220 230 240
pF1KA1 PEILGKGDPVAPGRMDPMTVRKEDLGSLGKVDPLCSSKTYTVSPRKEDPGSLRKVDPVSS
..:.: ::: : : :. :. :. . .: :: :..
XP_005 GPKGNSGEPGAPGS-------KGDTGAKGEPGPVGVQ-----GP----PG------PAGE
430 440 450 460
250 260 270 280 290 300
pF1KA1 DKVDPVFPRKEEPRYSGKEHPVSSEKVAPTSA--EKVDLVLSGKRDPGPSGKADPVPLES
. . . :: .: : .:. .: : .: : . : : :. :. ..
XP_005 EGKRGA---RGEPGPTGLPGP-PGERGGPGSRGFPGADGVAGPKGPAGERGSPGPAGPKG
470 480 490 500 510 520
310 320 330 340 350 360
pF1KA1 MDSASTGKTEPGLLG-KLIPGSSGKNGPVSSGTGAPGSLGRLDPTCLGMADPASVGN--V
. . : :: : : . :: :. :: .. :: :: :. : . :.. :. :
XP_005 SPGEAGRPGEAGLPGAKGLTGSPGSPGP-DGKTGPPGPAGQ-DGRPGPPGPPGARGQAGV
530 540 550 560 570
370 380 390 400 410 420
pF1KA1 ETVPATKEDSRFLGKMDPASSGEGRPVSGHTDTTASAKTDLTSLKNVDPMSSGKVDPVSL
:. : . : .:...:: : : : ... : : . . : : . :..
XP_005 MGFPGPKGAA---G--EPGKAGE-RGVPGPPGAVGPAGKDGEAGAQGPP---GPAGPAGE
580 590 600 610 620 630
430 440 450 460 470
pF1KA1 -GKMDPMCSGKPELLS-PGQAERVSVGKAGTVSPGKED-PVSSRREDPISA-GSRKTSSE
:.. : .:.: . . :: : :.:: .::.. : . : .: : : .:
XP_005 RGEQGP--AGSPGFQGLPGPAG--PPGEAG--KPGEQGVPGDLGAPGPSGARGERGFPGE
640 650 660 670 680
480 490 500 510 520 530
pF1KA1 KVNPESSGKTNP--VSSGPGDPRSLGTAGPPSAVKAEPATGGKGDPLSSEKAGLVAS---
. : ..: ....::. . : :: :.: .. : : .: : ::: .
XP_005 RGVQGPPGPAGPRGANGAPGNDGAKGDAGAPGAPGSQGAPGLQGMPGERGAAGLPGPKGD
690 700 710 720 730 740
540 550 560 570 580
pF1KA1 -GKAAPT-ASGKAEPLAV-GKEDPVSKGKADAGPSGQGDSVSIGKVVSTPGKTVPVPSGK
: :.: :.:. .: : :.. ..:. .:.: : . : .. .: :.
XP_005 RGDAGPKGADGSPGKDGVRGLTGPIGPPGPAGAPGDKGESGPSGPAGPTGARGAPGDRGE
750 760 770 780 790 800
590 600 610 620 630 640
pF1KA1 VDPVSLGKAE-AIPEGKVGSLPLEKGSPVTTTKADPRASGKAQPQSGGKAETKLPGQEG-
: : : : : : :. : :: : .: :.: : : : . . :: :
XP_005 PGPP--GPAGFAGPPGADGQ-PGAKGEP-----GDAGAKGDAGPP-GPAGPAGPPGPIGN
810 820 830 840 850
650 660 670 680 690 700
pF1KA1 AAAPGEAGAVCLKKETPQASEKVDPGSCRKAEPLASGKGEPVSLGKADSAPSRKTESPSL
..::: :: . : .. ::. .. : . .::: . : . .. : .: .
XP_005 VGAPGAKGAR--GSAGPPGATGF-PGAAGRVGP-PGPSGEPGKQGPSGASGERGPPGP-M
860 870 880 890 900 910
710 720 730 740 750 760
pF1KA1 GKVVPLSLEKTKPSSSSRQLDRKALGS-AR--SPEGARGSEGRQASARPVPRAAAECAPA
: : .: :. :.:. : :: .: :: ::.:..:. . : : .: ::.
XP_005 G---PPGLAGP-PGESGREGAPGAEGSPGRDGSP-GAKGDRGETGPAGPPGAPGAPGAPG
920 930 940 950 960
770 780 790
pF1KA1 AVLLAGGTHGRVICPHFVRPSFRPSQAPFLITGP
: :: . :
XP_005 PVGPAGKSGDRGETGPAGPAGPVGPVGARGPAGPQGPRGDKGETGEQGDRGIKGHRGFSG
970 980 990 1000 1010 1020
>>XP_005257116 (OMIM: 114000,120150,130000,130060,166200 (1158 aa)
initn: 130 init1: 86 opt: 357 Z-score: 184.9 bits: 45.6 E(85289): 0.0015
Smith-Waterman score: 394; 25.7% identity (44.7% similar) in 804 aa overlap (20-774:82-836)
10 20 30 40
pF1KA1 MDTAEDPAWLQLLQKDSSPPGPR-PTAFFCP--QDGSLGAGSSAMRDYC
:: . : . :: ::: . ..
XP_005 VWKPEPCRICVCDNGKVLCDDVICDETKNCPGAEVPEGECCPVCPDGSESPTDQETTGVE
60 70 80 90 100 110
50 60 70 80 90 100
pF1KA1 PSQQKASPAPPRHTPDQSPGMESRHRSPSGAGEGASCSDGPRGSLACPSPT----CFSPQ
. ..: :: : :: : :. : :: : . :.: :.::
XP_005 GPKGDTGPRGPRG-PAGPPG---RDGIPGQPG-----LPGPPGPPGPPGPPGLGGNFAPQ
120 130 140 150 160
110 120 130 140 150
pF1KA1 ESPSKETLEAHGASISGT-----PEATTS--GKPEP--VSSVKTEPKSSDDRNPMFLEKM
: . . . : :. : :.. . : : : .. :: .:: .
XP_005 LSYGYDEKSTGGISVPGPMGPSGPRGLPGPPGAPGPQGFQGPPGEPGEPGASGPMGPRGP
170 180 190 200 210 220
160 170 180 190 200 210
pF1KA1 DFKSSKQADSTSIGKEDPGSSRKADPMFTGKAEPEILGKGDPVAPGR--MDPMTVRKEDL
.:..:. :: :: . : :. : : :. .. . : :
XP_005 PGPPGKNGDDGEAGK--PGRPGERGPPGPQGARGLPGTAGLPGMKGHRGFSGLDGAKGDA
230 240 250 260 270 280
220 230 240 250 260
pF1KA1 GSLG-KVDPLCSSKTYTVSPRKEDPGSL--RKVDPVSSDKVDPVFPRKEE-----PRYSG
: : : .: .: . .: . : .: .. : . . :. : :. : ..:
XP_005 GPAGPKGEP--GSPGENGAPGQMGPRGLPGERGRPGAPGPAGPAGERGEQGPAGSPGFQG
290 300 310 320 330
270 280 290 300 310 320
pF1KA1 KEHPVSSEKVAPTSAEKVDLVLSGKRDPGPSGKADP--VPLESMDSASTGKTEP-GLLGK
:.. : .:. : . ::::: : : .. : . : : :
XP_005 LPGPAGPPGEAGKPGEQG--VPGDLGAPGPSGARGERGFPGERGVQGPPGPAGPRGANG-
340 350 360 370 380 390
330 340 350 360 370 380
pF1KA1 LIPGSSGKNGPVSSGTGAPGSLGRLDPTCLGMADPASVGNVETVPATKEDSRFLGKMDPA
::..: .: ... ::::: : : :: :. : . .:. : : : :
XP_005 -APGNDGAKGD-AGAPGAPGSQG--APGLQGM--PGERG-AAGLPGPKGDR---GDAGP-
400 410 420 430 440
390 400 410 420 430
pF1KA1 SSGEGRP----VSGHTDTTASAKTDLTSLKNVDPMSSGKVDPVSLGKMDPMCSGKPELLS
....: : : : : . . . . :: . :.. .. : :.:
XP_005 KGADGSPGKDGVRGLTGPIGPPGPAGAPGDKGESGPSGPAGPTG-ARGAPGDRGEPG--P
450 460 470 480 490 500
440 450 460 470 480 490
pF1KA1 PGQAERVSVGKAGTVSPGKEDPVSSRREDPISAGSRKTSSEKVNPESSGKTNPVSS--GP
:: : : :: :: . ... : : .::.. .. .: .:... .:
XP_005 PGPA-----GFAGP--PGADGQPGAKGE-PGDAGAKGDAGPPGPAGPAGPPGPIGNVGAP
510 520 530 540 550
500 510 520 530 540 550
pF1KA1 GDPRSLGTAGPPSAVKAEPATGGKGDPLSSEKAGLVASGKAAPTASGKA---EPLAVGKE
: . :.::::.:. :.: : : : .:: . : .::. : .:.
XP_005 GAKGARGSAGPPGATGFPGAAGRVGPPGPSGNAGPPGPPGPAGKEGGKGPRGETGPAGRP
560 570 580 590 600 610
560 570 580 590 600 610
pF1KA1 DPVSKGKADAGPSGQGDSVSIGKVVSTPGKTVPVPSGKVDPVSL-GKAEAIPEGKVGSLP
:. . ::.:. : . ...:: .: :.: . .. : : .::
XP_005 GEVGP-PGPPGPAGEKGSPGADGPAGAPG--TPGPQGIAGQRGVVGLPGQRGERGFPGLP
620 630 640 650 660 670
620 630 640 650 660
pF1KA1 LEKGSPVTTTKADPR-ASGKAQPQS--GGKAETKLPGQEG-AAAPGEAGAVCLKKETPQA
.: : : : :::. : . : . . ::. : .::: :. . .: :
XP_005 GPSGEP---GKQGPSGASGERGPPGPMGPPGLAGPPGESGREGAPGAEGSPG-RDGSPGA
680 690 700 710 720
670 680 690 700 710 720
pF1KA1 SEKVDPGSCRKA-EPLASGK-GEPVSLGKADSAPSRKTESPS--LGKVVPLSLEKTKPSS
: : : : : : : : : .: : .. .: .:. : : :.. . .
XP_005 --KGDRGETGPAGPPGAPGAPGAPGPVGPAGKSGDRGETGPAGPAGPVGPVGARGPAGPQ
730 740 750 760 770 780
730 740 750 760 770 780
pF1KA1 SSRQLDRKALGSA--RSPEGARGSEGRQASARPVPRAAAECAPAAVLLAGGTHGRVICPH
. : :. : :. .: :: : :. : : . .: .:... .: .:
XP_005 GPRG-DKGETGEQGDRGIKGHRGFSGLQGPPGP-PGSPGEQGPSGASGPAGPRGPPGSAG
790 800 810 820 830 840
790
pF1KA1 FVRPSFRPSQAPFLITGP
XP_005 APGKDGLNGLPGPIGPPGPRGRTGDAGPVGPPGPPGPPGPPGPPSAGFDFSFLPQPPQEK
850 860 870 880 890 900
>>XP_011522643 (OMIM: 114000,120150,130000,130060,166200 (1398 aa)
initn: 123 init1: 86 opt: 359 Z-score: 184.6 bits: 45.8 E(85289): 0.0015
Smith-Waterman score: 427; 27.9% identity (47.5% similar) in 807 aa overlap (16-775:279-1000)
10 20 30 40
pF1KA1 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQDGSLGA-GSSAMRD
:..: ::. ..:. : : ..
XP_011 PQGARGLPGTAGLPGMKGHRGFSGLDGAKGDAGPAGPKGEPGSPGENGAPGQMGPRGL--
250 260 270 280 290 300
50 60 70 80 90
pF1KA1 YCPSQQKASPAP-PRHTP--DQSPGMESRHRSPSGAGE----GASCSDGPRGSLACPSPT
:... :: : .: : .:: .. . .:. :: :: .::.: . :.:
XP_011 --PGERGRPGAPGPAGNPGADGQPGAKGANGAPGIAGAPGFPGARGPSGPQGPGGPPGPK
310 320 330 340 350 360
100 110 120 130 140 150
pF1KA1 CFS--PQESPSKETLEAHG----ASISGTP-EATTSGKPEPVSSVKTEPKSSDDRNPMFL
: : :: :.: ....: : : :: ... :: . .:
XP_011 GNSGEPGAPGSKGDTGAKGEPGPVGVQGPPGPAGEEGK----RGARGEPGPTGLPGPPG-
370 380 390 400 410
160 170 180 190 200
pF1KA1 EKMDFKSS--KQADSTSIGKEDPGSSRKADPMFTGKAEPEILGKGDPVAPGRMDPMTV--
:. : ::... : . :.. : ..: : : : ::.: :: .
XP_011 ERGGPGSRGFPGADGVA-GPKGPAGER-GSP---GPAGP----KGSPGEAGRPGEAGLPG
420 430 440 450 460 470
210 220 230 240 250
pF1KA1 RKEDLGSLGKVDPLCSSKTYTVSPRKED--PGSLRKVDPVSSDKVDPV-FPRKE----EP
: :: :. : ..:: .: .: :: : . .. . :: . ::
XP_011 AKGLTGSPGSPGP--DGKTGPPGPAGQDGRPGP--PGPPGARGQAGVMGFPGPKGAAGEP
480 490 500 510 520
260 270 280 290 300 310
pF1KA1 RYSGKEHPVSSEKVAPTSAEKVDLVLSGKRDPGPSGKADPVPLESMDSASTGKTEPGLLG
.: :. : . : : : : ... :::.: : : ... .:. ::. :
XP_011 GKAG-ERGVPGPPGAVGPAGK-DGEAGAQGPPGPAGPAG----ERGEQGPAGS--PGFQG
530 540 550 560 570
320 330 340 350 360 370
pF1KA1 KLIPGSSGKNGPVSSGTGAPGSLGRLDPTCLGMADPASVGNVETVPATKEDSRFLGKMDP
.:: .: : . : :: : : :: :... . . :. . : . :
XP_011 --LPGPAGPPGEA----GKPGEQGV--PGDLGAPGPSGARGERGFPGER------GVQGP
580 590 600 610 620
380 390 400 410 420 430
pF1KA1 ASSGEGRPVSGHTDTTASAKTDLTSLKNVDPMSSGKVDPVSLGKMDPMCSGKPELLSPGQ
. . : ..: . . :: : . : . :. .: : : : : .: .
XP_011 PGPAGPRGANGAPGNDG-AKGDAGA-----PGAPGSQGAPGLQGM-PGERGAAGLPGP-K
630 640 650 660 670
440 450 460 470 480 490
pF1KA1 AERVSVGKAGTV-SPGKED------PVSSRREDPISAGSRKTSSEKVNPE--SSGKTNPV
..: ..: :. ::::. :.. : .: . : : .: .... :
XP_011 GDRGDAGPKGADGSPGKDGVRGLTGPIGP--PGPAGAPGDKGESGPSGPAGPTGARGAPG
680 690 700 710 720 730
500 510 520 530 540
pF1KA1 SSG-PGDPRSLGTAGPPSAVKAEPATGGKGDPLSSEKAGLVASGKAAPTASGKAEPLA-V
. : :: : : ::::.: : : :: .. :: : :.: .: :.. :
XP_011 DRGEPGPPGPAGFAGPPGADGQPGAKGEPGDAGAKGDAG--PPGPAGP--AGPPGPIGNV
740 750 760 770 780 790
550 560 570 580 590 600
pF1KA1 GKEDPVSKG-KADAGPSGQGDSVSIGKVVSTPGKTVPV-PSGKVDPVSLGKAEAI-PEGK
: : .:: ...::: : . . :. :: . . : : :. :: . :.:.
XP_011 GA--PGAKGARGSAGPPGATGFPGAAGRVGPPGPSGNAGPPGPPGPA--GKEGGKGPRGE
800 810 820 830 840
610 620 630 640 650 660
pF1KA1 VGSL--PLEKGSPVTTTKADPRASG-KAQPQSGGKAETK-LPGQEGAAAPGEAGAVCLKK
.: : : : : . : .: :..: . : : . :: .: : :. :.: :
XP_011 TGPAGRPGEVGPP-----GPPGPAGEKGSPGADGPAGAPGTPGPQGIA--GQRGVVGL--
850 860 870 880 890
670 680 690 700 710 720
pF1KA1 ETPQASEKVDPGSCRKAEPLASGKGEPVSLGKADSAPSRKTESPSLGKVVPLSLEKTKPS
: .:. :: : . .::: . : . .. : .: .: : .: :.
XP_011 -PGQRGERGFPG-------LPGPSGEPGKQGPSGASGERGPPGP-MG---PPGLAGP-PG
900 910 920 930 940
730 740 750 760 770
pF1KA1 SSSRQLDRKALGS-AR--SPEGARGSEGRQASARPVPRAAAECAPAAVLLAGGTHGRVIC
:.:. : :: .: :: ::.:..:. . : : .: ::. : :: . :
XP_011 ESGREGAPGAEGSPGRDGSP-GAKGDRGETGPAGPPGAPGAPGAPGPVGPAGKSGDRGET
950 960 970 980 990 1000
780 790
pF1KA1 PHFVRPSFRPSQAPFLITGP
XP_011 GPAGPAGPVGPVGARGPAGPQGPRGDKGETGEQGDRGIKGHRGFSGLQGPPGPPGSPGEQ
1010 1020 1030 1040 1050 1060
>>NP_000081 (OMIM: 120180,130020,130050) collagen alpha- (1466 aa)
initn: 148 init1: 74 opt: 352 Z-score: 181.1 bits: 45.2 E(85289): 0.0024
Smith-Waterman score: 394; 24.5% identity (46.0% similar) in 881 aa overlap (16-797:142-978)
10 20 30 40
pF1KA1 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQ----DGSLGAGSSA
.: : ::. . :: : . :.. ..
NP_000 GPPGIPGRNGDPGIPGQPGSPGSPGPPGICESCPTGPQN---YSPQYDSYDVKSGVAVGG
120 130 140 150 160
50 60 70 80 90
pF1KA1 MRDY-CPSQQKASPAPPRHTPDQ-SPGMESRHRSPSGAGE-GASCSDGPRGSLACPSPTC
. : :. . :.:: . ::: . . :. :. : : :: :... .:
NP_000 LAGYPGPAGPPGPPGPPGTSGHPGSPGSPGYQGPPGEPGQAGPSGPPGPPGAIGPSGP--
170 180 190 200 210 220
100 110 120 130 140 150
pF1KA1 FSPQESPSKETLEAHGASISGTPEATTSGKPEPVSSVKTEPKSSDDRNPMFLEKMDFKSS
. ... : . . .. : : : : ... : . :. .: ...
NP_000 -AGKDGESGRPGRPGERGLPGPP-----GIKGP-AGIPGFPGMKGHRG------FDGRNG
230 240 250 260 270
160 170 180 190 200 210
pF1KA1 KQADSTSIGKED----PGSSRKADPMFTGKAEPEILGKGDPVAPGRMDPMTVRKED--LG
..... . : . :: . :: : : .: : :: .: .: :
NP_000 EKGETGAPGLKGENGLPGENGAPGPMGPRGAPGE---RGRPGLPG---AAGARGNDGARG
280 290 300 310 320
220 230 240 250 260
pF1KA1 SLGKVDPLCSSKTYTVSPRKEDPGSLRKVDPVSSDKVDPVFPRKEEPR---YSGKEHPVS
: :. : : : . ::. .: :..: . . .. :: ..: . : .
NP_000 SDGQPGPPGPPGTAGF-PGS--PGAKGEVGPAGSPGSNGAPGQRGEPGPQGHAGAQGPPG
330 340 350 360 370 380
270 280 290 300 310
pF1KA1 SEKVAPTSAEKVDL----------VLSGKRDPGPSGKADPVPLESMDSASTGKT----EP
. . . : .. ..... :::.: :. .: .. ::. ::
NP_000 PPGINGSPGGKGEMGPAGIPGAPGLMGARGPPGPAG-ANGAPGLRGGAGEPGKNGAKGEP
390 400 410 420 430 440
320 330 340 350 360
pF1KA1 GLLGKL-------IPGSSGKNG----PVSSGT-GAPGSLG-RLDPTCLGMADPASVGNVE
: :. .::..:..: : :. : ::. : : : : : : .. . :
NP_000 GPRGERGEAGIPGVPGAKGEDGKDGSPGEPGANGLPGAAGERGAPGFRGPAGPNGIPG-E
450 460 470 480 490 500
370 380 390 400 410
pF1KA1 TVPATKEDSRFLGKMDP-ASSGE-GR---PVS-GHTDTTASAKTDLTSLKNVDPMSSGKV
:: .. . : : ...:: :: : . : .: .. : : :.:.
NP_000 KGPAGERGAP--GPAGPRGAAGEPGRDGVPGGPGMRGMPGSPGGPGSDGKPGPPGSQGES
510 520 530 540 550 560
420 430 440 450 460
pF1KA1 D-PVSLGKMDPMCSGKPELLS-PG-QAERVSVGKAGTVS----PGKEDPVSSRRED----
: : : :.: ... :: ... . :: : . :: . : .. :
NP_000 GRPGPPGPSGP--RGQPGVMGFPGPKGNDGAPGKNGERGGPGGPGPQGPPGKNGETGPQG
570 580 590 600 610
470 480 490 500 510 520
pF1KA1 ---PISAGSRKTSSEKVNPESSGKTNPVSSGPGDPRSLGTAGPPSAVKAEPATGGKGDPL
: . :. : .. .:.. ... ::. . : :: . . : : :::::
NP_000 PPGPTGPGGDKGDTGPPGPQGLQGLPGTGGPPGENGKPGEPGPKGDAGAPGAPGGKGD--
620 630 640 650 660 670
530 540 550 560 570 580
pF1KA1 SSEKAGLVASGKAAPTASGKAEPLAVGKEDPVSKG-KADAGPSGQGDSVSIGKVVSTPGK
:: : :. .: . . : : : : .: :. ::: : ... . . ::.
NP_000 ----AG--APGERGPPGLAGAPGLRGGAGPPGPEGGKGAAGPPGPPGAAGTPGLQGMPGE
680 690 700 710 720 730
590 600 610 620
pF1KA1 T----VPVPSG-KVDPVSLGKAEAIP-----EGKVGSL--PLEKGSPVTTTKAD-PRASG
: :.: : .: . : :...: .: .: . : :.: .. : :
NP_000 RGGLGSPGPKGDKGEPGGPG-ADGVPGKDGPRGPTGPIGPPGPAGQPGDKGEGGAPGLPG
740 750 760 770 780
630 640 650 660 670
pF1KA1 KAQPQS--GGKAETKLPGQEG-AAAPGEAGAVCLKKETPQASEKVD---------PGSCR
: :.. : ..:: :: : .:::. : : : .:: . ::.
NP_000 IAGPRGSPGERGETGPPGPAGFPGAPGQNGEPGGKGERGAPGEKGEGGPPGVAGPPGGSG
790 800 810 820 830 840
680 690 700 710 720
pF1KA1 KAEP-----LASGKGEPVSLGKADSAPSRKTESP--SLGKVVPLSLEKTKPSSSSRQLDR
: : . . .: : . : : .: .: : :. : . . .:....
NP_000 PAGPPGPQGVKGERGSPGGPGAAGFPGARGLPGPPGSNGNPGPPG-PSGSPGKDGPPGPA
850 860 870 880 890 900
730 740 750 760 770 780
pF1KA1 KALGSARSP--EGARGSEGRQASARPVPRAAAE-CAPAAVLLAGGTHGRVICPHFVRPSF
:. :: : .:. : : . . : : . ::. . .:: : .: . :.
NP_000 GNTGAPGSPGVSGPKGDAG-QPGEKGSPGAQGPPGAPGPLGIAGITGARGLAGPPGMPGP
910 920 930 940 950 960
790
pF1KA1 RPSQAPFLITGP
: : .: . :
NP_000 RGSPGPQGVKGESGKPGANGLSGERGPPGPQGLPGLAGTAGEPGRDGNPGSDGLPGRDGS
970 980 990 1000 1010 1020
>>NP_000079 (OMIM: 114000,120150,130000,130060,166200,16 (1464 aa)
initn: 123 init1: 86 opt: 349 Z-score: 179.7 bits: 45.0 E(85289): 0.0029
Smith-Waterman score: 421; 27.6% identity (48.0% similar) in 798 aa overlap (11-775:367-1066)
10 20 30 40
pF1KA1 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQDGSLGAGSS
: .. . .:::: .: . :. : ..
NP_000 TGPAGPPGFPGAVGAKGEAGPQGPRGSEGPQGVRGEPGPPGPAGAAGPAGNPGADGQPGA
340 350 360 370 380 390
50 60 70 80 90
pF1KA1 AMRDYCPSQQKASPAPPRHTPD--QSPGMESRHRSPSGAGEGASCSDGPRGSLACPSPTC
. :. : : . :. :.:: .. :: :: : : :. . :.:.
NP_000 KGANGAPGIAGAPGFPGARGPSGPQGPGGPPGPKGNSGE-PGAPGSKGDTGAKGEPGPVG
400 410 420 430 440 450
100 110 120 130 140 150
pF1KA1 FSPQESPSKETLEAHGASISGTPEATTSGKPEPVSSVKTEPKSSDDRNPMFLEKMDFKSS
. .:. : . .:: : : : : : : . . : : ..
NP_000 VQGPPGPAGEEGK-RGAR--GEPGPT--GLPGPPGE-RGGPGS--------------RGF
460 470 480 490
160 170 180 190 200 210
pF1KA1 KQADSTSIGKEDPGSSRKADPMFTGKAEPEILGKGDPVAPGRMDPMTV--RKEDLGSLGK
::... : . :.. : ..: : : : ::.: :: . : :: :.
NP_000 PGADGVA-GPKGPAGER-GSP---GPAGP----KGSPGEAGRPGEAGLPGAKGLTGSPGS
500 510 520 530 540
220 230 240 250 260
pF1KA1 VDPLCSSKTYTVSPRKED--PGSLRKVDPVSSDKVDPV-FPRKE----EPRYSGKEHPVS
: ..:: .: .: :: : . .. . :: . :: .: :. :
NP_000 PGP--DGKTGPPGPAGQDGRPGP--PGPPGARGQAGVMGFPGPKGAAGEPGKAG-ERGVP
550 560 570 580 590 600
270 280 290 300 310 320
pF1KA1 SEKVAPTSAEKVDLVLSGKRDPGPSGKADPVPLESMDSASTGKTEPGLLGKLIPGSSGKN
. : : : : ... :::.: : : ... .:. ::. : .:: .:
NP_000 GPPGAVGPAGK-DGEAGAQGPPGPAGPAG----ERGEQGPAGS--PGFQG--LPGPAGPP
610 620 630 640 650
330 340 350 360 370 380
pF1KA1 GPVSSGTGAPGSLGRLDPTCLGMADPASVGNVETVPATKEDSRFLGKMDPASSGEGRPVS
: . : :: : : :: :... . . :. . : . : . . : ..
NP_000 GEA----GKPGEQGV--PGDLGAPGPSGARGERGFPGER------GVQGPPGPAGPRGAN
660 670 680 690 700
390 400 410 420 430 440
pF1KA1 GHTDTTASAKTDLTSLKNVDPMSSGKVDPVSLGKMDPMCSGKPELLSPGQAERVSVGKAG
: . . .:: : . : . :. .: : : : : .: ...: ..: :
NP_000 G-APGNDGAKGDAGA-----PGAPGSQGAPGLQGM-PGERGAAGLPGP-KGDRGDAGPKG
710 720 730 740 750
450 460 470 480 490
pF1KA1 TV-SPGKED------PVSSRREDPISAGSRKTSSEKVNPE--SSGKTNPVSSG-PGDPRS
. ::::. :.. : .: . : : .: .... : . : :: :
NP_000 ADGSPGKDGVRGLTGPIGP--PGPAGAPGDKGESGPSGPAGPTGARGAPGDRGEPGPPGP
760 770 780 790 800 810
500 510 520 530 540 550
pF1KA1 LGTAGPPSAVKAEPATGGKGDPLSSEKAGLVASGKAAPTA-SGKA-EPLAVGKED-PVSK
: ::::.: ..: :.::.: . :: :.: :.: . .: : : .:. : .:
NP_000 AGFAGPPGA-DGQP--GAKGEPGD---AG--AKGDAGPPGPAGPAGPPGPIGNVGAPGAK
820 830 840 850 860
560 570 580 590 600 610
pF1KA1 G-KADAGPSGQGDSVSIGKVVSTPGKTVPV-PSGKVDPVSLGKAEAIPEGKVGSL--PLE
: ...::: : . . :. :: . . : : :.. ... :.:..: : :
NP_000 GARGSAGPPGATGFPGAAGRVGPPGPSGNAGPPGPPGPAGKEGGKG-PRGETGPAGRPGE
870 880 890 900 910 920
620 630 640 650 660 670
pF1KA1 KGSPVTTTKADPRASG-KAQPQSGGKAETK-LPGQEGAAAPGEAGAVCLKKETPQASEKV
: : . : .: :..: . : : . :: .: : :. :.: : : .:.
NP_000 VGPP-----GPPGPAGEKGSPGADGPAGAPGTPGPQGIA--GQRGVVGLP---GQRGERG
930 940 950 960 970
680 690 700 710 720 730
pF1KA1 DPGSCRKAEPLASGKGEPVSLGKADSAPSRKTESPSLGKVVPLSLEKTKPSSSSRQLDRK
:: : . .::: . : . .. : .: .: : .: :. :.:.
NP_000 FPG-------LPGPSGEPGKQGPSGASGERGPPGP-MG---PPGLAGP-PGESGREGAPG
980 990 1000 1010
740 750 760 770 780
pF1KA1 ALGS-AR--SPEGARGSEGRQASARPVPRAAAECAPAAVLLAGGTHGRVICPHFVRPSFR
: :: .: :: ::.:..:. . : : .: ::. : :: . :
NP_000 AEGSPGRDGSP-GAKGDRGETGPAGPPGAPGAPGAPGPVGPAGKSGDRGETGPAGPAGPV
1020 1030 1040 1050 1060 1070
790
pF1KA1 PSQAPFLITGP
NP_000 GPVGARGPAGPQGPRGDKGETGEQGDRGIKGHRGFSGLQGPPGPPGSPGEQGPSGASGPA
1080 1090 1100 1110 1120 1130
>>XP_011536691 (OMIM: 601234) PREDICTED: nascent polypep (2078 aa)
initn: 87 init1: 54 opt: 352 Z-score: 178.8 bits: 45.3 E(85289): 0.0032
Smith-Waterman score: 463; 25.2% identity (44.0% similar) in 841 aa overlap (3-792:871-1641)
10 20 30
pF1KA1 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQD
: .: . : :.. : : . . :..
XP_011 LSFQGSKDSPATTHSPTPPSPKGAPTPSAVTPLSPKGVTLPPKET--PTPSVVNLPFPKE
850 860 870 880 890
40 50 60 70 80
pF1KA1 GSLG-----AGSSAMRDYCPSQQKASPAPPRHTPDQSPGMESRHRSPSGAGEG-ASCSDG
: : . .: . :.. .:.::: . : :: ::.:: :. .
XP_011 GPATPAPKQAPALSMTSSSPKKARATPAP-KGIP-ASP-------SPKGAPTPPAATPPS
900 910 920 930 940
90 100 110 120 130 140
pF1KA1 PRGSLACPSP--TCFSPQESPSKETLEAHGASISGTPEATTSGKPEPVSSVKTEPKSSDD
:.:. : ::: . : .: . : .:.: .. : : .. : :. .
XP_011 PKGGPATPSPKWAPTPPAATPPSPKGGPATPSPKGAPTPPAATPPSPKGGPAT-PSPKGA
950 960 970 980 990 1000
150 160 170 180 190 200
pF1KA1 RNPMFLEKMDFKSSKQADSTSIGKEDPGSSRKADPMFTGKAEPEILGKGDPVAPGRMDPM
.: . . :.: : : : .. .: . : : : :: :..:. :
XP_011 PTPPAVTPPSPKGSPAATPFPKGASTPPAATPPSPKGSPAATP--LPKGAPTTPAATLPS
1010 1020 1030 1040 1050 1060
210 220 230 240 250 260
pF1KA1 TVRKEDLGSLGKVDPLCSSKTYTVSPRKEDPGSLRKVDPVSSDKVDPVFPRKEEPRYSGK
: : : . .: : : . . : : :. : : .:
XP_011 P----------KGGPATPSLKGAPTPPAATPPSPKGGPATPSPKGAPMPPAATPPSPKGG
1070 1080 1090 1100 1110
270 280 290 300 310 320
pF1KA1 EHPVSSEKVAPTSAEKVDLVLSGKRDPGPSGK-ADPVPLESMDS-ASTGKTEPGLLGKLI
. .: :::. . :.:.: : : : . . :.: . : :.
XP_011 L-ATPPHKGAPTT--------PAATPPSPKGGLATPPPKGAPTTPAATPPSPKGGLATPP
1120 1130 1140 1150 1160
330 340 350 360 370 380
pF1KA1 PGSSGKNGPVSSGTGAPGSLGRLDPTCLGMADPASVGNVETVPATKEDSRFLGKMDPASS
: :..:.. .. :. : :.: :. : . :.::. : : : :
XP_011 P----KGAPTTPAATPPSPKG-------GLATPSPKG-APTTPAATPPSPKGGLATP--S
1170 1180 1190 1200 1210
390 400 410 420 430 440
pF1KA1 GEGRPVSGHTDTTASAKTDLTSLKNVDPMSSGKVDPVSL--GKMDPMCSGKPELLSPGQA
.: :.. . : : : :.. . .. . : : : : .: : .: :
XP_011 PKGAPTTP-AATPPSPKGGLATPSPKGAPTTPAATPPSPKGGPATPPPKGAP---TPPAA
1220 1230 1240 1250 1260
450 460 470 480 490
pF1KA1 ERVSVGKAGTVSPG-KEDPVSSRREDPISAGSRKTSSEKVNPESSGKTNPVSSG-PGDPR
:. :.: ..: : : . : :. :: : : . : : .: :: :
XP_011 TPPSL-KGGLATPPHKGAPNPAVVTPPSPKGGPATSPPKGAPTPPAATPPSPKGSPGTPP
1270 1280 1290 1300 1310 1320
500 510 520 530 540 550
pF1KA1 SLGTAGPPSAVKAEPATGGKGDPL-----SSEKAG-LVASGKAAPTASGKAEPLAVGKE-
:. ::... : :: : : :.: . :.: .:: . : : :
XP_011 PKGAPTPPAVTPPSP----KGTPTLPATTPSSKGGPTTPSSKEGPTPPA-ATPSHKGGPA
1330 1340 1350 1360 1370 1380
560 570 580 590
pF1KA1 -DPVSKGKADAGPSGQGDSVSIGKVVSTPGKT--VPV-------PSG------KVDPVSL
: : .. : :: .:: .: . . .: :. .:: :: : ::::
XP_011 MTPPSPKRGPAIPSPKGDPTSPAVIPLSPKKAPATPVTREGAATPSKGDLTPPAVTPVSL
1390 1400 1410 1420 1430 1440
600 610 620 630 640 650
pF1KA1 GKAEAIPEGKVG-SLPLEKGSPVTTTKADPRASGKAQPQSGGKAETKLPGQEGAAAPGEA
:: : : : . : ::.:. . . : : : : : .. : ... :.:.
XP_011 KKAPATSAPKGGPATPSSKGDPTLPAVTPP--SPKEPPAPKQVATSSSP-KKAPATPAPM
1450 1460 1470 1480 1490 1500
660 670 680 690 700
pF1KA1 GAVCLKKETPQASEKVDPGSCRKAEPLAS-----GKGEPVSLGKADS--APSRKTESPSL
:: : :.. ..: . .:.: .: :..:. .. :. . ::.
XP_011 GAPTLPAVIPSSPKEVPATPSSRRDPIAPTATLLSKKTPATLAPKEALIPPAMTVPSPKK
1510 1520 1530 1540 1550 1560
710 720 730 740 750 760
pF1KA1 GKVVPLSLEKTKPSSSSRQLDRKALGSARSPEGARGSEGRQ------ASARPVPRAAAEC
..: : :.. : . . . : .: .:. . . : . : :. :
XP_011 TPAIPTP--KEAPATPSSK--EASSPPAVTPSTYKGAPSPKELLIPPAVTSPSPKEAP--
1570 1580 1590 1600 1610
770 780 790
pF1KA1 APAAVLLAGGTHGRVICPHFVRPSFRPSQAPFLITGP
.: :: . .: : :. :.. :
XP_011 TPPAVTPPSPEKG----PATPAPKGTPTSPPVTPSSLKDSPTSPASVTCKMGATVPQASK
1620 1630 1640 1650 1660 1670
XP_011 GLPAKKGPTALKEVLVAPAPESTPIITAPTRKGPQTKKSSATSPPICPDPSAKNGSKGPL
1680 1690 1700 1710 1720 1730
>>XP_006719476 (OMIM: 601234) PREDICTED: nascent polypep (2082 aa)
initn: 87 init1: 54 opt: 352 Z-score: 178.8 bits: 45.3 E(85289): 0.0032
Smith-Waterman score: 463; 25.2% identity (44.0% similar) in 841 aa overlap (3-792:871-1641)
10 20 30
pF1KA1 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQD
: .: . : :.. : : . . :..
XP_006 LSFQGSKDSPATTHSPTPPSPKGAPTPSAVTPLSPKGVTLPPKET--PTPSVVNLPFPKE
850 860 870 880 890
40 50 60 70 80
pF1KA1 GSLG-----AGSSAMRDYCPSQQKASPAPPRHTPDQSPGMESRHRSPSGAGEG-ASCSDG
: : . .: . :.. .:.::: . : :: ::.:: :. .
XP_006 GPATPAPKQAPALSMTSSSPKKARATPAP-KGIP-ASP-------SPKGAPTPPAATPPS
900 910 920 930 940
90 100 110 120 130 140
pF1KA1 PRGSLACPSP--TCFSPQESPSKETLEAHGASISGTPEATTSGKPEPVSSVKTEPKSSDD
:.:. : ::: . : .: . : .:.: .. : : .. : :. .
XP_006 PKGGPATPSPKWAPTPPAATPPSPKGGPATPSPKGAPTPPAATPPSPKGGPAT-PSPKGA
950 960 970 980 990 1000
150 160 170 180 190 200
pF1KA1 RNPMFLEKMDFKSSKQADSTSIGKEDPGSSRKADPMFTGKAEPEILGKGDPVAPGRMDPM
.: . . :.: : : : .. .: . : : : :: :..:. :
XP_006 PTPPAVTPPSPKGSPAATPFPKGASTPPAATPPSPKGSPAATP--LPKGAPTTPAATLPS
1010 1020 1030 1040 1050 1060
210 220 230 240 250 260
pF1KA1 TVRKEDLGSLGKVDPLCSSKTYTVSPRKEDPGSLRKVDPVSSDKVDPVFPRKEEPRYSGK
: : : . .: : : . . : : :. : : .:
XP_006 P----------KGGPATPSLKGAPTPPAATPPSPKGGPATPSPKGAPMPPAATPPSPKGG
1070 1080 1090 1100 1110
270 280 290 300 310 320
pF1KA1 EHPVSSEKVAPTSAEKVDLVLSGKRDPGPSGK-ADPVPLESMDS-ASTGKTEPGLLGKLI
. .: :::. . :.:.: : : : . . :.: . : :.
XP_006 L-ATPPHKGAPTT--------PAATPPSPKGGLATPPPKGAPTTPAATPPSPKGGLATPP
1120 1130 1140 1150 1160
330 340 350 360 370 380
pF1KA1 PGSSGKNGPVSSGTGAPGSLGRLDPTCLGMADPASVGNVETVPATKEDSRFLGKMDPASS
: :..:.. .. :. : :.: :. : . :.::. : : : :
XP_006 P----KGAPTTPAATPPSPKG-------GLATPSPKG-APTTPAATPPSPKGGLATP--S
1170 1180 1190 1200 1210
390 400 410 420 430 440
pF1KA1 GEGRPVSGHTDTTASAKTDLTSLKNVDPMSSGKVDPVSL--GKMDPMCSGKPELLSPGQA
.: :.. . : : : :.. . .. . : : : : .: : .: :
XP_006 PKGAPTTP-AATPPSPKGGLATPSPKGAPTTPAATPPSPKGGPATPPPKGAP---TPPAA
1220 1230 1240 1250 1260
450 460 470 480 490
pF1KA1 ERVSVGKAGTVSPG-KEDPVSSRREDPISAGSRKTSSEKVNPESSGKTNPVSSG-PGDPR
:. :.: ..: : : . : :. :: : : . : : .: :: :
XP_006 TPPSL-KGGLATPPHKGAPNPAVVTPPSPKGGPATSPPKGAPTPPAATPPSPKGSPGTPP
1270 1280 1290 1300 1310 1320
500 510 520 530 540 550
pF1KA1 SLGTAGPPSAVKAEPATGGKGDPL-----SSEKAG-LVASGKAAPTASGKAEPLAVGKE-
:. ::... : :: : : :.: . :.: .:: . : : :
XP_006 PKGAPTPPAVTPPSP----KGTPTLPATTPSSKGGPTTPSSKEGPTPPA-ATPSHKGGPA
1330 1340 1350 1360 1370 1380
560 570 580 590
pF1KA1 -DPVSKGKADAGPSGQGDSVSIGKVVSTPGKT--VPV-------PSG------KVDPVSL
: : .. : :: .:: .: . . .: :. .:: :: : ::::
XP_006 MTPPSPKRGPAIPSPKGDPTSPAVIPLSPKKAPATPVTREGAATPSKGDLTPPAVTPVSL
1390 1400 1410 1420 1430 1440
600 610 620 630 640 650
pF1KA1 GKAEAIPEGKVG-SLPLEKGSPVTTTKADPRASGKAQPQSGGKAETKLPGQEGAAAPGEA
:: : : : . : ::.:. . . : : : : : .. : ... :.:.
XP_006 KKAPATSAPKGGPATPSSKGDPTLPAVTPP--SPKEPPAPKQVATSSSP-KKAPATPAPM
1450 1460 1470 1480 1490 1500
660 670 680 690 700
pF1KA1 GAVCLKKETPQASEKVDPGSCRKAEPLAS-----GKGEPVSLGKADS--APSRKTESPSL
:: : :.. ..: . .:.: .: :..:. .. :. . ::.
XP_006 GAPTLPAVIPSSPKEVPATPSSRRDPIAPTATLLSKKTPATLAPKEALIPPAMTVPSPKK
1510 1520 1530 1540 1550 1560
710 720 730 740 750 760
pF1KA1 GKVVPLSLEKTKPSSSSRQLDRKALGSARSPEGARGSEGRQ------ASARPVPRAAAEC
..: : :.. : . . . : .: .:. . . : . : :. :
XP_006 TPAIPTP--KEAPATPSSK--EASSPPAVTPSTYKGAPSPKELLIPPAVTSPSPKEAP--
1570 1580 1590 1600 1610
770 780 790
pF1KA1 APAAVLLAGGTHGRVICPHFVRPSFRPSQAPFLITGP
.: :: . .: : :. :.. :
XP_006 TPPAVTPPSPEKG----PATPAPKGTPTSPPVTPSSLKDSPTSPASVTCKMGATVPQASK
1620 1630 1640 1650 1660 1670
XP_006 GLPAKKGPTALKEVLVAPAPESTPIITAPTRKGPQTKKSSATSPPICPDPSAKNGSKGPL
1680 1690 1700 1710 1720 1730
798 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 22:15:28 2016 done: Wed Nov 2 22:15:30 2016
Total Scan time: 11.970 Total Display time: 0.240
Function used was FASTA [36.3.4 Apr, 2011]