FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1893, 798 aa 1>>>pF1KA1893 798 - 798 aa - 798 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 14.1461+/-0.00047; mu= -22.6173+/- 0.029 mean_var=471.7759+/-97.869, 0's: 0 Z-trim(121.9): 99 B-trim: 0 in 0/57 Lambda= 0.059048 statistics sampled from 39038 (39141) to 39038 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.743), E-opt: 0.2 (0.459), width: 16 Scan time: 11.970 The best scores are: opt bits E(85289) NP_443131 (OMIM: 611239) G protein-regulated induc (1008) 5023 443.1 2.9e-123 NP_001121180 (OMIM: 208250,604283) proteoglycan 4 (1363) 378 47.4 0.00049 NP_005798 (OMIM: 208250,604283) proteoglycan 4 iso (1404) 378 47.4 0.0005 XP_005257115 (OMIM: 114000,120150,130000,130060,16 (1374) 373 47.0 0.00066 XP_005257116 (OMIM: 114000,120150,130000,130060,16 (1158) 357 45.6 0.0015 XP_011522643 (OMIM: 114000,120150,130000,130060,16 (1398) 359 45.8 0.0015 NP_000081 (OMIM: 120180,130020,130050) collagen al (1466) 352 45.2 0.0024 NP_000079 (OMIM: 114000,120150,130000,130060,16620 (1464) 349 45.0 0.0029 XP_011536691 (OMIM: 601234) PREDICTED: nascent pol (2078) 352 45.3 0.0032 XP_006719476 (OMIM: 601234) PREDICTED: nascent pol (2082) 352 45.3 0.0032 XP_006719477 (OMIM: 601234) PREDICTED: nascent pol (2082) 352 45.3 0.0032 XP_006719475 (OMIM: 601234) PREDICTED: nascent pol (2082) 352 45.3 0.0032 >>NP_443131 (OMIM: 611239) G protein-regulated inducer o (1008 aa) initn: 4989 init1: 4989 opt: 5023 Z-score: 2334.0 bits: 443.1 E(85289): 2.9e-123 Smith-Waterman score: 5023; 96.1% identity (97.3% similar) in 789 aa overlap (1-788:1-788) 10 20 30 40 50 60 pF1KA1 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQDGSLGAGSSAMRDYCPSQQKASPAPPRHT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_443 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQDGSLGAGSSAMRDYCPSQQKASPAPPRHT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 PDQSPGMESRHRSPSGAGEGASCSDGPRGSLACPSPTCFSPQESPSKETLEAHGASISGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_443 PDQSPGMESRHRSPSGAGEGASCSDGPRGSLACPSPTCFSPQESPSKETLEAHGASISGT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 PEATTSGKPEPVSSVKTEPKSSDDRNPMFLEKMDFKSSKQADSTSIGKEDPGSSRKADPM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_443 PEATTSGKPEPVSSVKTEPKSSDDRNPMFLEKMDFKSSKQADSTSIGKEDPGSSRKADPM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 FTGKAEPEILGKGDPVAPGRMDPMTVRKEDLGSLGKVDPLCSSKTYTVSPRKEDPGSLRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_443 FTGKAEPEILGKGDPVAPGRMDPMTVRKEDLGSLGKVDPLCSSKTYTVSPRKEDPGSLRK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 VDPVSSDKVDPVFPRKEEPRYSGKEHPVSSEKVAPTSAEKVDLVLSGKRDPGPSGKADPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::. NP_443 VDPVSSDKVDPVFPRKEEPRYSGKEHPVSSEKVAPTSAEKVDLVLSGKRDPGPSGKADPM 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 PLESMDSASTGKTEPGLLGKLIPGSSGKNGPVSSGTGAPGSLGRLDPTCLGMADPASVGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_443 PLESMDSASTGKTEPGLLGKLIPGSSGKNGPVSSGTGAPGSLGRLDPTCLGMADPASVGN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 VETVPATKEDSRFLGKMDPASSGEGRPVSGHTDTTASAKTDLTSLKNVDPMSSGKVDPVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_443 VETVPATKEDSRFLGKMDPASSGEGRPVSGHTDTTASAKTDLTSLKNVDPMSSGKVDPVS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 LGKMDPMCSGKPELLSPGQAERVSVGKAGTVSPGKEDPVSSRREDPISAGSRKTSSEKVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_443 LGKMDPMCSGKPELLSPGQAERVSVGKAGTVSPGKEDPVSSRREDPISAGSRKTSSEKVN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 PESSGKTNPVSSGPGDPRSLGTAGPPSAVKAEPATGGKGDPLSSEKAGLVASGKAAPTAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_443 PESSGKTNPVSSGPGDPRSLGTAGPPSAVKAEPATGGKGDPLSSEKAGLVASGKAAPTAS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 GKAEPLAVGKEDPVSKGKADAGPSGQGDSVSIGKVVSTPGKTVPVPSGKVDPVSLGKAEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_443 GKAEPLAVGKEDPVSKGKADAGPSGQGDSVSIGKVVSTPGKTVPVPSGKVDPVSLGKAEA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 IPEGKVGSLPLEKGSPVTTTKADPRASGKAQPQSGGKAETKLPGQEGAAAPGEAGAVCLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_443 IPEGKVGSLPLEKGSPVTTTKADPRASGKAQPQSGGKAETKLPGQEGAAAPGEAGAVCLK 610 620 630 640 650 660 670 680 690 700 710 720 pF1KA1 KETPQASEKVDPGSCRKAEPLASGKGEPVSLGKADSAPSRKTESPSLGKVVPLSLEKTKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_443 KETPQASEKVDPGSCRKAEPLASGKGEPVSLGKADSAPSRKTESPSLGKVVPLSLEKTKP 670 680 690 700 710 720 730 740 750 760 770 pF1KA1 SSSSRQLDRKALGSARSPEGARGSEGR-QASARPVPRAAAECAPAAVLLAGGTHGRVICP ::::::::::::::::::::::::::: . .:.:: . : : :.:.. : :: NP_443 SSSSRQLDRKALGSARSPEGARGSEGRVEPKAEPVSSTEASSLGQKDLEAAGAE-RSPCP 730 740 750 760 770 780 790 pF1KA1 HFVRPSFRPSQAPFLITGP . . : : NP_443 EAAAPPPGPRTRDNFTKAPSWEASAPPPPREDAGTQAGAQACVSVAVSPMSPQDGAGGSA 780 790 800 810 820 830 >>NP_001121180 (OMIM: 208250,604283) proteoglycan 4 isof (1363 aa) initn: 141 init1: 74 opt: 378 Z-score: 193.5 bits: 47.4 E(85289): 0.00049 Smith-Waterman score: 460; 21.5% identity (48.3% similar) in 810 aa overlap (3-792:336-1079) 10 20 30 pF1KA1 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQD : ..:: . ..: : ::. : NP_001 PKEPTPTTPKEPASTTPKEPTPTTIKSAPTTPKEPAPTTTKSAPTTPKEPAPTTTKEPAP 310 320 330 340 350 360 40 50 60 70 80 90 pF1KA1 GSLGAGS-SAMRDYCPSQQKASPAPPRHTPDQSPGMESRHRSPSGAGEGASCSDGPRGSL . . .. .. :. :..:. :.. .: .. .:. : : . :. NP_001 TTPKEPAPTTTKEPAPTTTKSAPTTPKEPAPTTP----KKPAPTTPKEPAPTT--PKE-- 370 380 390 400 410 100 110 120 130 140 150 pF1KA1 ACPSPTCFSPQESPSKETLEAHGASISGTPEATTSGKPEPVSSVKTEPKSSDDRNPMFLE :.:: .:.: :. : : : :: .: :.. : : . . : NP_001 --PTPT--TPKE-PAPTTKE---------PAPTTPKEPAPTAPKKPAPTTPKEPAPT-TP 420 430 440 450 460 160 170 180 190 200 210 pF1KA1 KMDFKSSKQADSTSIGKEDPGSSRKADPMFTGKAEPEILGKGDPVAPGRMDPMTVRKEDL : .. . : . :: .. :. : : . : :. :..: . .: :... NP_001 KEPAPTTTKEPSPTTPKEPAPTTTKSAPTTTKEPAPTTT-KSAPTTPKEPSPTTTKEPAP 470 480 490 500 510 520 220 230 240 250 260 270 pF1KA1 GSLGKVDPLCSSKTYTVSPRKEDPGSLRKVDPVSSDKVDPVFPRKEEPRYSGKEHPVSSE . . : .: ..:.. : . .. :... : :. :.. : . :.. . NP_001 TTPKEPAPTTPKKPAPTTPKEPAPTTPKEPAPTTTKKPAPTTPKEPAPTTPKETAPTTPK 530 540 550 560 570 580 280 290 300 310 320 330 pF1KA1 KVAPTSAEKVDLVLSGKRDPGPSGKADPVPLESMDSASTGKTEPGLLGKLIPGSSGKNGP :..::. :: :. . . :.:. . .: . . : ::. : ... : : NP_001 KLTPTTPEK--LAPTTPEKPAPTTPEELAPTTPEEPTPTTPEEPA---PTTPKAAAPNTP 590 600 610 620 630 340 350 360 370 380 390 pF1KA1 VSSGTGAPGSLGRLDPTCLGMADPASVGNVETVPATKEDSRFLGKMDPASSGEGRPVSGH . .: .:. .:: . ::.:.: . . .:: . .:. . NP_001 KEPAPTTPK-----EPAPTTPKEPAPTTPKETAPTTPKGTAPTTLKEPAPTTPKKPAPKE 640 650 660 670 680 690 400 410 420 430 440 450 pF1KA1 -TDTTASAKTDLTSLKNVDPMSSGKVDPVSLGKMDPMCSGKPELLSPGQAERVSVGKAGT . ::.. :. :: : . : . . :.. . : .: .: . ... . . NP_001 LAPTTTKEPTSTTSDKPA-PTTPKGTAPTTPKEPAPTTPKEPAPTTPKGTAPTTLKEPAP 700 710 720 730 740 750 460 470 480 490 500 510 pF1KA1 VSPGKEDPVSSRREDPISAGSRKTSSEKVNPESSGKTNPVSSGPGDPRSLGTAGPPSAVK ..: : :. .. . : .:.:.: : . .: :.. : .: .: . : NP_001 TTPKK--PAPKELAPTTTKGPTSTTSDKPAPTTPKETAPTT--PKEP------APTTPKK 760 770 780 790 800 520 530 540 550 560 570 pF1KA1 AEPATGGKGDPLSSEKAGLVASGKAAPTASGKAEPLAVGKEDPVSKGKADAGPSGQGDSV :.: : .:: :.. ::.. :: .. : : . .: :. .. NP_001 PAPTTPETPPPTTSE----VST----PTTT--KEPTTIHKSPDESTPELSAEPTPKALEN 810 820 830 840 850 580 590 600 610 620 pF1KA1 SIGK----VVSTPGKTVP-VPSGKVDPVSLGKAEAIPEGKVGSLPLEKGSPVTTTKA-DP : . ...::. : : . . : .. .. :: ... . : . .:: :. . NP_001 SPKEPGVPTTKTPAATKPEMTTTAKDKTTERDLRTTPETTTAAPKMTKETATTTEKTTES 860 870 880 890 900 910 630 640 650 660 670 680 pF1KA1 RASGKAQPQSGGKAETKLPGQ-EGAAAPGEAGAVCLKKETPQASEKVD-PGSCRKAEPLA . .. . .. .. : . . : : :.: ..: .. : : . : NP_001 KITATTTQVTSTTTQDTTPFKITTLKTTTLAPKVTTTKKTITTTEIMNKPEETAKPKDRA 920 930 940 950 960 970 690 700 710 720 730 pF1KA1 SG-KGEPVSLGKADSAPSRKTESPSLGKVVPLSLEKTKPSSSSRQLDRKALGSARSPE-- .. :. . : .:: .: : . :..: ..: : . . :.. .. :: NP_001 TNSKATTPKPQKPTKAP-KKPTSTKKPKTMP-RVRKPKTTPTPRKM------TSTMPELN 980 990 1000 1010 1020 740 750 760 770 780 790 pF1KA1 -GARGSEGR-QASARP--VPRAA-AECAPAAVLLAGGTHGRVICPH-FVRPS-FRPSQAP .: .:. :...:: .: . .: : . :::..:.. :: ..:: : : .: NP_001 PTSRIAEAMLQTTTRPNQTPNSKLVEVNPKSED-AGGAEGET--PHMLLRPHVFMPEVTP 1030 1040 1050 1060 1070 pF1KA1 FLITGP NP_001 DMDYLPRVPNQGIIINPMLSDETNICNGKPVDGLTTLRNGTLVAFRGHYFWMLSPFSPPS 1080 1090 1100 1110 1120 1130 >>NP_005798 (OMIM: 208250,604283) proteoglycan 4 isoform (1404 aa) initn: 141 init1: 74 opt: 378 Z-score: 193.3 bits: 47.4 E(85289): 0.0005 Smith-Waterman score: 460; 21.5% identity (48.3% similar) in 810 aa overlap (3-792:377-1120) 10 20 30 pF1KA1 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQD : ..:: . ..: : ::. : NP_005 PKEPTPTTPKEPASTTPKEPTPTTIKSAPTTPKEPAPTTTKSAPTTPKEPAPTTTKEPAP 350 360 370 380 390 400 40 50 60 70 80 90 pF1KA1 GSLGAGS-SAMRDYCPSQQKASPAPPRHTPDQSPGMESRHRSPSGAGEGASCSDGPRGSL . . .. .. :. :..:. :.. .: .. .:. : : . :. NP_005 TTPKEPAPTTTKEPAPTTTKSAPTTPKEPAPTTP----KKPAPTTPKEPAPTT--PKE-- 410 420 430 440 450 100 110 120 130 140 150 pF1KA1 ACPSPTCFSPQESPSKETLEAHGASISGTPEATTSGKPEPVSSVKTEPKSSDDRNPMFLE :.:: .:.: :. : : : :: .: :.. : : . . : NP_005 --PTPT--TPKE-PAPTTKE---------PAPTTPKEPAPTAPKKPAPTTPKEPAPT-TP 460 470 480 490 500 160 170 180 190 200 210 pF1KA1 KMDFKSSKQADSTSIGKEDPGSSRKADPMFTGKAEPEILGKGDPVAPGRMDPMTVRKEDL : .. . : . :: .. :. : : . : :. :..: . .: :... NP_005 KEPAPTTTKEPSPTTPKEPAPTTTKSAPTTTKEPAPTTT-KSAPTTPKEPSPTTTKEPAP 510 520 530 540 550 560 220 230 240 250 260 270 pF1KA1 GSLGKVDPLCSSKTYTVSPRKEDPGSLRKVDPVSSDKVDPVFPRKEEPRYSGKEHPVSSE . . : .: ..:.. : . .. :... : :. :.. : . :.. . NP_005 TTPKEPAPTTPKKPAPTTPKEPAPTTPKEPAPTTTKKPAPTTPKEPAPTTPKETAPTTPK 570 580 590 600 610 620 280 290 300 310 320 330 pF1KA1 KVAPTSAEKVDLVLSGKRDPGPSGKADPVPLESMDSASTGKTEPGLLGKLIPGSSGKNGP :..::. :: :. . . :.:. . .: . . : ::. : ... : : NP_005 KLTPTTPEK--LAPTTPEKPAPTTPEELAPTTPEEPTPTTPEEPA---PTTPKAAAPNTP 630 640 650 660 670 340 350 360 370 380 390 pF1KA1 VSSGTGAPGSLGRLDPTCLGMADPASVGNVETVPATKEDSRFLGKMDPASSGEGRPVSGH . .: .:. .:: . ::.:.: . . .:: . .:. . NP_005 KEPAPTTPK-----EPAPTTPKEPAPTTPKETAPTTPKGTAPTTLKEPAPTTPKKPAPKE 680 690 700 710 720 730 400 410 420 430 440 450 pF1KA1 -TDTTASAKTDLTSLKNVDPMSSGKVDPVSLGKMDPMCSGKPELLSPGQAERVSVGKAGT . ::.. :. :: : . : . . :.. . : .: .: . ... . . NP_005 LAPTTTKEPTSTTSDKPA-PTTPKGTAPTTPKEPAPTTPKEPAPTTPKGTAPTTLKEPAP 740 750 760 770 780 790 460 470 480 490 500 510 pF1KA1 VSPGKEDPVSSRREDPISAGSRKTSSEKVNPESSGKTNPVSSGPGDPRSLGTAGPPSAVK ..: : :. .. . : .:.:.: : . .: :.. : .: .: . : NP_005 TTPKK--PAPKELAPTTTKGPTSTTSDKPAPTTPKETAPTT--PKEP------APTTPKK 800 810 820 830 840 520 530 540 550 560 570 pF1KA1 AEPATGGKGDPLSSEKAGLVASGKAAPTASGKAEPLAVGKEDPVSKGKADAGPSGQGDSV :.: : .:: :.. ::.. :: .. : : . .: :. .. NP_005 PAPTTPETPPPTTSE----VST----PTTT--KEPTTIHKSPDESTPELSAEPTPKALEN 850 860 870 880 890 580 590 600 610 620 pF1KA1 SIGK----VVSTPGKTVP-VPSGKVDPVSLGKAEAIPEGKVGSLPLEKGSPVTTTKA-DP : . ...::. : : . . : .. .. :: ... . : . .:: :. . NP_005 SPKEPGVPTTKTPAATKPEMTTTAKDKTTERDLRTTPETTTAAPKMTKETATTTEKTTES 900 910 920 930 940 950 630 640 650 660 670 680 pF1KA1 RASGKAQPQSGGKAETKLPGQ-EGAAAPGEAGAVCLKKETPQASEKVD-PGSCRKAEPLA . .. . .. .. : . . : : :.: ..: .. : : . : NP_005 KITATTTQVTSTTTQDTTPFKITTLKTTTLAPKVTTTKKTITTTEIMNKPEETAKPKDRA 960 970 980 990 1000 1010 690 700 710 720 730 pF1KA1 SG-KGEPVSLGKADSAPSRKTESPSLGKVVPLSLEKTKPSSSSRQLDRKALGSARSPE-- .. :. . : .:: .: : . :..: ..: : . . :.. .. :: NP_005 TNSKATTPKPQKPTKAP-KKPTSTKKPKTMP-RVRKPKTTPTPRKM------TSTMPELN 1020 1030 1040 1050 1060 740 750 760 770 780 790 pF1KA1 -GARGSEGR-QASARP--VPRAA-AECAPAAVLLAGGTHGRVICPH-FVRPS-FRPSQAP .: .:. :...:: .: . .: : . :::..:.. :: ..:: : : .: NP_005 PTSRIAEAMLQTTTRPNQTPNSKLVEVNPKSED-AGGAEGET--PHMLLRPHVFMPEVTP 1070 1080 1090 1100 1110 1120 pF1KA1 FLITGP NP_005 DMDYLPRVPNQGIIINPMLSDETNICNGKPVDGLTTLRNGTLVAFRGHYFWMLSPFSPPS 1130 1140 1150 1160 1170 1180 >>XP_005257115 (OMIM: 114000,120150,130000,130060,166200 (1374 aa) initn: 165 init1: 84 opt: 373 Z-score: 191.2 bits: 47.0 E(85289): 0.00066 Smith-Waterman score: 429; 26.8% identity (47.8% similar) in 761 aa overlap (47-775:285-976) 20 30 40 50 60 70 pF1KA1 SSPPGPRPTAFFCPQDGSLGAGSSAMRDYCPSQQKASP----APPRHTPDQSPGMESRHR :. . .:: :: . : :: ..: XP_005 LPGTAGLPGMKGHRGFSGLDGAKGDAGPAGPKGEPGSPGENGAPGQMGPRGLPGERGRPG 260 270 280 290 300 310 80 90 100 110 120 pF1KA1 SPSGAG----EGASCSDGPRGSLACPSPTCFSPQESPSKETLEAHGASISGTPEATTS-- .:. :: .::. . :: : . .: : : .: .: : :... . XP_005 APGPAGARGNDGATGAAGPPGPTGPAGPPGF-PGAVGAKGEAGPQGPRGSEGPQGVRGEP 320 330 340 350 360 370 130 140 150 160 170 180 pF1KA1 GKPEPVSSVKTEPKSSDDRNPMFLEKMDFKSSKQADSTSIGKEDPGSSRKADPMFTGKAE : : :.... . . : .: :... : . . . ::. . :. : XP_005 GPPGPAGAAGPAGNPGADGQP------GAKGANGAPGIAGAPGFPGARGPSGPQGPGGPP 380 390 400 410 420 190 200 210 220 230 240 pF1KA1 PEILGKGDPVAPGRMDPMTVRKEDLGSLGKVDPLCSSKTYTVSPRKEDPGSLRKVDPVSS ..:.: ::: : : :. :. :. . .: :: :.. XP_005 GPKGNSGEPGAPGS-------KGDTGAKGEPGPVGVQ-----GP----PG------PAGE 430 440 450 460 250 260 270 280 290 300 pF1KA1 DKVDPVFPRKEEPRYSGKEHPVSSEKVAPTSA--EKVDLVLSGKRDPGPSGKADPVPLES . . . :: .: : .:. .: : .: : . : : :. :. .. XP_005 EGKRGA---RGEPGPTGLPGP-PGERGGPGSRGFPGADGVAGPKGPAGERGSPGPAGPKG 470 480 490 500 510 520 310 320 330 340 350 360 pF1KA1 MDSASTGKTEPGLLG-KLIPGSSGKNGPVSSGTGAPGSLGRLDPTCLGMADPASVGN--V . . : :: : : . :: :. :: .. :: :: :. : . :.. :. : XP_005 SPGEAGRPGEAGLPGAKGLTGSPGSPGP-DGKTGPPGPAGQ-DGRPGPPGPPGARGQAGV 530 540 550 560 570 370 380 390 400 410 420 pF1KA1 ETVPATKEDSRFLGKMDPASSGEGRPVSGHTDTTASAKTDLTSLKNVDPMSSGKVDPVSL :. : . : .:...:: : : : ... : : . . : : . :.. XP_005 MGFPGPKGAA---G--EPGKAGE-RGVPGPPGAVGPAGKDGEAGAQGPP---GPAGPAGE 580 590 600 610 620 630 430 440 450 460 470 pF1KA1 -GKMDPMCSGKPELLS-PGQAERVSVGKAGTVSPGKED-PVSSRREDPISA-GSRKTSSE :.. : .:.: . . :: : :.:: .::.. : . : .: : : .: XP_005 RGEQGP--AGSPGFQGLPGPAG--PPGEAG--KPGEQGVPGDLGAPGPSGARGERGFPGE 640 650 660 670 680 480 490 500 510 520 530 pF1KA1 KVNPESSGKTNP--VSSGPGDPRSLGTAGPPSAVKAEPATGGKGDPLSSEKAGLVAS--- . : ..: ....::. . : :: :.: .. : : .: : ::: . XP_005 RGVQGPPGPAGPRGANGAPGNDGAKGDAGAPGAPGSQGAPGLQGMPGERGAAGLPGPKGD 690 700 710 720 730 740 540 550 560 570 580 pF1KA1 -GKAAPT-ASGKAEPLAV-GKEDPVSKGKADAGPSGQGDSVSIGKVVSTPGKTVPVPSGK : :.: :.:. .: : :.. ..:. .:.: : . : .. .: :. XP_005 RGDAGPKGADGSPGKDGVRGLTGPIGPPGPAGAPGDKGESGPSGPAGPTGARGAPGDRGE 750 760 770 780 790 800 590 600 610 620 630 640 pF1KA1 VDPVSLGKAE-AIPEGKVGSLPLEKGSPVTTTKADPRASGKAQPQSGGKAETKLPGQEG- : : : : : : :. : :: : .: :.: : : : . . :: : XP_005 PGPP--GPAGFAGPPGADGQ-PGAKGEP-----GDAGAKGDAGPP-GPAGPAGPPGPIGN 810 820 830 840 850 650 660 670 680 690 700 pF1KA1 AAAPGEAGAVCLKKETPQASEKVDPGSCRKAEPLASGKGEPVSLGKADSAPSRKTESPSL ..::: :: . : .. ::. .. : . .::: . : . .. : .: . XP_005 VGAPGAKGAR--GSAGPPGATGF-PGAAGRVGP-PGPSGEPGKQGPSGASGERGPPGP-M 860 870 880 890 900 910 710 720 730 740 750 760 pF1KA1 GKVVPLSLEKTKPSSSSRQLDRKALGS-AR--SPEGARGSEGRQASARPVPRAAAECAPA : : .: :. :.:. : :: .: :: ::.:..:. . : : .: ::. XP_005 G---PPGLAGP-PGESGREGAPGAEGSPGRDGSP-GAKGDRGETGPAGPPGAPGAPGAPG 920 930 940 950 960 770 780 790 pF1KA1 AVLLAGGTHGRVICPHFVRPSFRPSQAPFLITGP : :: . : XP_005 PVGPAGKSGDRGETGPAGPAGPVGPVGARGPAGPQGPRGDKGETGEQGDRGIKGHRGFSG 970 980 990 1000 1010 1020 >>XP_005257116 (OMIM: 114000,120150,130000,130060,166200 (1158 aa) initn: 130 init1: 86 opt: 357 Z-score: 184.9 bits: 45.6 E(85289): 0.0015 Smith-Waterman score: 394; 25.7% identity (44.7% similar) in 804 aa overlap (20-774:82-836) 10 20 30 40 pF1KA1 MDTAEDPAWLQLLQKDSSPPGPR-PTAFFCP--QDGSLGAGSSAMRDYC :: . : . :: ::: . .. XP_005 VWKPEPCRICVCDNGKVLCDDVICDETKNCPGAEVPEGECCPVCPDGSESPTDQETTGVE 60 70 80 90 100 110 50 60 70 80 90 100 pF1KA1 PSQQKASPAPPRHTPDQSPGMESRHRSPSGAGEGASCSDGPRGSLACPSPT----CFSPQ . ..: :: : :: : :. : :: : . :.: :.:: XP_005 GPKGDTGPRGPRG-PAGPPG---RDGIPGQPG-----LPGPPGPPGPPGPPGLGGNFAPQ 120 130 140 150 160 110 120 130 140 150 pF1KA1 ESPSKETLEAHGASISGT-----PEATTS--GKPEP--VSSVKTEPKSSDDRNPMFLEKM : . . . : :. : :.. . : : : .. :: .:: . XP_005 LSYGYDEKSTGGISVPGPMGPSGPRGLPGPPGAPGPQGFQGPPGEPGEPGASGPMGPRGP 170 180 190 200 210 220 160 170 180 190 200 210 pF1KA1 DFKSSKQADSTSIGKEDPGSSRKADPMFTGKAEPEILGKGDPVAPGR--MDPMTVRKEDL .:..:. :: :: . : :. : : :. .. . : : XP_005 PGPPGKNGDDGEAGK--PGRPGERGPPGPQGARGLPGTAGLPGMKGHRGFSGLDGAKGDA 230 240 250 260 270 280 220 230 240 250 260 pF1KA1 GSLG-KVDPLCSSKTYTVSPRKEDPGSL--RKVDPVSSDKVDPVFPRKEE-----PRYSG : : : .: .: . .: . : .: .. : . . :. : :. : ..: XP_005 GPAGPKGEP--GSPGENGAPGQMGPRGLPGERGRPGAPGPAGPAGERGEQGPAGSPGFQG 290 300 310 320 330 270 280 290 300 310 320 pF1KA1 KEHPVSSEKVAPTSAEKVDLVLSGKRDPGPSGKADP--VPLESMDSASTGKTEP-GLLGK :.. : .:. : . ::::: : : .. : . : : : XP_005 LPGPAGPPGEAGKPGEQG--VPGDLGAPGPSGARGERGFPGERGVQGPPGPAGPRGANG- 340 350 360 370 380 390 330 340 350 360 370 380 pF1KA1 LIPGSSGKNGPVSSGTGAPGSLGRLDPTCLGMADPASVGNVETVPATKEDSRFLGKMDPA ::..: .: ... ::::: : : :: :. : . .:. : : : : XP_005 -APGNDGAKGD-AGAPGAPGSQG--APGLQGM--PGERG-AAGLPGPKGDR---GDAGP- 400 410 420 430 440 390 400 410 420 430 pF1KA1 SSGEGRP----VSGHTDTTASAKTDLTSLKNVDPMSSGKVDPVSLGKMDPMCSGKPELLS ....: : : : : . . . . :: . :.. .. : :.: XP_005 KGADGSPGKDGVRGLTGPIGPPGPAGAPGDKGESGPSGPAGPTG-ARGAPGDRGEPG--P 450 460 470 480 490 500 440 450 460 470 480 490 pF1KA1 PGQAERVSVGKAGTVSPGKEDPVSSRREDPISAGSRKTSSEKVNPESSGKTNPVSS--GP :: : : :: :: . ... : : .::.. .. .: .:... .: XP_005 PGPA-----GFAGP--PGADGQPGAKGE-PGDAGAKGDAGPPGPAGPAGPPGPIGNVGAP 510 520 530 540 550 500 510 520 530 540 550 pF1KA1 GDPRSLGTAGPPSAVKAEPATGGKGDPLSSEKAGLVASGKAAPTASGKA---EPLAVGKE : . :.::::.:. :.: : : : .:: . : .::. : .:. XP_005 GAKGARGSAGPPGATGFPGAAGRVGPPGPSGNAGPPGPPGPAGKEGGKGPRGETGPAGRP 560 570 580 590 600 610 560 570 580 590 600 610 pF1KA1 DPVSKGKADAGPSGQGDSVSIGKVVSTPGKTVPVPSGKVDPVSL-GKAEAIPEGKVGSLP :. . ::.:. : . ...:: .: :.: . .. : : .:: XP_005 GEVGP-PGPPGPAGEKGSPGADGPAGAPG--TPGPQGIAGQRGVVGLPGQRGERGFPGLP 620 630 640 650 660 670 620 630 640 650 660 pF1KA1 LEKGSPVTTTKADPR-ASGKAQPQS--GGKAETKLPGQEG-AAAPGEAGAVCLKKETPQA .: : : : :::. : . : . . ::. : .::: :. . .: : XP_005 GPSGEP---GKQGPSGASGERGPPGPMGPPGLAGPPGESGREGAPGAEGSPG-RDGSPGA 680 690 700 710 720 670 680 690 700 710 720 pF1KA1 SEKVDPGSCRKA-EPLASGK-GEPVSLGKADSAPSRKTESPS--LGKVVPLSLEKTKPSS : : : : : : : : : .: : .. .: .:. : : :.. . . XP_005 --KGDRGETGPAGPPGAPGAPGAPGPVGPAGKSGDRGETGPAGPAGPVGPVGARGPAGPQ 730 740 750 760 770 780 730 740 750 760 770 780 pF1KA1 SSRQLDRKALGSA--RSPEGARGSEGRQASARPVPRAAAECAPAAVLLAGGTHGRVICPH . : :. : :. .: :: : :. : : . .: .:... .: .: XP_005 GPRG-DKGETGEQGDRGIKGHRGFSGLQGPPGP-PGSPGEQGPSGASGPAGPRGPPGSAG 790 800 810 820 830 840 790 pF1KA1 FVRPSFRPSQAPFLITGP XP_005 APGKDGLNGLPGPIGPPGPRGRTGDAGPVGPPGPPGPPGPPGPPSAGFDFSFLPQPPQEK 850 860 870 880 890 900 >>XP_011522643 (OMIM: 114000,120150,130000,130060,166200 (1398 aa) initn: 123 init1: 86 opt: 359 Z-score: 184.6 bits: 45.8 E(85289): 0.0015 Smith-Waterman score: 427; 27.9% identity (47.5% similar) in 807 aa overlap (16-775:279-1000) 10 20 30 40 pF1KA1 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQDGSLGA-GSSAMRD :..: ::. ..:. : : .. XP_011 PQGARGLPGTAGLPGMKGHRGFSGLDGAKGDAGPAGPKGEPGSPGENGAPGQMGPRGL-- 250 260 270 280 290 300 50 60 70 80 90 pF1KA1 YCPSQQKASPAP-PRHTP--DQSPGMESRHRSPSGAGE----GASCSDGPRGSLACPSPT :... :: : .: : .:: .. . .:. :: :: .::.: . :.: XP_011 --PGERGRPGAPGPAGNPGADGQPGAKGANGAPGIAGAPGFPGARGPSGPQGPGGPPGPK 310 320 330 340 350 360 100 110 120 130 140 150 pF1KA1 CFS--PQESPSKETLEAHG----ASISGTP-EATTSGKPEPVSSVKTEPKSSDDRNPMFL : : :: :.: ....: : : :: ... :: . .: XP_011 GNSGEPGAPGSKGDTGAKGEPGPVGVQGPPGPAGEEGK----RGARGEPGPTGLPGPPG- 370 380 390 400 410 160 170 180 190 200 pF1KA1 EKMDFKSS--KQADSTSIGKEDPGSSRKADPMFTGKAEPEILGKGDPVAPGRMDPMTV-- :. : ::... : . :.. : ..: : : : ::.: :: . XP_011 ERGGPGSRGFPGADGVA-GPKGPAGER-GSP---GPAGP----KGSPGEAGRPGEAGLPG 420 430 440 450 460 470 210 220 230 240 250 pF1KA1 RKEDLGSLGKVDPLCSSKTYTVSPRKED--PGSLRKVDPVSSDKVDPV-FPRKE----EP : :: :. : ..:: .: .: :: : . .. . :: . :: XP_011 AKGLTGSPGSPGP--DGKTGPPGPAGQDGRPGP--PGPPGARGQAGVMGFPGPKGAAGEP 480 490 500 510 520 260 270 280 290 300 310 pF1KA1 RYSGKEHPVSSEKVAPTSAEKVDLVLSGKRDPGPSGKADPVPLESMDSASTGKTEPGLLG .: :. : . : : : : ... :::.: : : ... .:. ::. : XP_011 GKAG-ERGVPGPPGAVGPAGK-DGEAGAQGPPGPAGPAG----ERGEQGPAGS--PGFQG 530 540 550 560 570 320 330 340 350 360 370 pF1KA1 KLIPGSSGKNGPVSSGTGAPGSLGRLDPTCLGMADPASVGNVETVPATKEDSRFLGKMDP .:: .: : . : :: : : :: :... . . :. . : . : XP_011 --LPGPAGPPGEA----GKPGEQGV--PGDLGAPGPSGARGERGFPGER------GVQGP 580 590 600 610 620 380 390 400 410 420 430 pF1KA1 ASSGEGRPVSGHTDTTASAKTDLTSLKNVDPMSSGKVDPVSLGKMDPMCSGKPELLSPGQ . . : ..: . . :: : . : . :. .: : : : : .: . XP_011 PGPAGPRGANGAPGNDG-AKGDAGA-----PGAPGSQGAPGLQGM-PGERGAAGLPGP-K 630 640 650 660 670 440 450 460 470 480 490 pF1KA1 AERVSVGKAGTV-SPGKED------PVSSRREDPISAGSRKTSSEKVNPE--SSGKTNPV ..: ..: :. ::::. :.. : .: . : : .: .... : XP_011 GDRGDAGPKGADGSPGKDGVRGLTGPIGP--PGPAGAPGDKGESGPSGPAGPTGARGAPG 680 690 700 710 720 730 500 510 520 530 540 pF1KA1 SSG-PGDPRSLGTAGPPSAVKAEPATGGKGDPLSSEKAGLVASGKAAPTASGKAEPLA-V . : :: : : ::::.: : : :: .. :: : :.: .: :.. : XP_011 DRGEPGPPGPAGFAGPPGADGQPGAKGEPGDAGAKGDAG--PPGPAGP--AGPPGPIGNV 740 750 760 770 780 790 550 560 570 580 590 600 pF1KA1 GKEDPVSKG-KADAGPSGQGDSVSIGKVVSTPGKTVPV-PSGKVDPVSLGKAEAI-PEGK : : .:: ...::: : . . :. :: . . : : :. :: . :.:. XP_011 GA--PGAKGARGSAGPPGATGFPGAAGRVGPPGPSGNAGPPGPPGPA--GKEGGKGPRGE 800 810 820 830 840 610 620 630 640 650 660 pF1KA1 VGSL--PLEKGSPVTTTKADPRASG-KAQPQSGGKAETK-LPGQEGAAAPGEAGAVCLKK .: : : : : . : .: :..: . : : . :: .: : :. :.: : XP_011 TGPAGRPGEVGPP-----GPPGPAGEKGSPGADGPAGAPGTPGPQGIA--GQRGVVGL-- 850 860 870 880 890 670 680 690 700 710 720 pF1KA1 ETPQASEKVDPGSCRKAEPLASGKGEPVSLGKADSAPSRKTESPSLGKVVPLSLEKTKPS : .:. :: : . .::: . : . .. : .: .: : .: :. XP_011 -PGQRGERGFPG-------LPGPSGEPGKQGPSGASGERGPPGP-MG---PPGLAGP-PG 900 910 920 930 940 730 740 750 760 770 pF1KA1 SSSRQLDRKALGS-AR--SPEGARGSEGRQASARPVPRAAAECAPAAVLLAGGTHGRVIC :.:. : :: .: :: ::.:..:. . : : .: ::. : :: . : XP_011 ESGREGAPGAEGSPGRDGSP-GAKGDRGETGPAGPPGAPGAPGAPGPVGPAGKSGDRGET 950 960 970 980 990 1000 780 790 pF1KA1 PHFVRPSFRPSQAPFLITGP XP_011 GPAGPAGPVGPVGARGPAGPQGPRGDKGETGEQGDRGIKGHRGFSGLQGPPGPPGSPGEQ 1010 1020 1030 1040 1050 1060 >>NP_000081 (OMIM: 120180,130020,130050) collagen alpha- (1466 aa) initn: 148 init1: 74 opt: 352 Z-score: 181.1 bits: 45.2 E(85289): 0.0024 Smith-Waterman score: 394; 24.5% identity (46.0% similar) in 881 aa overlap (16-797:142-978) 10 20 30 40 pF1KA1 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQ----DGSLGAGSSA .: : ::. . :: : . :.. .. NP_000 GPPGIPGRNGDPGIPGQPGSPGSPGPPGICESCPTGPQN---YSPQYDSYDVKSGVAVGG 120 130 140 150 160 50 60 70 80 90 pF1KA1 MRDY-CPSQQKASPAPPRHTPDQ-SPGMESRHRSPSGAGE-GASCSDGPRGSLACPSPTC . : :. . :.:: . ::: . . :. :. : : :: :... .: NP_000 LAGYPGPAGPPGPPGPPGTSGHPGSPGSPGYQGPPGEPGQAGPSGPPGPPGAIGPSGP-- 170 180 190 200 210 220 100 110 120 130 140 150 pF1KA1 FSPQESPSKETLEAHGASISGTPEATTSGKPEPVSSVKTEPKSSDDRNPMFLEKMDFKSS . ... : . . .. : : : : ... : . :. .: ... NP_000 -AGKDGESGRPGRPGERGLPGPP-----GIKGP-AGIPGFPGMKGHRG------FDGRNG 230 240 250 260 270 160 170 180 190 200 210 pF1KA1 KQADSTSIGKED----PGSSRKADPMFTGKAEPEILGKGDPVAPGRMDPMTVRKED--LG ..... . : . :: . :: : : .: : :: .: .: : NP_000 EKGETGAPGLKGENGLPGENGAPGPMGPRGAPGE---RGRPGLPG---AAGARGNDGARG 280 290 300 310 320 220 230 240 250 260 pF1KA1 SLGKVDPLCSSKTYTVSPRKEDPGSLRKVDPVSSDKVDPVFPRKEEPR---YSGKEHPVS : :. : : : . ::. .: :..: . . .. :: ..: . : . NP_000 SDGQPGPPGPPGTAGF-PGS--PGAKGEVGPAGSPGSNGAPGQRGEPGPQGHAGAQGPPG 330 340 350 360 370 380 270 280 290 300 310 pF1KA1 SEKVAPTSAEKVDL----------VLSGKRDPGPSGKADPVPLESMDSASTGKT----EP . . . : .. ..... :::.: :. .: .. ::. :: NP_000 PPGINGSPGGKGEMGPAGIPGAPGLMGARGPPGPAG-ANGAPGLRGGAGEPGKNGAKGEP 390 400 410 420 430 440 320 330 340 350 360 pF1KA1 GLLGKL-------IPGSSGKNG----PVSSGT-GAPGSLG-RLDPTCLGMADPASVGNVE : :. .::..:..: : :. : ::. : : : : : : .. . : NP_000 GPRGERGEAGIPGVPGAKGEDGKDGSPGEPGANGLPGAAGERGAPGFRGPAGPNGIPG-E 450 460 470 480 490 500 370 380 390 400 410 pF1KA1 TVPATKEDSRFLGKMDP-ASSGE-GR---PVS-GHTDTTASAKTDLTSLKNVDPMSSGKV :: .. . : : ...:: :: : . : .: .. : : :.:. NP_000 KGPAGERGAP--GPAGPRGAAGEPGRDGVPGGPGMRGMPGSPGGPGSDGKPGPPGSQGES 510 520 530 540 550 560 420 430 440 450 460 pF1KA1 D-PVSLGKMDPMCSGKPELLS-PG-QAERVSVGKAGTVS----PGKEDPVSSRRED---- : : : :.: ... :: ... . :: : . :: . : .. : NP_000 GRPGPPGPSGP--RGQPGVMGFPGPKGNDGAPGKNGERGGPGGPGPQGPPGKNGETGPQG 570 580 590 600 610 470 480 490 500 510 520 pF1KA1 ---PISAGSRKTSSEKVNPESSGKTNPVSSGPGDPRSLGTAGPPSAVKAEPATGGKGDPL : . :. : .. .:.. ... ::. . : :: . . : : ::::: NP_000 PPGPTGPGGDKGDTGPPGPQGLQGLPGTGGPPGENGKPGEPGPKGDAGAPGAPGGKGD-- 620 630 640 650 660 670 530 540 550 560 570 580 pF1KA1 SSEKAGLVASGKAAPTASGKAEPLAVGKEDPVSKG-KADAGPSGQGDSVSIGKVVSTPGK :: : :. .: . . : : : : .: :. ::: : ... . . ::. NP_000 ----AG--APGERGPPGLAGAPGLRGGAGPPGPEGGKGAAGPPGPPGAAGTPGLQGMPGE 680 690 700 710 720 730 590 600 610 620 pF1KA1 T----VPVPSG-KVDPVSLGKAEAIP-----EGKVGSL--PLEKGSPVTTTKAD-PRASG : :.: : .: . : :...: .: .: . : :.: .. : : NP_000 RGGLGSPGPKGDKGEPGGPG-ADGVPGKDGPRGPTGPIGPPGPAGQPGDKGEGGAPGLPG 740 750 760 770 780 630 640 650 660 670 pF1KA1 KAQPQS--GGKAETKLPGQEG-AAAPGEAGAVCLKKETPQASEKVD---------PGSCR : :.. : ..:: :: : .:::. : : : .:: . ::. NP_000 IAGPRGSPGERGETGPPGPAGFPGAPGQNGEPGGKGERGAPGEKGEGGPPGVAGPPGGSG 790 800 810 820 830 840 680 690 700 710 720 pF1KA1 KAEP-----LASGKGEPVSLGKADSAPSRKTESP--SLGKVVPLSLEKTKPSSSSRQLDR : : . . .: : . : : .: .: : :. : . . .:.... NP_000 PAGPPGPQGVKGERGSPGGPGAAGFPGARGLPGPPGSNGNPGPPG-PSGSPGKDGPPGPA 850 860 870 880 890 900 730 740 750 760 770 780 pF1KA1 KALGSARSP--EGARGSEGRQASARPVPRAAAE-CAPAAVLLAGGTHGRVICPHFVRPSF :. :: : .:. : : . . : : . ::. . .:: : .: . :. NP_000 GNTGAPGSPGVSGPKGDAG-QPGEKGSPGAQGPPGAPGPLGIAGITGARGLAGPPGMPGP 910 920 930 940 950 960 790 pF1KA1 RPSQAPFLITGP : : .: . : NP_000 RGSPGPQGVKGESGKPGANGLSGERGPPGPQGLPGLAGTAGEPGRDGNPGSDGLPGRDGS 970 980 990 1000 1010 1020 >>NP_000079 (OMIM: 114000,120150,130000,130060,166200,16 (1464 aa) initn: 123 init1: 86 opt: 349 Z-score: 179.7 bits: 45.0 E(85289): 0.0029 Smith-Waterman score: 421; 27.6% identity (48.0% similar) in 798 aa overlap (11-775:367-1066) 10 20 30 40 pF1KA1 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQDGSLGAGSS : .. . .:::: .: . :. : .. NP_000 TGPAGPPGFPGAVGAKGEAGPQGPRGSEGPQGVRGEPGPPGPAGAAGPAGNPGADGQPGA 340 350 360 370 380 390 50 60 70 80 90 pF1KA1 AMRDYCPSQQKASPAPPRHTPD--QSPGMESRHRSPSGAGEGASCSDGPRGSLACPSPTC . :. : : . :. :.:: .. :: :: : : :. . :.:. NP_000 KGANGAPGIAGAPGFPGARGPSGPQGPGGPPGPKGNSGE-PGAPGSKGDTGAKGEPGPVG 400 410 420 430 440 450 100 110 120 130 140 150 pF1KA1 FSPQESPSKETLEAHGASISGTPEATTSGKPEPVSSVKTEPKSSDDRNPMFLEKMDFKSS . .:. : . .:: : : : : : : . . : : .. NP_000 VQGPPGPAGEEGK-RGAR--GEPGPT--GLPGPPGE-RGGPGS--------------RGF 460 470 480 490 160 170 180 190 200 210 pF1KA1 KQADSTSIGKEDPGSSRKADPMFTGKAEPEILGKGDPVAPGRMDPMTV--RKEDLGSLGK ::... : . :.. : ..: : : : ::.: :: . : :: :. NP_000 PGADGVA-GPKGPAGER-GSP---GPAGP----KGSPGEAGRPGEAGLPGAKGLTGSPGS 500 510 520 530 540 220 230 240 250 260 pF1KA1 VDPLCSSKTYTVSPRKED--PGSLRKVDPVSSDKVDPV-FPRKE----EPRYSGKEHPVS : ..:: .: .: :: : . .. . :: . :: .: :. : NP_000 PGP--DGKTGPPGPAGQDGRPGP--PGPPGARGQAGVMGFPGPKGAAGEPGKAG-ERGVP 550 560 570 580 590 600 270 280 290 300 310 320 pF1KA1 SEKVAPTSAEKVDLVLSGKRDPGPSGKADPVPLESMDSASTGKTEPGLLGKLIPGSSGKN . : : : : ... :::.: : : ... .:. ::. : .:: .: NP_000 GPPGAVGPAGK-DGEAGAQGPPGPAGPAG----ERGEQGPAGS--PGFQG--LPGPAGPP 610 620 630 640 650 330 340 350 360 370 380 pF1KA1 GPVSSGTGAPGSLGRLDPTCLGMADPASVGNVETVPATKEDSRFLGKMDPASSGEGRPVS : . : :: : : :: :... . . :. . : . : . . : .. NP_000 GEA----GKPGEQGV--PGDLGAPGPSGARGERGFPGER------GVQGPPGPAGPRGAN 660 670 680 690 700 390 400 410 420 430 440 pF1KA1 GHTDTTASAKTDLTSLKNVDPMSSGKVDPVSLGKMDPMCSGKPELLSPGQAERVSVGKAG : . . .:: : . : . :. .: : : : : .: ...: ..: : NP_000 G-APGNDGAKGDAGA-----PGAPGSQGAPGLQGM-PGERGAAGLPGP-KGDRGDAGPKG 710 720 730 740 750 450 460 470 480 490 pF1KA1 TV-SPGKED------PVSSRREDPISAGSRKTSSEKVNPE--SSGKTNPVSSG-PGDPRS . ::::. :.. : .: . : : .: .... : . : :: : NP_000 ADGSPGKDGVRGLTGPIGP--PGPAGAPGDKGESGPSGPAGPTGARGAPGDRGEPGPPGP 760 770 780 790 800 810 500 510 520 530 540 550 pF1KA1 LGTAGPPSAVKAEPATGGKGDPLSSEKAGLVASGKAAPTA-SGKA-EPLAVGKED-PVSK : ::::.: ..: :.::.: . :: :.: :.: . .: : : .:. : .: NP_000 AGFAGPPGA-DGQP--GAKGEPGD---AG--AKGDAGPPGPAGPAGPPGPIGNVGAPGAK 820 830 840 850 860 560 570 580 590 600 610 pF1KA1 G-KADAGPSGQGDSVSIGKVVSTPGKTVPV-PSGKVDPVSLGKAEAIPEGKVGSL--PLE : ...::: : . . :. :: . . : : :.. ... :.:..: : : NP_000 GARGSAGPPGATGFPGAAGRVGPPGPSGNAGPPGPPGPAGKEGGKG-PRGETGPAGRPGE 870 880 890 900 910 920 620 630 640 650 660 670 pF1KA1 KGSPVTTTKADPRASG-KAQPQSGGKAETK-LPGQEGAAAPGEAGAVCLKKETPQASEKV : : . : .: :..: . : : . :: .: : :. :.: : : .:. NP_000 VGPP-----GPPGPAGEKGSPGADGPAGAPGTPGPQGIA--GQRGVVGLP---GQRGERG 930 940 950 960 970 680 690 700 710 720 730 pF1KA1 DPGSCRKAEPLASGKGEPVSLGKADSAPSRKTESPSLGKVVPLSLEKTKPSSSSRQLDRK :: : . .::: . : . .. : .: .: : .: :. :.:. NP_000 FPG-------LPGPSGEPGKQGPSGASGERGPPGP-MG---PPGLAGP-PGESGREGAPG 980 990 1000 1010 740 750 760 770 780 pF1KA1 ALGS-AR--SPEGARGSEGRQASARPVPRAAAECAPAAVLLAGGTHGRVICPHFVRPSFR : :: .: :: ::.:..:. . : : .: ::. : :: . : NP_000 AEGSPGRDGSP-GAKGDRGETGPAGPPGAPGAPGAPGPVGPAGKSGDRGETGPAGPAGPV 1020 1030 1040 1050 1060 1070 790 pF1KA1 PSQAPFLITGP NP_000 GPVGARGPAGPQGPRGDKGETGEQGDRGIKGHRGFSGLQGPPGPPGSPGEQGPSGASGPA 1080 1090 1100 1110 1120 1130 >>XP_011536691 (OMIM: 601234) PREDICTED: nascent polypep (2078 aa) initn: 87 init1: 54 opt: 352 Z-score: 178.8 bits: 45.3 E(85289): 0.0032 Smith-Waterman score: 463; 25.2% identity (44.0% similar) in 841 aa overlap (3-792:871-1641) 10 20 30 pF1KA1 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQD : .: . : :.. : : . . :.. XP_011 LSFQGSKDSPATTHSPTPPSPKGAPTPSAVTPLSPKGVTLPPKET--PTPSVVNLPFPKE 850 860 870 880 890 40 50 60 70 80 pF1KA1 GSLG-----AGSSAMRDYCPSQQKASPAPPRHTPDQSPGMESRHRSPSGAGEG-ASCSDG : : . .: . :.. .:.::: . : :: ::.:: :. . XP_011 GPATPAPKQAPALSMTSSSPKKARATPAP-KGIP-ASP-------SPKGAPTPPAATPPS 900 910 920 930 940 90 100 110 120 130 140 pF1KA1 PRGSLACPSP--TCFSPQESPSKETLEAHGASISGTPEATTSGKPEPVSSVKTEPKSSDD :.:. : ::: . : .: . : .:.: .. : : .. : :. . XP_011 PKGGPATPSPKWAPTPPAATPPSPKGGPATPSPKGAPTPPAATPPSPKGGPAT-PSPKGA 950 960 970 980 990 1000 150 160 170 180 190 200 pF1KA1 RNPMFLEKMDFKSSKQADSTSIGKEDPGSSRKADPMFTGKAEPEILGKGDPVAPGRMDPM .: . . :.: : : : .. .: . : : : :: :..:. : XP_011 PTPPAVTPPSPKGSPAATPFPKGASTPPAATPPSPKGSPAATP--LPKGAPTTPAATLPS 1010 1020 1030 1040 1050 1060 210 220 230 240 250 260 pF1KA1 TVRKEDLGSLGKVDPLCSSKTYTVSPRKEDPGSLRKVDPVSSDKVDPVFPRKEEPRYSGK : : : . .: : : . . : : :. : : .: XP_011 P----------KGGPATPSLKGAPTPPAATPPSPKGGPATPSPKGAPMPPAATPPSPKGG 1070 1080 1090 1100 1110 270 280 290 300 310 320 pF1KA1 EHPVSSEKVAPTSAEKVDLVLSGKRDPGPSGK-ADPVPLESMDS-ASTGKTEPGLLGKLI . .: :::. . :.:.: : : : . . :.: . : :. XP_011 L-ATPPHKGAPTT--------PAATPPSPKGGLATPPPKGAPTTPAATPPSPKGGLATPP 1120 1130 1140 1150 1160 330 340 350 360 370 380 pF1KA1 PGSSGKNGPVSSGTGAPGSLGRLDPTCLGMADPASVGNVETVPATKEDSRFLGKMDPASS : :..:.. .. :. : :.: :. : . :.::. : : : : XP_011 P----KGAPTTPAATPPSPKG-------GLATPSPKG-APTTPAATPPSPKGGLATP--S 1170 1180 1190 1200 1210 390 400 410 420 430 440 pF1KA1 GEGRPVSGHTDTTASAKTDLTSLKNVDPMSSGKVDPVSL--GKMDPMCSGKPELLSPGQA .: :.. . : : : :.. . .. . : : : : .: : .: : XP_011 PKGAPTTP-AATPPSPKGGLATPSPKGAPTTPAATPPSPKGGPATPPPKGAP---TPPAA 1220 1230 1240 1250 1260 450 460 470 480 490 pF1KA1 ERVSVGKAGTVSPG-KEDPVSSRREDPISAGSRKTSSEKVNPESSGKTNPVSSG-PGDPR :. :.: ..: : : . : :. :: : : . : : .: :: : XP_011 TPPSL-KGGLATPPHKGAPNPAVVTPPSPKGGPATSPPKGAPTPPAATPPSPKGSPGTPP 1270 1280 1290 1300 1310 1320 500 510 520 530 540 550 pF1KA1 SLGTAGPPSAVKAEPATGGKGDPL-----SSEKAG-LVASGKAAPTASGKAEPLAVGKE- :. ::... : :: : : :.: . :.: .:: . : : : XP_011 PKGAPTPPAVTPPSP----KGTPTLPATTPSSKGGPTTPSSKEGPTPPA-ATPSHKGGPA 1330 1340 1350 1360 1370 1380 560 570 580 590 pF1KA1 -DPVSKGKADAGPSGQGDSVSIGKVVSTPGKT--VPV-------PSG------KVDPVSL : : .. : :: .:: .: . . .: :. .:: :: : :::: XP_011 MTPPSPKRGPAIPSPKGDPTSPAVIPLSPKKAPATPVTREGAATPSKGDLTPPAVTPVSL 1390 1400 1410 1420 1430 1440 600 610 620 630 640 650 pF1KA1 GKAEAIPEGKVG-SLPLEKGSPVTTTKADPRASGKAQPQSGGKAETKLPGQEGAAAPGEA :: : : : . : ::.:. . . : : : : : .. : ... :.:. XP_011 KKAPATSAPKGGPATPSSKGDPTLPAVTPP--SPKEPPAPKQVATSSSP-KKAPATPAPM 1450 1460 1470 1480 1490 1500 660 670 680 690 700 pF1KA1 GAVCLKKETPQASEKVDPGSCRKAEPLAS-----GKGEPVSLGKADS--APSRKTESPSL :: : :.. ..: . .:.: .: :..:. .. :. . ::. XP_011 GAPTLPAVIPSSPKEVPATPSSRRDPIAPTATLLSKKTPATLAPKEALIPPAMTVPSPKK 1510 1520 1530 1540 1550 1560 710 720 730 740 750 760 pF1KA1 GKVVPLSLEKTKPSSSSRQLDRKALGSARSPEGARGSEGRQ------ASARPVPRAAAEC ..: : :.. : . . . : .: .:. . . : . : :. : XP_011 TPAIPTP--KEAPATPSSK--EASSPPAVTPSTYKGAPSPKELLIPPAVTSPSPKEAP-- 1570 1580 1590 1600 1610 770 780 790 pF1KA1 APAAVLLAGGTHGRVICPHFVRPSFRPSQAPFLITGP .: :: . .: : :. :.. : XP_011 TPPAVTPPSPEKG----PATPAPKGTPTSPPVTPSSLKDSPTSPASVTCKMGATVPQASK 1620 1630 1640 1650 1660 1670 XP_011 GLPAKKGPTALKEVLVAPAPESTPIITAPTRKGPQTKKSSATSPPICPDPSAKNGSKGPL 1680 1690 1700 1710 1720 1730 >>XP_006719476 (OMIM: 601234) PREDICTED: nascent polypep (2082 aa) initn: 87 init1: 54 opt: 352 Z-score: 178.8 bits: 45.3 E(85289): 0.0032 Smith-Waterman score: 463; 25.2% identity (44.0% similar) in 841 aa overlap (3-792:871-1641) 10 20 30 pF1KA1 MDTAEDPAWLQLLQKDSSPPGPRPTAFFCPQD : .: . : :.. : : . . :.. XP_006 LSFQGSKDSPATTHSPTPPSPKGAPTPSAVTPLSPKGVTLPPKET--PTPSVVNLPFPKE 850 860 870 880 890 40 50 60 70 80 pF1KA1 GSLG-----AGSSAMRDYCPSQQKASPAPPRHTPDQSPGMESRHRSPSGAGEG-ASCSDG : : . .: . :.. .:.::: . : :: ::.:: :. . XP_006 GPATPAPKQAPALSMTSSSPKKARATPAP-KGIP-ASP-------SPKGAPTPPAATPPS 900 910 920 930 940 90 100 110 120 130 140 pF1KA1 PRGSLACPSP--TCFSPQESPSKETLEAHGASISGTPEATTSGKPEPVSSVKTEPKSSDD :.:. : ::: . : .: . : .:.: .. : : .. : :. . XP_006 PKGGPATPSPKWAPTPPAATPPSPKGGPATPSPKGAPTPPAATPPSPKGGPAT-PSPKGA 950 960 970 980 990 1000 150 160 170 180 190 200 pF1KA1 RNPMFLEKMDFKSSKQADSTSIGKEDPGSSRKADPMFTGKAEPEILGKGDPVAPGRMDPM .: . . :.: : : : .. .: . : : : :: :..:. : XP_006 PTPPAVTPPSPKGSPAATPFPKGASTPPAATPPSPKGSPAATP--LPKGAPTTPAATLPS 1010 1020 1030 1040 1050 1060 210 220 230 240 250 260 pF1KA1 TVRKEDLGSLGKVDPLCSSKTYTVSPRKEDPGSLRKVDPVSSDKVDPVFPRKEEPRYSGK : : : . .: : : . . : : :. : : .: XP_006 P----------KGGPATPSLKGAPTPPAATPPSPKGGPATPSPKGAPMPPAATPPSPKGG 1070 1080 1090 1100 1110 270 280 290 300 310 320 pF1KA1 EHPVSSEKVAPTSAEKVDLVLSGKRDPGPSGK-ADPVPLESMDS-ASTGKTEPGLLGKLI . .: :::. . :.:.: : : : . . :.: . : :. XP_006 L-ATPPHKGAPTT--------PAATPPSPKGGLATPPPKGAPTTPAATPPSPKGGLATPP 1120 1130 1140 1150 1160 330 340 350 360 370 380 pF1KA1 PGSSGKNGPVSSGTGAPGSLGRLDPTCLGMADPASVGNVETVPATKEDSRFLGKMDPASS : :..:.. .. :. : :.: :. : . :.::. : : : : XP_006 P----KGAPTTPAATPPSPKG-------GLATPSPKG-APTTPAATPPSPKGGLATP--S 1170 1180 1190 1200 1210 390 400 410 420 430 440 pF1KA1 GEGRPVSGHTDTTASAKTDLTSLKNVDPMSSGKVDPVSL--GKMDPMCSGKPELLSPGQA .: :.. . : : : :.. . .. . : : : : .: : .: : XP_006 PKGAPTTP-AATPPSPKGGLATPSPKGAPTTPAATPPSPKGGPATPPPKGAP---TPPAA 1220 1230 1240 1250 1260 450 460 470 480 490 pF1KA1 ERVSVGKAGTVSPG-KEDPVSSRREDPISAGSRKTSSEKVNPESSGKTNPVSSG-PGDPR :. :.: ..: : : . : :. :: : : . : : .: :: : XP_006 TPPSL-KGGLATPPHKGAPNPAVVTPPSPKGGPATSPPKGAPTPPAATPPSPKGSPGTPP 1270 1280 1290 1300 1310 1320 500 510 520 530 540 550 pF1KA1 SLGTAGPPSAVKAEPATGGKGDPL-----SSEKAG-LVASGKAAPTASGKAEPLAVGKE- :. ::... : :: : : :.: . :.: .:: . : : : XP_006 PKGAPTPPAVTPPSP----KGTPTLPATTPSSKGGPTTPSSKEGPTPPA-ATPSHKGGPA 1330 1340 1350 1360 1370 1380 560 570 580 590 pF1KA1 -DPVSKGKADAGPSGQGDSVSIGKVVSTPGKT--VPV-------PSG------KVDPVSL : : .. : :: .:: .: . . .: :. .:: :: : :::: XP_006 MTPPSPKRGPAIPSPKGDPTSPAVIPLSPKKAPATPVTREGAATPSKGDLTPPAVTPVSL 1390 1400 1410 1420 1430 1440 600 610 620 630 640 650 pF1KA1 GKAEAIPEGKVG-SLPLEKGSPVTTTKADPRASGKAQPQSGGKAETKLPGQEGAAAPGEA :: : : : . : ::.:. . . : : : : : .. : ... :.:. XP_006 KKAPATSAPKGGPATPSSKGDPTLPAVTPP--SPKEPPAPKQVATSSSP-KKAPATPAPM 1450 1460 1470 1480 1490 1500 660 670 680 690 700 pF1KA1 GAVCLKKETPQASEKVDPGSCRKAEPLAS-----GKGEPVSLGKADS--APSRKTESPSL :: : :.. ..: . .:.: .: :..:. .. :. . ::. XP_006 GAPTLPAVIPSSPKEVPATPSSRRDPIAPTATLLSKKTPATLAPKEALIPPAMTVPSPKK 1510 1520 1530 1540 1550 1560 710 720 730 740 750 760 pF1KA1 GKVVPLSLEKTKPSSSSRQLDRKALGSARSPEGARGSEGRQ------ASARPVPRAAAEC ..: : :.. : . . . : .: .:. . . : . : :. : XP_006 TPAIPTP--KEAPATPSSK--EASSPPAVTPSTYKGAPSPKELLIPPAVTSPSPKEAP-- 1570 1580 1590 1600 1610 770 780 790 pF1KA1 APAAVLLAGGTHGRVICPHFVRPSFRPSQAPFLITGP .: :: . .: : :. :.. : XP_006 TPPAVTPPSPEKG----PATPAPKGTPTSPPVTPSSLKDSPTSPASVTCKMGATVPQASK 1620 1630 1640 1650 1660 1670 XP_006 GLPAKKGPTALKEVLVAPAPESTPIITAPTRKGPQTKKSSATSPPICPDPSAKNGSKGPL 1680 1690 1700 1710 1720 1730 798 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 22:15:28 2016 done: Wed Nov 2 22:15:30 2016 Total Scan time: 11.970 Total Display time: 0.240 Function used was FASTA [36.3.4 Apr, 2011]