FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1318, 1388 aa 1>>>pF1KSDA1318 1388 - 1388 aa - 1388 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.7293+/-0.000688; mu= -11.4133+/- 0.042 mean_var=454.0731+/-97.162, 0's: 0 Z-trim(115.5): 133 B-trim: 426 in 1/53 Lambda= 0.060188 statistics sampled from 25953 (26063) to 25953 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.62), E-opt: 0.2 (0.306), width: 16 Scan time: 18.390 The best scores are: opt bits E(85289) XP_011529300 (OMIM: 300965) PREDICTED: retrotransp (1388) 8922 791.1 0 XP_011529301 (OMIM: 300965) PREDICTED: retrotransp (1388) 8922 791.1 0 XP_016885184 (OMIM: 300965) PREDICTED: retrotransp (1388) 8922 791.1 0 XP_016885183 (OMIM: 300965) PREDICTED: retrotransp (1388) 8922 791.1 0 NP_065820 (OMIM: 300965) retrotransposon gag domai (1388) 8922 791.1 0 NP_001035194 (OMIM: 608424) mucin-17 precursor [Ho (4493) 615 70.2 3.9e-10 NP_001291288 (OMIM: 158373) mucin-5AC precursor [H (5654) 539 63.7 4.5e-08 NP_060876 (OMIM: 158372) mucin-4 isoform a precurs (5412) 515 61.6 1.8e-07 XP_011514552 (OMIM: 158371) PREDICTED: mucin-3A is (3076) 369 48.7 0.00078 XP_016867720 (OMIM: 158371) PREDICTED: mucin-3A is (3143) 369 48.7 0.0008 XP_011514551 (OMIM: 158371) PREDICTED: mucin-3A is (3245) 369 48.7 0.00082 XP_011514549 (OMIM: 158371) PREDICTED: mucin-3A is (3296) 369 48.7 0.00083 XP_011514548 (OMIM: 158371) PREDICTED: mucin-3A is (3313) 369 48.7 0.00083 NP_005951 (OMIM: 158371) mucin-3A precursor [Homo (3323) 369 48.8 0.00083 XP_016882989 (OMIM: 606154) PREDICTED: mucin-16 is (11159) 363 48.6 0.003 XP_016882988 (OMIM: 606154) PREDICTED: mucin-16 is (11186) 363 48.6 0.003 XP_011536691 (OMIM: 601234) PREDICTED: nascent pol (2078) 330 45.2 0.0061 XP_006719476 (OMIM: 601234) PREDICTED: nascent pol (2082) 330 45.2 0.0061 XP_006719477 (OMIM: 601234) PREDICTED: nascent pol (2082) 330 45.2 0.0061 XP_006719475 (OMIM: 601234) PREDICTED: nascent pol (2082) 330 45.2 0.0061 NP_001157934 (OMIM: 604609) mucin-12 precursor [Ho (5335) 338 46.2 0.0077 >>XP_011529300 (OMIM: 300965) PREDICTED: retrotransposon (1388 aa) initn: 8922 init1: 8922 opt: 8922 Z-score: 4208.3 bits: 791.1 E(85289): 0 Smith-Waterman score: 8922; 100.0% identity (100.0% similar) in 1388 aa overlap (1-1388:1-1388) 10 20 30 40 50 60 pF1KSD MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP 850 860 870 880 890 900 910 920 930 940 950 960 pF1KSD LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KSD TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KSD ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KSD TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KSD FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KSD FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KSD RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KSD SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH 1330 1340 1350 1360 1370 1380 pF1KSD HQKAHTNK :::::::: XP_011 HQKAHTNK >>XP_011529301 (OMIM: 300965) PREDICTED: retrotransposon (1388 aa) initn: 8922 init1: 8922 opt: 8922 Z-score: 4208.3 bits: 791.1 E(85289): 0 Smith-Waterman score: 8922; 100.0% identity (100.0% similar) in 1388 aa overlap (1-1388:1-1388) 10 20 30 40 50 60 pF1KSD MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP 850 860 870 880 890 900 910 920 930 940 950 960 pF1KSD LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KSD TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KSD ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KSD TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KSD FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KSD FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KSD RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KSD SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_011 SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH 1330 1340 1350 1360 1370 1380 pF1KSD HQKAHTNK :::::::: XP_011 HQKAHTNK >>XP_016885184 (OMIM: 300965) PREDICTED: retrotransposon (1388 aa) initn: 8922 init1: 8922 opt: 8922 Z-score: 4208.3 bits: 791.1 E(85289): 0 Smith-Waterman score: 8922; 100.0% identity (100.0% similar) in 1388 aa overlap (1-1388:1-1388) 10 20 30 40 50 60 pF1KSD MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP 850 860 870 880 890 900 910 920 930 940 950 960 pF1KSD LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KSD TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KSD ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KSD TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KSD FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KSD FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KSD RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KSD SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH 1330 1340 1350 1360 1370 1380 pF1KSD HQKAHTNK :::::::: XP_016 HQKAHTNK >>XP_016885183 (OMIM: 300965) PREDICTED: retrotransposon (1388 aa) initn: 8922 init1: 8922 opt: 8922 Z-score: 4208.3 bits: 791.1 E(85289): 0 Smith-Waterman score: 8922; 100.0% identity (100.0% similar) in 1388 aa overlap (1-1388:1-1388) 10 20 30 40 50 60 pF1KSD MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP 850 860 870 880 890 900 910 920 930 940 950 960 pF1KSD LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KSD TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KSD ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KSD TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KSD FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KSD FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KSD RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KSD SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_016 SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH 1330 1340 1350 1360 1370 1380 pF1KSD HQKAHTNK :::::::: XP_016 HQKAHTNK >>NP_065820 (OMIM: 300965) retrotransposon gag domain-co (1388 aa) initn: 8922 init1: 8922 opt: 8922 Z-score: 4208.3 bits: 791.1 E(85289): 0 Smith-Waterman score: 8922; 100.0% identity (100.0% similar) in 1388 aa overlap (1-1388:1-1388) 10 20 30 40 50 60 pF1KSD MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP 850 860 870 880 890 900 910 920 930 940 950 960 pF1KSD LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KSD TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KSD ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KSD TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KSD FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KSD FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KSD RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KSD SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH 1330 1340 1350 1360 1370 1380 pF1KSD HQKAHTNK :::::::: NP_065 HQKAHTNK >>NP_001035194 (OMIM: 608424) mucin-17 precursor [Homo s (4493 aa) initn: 101 init1: 59 opt: 615 Z-score: 303.0 bits: 70.2 E(85289): 3.9e-10 Smith-Waterman score: 681; 25.9% identity (52.1% similar) in 1166 aa overlap (31-1146:139-1214) 10 20 30 40 50 pF1KSD MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSA--SDP : : .:: . . . : :: : : NP_001 RMTPTESRTTSESTSDSTTLFPSSTEDTSSPTTPEGTDVP-MSTPSEESISSTMAFVSTA 110 120 130 140 150 160 60 70 80 90 100 110 pF1KSD GGTSTQLMTSPVFDT-MSAPLMGVPNSGALSPPLMPASDSGALSPLLMPAS-DSGALSPL : . .:: .. . ::.:: . .. : : : : : . .: : .: . .:: NP_001 PLPSFEAYTSLTYKVDMSTPL--TTSTQASSSPTTPESTT-------IPKSTNSEGSTPL 170 180 190 200 210 120 130 140 150 160 170 pF1KSD L-MPALDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSG ::: .:.. : . . .: .. : :.:: .: .:: :. :::.: NP_001 TSMPA---STMKVASSEAITLLTTPVEISTP--VTISAQASSSPTTAEGPSLSNSAPSGG 220 230 240 250 260 270 180 190 200 210 220 230 pF1KSD VVCTPIMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSS-EAMS-PLQ ::. . .:. :... ... :: : . ::. .:.. :. : : . NP_001 --STPL----TRMPLSVMLVVSSEASTLSTTPAATNIPVITSTEASSSPTTAEGTSIPTS 280 290 300 310 320 240 250 260 270 280 290 pF1KSD ITDEDTEAMSKVLMTAL--ASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNS : . .... ... :..:.:.: .. .:. :.:. :: .:.: .. NP_001 TYTEGSTPLTSTPASTMPVATSEMSTLSITPVDT---STLVT-------TSTEPSSLPTT 330 340 350 360 370 300 310 320 330 340 pF1KSD GGIPTPLMSDLDSG--------IMSSLLMSSPGSEVMSTPLLS---VPDAGEMSTLPKPA . . : : :. : . . :. :: .: . . :. : : :.: :. : : NP_001 AEATSMLTSTLSEGSTPLTNMPVSTILVASSEASTTSTIPVDSKTFVTTASEASSSPTTA 380 390 400 410 420 430 350 360 370 380 390 pF1KSD PDAE-AMSPALMTALPSGVMPTQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMS :. : : . : ::..: :. .: : : :: :::. . . ..:..: NP_001 EDTSIATSTPSEGSTPLTSMPVSTTPVASSEA-SNLSTTPVDSKTQVTTSTEASSS---- 440 450 460 470 480 490 400 410 420 430 440 450 pF1KSD APPVRALDSGAMSTPLMGAPASGNMSTLQKTVPASGAMTTSLMTVP---SSGVMSTEQMS ::. ..: ::: :. .::. .:.:.... ...: :.: :. : .. . : NP_001 -PPTAEVNSMPTSTPSEGSTPLTSMSV--STMPVASSEASTLSTTPVDTSTPVTTSSEAS 500 510 520 530 540 460 470 480 490 500 510 pF1KSD ATASRVMSAQL-TMAKTSGAMPTGSMKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPV .... .... : . . :. : .: . .. . :: .:: . : NP_001 SSSTTPEGTSIPTSTPSEGSTPLTNMPVSTRLVVSSEASTTSTTPADSNTFVTTSSEASS 550 560 570 580 590 600 520 530 540 550 560 570 pF1KSD TATASETMSMPQLTVPASGSMSMLQMRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAM ..:..: ::: : :. .. .: . .. . : . :... ... . .. : NP_001 SSTTAEGTSMPTSTYSERGT-TITSMSVSTTLVAS-SEASTLSTTPVDSNTPVTTSTEAT 610 620 630 640 650 660 580 590 600 610 620 630 pF1KSD STPLMTAQTSGSTSTLLMRDTASGVMSCPQMRSLASGALSKPL-MTPKASGTMFTEKMTT :. . :: ::: . . .. . : : .:.... .. : :: ..: : :. NP_001 SSSTTAEGTSMPTST--YTEGSTPLTSMPVNTTLVASSEASTLSTTPVDTSTPVT---TS 670 680 690 700 710 720 640 650 660 670 680 690 pF1KSD TASEAMPTLLMRDTVSGALSMPQMTDTASGGLSASLMRDTASGAMSTSQMTATVSGGMSM : . . :: :..:: ::: :.: : : :. : .: .. ::. ..:.: . NP_001 TEASSSPT-----TADGA-SMP--TSTPSEG-STPLTSMPVSKTLLTSSEASTLS---TT 730 740 750 760 770 700 710 720 730 740 750 pF1KSD PLMRAQDPGVMPASLMRAKVSGKML---SQPMSTQDPGGMSMSPM-KSMTAGGMQMNSPT :: : .. .. .:. : :.:.:: . : ::. :. .. ..:: NP_001 PL----DTSTHITTSTEASCSPTTTEGTSMPISTPSEG----SPLLTSIPVSITPVTSPE 780 790 800 810 820 760 770 780 790 800 810 pF1KSD SDVMSTPTVRAWTSETMSTPLMRTSDPGERPSLLTRASSSGEMSLPLMRAPASGEIATPL ....:: : . . : :: . . :.: :. : . : :. :: :.: .: . NP_001 ASTLSTTPVDSNSPVTTSTEVSSSPTPAEGTSMPTSTYSEGR--TPLTSMPVS---TTLV 830 840 850 860 870 820 830 840 850 860 pF1KSD RSPAYGAMSAPQMTATASGMMSSMPQVKAPISGAMSMPLTRSTASGGMSMPLMRAPDSR- . : ...:. . ... :. . . : . ::: ... : : :: ::: NP_001 ATSAISTLSTTPVDTSTPVTNSTEARSSPTTSEGTSMP---TSTPGEGSTPLTSMPDSTT 880 890 900 910 920 930 870 880 890 900 910 920 pF1KSD --VTSTSQMMPTASGDMCTLPVRAPASGGVSSPLVRAPASGTMSTPLR--RPSACETVST :.: .. . .. : : :: . .. ..::: . .: ::: . : . :: NP_001 PVVSSEARTLSATPVDTST-PV-TTSTEATSSPTTAEGTSIPTSTPSEGTTPLTSTPVSH 940 950 960 970 980 990 930 940 950 960 970 980 pF1KSD ELMRASASGHMSTAQTTAMVSGGMSKPLMRAP--ASGT-MPMPLMSAMASGEMSMPLMET :. : .. .::. . . . : : : :: :: : .. ::. : NP_001 TLVANSEASTLSTTPVDSNTPLTTSTEASSPPPTAEGTSMPTSTPSEGSTPLTRMPVSTT 1000 1010 1020 1030 1040 1050 990 1000 1010 1020 1030 pF1KSD M-ASGATSTLQTSVANSRS--MSLSQ-TTYTVSGRMATAPIRASASGARSTSFMRASVSG : ::. ::::.:. :.. . . :: .. .... .. : . . : :: . . :: NP_001 MVASSETSTLSTTPADTSTPVTTYSQASSSSTTADGTSMPTSTYSEG--STPLTSVPVST 1060 1070 1080 1090 1100 1110 1040 1050 1060 1070 1080 1090 pF1KSD SMPMPLPRATASGCGMGMSMPQMTATDS-------RGMSTPLMRASGPGTMSTPQTAFGV . . .: : . :.: :.:.. .: : : .: :. .:: ... : NP_001 RLVVSSEASTLSTTPVDTSIPVTTSTEASSSPTTAEGTSIP---TSPPSEGTTPLASMPV 1120 1130 1140 1150 1160 1100 1110 1120 1130 1140 1150 pF1KSD MSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPK-EVPSFGMLTPALCY .: . :.::.: .. : :: ..::. :...::: :: :. :: NP_001 STTLVV----SSEANT--LSTTPVDSKT---QVATSTEASSPPPTAEVTSMPTSTPGERS 1170 1180 1190 1200 1210 1160 1170 1180 1190 1200 1210 pF1KSD LLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERWFILQMEVGEP NP_001 TPLTSMPVRHTPVASSEASTLSTSPVDTSTPVTTSAETSSSPTTAEGTSLPTSTTSEGST 1220 1230 1240 1250 1260 1270 >-- initn: 91 init1: 56 opt: 606 Z-score: 298.7 bits: 69.4 E(85289): 6.7e-10 Smith-Waterman score: 623; 23.6% identity (55.2% similar) in 1143 aa overlap (31-1135:1269-2321) 10 20 30 40 50 60 pF1KSD MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG : . : .: : .:. .: ...: . NP_001 LSTSPVDTSTPVTTSAETSSSPTTAEGTSLPTSTTSEGSTLLTS---IPVSTTLVTSPEA 1240 1250 1260 1270 1280 1290 70 80 90 100 110 pF1KSD TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASD-SGALSPLLMP .. :.:.:: :: ..: : .:. .: :: .. ::.: : . .:: NP_001 ST--LLTTPV-DT-KGP---VVTSNEVSSSPTPAEGTS------MPTSTYSEGRTPLTSI 1300 1310 1320 1330 1340 120 130 140 150 160 170 pF1KSD ALDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCT ... :...: ...: . : :. .: ..: . . :: :. : NP_001 PVNT----TLVASSAISILSTTPVDNSTPVTTSTEACSSPTTSEGTSMPNSNPSEGT--T 1350 1360 1370 1380 1390 180 190 200 210 220 230 pF1KSD PIMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSS-EAMS-PLQITDE :. : : .::.. . ... :: .. .::. :.. . .:.. :..: : . .: NP_001 PLTSIPVS---TTPVV-SSEASTLSATPVDTSTPGTTSAEATSSPTTAEGISIPTSTPSE 1400 1410 1420 1430 1440 1450 240 250 260 270 280 290 pF1KSD DTEAMSKVLM--TALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPT-STQNSGGI .... . : .:..: :.: . .::. : .. :...: .:: :. .:. . . NP_001 GKTPLKSIPVSNTPVANSEASTLSTTPVDSN--SPVVTSTAVS--SSPTPAEGTSIAIST 1460 1470 1480 1490 1500 300 310 320 330 340 350 pF1KSD PTPLMSDLDS-GIMSSLLMSSPGSEVMSTP-LLSVP--DAGEMSTLPKPAPDAEAMSPAL :. . : : . .. . :: . . .:: . :.: .. :. : : :. .:. . NP_001 PSEGSTALTSIPVSTTTVASSEINSLSTTPAVTSTPVTTYSQASSSPTTA-DGTSMQTST 1510 1520 1530 1540 1550 1560 360 370 380 390 400 pF1KSD MT--ALPSGVMPTQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDS .. . : .:..:: . .: : . :: .::. ...::: :. . .: NP_001 YSEGSTPLTSLPVSTMLVVSSEA-NTLSTTPIDSK------TQVTASTEASSSTTAEGSS 1570 1580 1590 1600 1610 1620 410 420 430 440 450 460 pF1KSD GAMSTPLMGAPASGNMSTLQKTVPASGAMTTSLMTVP---SSGVMSTEQMSATASRVMSA ..::: :.: .. . .:.:... ...: :.: .: :... ..:.. . . .. NP_001 MTISTPSEGSPLLTSIPV--STTPVASPEASTLSTTPVDSNSPVITSTEVSSSPTPAEGT 1630 1640 1650 1660 1670 470 480 490 500 510 520 pF1KSD QL-TMAKTSGAMPTGSMKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMS .. : . : : : :. . . .. : .::. . . . . :.:: : NP_001 SMPTSTYTEGRTPLTSITVRTTPVASSAISTLSTTPVDNSTPVTTSTEARSSPTTSEGTS 1680 1690 1700 1710 1720 1730 530 540 550 560 570 580 pF1KSD MPQLTVPASGSMSMLQMRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQT ::. ..:. :. . .. . .. ..: :. . ... . . : : :.: . : NP_001 MPN-STPSEGTTPLTSIPVSTTPVLSSEASTLSATPIDTSTPVTTSTE-ATSSPTTAEGT 1740 1750 1760 1770 1780 1790 590 600 610 620 630 640 pF1KSD SGSTSTLLMRDTASGVMSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLL : :::: . . . : : ..:.... .. : : .... . .:.:: . :: NP_001 SIPTSTL--SEGMTPLTSTPVSHTLVANSEASTLSTTPVDSN--SPVVTSTAVSSSPT-- 1800 1810 1820 1830 1840 1850 650 660 670 680 690 700 pF1KSD MRDTVSGALSMPQMTDTASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGV . .: : : :. .:: .. .: :.. : : .. .:. . : :. . . NP_001 PAEGTSIATSTPSEGSTALTSIPVS----TTTVASSETNTLSTTPAVTSTPVTTYAQVSS 1860 1870 1880 1890 1900 710 720 730 740 750 760 pF1KSD MPASLMRAKVSGKMLSQPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTS :.. : :. : : . : .. :... :... ..:. .. . .: : . : NP_001 SPTT---ADGSSMPTSTPREGRPP--LTSIPVSTTTVASSEINTLSTTLADTRTPVTTYS 1910 1920 1930 1940 1950 1960 770 780 790 800 810 pF1KSD ETMSTPLMRTSDPGERPSLLTRASSSGEMSLPL-----MRAPASGEIATPL--RSPAYGA .. :.: :.: :. .:. :.:: . . :: .::. .:: . NP_001 QASSSPT--TADGTSMPTPAYSEGSTPLTSMPLSTTLVVSSEASTLSTTPVDTSTPATTS 1970 1980 1990 2000 2010 820 830 840 850 860 870 pF1KSD MSAPQMTATASG--MMSSMPQVKA-PISGAMSMPLTRSTASGGMSMPLMRAP-DSR--VT . . .::.: ...: :. .. :..: ::.. . . .. . : .: ::. :: NP_001 TEGSSSPTTAGGTSIQTSTPSERTTPLAG---MPVSTTLVVSSEGNTLSTTPVDSKTQVT 2020 2030 2040 2050 2060 2070 880 890 900 910 920 930 pF1KSD STSQMMPTASGDMCTLPVRAPASGGVSSPLVRA-PASGTMSTPLRRPSACETVSTELMRA .... .:... .. . ::. : :::. . : : .::. : : :.:: . . NP_001 NSTEASSSATAEGSSMTISAPSEG---SPLLTSIPLS---TTPVASPEAS-TLSTTPVDS 2080 2090 2100 2110 2120 940 950 960 970 980 pF1KSD SASGHMSTAQTTAMVSGGMSKPLMRAPASGT-MPMPLMSAMASGEMSMPLMETM-ASGAT . : . :.. :: :.:. :. :: : .: . :::. :. ::.: NP_001 N-----SPVITSTEVS---SSPI---PTEGTSMQTSTYSDRRTPLTSMPVSTTVVASSAI 2130 2140 2150 2160 2170 990 1000 1010 1020 1030 1040 pF1KSD STLQTSVANSRSMSLSQT---TYTVSGRMATAPIRASASGARSTSFMRASVSGSMPMPLP :::.:. ... . ..: . .... .. : . . : :: : :: .::. NP_001 STLSTTPVDTSTPVTNSTEARSSPTTSEGTSMPTSTPSEG--STPFTSMPVS-TMPVVTS 2180 2190 2200 2210 2220 2230 1050 1060 1070 1080 1090 1100 pF1KSD RA-TASGCGMGMSMPQMTATDSRGMSTPLMRASGPGTMSTPQTAFGVMSTPEIKATDSGE .: : :. . : : :.:.. :.: ... :: : : .... .:: . . .. NP_001 EASTLSATPVDTSTPVTTSTEA--TSSP---TTAEGT-SIPTSTLSEGTTP-LTSIPVSH 2240 2250 2260 2270 2280 1110 1120 1130 1140 1150 1160 pF1KSD ASTSHINITASGSKPTSHMT--ATTPETAKPPPKEVPSFGMLTPALCYLLEEQEAARGSC . ... .... .. :.. : .:. :...::: NP_001 TLVANSEVSTLSTTPVDSNTPFTTSTEASSPPPTAEGTSMPTSTSSEGNTPLTRMPVSTT 2290 2300 2310 2320 2330 2340 1170 1180 1190 1200 1210 1220 pF1KSD SVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERWFILQMEVGEPLSHENKSFLRRS NP_001 MVASFETSTLSTTPADTSTPVTTYSQAGSSPTTADDTSMPTSTYSEGSTPLTSVPVSTMP 2350 2360 2370 2380 2390 2400 >>NP_001291288 (OMIM: 158373) mucin-5AC precursor [Homo (5654 aa) initn: 375 init1: 164 opt: 539 Z-score: 265.9 bits: 63.7 E(85289): 4.5e-08 Smith-Waterman score: 619; 23.3% identity (52.8% similar) in 1093 aa overlap (69-1121:3625-4624) 40 50 60 70 80 90 pF1KSD VQILHSHVQLPIVSTSASDPGGTSTQLMTSPVFDT-MSAPLMGVPNSGALSPPLMPASDS :: .: ..:: ..:.. : :: .: . NP_001 VCRNQDQQGPFKMCLNYEVRVLCCETPKGCPVTSTSVTAP--STPSGRATSPTQSTSSWQ 3600 3610 3620 3630 3640 3650 100 110 120 130 140 150 pF1KSD GALSPLLMPASDSGALSPLLMPALDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMV . . :. .: ... . : : .: ::. .. :. . : .: : NP_001 KSRTTTLVTSSITSTTQT-------STTSAPTTSTTPASI--PSTTSAPTTSTTS----- 3660 3670 3680 3690 160 170 180 190 200 210 pF1KSD APDSAEISPLAMPAPSSGVVCTPIMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMS :: .. : ::..... :: .:::. . :: :: .. .: . .. . : NP_001 APTTSTTS-----APTTSTTSTPQTTTSSAPTSSTT--SAPTTSTISAPTTSTISAPTTS 3700 3710 3720 3730 3740 3750 220 230 240 250 260 270 pF1KSD TQPVPAPSSEAMSPLQITDEDTEAMSKVLMTALASGEISSLL---MSGTDSEAISSLIMS : .:. :. . .: . .. : ... :. .:. :.: . ..: : .: : : NP_001 TTSAPTASTTS-APTSTSSAPTTNTTSAPTTSTTSAPITSTISAPTTSTTSTPQTSTISS 3760 3770 3780 3790 3800 3810 280 290 300 310 320 330 pF1KSD AVASGGTSPQP--TSTQNSGGIPTPLMSDLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGE ..: ..:: ::. ... .: : .. :. :.: . . :.: :. .: NP_001 PTTSTTSTPQTSTTSSPTTSTTSAPTTSTTSAPTTSTT--STPQTSISSAPTSSTTSAPT 3820 3830 3840 3850 3860 340 350 360 370 380 390 pF1KSD MSTLPKPAPDAEAMSPALMTALPSGVMPTQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRA ::. :. .. .. . :. :.. :.. : .. . . :: . .. : :. . NP_001 ASTISAPTTSTTSFHTTSTTSPPTS--STSSTPQTSKTSAATSSTTSGSGTTPSPVPTTS 3870 3880 3890 3900 3910 3920 400 410 420 430 440 pF1KSD TASGVMSAPPVRALDSGAMSTPLMGA--PASGNMSTLQKTVPASGAM---TTSLMTVPSS ::: .. .... . : :. : . .. :. : . .. : NP_001 TASVSKTSTSHVSVSKTTHSQPVTRDCHPRCTWTKWFDVDFPSPGPHGGDKETYNNIIRS 3930 3940 3950 3960 3970 3980 450 460 470 480 490 500 pF1KSD G---VMSTEQMSATASRVMS-AQLTMAKTSGAMPTGSMKAVAKQYKRATASGKM--STPL : :... :. : .... . . .. . .... . . . :: . . NP_001 GEKICRRPEEITRLQCRAESHPEVSIEHLGQVVQCSREEGLVCRNQDQQGPFKMCLNYEV 3990 4000 4010 4020 4030 4040 510 520 530 540 550 pF1KSD R----RAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQMRAPV---SEAMSMPQM : ..: . ... :::: .. . . : :.... : . :. . . . : :: NP_001 RVLCCETPKGCPVTSTPVTAPSTPS---GRATSPTQSTSSWQKSRTTTLVTTSTTSTPQT 4050 4060 4070 4080 4090 4100 560 570 580 590 600 610 pF1KSD RTMASGLTSAAQMKA-MTSGAMSTPLMTAQTSGSTSTLLMRDTASGVMSCPQMRSLASGA : .. ::. .. :..: .: .: :...::. : :.:: . . .: . NP_001 STTSAPTTSTIPASTPSTTSAPTTSTTSAPTTSTTSAPTHR-TTSGPTTSTTLAPTTS-T 4110 4120 4130 4140 4150 4160 620 630 640 650 660 670 pF1KSD LSKPLMTPKASGTMFTEKMTTTASEAMPTL-LMRDTVSGALSMPQMTDT-ASGGLSASLM : : . ... : : . .::.. . :: . . .:.. : :: . : :. . ..: NP_001 TSAPTTSTNSAPTTSTISASTTSTISAPTTSTISSPTSSTTSTPQTSKTSAATSSTTSGS 4170 4180 4190 4200 4210 4220 680 690 700 710 720 730 pF1KSD RDTASGAMSTSQMTATVSGGMSMPLMRAQD-PGVMPASLMRAKVSGKMLSQPMSTQDPGG : : . .:: .:.... : : . . ::. :. . ..... .. .:. : NP_001 GTTPSPVPTTSTTSASTTSTTSAPTTSTTSGPGTTPSPVPSTSTTSAATTS--TTSAPTT 4230 4240 4250 4260 4270 740 750 760 770 780 pF1KSD MSMS-PMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGERPSLLTRASS . : : .:::.: ::. ::. . .. : :: :: :: :: . .:. NP_001 RTTSAPTSSMTSGPGTTPSPV------PTTSTTSAPTTST----TSGPGTTPSPVPTTST 4280 4290 4300 4310 4320 790 800 810 820 830 840 pF1KSD SGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAPISGAMSMPL . : :. . .:: .:: :. .. ::: ..:... :. ...: . .: NP_001 T---SAPIT-STTSGPGSTPSPVPTTSTTSAPTTSTTSASTAST---TSGPGTTPSPVPT 4330 4340 4350 4360 4370 4380 850 860 870 880 890 900 pF1KSD TRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSPLVRA-PAS- : .:. :: .:.::.: :.:: : : .:... .:.: .:. ::: NP_001 TSTTS----------APTTRTTSASTA-STTSGPGST-PSPVPTTSTTSAPTTRTTPAST 4390 4400 4410 4420 4430 910 920 930 940 950 960 pF1KSD -GTMSTPLRRPSACETVSTELMRASASGHMSTAQTTA-----MVSGGMSKPLMRAPASGT .: : : :: :.:: .... . :..::. :.:: . : .:...: NP_001 ASTTSGPGTTPSPVPTTSTTSASTTSTISLPTTSTTSAPITSMTSGPGTTP-SPVPTTST 4440 4450 4460 4470 4480 970 980 990 1000 1010 pF1KSD MPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMAT-API- : :. ... : . . . : .:. : . : . ..:. :.:: .. .:. NP_001 TSAPTTSTTSASTASTTSGPGTTPSPVPTTSTTSAPTTSTTSASTASTTSGPGTSLSPVP 4490 4500 4510 4520 4530 4540 1020 1030 1040 1050 1060 1070 pF1KSD RASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGP .:...: .:: .: :. : :.: .... : : ..: ::: NP_001 TTSTTSAPTTS--TTSGPGTTPSPVPTTSTT------SAPTTSTT------------SGP 4550 4560 4570 4580 1080 1090 1100 1110 1120 1130 pF1KSD GTMSTPQTAFGVMSTPEIKATDSGEASTSHINIT-ASGSKPTSHMTATTPETAKPPPKEV :: .: .: ..: ...::::.... .. :.:.. NP_001 GTTPSP--------VPTTSTTPVSKTSTSHLSVSKTTHSQPVTSDCHPLCAWTKWFDVDF 4590 4600 4610 4620 4630 4640 1140 1150 1160 1170 1180 1190 pF1KSD PSFGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAE NP_001 PSPGPHGGDKETYNNIIRSGEKICRRPEEITRLQCRAESHPEVNIEHLGQVVQCSREEGL 4650 4660 4670 4680 4690 4700 >-- initn: 277 init1: 155 opt: 515 Z-score: 254.7 bits: 61.6 E(85289): 1.9e-07 Smith-Waterman score: 696; 23.7% identity (54.3% similar) in 1086 aa overlap (49-1110:2240-3207) 20 30 40 50 60 70 pF1KSD VEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGGTSTQLMTSPVFDTMSAPL : :::. . . :.: . :: : :.: NP_001 RVLCCETPKGCPVTSTPVTAPSTPSGRATSPTQSTSSWQKSRTTTLVTTS----TTSTPQ 2210 2220 2230 2240 2250 2260 80 90 100 110 120 130 pF1KSD MGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPALDSGTLSPLLSTSEYGVM .. . . : :.. . . :.. . . :: . ..: ::. .:: .. NP_001 TSTTYAHTTSTTSAPTARTTS-----APTTRTTSASPASTTSGPGNTPSPVPTTSTISAP 2270 2280 2290 2300 2310 2320 140 150 160 170 180 190 pF1KSD SPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTPIMSTSSSEAMSTPLMLAP . .. . : .: :: . .. .: :.:..... .: ::.:. . :: : NP_001 TTSITSAPTTSTTSAPTSSTTSGPGTTP--SPVPTTSITSAPTTSTTSAPTTSTTS--AR 2330 2340 2350 2360 2370 200 210 220 230 240 250 pF1KSD DSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTEAMSKVLMTALASGEISSL :. : . .. . .:::. :. . . . :. : :. .:. :: NP_001 TSSTTSATTTSRISGPETTPSPVPTTSTTSATTTSTTSAPT--------TSTTSAPTSST 2380 2390 2400 2410 2420 260 270 280 290 300 310 pF1KSD LMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMSDLDSGIMSSLLMSSP--G :. .. . :. :.... ::.:.:. : .. . :: .. .. .: .: : NP_001 T-SSPQTSTTSAPTTSTTSGPGTTPSPVPTTSTTSAPTTRTTSAPKSSTTSAATTSTTSG 2430 2440 2450 2460 2470 2480 320 330 340 350 360 370 pF1KSD SEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMPTQTMPAPGSGAMSPWS :. :. .. .. .: :: . . : : :. ::. : . :.: ... : . NP_001 PETTPRPVPTTSTTSSPTTSTTSAPTTSTTS-ASTTSTTSGAGTTPS-PVPTTSTTSAPT 2490 2500 2510 2520 2530 2540 380 390 400 410 420 430 pF1KSD TQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPASGNMSTLQKTVPASGA :..... . :. . ::.... :.: . : . .: .::.... : :.: :.. NP_001 TSTTSAPISST--TSATTTSTTSGPGTTP--SPVPTTSTTSAPTTSTTSG-PGTTP-SAV 2550 2560 2570 2580 2590 440 450 460 470 480 490 pF1KSD MTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGA-MPTGSMKAVAKQYKRATASG :::. ..:.... :. .:.:.: . ..... .:. . .::.: ... .:.:: NP_001 PTTSITSAPTTSTNSAP-ISSTTSATTTSRISGPETTPSPVPTASTTSASTT---STTSG 2600 2610 2620 2630 2640 2650 500 510 520 530 540 pF1KSD KMSTP----------LRRAPTSGAMSTQPVTATASETMSMPQLT---VPASGSMSMLQMR .:: . . :..: .:. ..:... : : : : ::.... : NP_001 PGTTPSPVPTTSTISVPTTSTTSASTTSTTSASTTSTTSGPGTTPSPVPTTSTTS----- 2660 2670 2680 2690 2700 2710 550 560 570 580 590 600 pF1KSD APVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGVMS ::.. . : : :... ::... : :... :.: .. .:::. :.. . NP_001 APTTSTTSAPTTSTISAPTTSTTS--ATTTSTTSAPTPRRTSAPTTSTISASTTSTTSAT 2720 2730 2740 2750 2760 610 620 630 640 650 660 pF1KSD CPQMRS-LASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTDT . : .....: : . : : : . : :.. . : .:.. : :: . : NP_001 TTSTTSATTTSTISAPTTSTTLSPTTSTTSTTITSTTSAP-------ISSTTSTPQTSTT 2770 2780 2790 2800 2810 2820 670 680 690 700 710 720 pF1KSD ASGGLSASLMRDTASGAM-STSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS .. :.. :.:. . .:: .: ... : : :. . .:.: . .. . : NP_001 SAPTTSTTSGPGTTSSPVPTTSTTSAPTTSTTSAPTTRTTS---VPTSSTTSTATTSTTS 2830 2840 2850 2860 2870 730 740 750 760 770 780 pF1KSD QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER : .: .: : : :. .::. . :.::. . .. : :: :: : NP_001 GPGTTPSP-----VPTTSTTS------APTTRTTSAPTTSTTSAPTTST----TSAP--- 2880 2890 2900 2910 2920 790 800 810 820 830 840 pF1KSD PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP : : :.... .:.: . .: .:: :. ...:.: ..:... :. ...: NP_001 TSSTTSATTTSTISVPTT-STTSVPGTTPSPVPTTSTISVPTTSTTSASTTST---TSGP 2930 2940 2950 2960 2970 850 860 870 880 890 900 pF1KSD ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP . .: : .:. :: . .::. ::.: . ::... :.: NP_001 GTTPSPVPTTSTTS----------APTTSTTSA----PTTS------TISAPTTSTPSAP 2980 2990 3000 3010 910 920 930 940 950 pF1KSD LVR---APASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAP . ::...: :.: .. : :: .: . ..:.::...:: . : .: NP_001 TTSTTLAPTTSTTSAPTTSTTSTPTSSTT---SSPQTSTTSASTTSITSGPGTTP-SPVP 3020 3030 3040 3050 3060 3070 960 970 980 990 1000 1010 pF1KSD ASGTMPMPLMS---AMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRM ...: : : : ... .: : : .. .::: ..:.: :.. .:. : . NP_001 TTSTTSAPTTSTTSAATTSTISAPTTSTTSAPTTSTTSASTA-SKTSGLGTTPSPIPTTS 3080 3090 3100 3110 3120 3130 1020 1030 1040 1050 1060 1070 pF1KSD ATAPIRASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLM .:.: .:...: ..: ..: :. : :.: ... . :. ..:.. :: NP_001 TTSPPTTSTTSASTAS--KTSGPGTTPSPVPTTST------IFAPRTSTTSASTTST--- 3140 3150 3160 3170 3180 1080 1090 1100 1110 1120 1130 pF1KSD RASGPGTMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPP . :::: .: .: .... ...::::. NP_001 -TPGPGTTPSP--------VPTTSTASVSKTSTSHVSISKTTHSQPVTRDCHLRCTWTKW 3190 3200 3210 3220 3230 1140 1150 1160 1170 1180 1190 pF1KSD PKEVPSFGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHL NP_001 FDIDFPSPGPHGGDKETYNNIIRSGEKICRRPEEITRLQCRAESHPEVSIEHLGQVVQCS 3240 3250 3260 3270 3280 3290 >>NP_060876 (OMIM: 158372) mucin-4 isoform a precursor [ (5412 aa) initn: 217 init1: 56 opt: 515 Z-score: 254.9 bits: 61.6 E(85289): 1.8e-07 Smith-Waterman score: 654; 24.8% identity (54.0% similar) in 1264 aa overlap (31-1146:1904-3120) 10 20 30 40 50 pF1KSD MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRAD-VQILHSHVQLPIVSTSASDPG :. : :. :. :. ..::..: :... : NP_060 LVTDASSVSTGDTTPLPVTDTNSASTGDTTPLHVTDASSVSTGHA-TSLPVTSLSSASTG 1880 1890 1900 1910 1920 1930 60 70 80 90 100 110 pF1KSD GTSTQLMTSPVFDT--MSAPL-----MGVPNSGALSPPLMPASD--SGALSPLLMPASDS :. .::: . ..:: .::.. : : :. ::. .: .:: :..:. NP_060 DTTPLPVTSPSSASSGHTTPLPVTDASSVPTGHATSLPVTDASSVSTGHATPL--PVTDA 1940 1950 1960 1970 1980 1990 120 130 140 150 pF1KSD GALS-----PLLMPALDSGTLS-----PL----LSTSEYGVMSPGMMTIPDFGTMSA--- ...: :: :. :....: :: ::.. : .: . . : .. :. NP_060 SSVSTGHATPL--PVTDTSSVSTGQATPLPVTSLSSASTGDTTP--LPVTDTSSASTGQD 2000 2010 2020 2030 2040 160 170 180 190 200 pF1KSD -----TLMVAPDSAEISPLAMPAPSSGVV--CTPIMSTSSSEAMST---PLMLAPDSGEL : . . .... .:: . :::. . ::.. :..: ..:: .:. :.. . NP_060 TPLPVTSLSSVSTGDTTPLPVTNPSSASTGHATPLLVTDAS-SISTGHATSLLVTDASSV 2050 2060 2070 2080 2090 2100 210 220 230 240 250 pF1KSD SP---ILMQDMNPGVMST-QPVPAPSSEAMSPLQITDEDTEAMSKVLMTALASGEISSLL : ..: . . .:: . .: : . :: . . :: . . .....:. .:: NP_060 STGHATALHDTDASSLSTGDTTPLPVT---SPSSTSTGDTTPLPVTETSSVSTGHATSLP 2110 2120 2130 2140 2150 2160 260 270 280 290 300 pF1KSD MSGTDSEAI---SSLIM---SAVASGGTSPQP---TSTQNSG-GIPTPLMS--DLDSGIM .. :.: . .:: . :....: ..: : ::. ..: . : :. : . ..: NP_060 VTDTSSASTGHATSLPVTDTSSASTGHATPLPVTDTSSASTGQATPLPVTSPSSASTGHA 2170 2180 2190 2200 2210 2220 310 320 330 340 350 pF1KSD SSLLMS--SPGSEVMSTPL--LSVPDAGEMSTLPKPAPDAEAMSPALMTALP----SGVM ::.. : .: ..::: :. .:. .: : :. :: ..: . :.:: :.: NP_060 IPLLVTDTSSASTGQATPLPVTSLSSASTGDTTPLPVTDASSVSTGHATSLPVTSLSSVS 2230 2240 2250 2260 2270 2280 360 370 380 390 400 410 pF1KSD PTQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAM--STPL-M .: : : . :: :... . . . ....: . :: .:.:.. .::: . NP_060 TGDTTPLP---VTSPSSASTGHATPLHVTDASSASTGHATPLPVTSLSSASTGDTTPLPV 2290 2300 2310 2320 2330 420 430 440 450 460 470 pF1KSD GAPAS---GNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTS .:.: :. . :. : ::.. : . .: .. :..:: .. : .. .: NP_060 TSPSSASTGHATPLHVT-DASSVSTGDTTPLPVTS-------SSSASSGHTTPLPVTDAS 2340 2350 2360 2370 2380 2390 480 490 500 510 520 pF1KSD GAMPTGSMKAVAKQYKRATASGKMS-TPLR--RAPTSGAMSTQPVT--ATASETMSMPQL .: ::. . ....:. . :. . ..: . ::: ..:: . : : NP_060 SA-STGDTTPLPVTDTSSASTGHATHLPVTGLSSASTGDTTRLPVTNVSSASTGHATP-L 2400 2410 2420 2430 2440 530 540 550 560 570 580 pF1KSD TVPASGSMSMLQMRA-PVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGS : ...: : . : ... :. .: .:.:..... . . . .. ..: NP_060 PVTSTSSASTGDTTPLPGTDTSSVSTGHTTPLLVTDASSVSTGDTTRLPVTSPSSASTGH 2450 2460 2470 2480 2490 2500 590 600 610 620 630 640 pF1KSD TSTLLMRDTASGVMSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEA--MPTLLM :. : . :: :. : . : :. : : .:.. : ......: .:. NP_060 TTPLPVTDTPSA--STGDTTPLPVTNASS-LSTRHATSLHVTSPSSASTGHATSLPVTDT 2510 2520 2530 2540 2550 2560 650 660 670 680 690 pF1KSD RDTVSG-ALSMP-QMTDTASGGLSASL-MRDTASGAMSTSQMT-------ATVSGGMSMP . .: : .: :..:: : .. : . :: :. ::.: : ..:: : . : NP_060 SAASTGHATPLPVTSTSSASTGDTTPLPVTDTYSA--STGQATPLPVTSLSSVSTGDTTP 2570 2580 2590 2600 2610 2620 700 710 720 730 740 750 pF1KSD LMRAQDPGVMPASLMRAKVSGKMLSQP--MSTQDPGGMSMSPMKSMTAGG---MQMNSPT : : . :.: .... .... :: . . .. ..:...: . ..::. NP_060 L-----PVTSPSSASTGHATPLLVTDASSASTGQATPLPVTSLSSVSTGDTTPLPVTSPS 2630 2640 2650 2660 2670 760 770 780 790 pF1KSD S----DVMSTP---TVRAWTSETMSTPLMRTS-----DPGERPSLLTRASSSGEMSLPLM : . : : : : :..: : :. :: : : : .::.:. . ::. NP_060 SASTGHATSLPVTDTSSASTGDTTSLPVTDTSSAYTGDTTSLPVTDTSSSSTGDTT-PLL 2680 2690 2700 2710 2720 2730 800 810 820 830 840 850 pF1KSD RAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVK-APISGAMSMPL---TRSTA . .:. ..: .: . . . .....: . .: .. . .: . . :: . :.: NP_060 VTETSS-VSTGDTTP----LPVTDTSSASTGHATPLPVTNTSSVSTGHATPLHVTSPSSA 2740 2750 2760 2770 2780 2790 860 870 880 890 900 pF1KSD SGGMSMPLMRAPDSRVTS---TSQMMPTAS----GDMCTLPVRAP--ASGGVSSPLVRAP : : . :: . : :.. :: . :: : .::: : ::.: ..:: . NP_060 STGHTTPLPVTDASSVSTGHATSLPVTDASSVFTGHATSLPVTIPSSASSGHTTPLPVTD 2800 2810 2820 2830 2840 2850 910 920 930 940 950 pF1KSD ASGT-----MSTPLRRPSACETV-STELMRASAS----GHMSTAQTTAM--VSGGMSKPL ::.. : :. :. : .: : ..:: :: . :.. :: : . :: NP_060 ASSVSTGHATSLPVTDASSVSTGHATPLPVTDASSVSTGHATPLPLTSLSSVSTGDTTPL 2860 2870 2880 2890 2900 2910 960 970 980 990 1000 pF1KSD ----MRAPASG-TMPMPL--MSAMASGEMS-MPLMET--MASGATSTLQTSVANSRS--- . ..: . :.:. .:....:. . .:. .: ..: ...: .. ..: : NP_060 PVTDTSSASTGQATPLPVTSLSSVSTGDTTPLPVTDTSSASTGHATSLPVTDTSSASTGH 2920 2930 2940 2950 2960 2970 1010 1020 1030 1040 1050 pF1KSD ---MSLSQTTYTVSGRMATAPIR--ASASGARSTSFM---RASVSGSMPMPLPRATASGC . ..:. . .:. . :. .::: ...::. .:.: . :: .. :. NP_060 ATPLPDTDTSSASTGHATLLPVTDTSSASIGHATSLPVTDTSSISTGHATPLHVTSPSSA 2980 2990 3000 3010 3020 3030 1060 1070 1080 1090 1100 1110 pF1KSD GMGMSMPQMTATDSRGMSTPLMRASGPGTMSTPQTAFGVMSTPEIKATDSGEASTSHINI . : . : . .::. . :: ..: ...:..: .:: . .::.. :::.: . NP_060 STGHATP-LPVTDTSSASTG---HANPLHVTSPSSASTGHATP-LPVTDTSSASTGHATP 3040 3050 3060 3070 3080 1120 1130 1140 1150 1160 1170 pF1KSD TASGSKPTSHMTATTPETAKPPPKEVPSFGMLTPALCYLLEEQEAARGSCSVEEEMEIDE : . ::: . : . : : :: NP_060 LPVTSLSSVSTGDTTPLPVTSPSSA--STGHTTPLPVTDTSSASTGQATALPVTSTSSAS 3090 3100 3110 3120 3130 3140 1180 1190 1200 1210 1220 1230 pF1KSD EKQMKGFLDDSERMAFLVSLHLGAAERWFILQMEVGEPLSHENKSFLRRSQGIYDSLSEI NP_060 TGDTTPLPVTDTSSASTGQATPLPVTSLSSVSTGDTTPLPVTSPSSASTGHATPLLVTDA 3150 3160 3170 3180 3190 3200 >-- initn: 221 init1: 58 opt: 415 Z-score: 208.0 bits: 52.9 E(85289): 7.6e-05 Smith-Waterman score: 611; 25.1% identity (53.5% similar) in 1173 aa overlap (48-1124:3137-4223) 20 30 40 50 60 70 pF1KSD NVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGGTSTQLMTSPVFDTMSA- ::..:::... : : : : :: :: :: NP_060 VTSPSSASTGHTTPLPVTDTSSASTGQATALPVTSTSSASTGDT-TPL---PVTDTSSAS 3110 3120 3130 3140 3150 3160 80 90 100 110 120 pF1KSD -----PL----MGVPNSGALSP-PLM-PASDS-GALSPLLMPASDS---GALSPLLMPAL :: .. ..: .: :. :.: : : .:::. ..: : .:: . .: NP_060 TGQATPLPVTSLSSVSTGDTTPLPVTSPSSASTGHATPLLVTDASSASTGQATPLPVTSL 3170 3180 3190 3200 3210 3220 130 140 150 160 170 pF1KSD DS---GTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSG-VV .: : .:: :: .. . ..: : ::. . :.. . . .: .. NP_060 SSVSTGDTTPLPVTSPSSASTGHATSLPVTDTSSAS---TGDTTSLPVTDTSSAYTGDTT 3230 3240 3250 3260 3270 180 190 200 210 220 pF1KSD CTPIMSTSSSEAM-STPLMLAPDS----GELSPILMQDMNP---GVMSTQPVPAPSSEAM :. .:::: . .:::... : :. .:.:. : . : . : .::: . NP_060 SLPVTDTSSSSTGDTTPLLVTETSSVSTGHATPLLVTDASSASTGHATPLHVTSPSSAST 3280 3290 3300 3310 3320 3330 230 240 250 260 270 280 pF1KSD ---SPLQITDEDTEAMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQP- .:. .: :: ..: : : .:: : :. . .:....: ..: : NP_060 GDTTPVPVT--DTSSVSTGHATPLPVTGLSS--ASTGDTTRLPVTDISSASTGQATPLPV 3340 3350 3360 3370 3380 3390 290 300 310 320 330 pF1KSD --TSTQNSGG-IPTPLMS--DLDSGIMSSLLMSSPGS----EVMSTPLLSVPDAGEMSTL ::. ..: .: :. : . ..: . : ..: .: .. .:. :. .:. : NP_060 TNTSSVSTGDTMPLPVTSPSSASTGHATPLPVTSTSSASTGHATPVPVTSTSSASTGHTT 3400 3410 3420 3430 3440 3450 340 350 360 370 380 390 pF1KSD PKPAPDAEAMSPALMTALP----SGVMPTQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRA : :. :. . : . : :: :.. .: : . : :... :. . : . : NP_060 PLPVTDTSSASTGDTTPLPVTSPSSASTGHTTPLH---VTIPSSASTGDTSTL--PVTGA 3460 3470 3480 3490 3500 3510 400 410 420 430 440 pF1KSD TASGVMSAPPVRALDSGAMST----PL----MGAPASGNMSTLQKTVPASGAMTTSLMTV ..... : :. . :....:: :: ... ..:. . : : ::.: : . . NP_060 SSASTGHATPLPVTDTSSVSTGHATPLPVTSLSSVSTGDTTPLPVT-DASSASTGQATPL 3520 3530 3540 3550 3560 450 460 470 480 490 500 pF1KSD PSSGVMSTEQMSATASRVMSAQLTMAKTSGAMP-TGSMKAVAKQYKRATASGKMSTPLRR : ... :. ..: : .:. . . . .: : . .: . . : .. :. NP_060 PVTSLSSVSTGDTTPLLVTDASSVSTGHATPLPVTDTSSASTGDTTRLPVTDTSSA---- 3570 3580 3590 3600 3610 3620 510 520 530 540 550 560 pF1KSD APTSGAMSTQPVTATASETM--SMPQLTVPASGSMSMLQMRAPVSEAMSMPQMRTMASGL ..: . :::. .: . . : :.. ::. . ::... : : . NP_060 --STGQATPLPVTSLSSVSTGDTTPLLVTDASSVSTGHATPLPVTDTSSASTGDTTRLPV 3630 3640 3650 3660 3670 3680 570 580 590 600 610 620 pF1KSD TSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGVMSCPQMRSLASGALSKPLMTP :.... .. . . . . ....:: :. : . .:.: .: .. : ...: . NP_060 TDTSSASTGQATPLPVTIPSSSSSGHTTPLPVTSTSS--VSTGHVTPLH---VTSPSSAS 3690 3700 3710 3720 3730 630 640 650 660 670 pF1KSD KASGTMFTEKMTTTASEAMPT-LLMRD--TVSGALSMP-QMTD--TASGGLSASL-MRDT . : . :..:: . : ::. : .:: . . : .:: .:: : .. : . :: NP_060 TGHVTPLPVTSTSSASTGHATPLLVTDASSVSTGHATPLPVTDASSASTGDTTPLPVTDT 3740 3750 3760 3770 3780 3790 680 690 700 710 720 pF1KSD ASGAMSTSQMT-------ATVSGGMSMPL----MRAQDPG---VMPASLMRAKVSGKMLS .:. ::.: : ..:: : . :: . . : .:... . .: . NP_060 SSA--STGQATPLPVTSLSSVSTGDTTPLPVTDASSASTGHATPLPVTIPSSVSTGDTMP 3800 3810 3820 3830 3840 3850 730 740 750 760 770 pF1KSD QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSET-MSTPLMRTSDPGE :... :.. : . . . :.. : :.:. :.. . .. : .::: :. NP_060 LPVTS--PSSASTGHATPLPVTGLSSAS-TGDTTPLPVTDTSSASTRHATPLPVTDT--- 3860 3870 3880 3890 3900 3910 780 790 800 810 820 830 pF1KSD RPSLLTRASSSGEMSLPLMR-APASGEIATPLRSPAYGAMSAPQMTATASGMMSSMP--Q . ::.. ::. . :: :::: :. .. :: ..: . .: . NP_060 -----SSASTDDTTRLPVTDVSSASTGHATPL--PVTSTSSA------STGDTTPLPVTD 3920 3930 3940 3950 840 850 860 870 880 890 pF1KSD VKAPISG-AMSMPLT-RSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPAS ... .: : :.:.: ::.:: : . :: : ::.::.. ..: ::: . .: NP_060 TSSVSTGHATSLPVTSRSSASTGHATPL---P---VTDTSSV---STGHATPLPVTSTSS 3960 3970 3980 3990 4000 900 910 920 930 940 pF1KSD --GGVSSPL-VRAPASGTMS----TPLRRPSACETVSTELMRASASGHMSTAQTTAM-VS : ..:: : .:.:.. . .:. :. : .: . .. .. .::...: . :. NP_060 VSTGHATPLPVTSPSSASTGHATPVPVTSTSSASTGDTTPLPVTNASSLSTGHATPLHVT 4010 4020 4030 4040 4050 4060 950 960 970 980 990 1000 pF1KSD GGMSKPLMRAPASGTMPMPLMSAMASGEMS-MPLMETMASGATSTLQTSVANSRSMSLSQ . : :. .: :.:. :. ..:. . .:: :: ..:.... . ... NP_060 SPSSAS--RGDTS-TLPVTDASSASTGHATPLPL--------TSLSSVSTGDTTPLPVTD 4070 4080 4090 4100 4110 1010 1020 1030 1040 1050 1060 pF1KSD TTYTVSGRMATAPIRASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATD :. . .:. . :. ::. .:.. . :.:. .... : :.: :.. NP_060 TSSASTGQATPLPV---------TSLSSVSTGDTTPLPVTIPSSASSGHTTSLPVTDASS 4120 4130 4140 4150 4160 1070 1080 1090 1100 1110 1120 pF1KSD -SRGMSTPLMRASGPGTMSTPQTAFGVMSTPEIKATDSGEASTSH---INITASGSKPTS : : .::: : : :: ... : .: . .::.. :::.: . .: ..: :. NP_060 VSTGHGTPL-----PVT-STSSASTG--DTTPLPVTDTSSASTGHATPLPVTDTSSASTG 4170 4180 4190 4200 4210 4220 1130 1140 1150 1160 1170 1180 pF1KSD HMTATTPETAKPPPKEVPSFGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLD : : NP_060 HATPLPVTSLSSVSTGHATPLAVSSATSASTVSSDSPLKMETPGMTTPSLKTDGGRRTAT 4230 4240 4250 4260 4270 4280 >>XP_011514552 (OMIM: 158371) PREDICTED: mucin-3A isofor (3076 aa) initn: 76 init1: 76 opt: 369 Z-score: 189.8 bits: 48.7 E(85289): 0.00078 Smith-Waterman score: 492; 21.4% identity (53.4% similar) in 1089 aa overlap (127-1145:16-1056) 100 110 120 130 140 150 pF1KSD SGALSPLLMPASDSGALSPLLMPALDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLM :: . . . : ... .: . ::.: XP_011 MQLLGLLGLLWMLKASPWATGTLSTATSISQVPFPRAEAASAVLS 10 20 30 40 160 170 180 190 200 pF1KSD VAPDSAEIS--PLAMP---APSSGVVCTPIMSTSSSEA---MSTPLMLAPDSGELSPILM .: : ... ::..: .:. : . :. ..: .: :. .: :.. : XP_011 NSPHSRDLAGWPLGVPQLASPAPGHRENAPMTLTTSPHDTLISETLLNSPVSSNTSTTPT 50 60 70 80 90 100 210 220 230 240 250 260 pF1KSD QDMNPGVMSTQP---VPAPSSEAMSPLQITDEDTEAMSKVLMT---ALASGEISSLLMSG . . : .: : : . ..: . : .. .. : . : :..:. :. . . XP_011 SKFAFKVETTPPTVLVYSATTECVYPTSFIITISHPTSICVTTTQVAFTSSYTSTPVTQK 110 120 130 140 150 160 270 280 290 300 310 320 pF1KSD TDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMSDLDSGIMSS--LLMSSPGSEVM . . :. :... .: :: . .: ... . ::... :.. .. . .. .: . XP_011 PVTTVTSTYSMTTTEKG-TSAMTSSPSTTTARETPIVTVTPSSVSATDTTFHTTISSTTR 170 180 190 200 210 220 330 340 350 360 370 pF1KSD STPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALP--SGVMPTQTMPAPGSGAMSPWSTQ .: .: .: . : .:.: ... :. .. : :.. :.:. . . : .: .:. XP_011 TTERTPLP-TGSIHTTTSPTPVFTTLKTAVTSTSPITSSITSTNTVTSMTTTASQPTATN 230 240 250 260 270 280 380 390 400 410 420 430 pF1KSD NVDSE---MMSNPPVRAT---ASGVMSAPPVRALDSGAMSTPLMGAPASGNMSTLQKTVP ...: ..:. :: .: .::. .. :. .: . .: ..:.: . : . : XP_011 TLSSPTRTILSSTPVLSTETITSGITNTTPLSTLVTTLPTTISRSTPTSETTYTTSPTST 290 300 310 320 330 340 440 450 460 470 480 pF1KSD ASGAMTTSLMTVPSSGVMSTE-QMSATASRVMSAQLT------MAKTSGAMPTGSMKAVA .. . : ... .:..::: .. :.: . ... . .. :. . . : . . XP_011 VTDSTTKIAYSTSMTGTLSTETSLPPTSSSLPTTETATTPMTNLVTTTTEISSHSTPSFS 350 360 370 380 390 400 490 500 510 520 530 pF1KSD KQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPAS------GSMSML .. .:.: . .. ::::.: :. . . .: . ..: .:.:.. :: ..: XP_011 SSTIYSTVSTSTTAISSLPPTSGTMVTSTTMTPSSLSTDIP-FTTPTTITHHSVGSTGFL 410 420 430 440 450 460 540 550 560 570 580 pF1KSD QMRAPVSEAMSMPQMRTMASGL---------TSAAQMKAMTSGAMST--PLMTAQTSGST . .. .... . .:.... : .... .:::.. . : ... : : XP_011 TTATDLTSTFTVSSSSAMSTSVIPSSPSIQNTETSSLVSMTSATTPNVRPTFVSTLSTPT 470 480 490 500 510 520 590 600 610 620 630 640 pF1KSD STLLMRDTASGVMSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDT :.:: :. .: . : :. . .. . .: :: . . ::. : :: : XP_011 SSLLTTFPATYSFSSSMSASSAGTTHTESISSPPASTSTL---HTTAESTLAPTTTTSFT 530 540 550 560 570 650 660 670 680 690 700 pF1KSD VSGALSMPQMTDTASGGLSASLMRDTASGAMSTSQM------TATVSGGMSMPLMRAQDP .: .. :. : ...: .... .::. .:. : ... .:. : . .. XP_011 TSTTMEPPSTTAATTGTGQTTFTSSTATFPETTTPTPTTDMSTESLTTAMTSPPITSSVT 580 590 600 610 620 630 710 720 730 740 750 pF1KSD GVMPASLMRAKVSGKMLSQPMSTQDPGGMSMSPMKS---MTAGGMQMNSPTSDVMSTPTV .. .. : . .: .. ... .: .:. : .:.: .. :. : . :: XP_011 STNTVTSMTTTTSPPTTTNSFTSLTSMPLSSTPVPSTEVVTSGTINTIPPSILVTTLPTP 640 650 660 670 680 690 760 770 780 790 800 810 pF1KSD RAWTSETMSTPLMRTSDPGERPSLLTRASSSGEMSLPL-MRAPASGEIATPLRSPAYGAM : .: : : . .: : :. ..:. :.. : : .: . : :: . XP_011 NA-SSMTTSETTYPNSPTG--PG----TNSTTEITYPTTMTETSSTATSLPPTSPLVS-- 700 710 720 730 740 750 820 830 840 850 860 870 pF1KSD SAPQMTATASGMMSSMPQVKAPISGAMSMPLTRSTASGGMSMPLMRAPDS---RVTSTSQ .: . ....... .. . . ... . :::: .. . .: . :::::. XP_011 TAKTAKTPTTNLVTTTTKTTSHSTTSFTSSTVYSTAST-YTTAITSVPTTLGTMVTSTSM 760 770 780 790 800 880 890 900 910 920 930 pF1KSD MMPTAS-GDMCTLPVR-APASGGVSS--PLVRAPAS-GTMSTPLRRPSACETVSTELMRA . :.: : . :. .:.: :.:. :.. .: :.:. ::.. : .. . XP_011 ISSTVSTGIPTSQPTTITPSSVGISGSLPMMTDLTSVYTVSNMSARPTTVIPSSPTVQNT 810 820 830 840 850 860 940 950 960 970 980 pF1KSD SASGHMSTAQTTAMV-SGGMSKPLMRAPASGTMPMPLMSAMASGEMSMPLMETMASGATS : .:...:.: . ::: : . ..: : : ..: :. . .:. .... XP_011 EIS--ISVSMTSATTPSGG---PTF----TSTENTPTRSLLTSFPMTHSFSSSMSESSAG 870 880 890 900 910 920 990 1000 1010 1020 1030 1040 pF1KSD TLQT-SVANSRSMSLSQTTYTVSGRMATAPIRASASGARSTSFMRASVSGSMPMPLPRAT : .: :... :. :: :. . ..: : . .::: ....: : : .: XP_011 TTHTESISSPRG-----TTSTLHTTVESTP-----SPTTTTSF----TTSTMMEP-PSST 930 940 950 960 1050 1060 1070 1080 1090 1100 pF1KSD ASGCGMGMS-MPQMTATDSRGMSTPLMRASGPGT-MSTPQTAFGVMSTPEIKATDSGEAS .: : :.. .:. ::: : . : : .:: . . .. : : .... . . XP_011 VSTTGRGQTTFPSSTAT------FPETTTLTPTTDISTVSLTTAMTSPPPVSSSITPTNT 970 980 990 1000 1010 1110 1120 1130 1140 1150 1160 pF1KSD TSHINITASGSKPTSHMTATTPETAKPPPKEVPSFGMLTPALCYLLEEQEAARGSCSVEE . . :. :. .. : . : ::: :.: XP_011 MTSMRTTTYWPTATNTLSPLTSSILSSTP--VPSTEMITSHTTNTTPLSTLVTTLLTTIT 1020 1030 1040 1050 1060 1070 1170 1180 1190 1200 1210 1220 pF1KSD EMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERWFILQMEVGEPLSHENKSFLRRSQGIY XP_011 RSTPTSETTYPTSPTSIVSDSTTEITYSTSITGTLSTATTLPPTSSSLPTTETATMTPTT 1080 1090 1100 1110 1120 1130 >-- initn: 145 init1: 60 opt: 381 Z-score: 195.4 bits: 49.8 E(85289): 0.00038 Smith-Waterman score: 556; 22.2% identity (53.0% similar) in 1124 aa overlap (52-1141:1082-2128) 30 40 50 60 70 80 pF1KSD QNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGGTSTQLMTSPVFDTMSAPLMGV .. .. : . .. . : . :.:. . :. XP_011 TEMITSHTTNTTPLSTLVTTLLTTITRSTPTSETTYPTSPTSIVSDSTTEITYSTSITGT 1060 1070 1080 1090 1100 1110 90 100 110 120 130 pF1KSD PNSGALSPPL---MPASDSGALSPLLMPASDSGALSPLLMPALDSGTLSPLLSTSEYGVM .... :: .:........: . . . : :.. :.:. .::: .. XP_011 LSTATTLPPTSSSLPTTETATMTPTTTLITTTPNTTSLSTPSFTSSTIYSTVSTSTTAIS 1120 1130 1140 1150 1160 1170 140 150 160 170 180 pF1KSD SPGMMTIPDFGTMSATLMVAP-----DSAEISPLAMPAPSSG-----VVCTPIMST---S : . : ::: .. ..: :. .: .. :: : .. : . :: : XP_011 SAS----PTSGTMVTSTTMTPSSLSTDTPSTTPTTITYPSVGSTGFLTTATDLTSTFTVS 1180 1190 1200 1210 1220 190 200 210 220 230 240 pF1KSD SSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTEAMSKV :: :::: .. :.: : ... . ...: . .:: . : ::. :. :.. XP_011 SSSAMSTSVI--PSS----PSIQNTETSSLVSMTSATTPS---LRPT-ITSTDSTLTSSL 1230 1240 1250 1260 1270 250 260 270 280 290 300 pF1KSD LMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMSDLDSG : : .. .:: . ... . . . : : :: .: .: .:. :: : : XP_011 LTTFPSTYSFSSSMSASSAGTTHTETISSLPASTNT---IHTTAESALAPTTTTSFTTSP 1280 1290 1300 1310 1320 1330 310 320 330 340 350 pF1KSD IMS--SLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPD--AEAMSPALMTALP--SGVM : : ... :. . : :. : .:: :. : .:... :. .. : :.. XP_011 TMEPPSTTVATTGTGQTTFPS-STATFLETTTLT-PTTDFSTESLTTAMTSTPPITSSIT 1340 1350 1360 1370 1380 1390 360 370 380 390 400 410 pF1KSD PTQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAP ::.:: . . . : : .. .: :. .:...:. :: . . . : : XP_011 PTDTMTSMRT--TTSWPTA---TNTLS--PL---TSSILSSTPVPSTEV-TTSHTTNTNP 1400 1410 1420 1430 1440 420 430 440 450 460 470 pF1KSD ASGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTG .: ..:: :. : :: . ::: . .. . .. . . : . ... ::. XP_011 VSTLVTTLPITITRS--TLTSETAYPSSPTSTVTESTTEITYPTTMTETSSTATSLPPTS 1450 1460 1470 1480 1490 480 490 500 510 520 530 pF1KSD SMKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPAS-GSMSM :. ..:. : :.. .: . .. ..... . .::: : . .::.. :.: XP_011 SLVSTAETAKTPTTNLVTTTTKTTSHSTTSFTSSTIYSTAS-TPTTAITSVPTTLGTMVT 1500 1510 1520 1530 1540 1550 540 550 560 570 580 590 pF1KSD LQMRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGST-STLLMRDTA : . . ..: .: :. . .. ::.. :.:: :: : :.. : : XP_011 STSMIPSTVSTGIP-----TSQPTTITPSSVGISGSL--PMMTDLTSVYTVSSMSARPT- 1560 1570 1580 1590 1600 1610 600 610 620 630 640 650 pF1KSD SGVMSCPQMRSLASGALSKPL-MTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMP : . : : ... .. . . . : ..: :: .: . . .. . . :...: XP_011 SVIPSSPTVQNTETSIFVSMMSATTPSGGPTFTSTENTPTRSLLTSFPVTHSFSSSMSAS 1620 1630 1640 1650 1660 1670 660 670 680 690 700 710 pF1KSD QMTDTASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSG .. : . ..:. .: .:.. : . . ::. . .. :.: . . .: XP_011 SVGTTHTQSISSP--PAITSTLHTTAESTPSPTTTMSFTTFTKMET---PSSTVATTGTG 1680 1690 1700 1710 1720 720 730 740 750 760 770 pF1KSD KMLSQPMSTQDPGGMSMSPMKSMTAGGMQM---NSP--TSDVMSTPTVRAWTSETMSTPL . .. .: ...: .....:... ..: ::.. :: :: :: : .::: XP_011 QTTFTSSTATSPKTTTLTPTSDISTGSFKTAVSSTPPITSSITSTYTV---TSMTTTTPL 1730 1740 1750 1760 1770 1780 780 790 800 810 820 830 pF1KSD MRTSDPGERPSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMM :. . ::. . .::: .: .: .:: : : ..: . ..: .. XP_011 GPTAT-NTLPSFTSSVSSS--TPVPSTEAITSGTTNTTPLSTLVTTFSNSDTSSTPTSE- 1790 1800 1810 1820 1830 840 850 860 870 880 890 pF1KSD SSMPQVKAPISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRA ...: . ...:.. ::.: : .:. : : ::: . ::.:. . :. . . XP_011 TTYP---TSLTSALTDSTTRTTYSTNMTGTL-----STVTS---LRPTSSSLLTTVTATV 1840 1850 1860 1870 1880 900 910 920 930 940 pF1KSD PASGGVSSPL-VRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGM- :... :.. . . .. .... . .. :: : : ..: . :..::.. . .. XP_011 PTTNLVTTTTKITSHSTPSFTSSI---ATTETPSHSTPRFTSS--IRTTETTSYSTPSFT 1890 1900 1910 1920 1930 1940 950 960 970 980 990 1000 pF1KSD SKPLMRAPASGTMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYT :. . .: . : ...... : ...:. :.: :: .: :. : : XP_011 SSNTITETTSHSTP-SYITSITTTETPSSSTPSFSSSITTTETTS--HSTPGFTSSITTT 1950 1960 1970 1980 1990 1010 1020 1030 1040 1050 1060 pF1KSD VSGRMATAPIRASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGM . .: . .: . ...:: : ..:. . .. . .. .:.: . . XP_011 ETTSHSTPSFTSSITTTETTSHDTPSFTSSITTSETPSHSTPSSTSL----ITTTKTTSH 2000 2010 2020 2030 2040 2050 1070 1080 1090 1100 1110 1120 pF1KSD STPLMRASGPGTMSTPQTAFGVMSTPEIKATDSGEAS--TSHINITASGSKPTSHMTATT ::: . .: : .: ..: . :. : : .. :: :. : ..:. :. .:.. XP_011 STPSFTSSITTTETTSHSAHSFTSSITTTETTSHNTRSFTSSITTTETNSHSTTSFTSSI 2060 2070 2080 2090 2100 2110 1130 1140 1150 1160 1170 1180 pF1KSD PETAKPPPKEVPSFGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMA :.. . .::: XP_011 T-TTETTSHSTPSFSSSITTTETPLHSTPGLTSWVTTTKTTSHITPGLTSSITTTETTSH 2120 2130 2140 2150 2160 2170 >>XP_016867720 (OMIM: 158371) PREDICTED: mucin-3A isofor (3143 aa) initn: 76 init1: 76 opt: 369 Z-score: 189.7 bits: 48.7 E(85289): 0.0008 Smith-Waterman score: 492; 21.4% identity (53.4% similar) in 1089 aa overlap (127-1145:16-1056) 100 110 120 130 140 150 pF1KSD SGALSPLLMPASDSGALSPLLMPALDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLM :: . . . : ... .: . ::.: XP_016 MQLLGLLGLLWMLKASPWATGTLSTATSISQVPFPRAEAASAVLS 10 20 30 40 160 170 180 190 200 pF1KSD VAPDSAEIS--PLAMP---APSSGVVCTPIMSTSSSEA---MSTPLMLAPDSGELSPILM .: : ... ::..: .:. : . :. ..: .: :. .: :.. : XP_016 NSPHSRDLAGWPLGVPQLASPAPGHRENAPMTLTTSPHDTLISETLLNSPVSSNTSTTPT 50 60 70 80 90 100 210 220 230 240 250 260 pF1KSD QDMNPGVMSTQP---VPAPSSEAMSPLQITDEDTEAMSKVLMT---ALASGEISSLLMSG . . : .: : : . ..: . : .. .. : . : :..:. :. . . XP_016 SKFAFKVETTPPTVLVYSATTECVYPTSFIITISHPTSICVTTTQVAFTSSYTSTPVTQK 110 120 130 140 150 160 270 280 290 300 310 320 pF1KSD TDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMSDLDSGIMSS--LLMSSPGSEVM . . :. :... .: :: . .: ... . ::... :.. .. . .. .: . XP_016 PVTTVTSTYSMTTTEKG-TSAMTSSPSTTTARETPIVTVTPSSVSATDTTFHTTISSTTR 170 180 190 200 210 220 330 340 350 360 370 pF1KSD STPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALP--SGVMPTQTMPAPGSGAMSPWSTQ .: .: .: . : .:.: ... :. .. : :.. :.:. . . : .: .:. XP_016 TTERTPLP-TGSIHTTTSPTPVFTTLKTAVTSTSPITSSITSTNTVTSMTTTASQPTATN 230 240 250 260 270 280 380 390 400 410 420 430 pF1KSD NVDSE---MMSNPPVRAT---ASGVMSAPPVRALDSGAMSTPLMGAPASGNMSTLQKTVP ...: ..:. :: .: .::. .. :. .: . .: ..:.: . : . : XP_016 TLSSPTRTILSSTPVLSTETITSGITNTTPLSTLVTTLPTTISRSTPTSETTYTTSPTST 290 300 310 320 330 340 440 450 460 470 480 pF1KSD ASGAMTTSLMTVPSSGVMSTE-QMSATASRVMSAQLT------MAKTSGAMPTGSMKAVA .. . : ... .:..::: .. :.: . ... . .. :. . . : . . XP_016 VTDSTTKIAYSTSMTGTLSTETSLPPTSSSLPTTETATTPMTNLVTTTTEISSHSTPSFS 350 360 370 380 390 400 490 500 510 520 530 pF1KSD KQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPAS------GSMSML .. .:.: . .. ::::.: :. . . .: . ..: .:.:.. :: ..: XP_016 SSTIYSTVSTSTTAISSLPPTSGTMVTSTTMTPSSLSTDIP-FTTPTTITHHSVGSTGFL 410 420 430 440 450 460 540 550 560 570 580 pF1KSD QMRAPVSEAMSMPQMRTMASGL---------TSAAQMKAMTSGAMST--PLMTAQTSGST . .. .... . .:.... : .... .:::.. . : ... : : XP_016 TTATDLTSTFTVSSSSAMSTSVIPSSPSIQNTETSSLVSMTSATTPNVRPTFVSTLSTPT 470 480 490 500 510 520 590 600 610 620 630 640 pF1KSD STLLMRDTASGVMSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDT :.:: :. .: . : :. . .. . .: :: . . ::. : :: : XP_016 SSLLTTFPATYSFSSSMSASSAGTTHTESISSPPASTSTL---HTTAESTLAPTTTTSFT 530 540 550 560 570 650 660 670 680 690 700 pF1KSD VSGALSMPQMTDTASGGLSASLMRDTASGAMSTSQM------TATVSGGMSMPLMRAQDP .: .. :. : ...: .... .::. .:. : ... .:. : . .. XP_016 TSTTMEPPSTTAATTGTGQTTFTSSTATFPETTTPTPTTDMSTESLTTAMTSPPITSSVT 580 590 600 610 620 630 710 720 730 740 750 pF1KSD GVMPASLMRAKVSGKMLSQPMSTQDPGGMSMSPMKS---MTAGGMQMNSPTSDVMSTPTV .. .. : . .: .. ... .: .:. : .:.: .. :. : . :: XP_016 STNTVTSMTTTTSPPTTTNSFTSLTSMPLSSTPVPSTEVVTSGTINTIPPSILVTTLPTP 640 650 660 670 680 690 760 770 780 790 800 810 pF1KSD RAWTSETMSTPLMRTSDPGERPSLLTRASSSGEMSLPL-MRAPASGEIATPLRSPAYGAM : .: : : . .: : :. ..:. :.. : : .: . : :: . XP_016 NA-SSMTTSETTYPNSPTG--PG----TNSTTEITYPTTMTETSSTATSLPPTSPLVS-- 700 710 720 730 740 750 820 830 840 850 860 870 pF1KSD SAPQMTATASGMMSSMPQVKAPISGAMSMPLTRSTASGGMSMPLMRAPDS---RVTSTSQ .: . ....... .. . . ... . :::: .. . .: . :::::. XP_016 TAKTAKTPTTNLVTTTTKTTSHSTTSFTSSTVYSTAST-YTTAITSVPTTLGTMVTSTSM 760 770 780 790 800 880 890 900 910 920 930 pF1KSD MMPTAS-GDMCTLPVR-APASGGVSS--PLVRAPAS-GTMSTPLRRPSACETVSTELMRA . :.: : . :. .:.: :.:. :.. .: :.:. ::.. : .. . XP_016 ISSTVSTGIPTSQPTTITPSSVGISGSLPMMTDLTSVYTVSNMSARPTTVIPSSPTVQNT 810 820 830 840 850 860 940 950 960 970 980 pF1KSD SASGHMSTAQTTAMV-SGGMSKPLMRAPASGTMPMPLMSAMASGEMSMPLMETMASGATS : .:...:.: . ::: : . ..: : : ..: :. . .:. .... XP_016 EIS--ISVSMTSATTPSGG---PTF----TSTENTPTRSLLTSFPMTHSFSSSMSESSAG 870 880 890 900 910 920 990 1000 1010 1020 1030 1040 pF1KSD TLQT-SVANSRSMSLSQTTYTVSGRMATAPIRASASGARSTSFMRASVSGSMPMPLPRAT : .: :... :. :: :. . ..: : . .::: ....: : : .: XP_016 TTHTESISSPRG-----TTSTLHTTVESTP-----SPTTTTSF----TTSTMMEP-PSST 930 940 950 960 1050 1060 1070 1080 1090 1100 pF1KSD ASGCGMGMS-MPQMTATDSRGMSTPLMRASGPGT-MSTPQTAFGVMSTPEIKATDSGEAS .: : :.. .:. ::: : . : : .:: . . .. : : .... . . XP_016 VSTTGRGQTTFPSSTAT------FPETTTLTPTTDISTVSLTTAMTSPPPVSSSITPTNT 970 980 990 1000 1010 1110 1120 1130 1140 1150 1160 pF1KSD TSHINITASGSKPTSHMTATTPETAKPPPKEVPSFGMLTPALCYLLEEQEAARGSCSVEE . . :. :. .. : . : ::: :.: XP_016 MTSMRTTTYWPTATNTLSPLTSSILSSTP--VPSTEMITSHTTNTTPLSTLVTTLLTTIT 1020 1030 1040 1050 1060 1070 1170 1180 1190 1200 1210 1220 pF1KSD EMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERWFILQMEVGEPLSHENKSFLRRSQGIY XP_016 RSTPTSETTYPTSPTSIVSDSTTEITYSTSITGTLSTATTLPPTSSSLPTTETATMTPTT 1080 1090 1100 1110 1120 1130 >-- initn: 145 init1: 60 opt: 381 Z-score: 195.3 bits: 49.8 E(85289): 0.00039 Smith-Waterman score: 559; 22.6% identity (52.2% similar) in 1127 aa overlap (52-1141:1082-2127) 30 40 50 60 70 80 pF1KSD QNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGGTSTQLMTSPVFDTMSAPLMGV .. .. : . .. . : . :.:. . :. XP_016 TEMITSHTTNTTPLSTLVTTLLTTITRSTPTSETTYPTSPTSIVSDSTTEITYSTSITGT 1060 1070 1080 1090 1100 1110 90 100 110 120 130 pF1KSD PNSGALSPPL---MPASDSGALSPLLMPASDSGALSPLLMPALDSGTLSPLLSTSEYGVM .... :: .:........: . . . : :.. :.:. .::: .. XP_016 LSTATTLPPTSSSLPTTETATMTPTTTLITTTPNTTSLSTPSFTSSTIYSTVSTSTTAIS 1120 1130 1140 1150 1160 1170 140 150 160 170 180 pF1KSD SPGMMTIPDFGTMSATLMVAP-----DSAEISPLAMPAPSSG-----VVCTPIMST---S : . : ::: .. ..: :. .: .. :: : .. : . :: : XP_016 SAS----PTSGTMVTSTTMTPSSLSTDTPSTTPTTITYPSVGSTGFLTTATDLTSTFTVS 1180 1190 1200 1210 1220 190 200 210 220 230 240 pF1KSD SSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTEAMSKV :: :::: .. :.: : ... . ...: . .:: . : ::. :. :.. XP_016 SSSAMSTSVI--PSS----PSIQNTETSSLVSMTSATTPS---LRPT-ITSTDSTLTSSL 1230 1240 1250 1260 1270 250 260 270 280 290 300 pF1KSD LMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMSDLDSG : : .. .:: . ... . . . : : :: .: .: .:. :: : : XP_016 LTTFPSTYSFSSSMSASSAGTTHTETISSLPASTNT---IHTTAESALAPTTTTSFTTSP 1280 1290 1300 1310 1320 1330 310 320 330 340 350 pF1KSD IMS--SLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPD--AEAMSPALMTALP--SGVM : : ... :. . : :. : .:: :. : .:... :. .. : :.. XP_016 TMEPPSTTVATTGTGQTTFPS-STATFLETTTLT-PTTDFSTESLTTAMTSTPPITSSIT 1340 1350 1360 1370 1380 1390 360 370 380 390 400 410 pF1KSD PTQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAP ::.:: . . . : : .. .: :. .:...:. :: . . . : : XP_016 PTDTMTSMRT--TTSWPTA---TNTLS--PL---TSSILSSTPVPSTEV-TTSHTTNTNP 1400 1410 1420 1430 1440 420 430 440 450 460 470 pF1KSD ASGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTG .: ..:: :. : :: . ::: . .. . .. . . : . ... ::. XP_016 VSTLVTTLPITITRS--TLTSETAYPSSPTSTVTESTTEITYPTTMTETSSTATSLPPTS 1450 1460 1470 1480 1490 480 490 500 510 520 530 pF1KSD SMKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPAS-GSMSM :. ..:. : :.. .: . .. ..... . .::: : . .::.. :.: XP_016 SLVSTAETAKTPTTNLVTTTTKTTSHSTTSFTSSTIYSTAS-TPTTAITSVPTTLGTMVT 1500 1510 1520 1530 1540 1550 540 550 560 570 580 590 pF1KSD LQMRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGST-STLLMRDTA : . . ..: .: :. . .. ::.. :.:: :: : :.. : : XP_016 STSMIPSTVSTGIP-----TSQPTTITPSSVGISGSL--PMMTDLTSVYTVSSMSARPT- 1560 1570 1580 1590 1600 1610 600 610 620 630 640 650 pF1KSD SGVMSCPQMRSLASGALSKPL-MTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMP : . : : ... .. . . . : ..: :: .: . . .. . . :...: XP_016 SVIPSSPTVQNTETSIFVSMMSATTPSGGPTFTSTENTPTRSLLTSFPVTHSFSSSMSAS 1620 1630 1640 1650 1660 1670 660 670 680 690 700 710 pF1KSD QMTDTASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSG .. : . ..:. .: .:.. : . . ::. . .. :.: . . .: XP_016 SVGTTHTQSISSP--PAITSTLHTTAESTPSPTTTMSFTTFTKMET---PSSTVATTGTG 1680 1690 1700 1710 1720 720 730 740 750 760 770 pF1KSD KMLSQPMSTQDPGGMSMSPMKSMTAGGMQM---NSP--TSDVMSTPTVRAWTSETMSTPL . .. .: ...: .....:... ..: ::.. :: :: :: : .::: XP_016 QTTFTSSTATSPKTTTLTPTSDISTGSFKTAVSSTPPITSSITSTYTV---TSMTTTTPL 1730 1740 1750 1760 1770 1780 780 790 800 810 820 830 pF1KSD MRTSDPGERPSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMM :. . ::. . .::: .: .: .:: : : ..: . ..: .. XP_016 GPTAT-NTLPSFTSSVSSS--TPVPSTEAITSGTTNTTPLSTLVTTFSNSDTSSTPTSE- 1790 1800 1810 1820 1830 840 850 860 870 880 890 pF1KSD SSMPQVKAPISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRA ...: . ...:.. ::.: : .:. : : ::: . ::.:. . :. . . XP_016 TTYP---TSLTSALTDSTTRTTYSTNMTGTL-----STVTS---LRPTSSSLLTTVTATV 1840 1850 1860 1870 1880 900 910 920 930 940 950 pF1KSD PASGGVSSPLVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSK :... :.. : : :: ...: . .. ..... ::. . . : XP_016 PTTNLVTTT--------TKITSHSTPSFTSSIATTETPSHSTPRFTSSITTTE-TPSHST 1890 1900 1910 1920 1930 960 970 980 990 1000 1010 pF1KSD PLMRAPASGTMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVS : : .: : . : :. :: .: : .: .:...... : : .:: XP_016 P--RFTSSITNTKTTSHSSPSFTSSITTTET-TSHNTPSLTSSITTTKTTSHSTPSYT-- 1940 1950 1960 1970 1980 1990 1020 1030 1040 1050 1060 pF1KSD GRMATAPIRASASGARSTSFMRASVSGSMPMP-LPRATASGCGMGMSMPQMTA---TDSR . :. .: : :: . .. . : : : . .. . : :..:. :.. XP_016 -SLITTTTTTSHSTPSFTSSITTTETTSHNTPSLTSSITTTETTSHSTPSFTSSITTETT 2000 2010 2020 2030 2040 2050 1070 1080 1090 1100 1110 1120 pF1KSD GMSTPLMRASGPGTMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMT--- . ::: . . : : ..... : : .:.. :: .. . . .. ::: : XP_016 SHSTPSFTSLITITEITSHSTLSY--TTSITTTETPSHSTLSFTSSITTTETTSHSTPSF 2060 2070 2080 2090 2100 2110 1130 1140 1150 1160 1170 1180 pF1KSD ATTPETAKPPPKEVPSFGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSE ... :.. : . .::: XP_016 TSSITTSEMPSHSTPSFTSSITTTENATHSTPNFTSSITTTETTSHSTPSFTSLITTTET 2120 2130 2140 2150 2160 2170 1388 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 05:48:41 2016 done: Thu Nov 3 05:48:44 2016 Total Scan time: 18.390 Total Display time: 1.090 Function used was FASTA [36.3.4 Apr, 2011]