FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1237, 1482 aa 1>>>pF1KA1237 1482 - 1482 aa - 1482 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.4636+/-0.000457; mu= -8.5756+/- 0.029 mean_var=427.6664+/-88.498, 0's: 0 Z-trim(121.4): 142 B-trim: 256 in 2/53 Lambda= 0.062019 statistics sampled from 37856 (38014) to 37856 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.723), E-opt: 0.2 (0.446), width: 16 Scan time: 16.240 The best scores are: opt bits E(85289) XP_005247723 (OMIM: 614182) PREDICTED: protein HEG (1481) 9583 873.1 0 NP_065784 (OMIM: 614182) protein HEG homolog 1 pre (1381) 5587 515.6 1.1e-144 NP_001291288 (OMIM: 158373) mucin-5AC precursor [H (5654) 459 57.2 4.3e-06 NP_001035194 (OMIM: 608424) mucin-17 precursor [Ho (4493) 441 55.5 1.1e-05 NP_002448 (OMIM: 158370) mucin-2 precursor [Homo s (5289) 386 50.6 0.00038 NP_001309397 (OMIM: 158372) mucin-4 isoform f prec (7418) 388 50.9 0.00044 XP_011514552 (OMIM: 158371) PREDICTED: mucin-3A is (3076) 372 49.2 0.0006 XP_016867720 (OMIM: 158371) PREDICTED: mucin-3A is (3143) 372 49.2 0.00061 XP_011514551 (OMIM: 158371) PREDICTED: mucin-3A is (3245) 372 49.2 0.00062 XP_006720482 (OMIM: 155760,165800,608361,612813) P (2568) 369 48.9 0.00062 XP_011514549 (OMIM: 158371) PREDICTED: mucin-3A is (3296) 372 49.2 0.00063 XP_011514548 (OMIM: 158371) PREDICTED: mucin-3A is (3313) 372 49.2 0.00063 NP_005951 (OMIM: 158371) mucin-3A precursor [Homo (3323) 372 49.2 0.00063 NP_001186930 (OMIM: 102500,600275,610205) neurogen (1235) 327 44.9 0.0048 NP_001157570 (OMIM: 118661,143200) versican core p (1642) 323 44.6 0.0077 XP_005270958 (OMIM: 102500,600275,610205) PREDICTE (2432) 327 45.1 0.0081 XP_016856862 (OMIM: 102500,600275,610205) PREDICTE (2432) 327 45.1 0.0081 XP_011539822 (OMIM: 102500,600275,610205) PREDICTE (2432) 327 45.1 0.0081 XP_016856861 (OMIM: 102500,600275,610205) PREDICTE (2455) 327 45.1 0.0082 XP_011539821 (OMIM: 102500,600275,610205) PREDICTE (2467) 327 45.1 0.0082 NP_077719 (OMIM: 102500,600275,610205) neurogenic (2471) 327 45.1 0.0082 >>XP_005247723 (OMIM: 614182) PREDICTED: protein HEG hom (1481 aa) initn: 9490 init1: 9490 opt: 9583 Z-score: 4650.4 bits: 873.1 E(85289): 0 Smith-Waterman score: 9583; 99.9% identity (99.9% similar) in 1482 aa overlap (1-1482:1-1481) 10 20 30 40 50 60 pF1KA1 MASPRASRWPPPLLLLLLPLLLLMPPAAPGTRDPPPSPARRALSLAPLAGAGLELQLERR ::::::::::::::::::::::: :::::::::::::::::::::::::::::::::::: XP_005 MASPRASRWPPPLLLLLLPLLLL-PPAAPGTRDPPPSPARRALSLAPLAGAGLELQLERR 10 20 30 40 50 70 80 90 100 110 120 pF1KA1 PEREPPPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRAPRGGSADAAWKHWPESNTEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 PEREPPPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRAPRGGSADAAWKHWPESNTEA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KA1 HVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENLTLLAETADARGRSGSSSRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 HVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENLTLLAETADARGRSGSSSRT 120 130 140 150 160 170 190 200 210 220 230 240 pF1KA1 NFTILPVGYSLEIATALTSQSGNLASESLHLPSSSSEFDERIAAFQTKSGTASEMGTERA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 NFTILPVGYSLEIATALTSQSGNLASESLHLPSSSSEFDERIAAFQTKSGTASEMGTERA 180 190 200 210 220 230 250 260 270 280 290 300 pF1KA1 MGLSEEWIVHSQEATTSAWSPSFLPALEMGELTTPSRKRNSSGPDLSWLHFYRTAASSPL ::::::: :::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 MGLSEEWTVHSQEATTSAWSPSFLPALEMGELTTPSRKRNSSGPDLSWLHFYRTAASSPL 240 250 260 270 280 290 310 320 330 340 350 360 pF1KA1 LDLSSSSESTEKLNNSTGLQSSSVSQTKTMHVATVFTDGGPRTLRSLTVSLGPVSKTEGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 LDLSSSSESTEKLNNSTGLQSSSVSQTKTMHVATVFTDGGPRTLRSLTVSLGPVSKTEGF 300 310 320 330 340 350 370 380 390 400 410 420 pF1KA1 PKDSRIATTSSSVLLSPSAVESRRNSRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 PKDSRIATTSSSVLLSPSAVESRRNSRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTF 360 370 380 390 400 410 430 440 450 460 470 480 pF1KA1 GEHQLASSSEVQNGSPMSQTETVSRSVAPMRGGEITAHWLLTNSTTSADVTGSSASYPEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 GEHQLASSSEVQNGSPMSQTETVSRSVAPMRGGEITAHWLLTNSTTSADVTGSSASYPEG 420 430 440 450 460 470 490 500 510 520 530 540 pF1KA1 VNASVLTQFSDSTVQSGGSHTALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 VNASVLTQFSDSTVQSGGSHTALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQ 480 490 500 510 520 530 550 560 570 580 590 600 pF1KA1 ALGDSSANAEDRTSGVPSLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPAAAMH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 ALGDSSANAEDRTSGVPSLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPAAAMH 540 550 560 570 580 590 610 620 630 640 650 660 pF1KA1 QETEGASLHVNVTDDMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYLSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 QETEGASLHVNVTDDMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYLSS 600 610 620 630 640 650 670 680 690 700 710 720 pF1KA1 TFTKGERALLSITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 TFTKGERALLSITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYA 660 670 680 690 700 710 730 740 750 760 770 780 pF1KA1 QPSTESPVLHTSNLPSYTPTINMPNTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 QPSTESPVLHTSNLPSYTPTINMPNTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLP 720 730 740 750 760 770 790 800 810 820 830 840 pF1KA1 SVSQSHHLFSSILPSTRASVHLLKSTSDASTPWSSSPSPLPVSLTTSTSAPLSVSQTTLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 SVSQSHHLFSSILPSTRASVHLLKSTSDASTPWSSSPSPLPVSLTTSTSAPLSVSQTTLP 780 790 800 810 820 830 850 860 870 880 890 900 pF1KA1 QSSSTPVLPRARETPVTSFQTSTMTSFMTMLHSSQTADLKSQSTPHQEKVITESKSPSLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 QSSSTPVLPRARETPVTSFQTSTMTSFMTMLHSSQTADLKSQSTPHQEKVITESKSPSLV 840 850 860 870 880 890 910 920 930 940 950 960 pF1KA1 SLPTESTKAVTTNSPLPPSLTESSTEQTLPATSTNLAQMSPTFTTTILKTSQPLMTTPGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 SLPTESTKAVTTNSPLPPSLTESSTEQTLPATSTNLAQMSPTFTTTILKTSQPLMTTPGT 900 910 920 930 940 950 970 980 990 1000 1010 1020 pF1KA1 LSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQISTEGGISTERNRVIVDATTGLIPLTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 LSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQISTEGGISTERNRVIVDATTGLIPLTS 960 970 980 990 1000 1010 1030 1040 1050 1060 1070 1080 pF1KA1 VPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQTTVVSTAEDLAPKSATFAVQSSTQSPTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 VPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQTTVVSTAEDLAPKSATFAVQSSTQSPTT 1020 1030 1040 1050 1060 1070 1090 1100 1110 1120 1130 1140 pF1KA1 VSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNECLSNPCPSTAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 VSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNECLSNPCPSTAM 1080 1090 1100 1110 1120 1130 1150 1160 1170 1180 1190 1200 pF1KA1 CNNTQGSFICKCPVGYQLEKGICNLVRTFVTEFKLKRTFLNTTVEKHSDLQEVENEITKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 CNNTQGSFICKCPVGYQLEKGICNLVRTFVTEFKLKRTFLNTTVEKHSDLQEVENEITKT 1140 1150 1160 1170 1180 1190 1210 1220 1230 1240 1250 1260 pF1KA1 LNMCFSALPSYIRSTVHASRESNAVVISLQTTFSLASNVTLFDLADRMQKCVNSCKSSAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 LNMCFSALPSYIRSTVHASRESNAVVISLQTTFSLASNVTLFDLADRMQKCVNSCKSSAE 1200 1210 1220 1230 1240 1250 1270 1280 1290 1300 1310 1320 pF1KA1 VCQLLGSQRRIFRAGSLCKRKSPECDKDTSICTDLDGVALCQCKSGYFQFNKMDHSCRAC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 VCQLLGSQRRIFRAGSLCKRKSPECDKDTSICTDLDGVALCQCKSGYFQFNKMDHSCRAC 1260 1270 1280 1290 1300 1310 1330 1340 1350 1360 1370 1380 pF1KA1 EDGYRLENETCMSCPFGLGGLNCGNPYQLITVVIAAAGGGLLLILGIALIVTCCRKNKND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 EDGYRLENETCMSCPFGLGGLNCGNPYQLITVVIAAAGGGLLLILGIALIVTCCRKNKND 1320 1330 1340 1350 1360 1370 1390 1400 1410 1420 1430 1440 pF1KA1 ISKLIFKSGDFQMSPYAEYPKNPRSQEWGREAIEMHENGSTKNLLQMTDVYYSPTSVRNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: XP_005 ISKLIFKSGDFQMSPYAEYPKNPRSQEWGREAIEMHENGSTKNLLQMTDVYYSPTSVRNP 1380 1390 1400 1410 1420 1430 1450 1460 1470 1480 pF1KA1 ELERNGLYPAYTGLPGSRHSCIFPGQYNPSFISDESRRRDYF :::::::::::::::::::::::::::::::::::::::::: XP_005 ELERNGLYPAYTGLPGSRHSCIFPGQYNPSFISDESRRRDYF 1440 1450 1460 1470 1480 >>NP_065784 (OMIM: 614182) protein HEG homolog 1 precurs (1381 aa) initn: 8862 init1: 5561 opt: 5587 Z-score: 2718.5 bits: 515.6 E(85289): 1.1e-144 Smith-Waterman score: 8759; 93.0% identity (93.1% similar) in 1482 aa overlap (1-1482:1-1381) 10 20 30 40 50 60 pF1KA1 MASPRASRWPPPLLLLLLPLLLLMPPAAPGTRDPPPSPARRALSLAPLAGAGLELQLERR ::::::::::::::::::::::: :::::::::::::::::::::::::::::::::::: NP_065 MASPRASRWPPPLLLLLLPLLLL-PPAAPGTRDPPPSPARRALSLAPLAGAGLELQLERR 10 20 30 40 50 70 80 90 100 110 120 pF1KA1 PEREPPPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRAPRGGSADAAWKHWPESNTEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 PEREPPPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRAPRGGSADAAWKHWPESNTEA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KA1 HVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENLTLLAETADARGRSGSSSRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 HVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENLTLLAETADARGRSGSSSRT 120 130 140 150 160 170 190 200 210 220 230 240 pF1KA1 NFTILPVGYSLEIATALTSQSGNLASESLHLPSSSSEFDERIAAFQTKSGTASEMGTERA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 NFTILPVGYSLEIATALTSQSGNLASESLHLPSSSSEFDERIAAFQTKSGTASEMGTERA 180 190 200 210 220 230 250 260 270 280 290 300 pF1KA1 MGLSEEWIVHSQEATTSAWSPSFLPALEMGELTTPSRKRNSSGPDLSWLHFYRTAASSPL ::::::: :::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 MGLSEEWTVHSQEATTSAWSPSFLPALEMGELTTPSRKRNSSGPDLSWLHFYRTAASSPL 240 250 260 270 280 290 310 320 330 340 350 360 pF1KA1 LDLSSSSESTEKLNNSTGLQSSSVSQTKTMHVATVFTDGGPRTLRSLTVSLGPVSKTEGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 LDLSSSSESTEKLNNSTGLQSSSVSQTKTMHVATVFTDGGPRTLRSLTVSLGPVSKTEGF 300 310 320 330 340 350 370 380 390 400 410 420 pF1KA1 PKDSRIATTSSSVLLSPSAVESRRNSRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 PKDSRIATTSSSVLLSPSAVESRRNSRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTF 360 370 380 390 400 410 430 440 450 460 470 480 pF1KA1 GEHQLASSSEVQNGSPMSQTETVSRSVAPMRGGEITAHWLLTNSTTSADVTGSSASYPEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 GEHQLASSSEVQNGSPMSQTETVSRSVAPMRGGEITAHWLLTNSTTSADVTGSSASYPEG 420 430 440 450 460 470 490 500 510 520 530 540 pF1KA1 VNASVLTQFSDSTVQSGGSHTALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQ :::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 VNASVLTQFSDSTVQSGGSHTALGDRSYSESSSTSSSESLNSSAPRGERS---------- 480 490 500 510 520 550 560 570 580 590 600 pF1KA1 ALGDSSANAEDRTSGVPSLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPAAAMH NP_065 ------------------------------------------------------------ 610 620 630 640 650 660 pF1KA1 QETEGASLHVNVTDDMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYLSS .::::::::::::::::::::::::::::: NP_065 ------------------------------IAGISYGQVRGTAIEQRTSSDHTDHTYLSS 530 540 550 670 680 690 700 710 720 pF1KA1 TFTKGERALLSITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 TFTKGERALLSITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYA 560 570 580 590 600 610 730 740 750 760 770 780 pF1KA1 QPSTESPVLHTSNLPSYTPTINMPNTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 QPSTESPVLHTSNLPSYTPTINMPNTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLP 620 630 640 650 660 670 790 800 810 820 830 840 pF1KA1 SVSQSHHLFSSILPSTRASVHLLKSTSDASTPWSSSPSPLPVSLTTSTSAPLSVSQTTLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 SVSQSHHLFSSILPSTRASVHLLKSTSDASTPWSSSPSPLPVSLTTSTSAPLSVSQTTLP 680 690 700 710 720 730 850 860 870 880 890 900 pF1KA1 QSSSTPVLPRARETPVTSFQTSTMTSFMTMLHSSQTADLKSQSTPHQEKVITESKSPSLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 QSSSTPVLPRARETPVTSFQTSTMTSFMTMLHSSQTADLKSQSTPHQEKVITESKSPSLV 740 750 760 770 780 790 910 920 930 940 950 960 pF1KA1 SLPTESTKAVTTNSPLPPSLTESSTEQTLPATSTNLAQMSPTFTTTILKTSQPLMTTPGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 SLPTESTKAVTTNSPLPPSLTESSTEQTLPATSTNLAQMSPTFTTTILKTSQPLMTTPGT 800 810 820 830 840 850 970 980 990 1000 1010 1020 pF1KA1 LSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQISTEGGISTERNRVIVDATTGLIPLTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 LSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQISTEGGISTERNRVIVDATTGLIPLTS 860 870 880 890 900 910 1030 1040 1050 1060 1070 1080 pF1KA1 VPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQTTVVSTAEDLAPKSATFAVQSSTQSPTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 VPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQTTVVSTAEDLAPKSATFAVQSSTQSPTT 920 930 940 950 960 970 1090 1100 1110 1120 1130 1140 pF1KA1 VSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNECLSNPCPSTAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 VSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNECLSNPCPSTAM 980 990 1000 1010 1020 1030 1150 1160 1170 1180 1190 1200 pF1KA1 CNNTQGSFICKCPVGYQLEKGICNLVRTFVTEFKLKRTFLNTTVEKHSDLQEVENEITKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 CNNTQGSFICKCPVGYQLEKGICNLVRTFVTEFKLKRTFLNTTVEKHSDLQEVENEITKT 1040 1050 1060 1070 1080 1090 1210 1220 1230 1240 1250 1260 pF1KA1 LNMCFSALPSYIRSTVHASRESNAVVISLQTTFSLASNVTLFDLADRMQKCVNSCKSSAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 LNMCFSALPSYIRSTVHASRESNAVVISLQTTFSLASNVTLFDLADRMQKCVNSCKSSAE 1100 1110 1120 1130 1140 1150 1270 1280 1290 1300 1310 1320 pF1KA1 VCQLLGSQRRIFRAGSLCKRKSPECDKDTSICTDLDGVALCQCKSGYFQFNKMDHSCRAC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 VCQLLGSQRRIFRAGSLCKRKSPECDKDTSICTDLDGVALCQCKSGYFQFNKMDHSCRAC 1160 1170 1180 1190 1200 1210 1330 1340 1350 1360 1370 1380 pF1KA1 EDGYRLENETCMSCPFGLGGLNCGNPYQLITVVIAAAGGGLLLILGIALIVTCCRKNKND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 EDGYRLENETCMSCPFGLGGLNCGNPYQLITVVIAAAGGGLLLILGIALIVTCCRKNKND 1220 1230 1240 1250 1260 1270 1390 1400 1410 1420 1430 1440 pF1KA1 ISKLIFKSGDFQMSPYAEYPKNPRSQEWGREAIEMHENGSTKNLLQMTDVYYSPTSVRNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_065 ISKLIFKSGDFQMSPYAEYPKNPRSQEWGREAIEMHENGSTKNLLQMTDVYYSPTSVRNP 1280 1290 1300 1310 1320 1330 1450 1460 1470 1480 pF1KA1 ELERNGLYPAYTGLPGSRHSCIFPGQYNPSFISDESRRRDYF :::::::::::::::::::::::::::::::::::::::::: NP_065 ELERNGLYPAYTGLPGSRHSCIFPGQYNPSFISDESRRRDYF 1340 1350 1360 1370 1380 >>NP_001291288 (OMIM: 158373) mucin-5AC precursor [Homo (5654 aa) initn: 457 init1: 190 opt: 459 Z-score: 230.3 bits: 57.2 E(85289): 4.3e-06 Smith-Waterman score: 547; 22.5% identity (51.5% similar) in 1273 aa overlap (96-1296:3637-4823) 70 80 90 100 110 120 pF1KA1 PPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRAPRGGSADAAW-KHWPESNTEAHVEN ::::: .. ..: : . . . . . NP_001 MCLNYEVRVLCCETPKGCPVTSTSVTAPSTPSGRATSPTQSTSSWQKSRTTTLVTSSITS 3610 3620 3630 3640 3650 3660 130 140 150 160 170 180 pF1KA1 ITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENLTLLAETADARGR----SGSSSRT : .. .: .. .. ::. . ....:: . : : :... . ..:. . NP_001 TTQTSTTSAPTTSTTPASIPSTTSAPTTSTTSAPTTSTTSAPTTSTTSTPQTTTSSAPTS 3670 3680 3690 3700 3710 3720 190 200 210 220 230 240 pF1KA1 NFTILPVGYSLEIATALTSQSGNLASESLHLPSSSSEFDERIAAFQTKSGTASEMGTERA . : :. .. :. : .. . .. : :..: .: :.. .: .: : NP_001 STTSAPTTSTISAPTTSTISAPTTSTTSAPTASTTSAPTSTSSAPTTNTTSAPTTSTTSA 3730 3740 3750 3760 3770 3780 250 260 270 280 290 300 pF1KA1 MGLSEEWIVHSQEATTSAWSPSFLPALEMGELTTPSRKRNSSGPDLSWLHFYRTAASSPL : : .:::. . : . . . .::. . .:: : : ..:.: NP_001 PITST--ISAPTTSTTSTPQTSTISSPTTSTTSTPQTSTTSS-PTTS-------TTSAPT 3790 3800 3810 3820 3830 310 320 330 340 350 pF1KA1 LDLSSSSESTEKLNNSTGLQSSSVSQTKTMHVATVFTDGGPRT--LRSLTVSLGPVSKTE . .:. .. . .:...:. .:.: . .:.... : ... ... :.:.: NP_001 TSTTSAPTTSTTSTPQTSISSAPTSSTTSAPTASTISAPTTSTTSFHTTSTTSPPTSSTS 3840 3850 3860 3870 3880 3890 360 370 380 390 400 pF1KA1 GFPKDSRIATTSSSVL----LSPSAVESRRNSRVTGNPGDEEFIEPSTENEFGL------ . :. :. ....::. .:: : . .. :. . .. . .:... NP_001 STPQTSKTSAATSSTTSGSGTTPSPVPTTSTASVSKTSTSHVSVSKTTHSQPVTRDCHPR 3900 3910 3920 3930 3940 3950 410 420 430 440 450 460 pF1KA1 -TSLRWQN-DSPTFGEHQLASSSEVQNGSPMSQTETVSRSVAPMRGGEITAHWLLTNS-- : .: . : :. : : ....:. : . . . : . : : ::: ..: NP_001 CTWTKWFDVDFPSPGPH--GGDKETYN-NIIRSGEKICR-----RPEEITRLQCRAESHP 3960 3970 3980 3990 4000 470 480 490 500 510 pF1KA1 TTSADVTGS--SASYPEGV---NASVLTQFS---DSTVQSGGSHTALGDRSYSESSSTSS .: . :. . : ::. : . :. . :. .: : : .. : NP_001 EVSIEHLGQVVQCSREEGLVCRNQDQQGPFKMCLNYEVRVLCCETPKGCPVTSTPVTAPS 4010 4020 4030 4040 4050 4060 520 530 540 550 560 570 pF1KA1 SESLNSSAPRGERSTLEDSREPGQALGDSSANAEDRTSGVPSLGTHTLATVTGNGERTLR . : ...: :. . :: . ..... . :...: : .:. .. : NP_001 TPSGRATSPTQSTSSWQKSRTTTLVTTSTTSTPQTSTTSAP-----TTSTIPASTPSTTS 4070 4080 4090 4100 4110 4120 580 590 600 610 620 630 pF1KA1 SVTLTNTSMSTTSGEAGSPAAAMHQETEGASLHVNVTDDMGLVSRSLAASSALGVAGISY . : ..:: ::: . .: :. : : . .: .:: ... : NP_001 APTTSTTSAPTTS----TTSAPTHRTTSGPT-----------TSTTLAPTTSTTSAP--- 4130 4140 4150 4160 640 650 660 670 680 690 pF1KA1 GQVRGTAIEQRTSSDHTDHTYLSSTFTKGERALLSITDNSSSSDIVESSTSYIKISNSSH :.: .. : .::.. . . .: .:. :. . :.:: . :..: NP_001 -----------TTSTNSAPT--TSTISASTTSTISAPTTSTISSPTSSTTSTPQTSKTSA 4170 4180 4190 4200 4210 700 710 720 730 740 750 pF1KA1 SEYSSFFHAQTERSNI--SSYDGEYAQPSTESPVLHTSNLPSYTPTINMPNTSVV-LDTD . :. . : : . .: . . .: .:. :.. :. ::. .:.::.. : NP_001 ATSSTTSGSGTTPSPVPTTSTTSASTTSTTSAPTTSTTSGPGTTPS-PVPSTSTTSAATT 4220 4230 4240 4250 4260 4270 760 770 780 790 800 810 pF1KA1 AEFVSDSSSSSSSSSSSSSSGP---PLPLPSVSQSHHLFSSILPSTRASVHLLKSTSDAS . . .. ..:. .:: .::: : :.:..: . .: . .. . .:: .: NP_001 STTSAPTTRTTSAPTSSMTSGPGTTPSPVPTTSTTSAPTTSTTSGPGTTPSPVPTTSTTS 4280 4290 4300 4310 4320 4330 820 830 840 850 860 pF1KA1 TPWSSSPS-----PLPVSLTTSTSAPLSVSQTTLPQSSSTPVLPRARETPVTSFQTSTMT .: .:. : : :: :..:::: ...:: ...:: : . .:: . ::: . NP_001 APITSTTSGPGSTPSPVPTTSTTSAP--TTSTTSASTASTTSGPGTTPSPVPT--TSTTS 4340 4350 4360 4370 4380 870 880 890 900 910 pF1KA1 SFMTMLHSSQTADLKSQ--STPHQEKVITESKSPSLVSLPTESTKAV----TTNSPLPP- . : :..::. : ::: . . ...:. . :. ..... :: ::.: NP_001 APTTRTTSASTASTTSGPGSTPSPVPTTSTTSAPTTRTTPASTASTTSGPGTTPSPVPTT 4390 4400 4410 4420 4430 4440 920 930 940 950 960 970 pF1KA1 SLTESSTEQT--LPATSTNLAQMSPTFTTTILKTSQPLMTTPGTLSSTASLVTGPIAVQT : : .:: .: ::.:::. : .. ..:. : .:. :: : . :.: ... : .: NP_001 STTSASTTSTISLPTTSTTSAPIT-SMTSGPGTTPSPVPTTSTTSAPTTSTTSASTA-ST 4450 4460 4470 4480 4490 4500 980 990 1000 1010 1020 1030 pF1KA1 TAGKQLSLTHPEILVPQISTEGGISTERNRVIVDATTGL--IPLTSVPTSAKEMTTKLGV :.: . . : :: :: .. .: . . . .::. :. :::.. :: NP_001 TSGPGTTPS-P---VPTTSTTSAPTTSTTSASTASTTSGPGTSLSPVPTTS---TT---- 4510 4520 4530 4540 4550 1040 1050 1060 1070 1080 pF1KA1 TAEYSPASRSLGTSPSPQTTVVSTAEDLAPKSATFAVQSSTQSP-----TTVSSSASVNS .: . .. . ::.::: :. .:. :: ..: . ..: :: :: :..:.. NP_001 SAPTTSTTSGPGTTPSPVPTTSTTS---APTTSTTSGPGTTPSPVPTTSTTPVSKTSTSH 4560 4570 4580 4590 4600 4610 1090 1100 1110 1120 1130 1140 pF1KA1 CAVNPCLHNGECVADNT-----SRGYHCRCP-PSWQGDDCSVDVNECLSNPCPS-TAMCN .:. :. ..: .. . : :. .: : .: .: : .: NP_001 LSVSKTTHSQPVTSDCHPLCAWTKWFDVDFPSPGPHGGD-----KETYNNIIRSGEKICR 4620 4630 4640 4650 4660 1150 1160 1170 1180 1190 1200 pF1KA1 NTQGSFICKCPVGYQLEKGICNLVRTFVTEFKLKRTFLNTTVEKHSDLQEVENEITKTLN . .: . . : .: .: . :.. . .. .. . .... .. : ...: NP_001 RPEEITRLQCRAESHPEVNIEHLGQ--VVQCSREEGLVCRNQDQQGPFKMCLNYEVRVLC 4670 4680 4690 4700 4710 4720 1210 1220 1230 1240 1250 1260 pF1KA1 MCFSALPSYIRS-TVHASRESNAVVISLQTTFSLASNVTLFDLADRMQKCVNSCKSSAEV : . . : : ... .::. ::.:.. :: :. ..:. . .: :... NP_001 -CETPRGCPVTSVTPYGTSPTNALYPSLSTSMVSAS-VASTSVASS-SVASSSVAYSTQT 4730 4740 4750 4760 4770 4780 1270 1280 1290 1300 1310 pF1KA1 CQLLGSQRRIFRAGSLCKRKSPE--------CDKDTSICTDLDGVALCQCKSGYFQFNKM : . . :.. ::: :. :..: .. .: NP_001 C-FCNVADRLYPAGSTIYRHRDLAGHCYYALCSQDCQVVRGVDSDCPSTTLPPAPATSPS 4790 4800 4810 4820 4830 4840 1320 1330 1340 1350 1360 1370 pF1KA1 DHSCRACEDGYRLENETCMSCPFGLGGLNCGNPYQLITVVIAAAGGGLLLILGIALIVTC NP_001 ISTSEPVTELGCPNAVPPRKKGETWATPNCSEATCEGNNVISLRPRTCPRVEKPTCANGY 4850 4860 4870 4880 4890 4900 >-- initn: 494 init1: 190 opt: 459 Z-score: 230.3 bits: 57.2 E(85289): 4.3e-06 Smith-Waterman score: 631; 22.8% identity (53.4% similar) in 1060 aa overlap (96-1114:2233-3226) 70 80 90 100 110 120 pF1KA1 PPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRAPRGGSADAAWKHWPESNTEAHVENI ::::: .. ..:. .: : . : . NP_001 MCLNYEVRVLCCETPKGCPVTSTPVTAPSTPSGRATSPTQSTSSWQ---KSRTTTLVTTS 2210 2220 2230 2240 2250 130 140 150 160 170 180 pF1KA1 TFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENLTLLAETADARGRSGSSSRTNFTIL : : : .. . ::. . ...:: . : : :.. . :.. NP_001 TTSTPQ----TSTTYAHTTSTTSAPTARTTSAPTTRTTSASPASTTSGPGNTPS------ 2260 2270 2280 2290 2300 190 200 210 220 230 240 pF1KA1 PVGYSLEIATALTSQSGNLASESLHLPSSSSEFDERIAAFQTKSGTASEMGTERAMGLSE :: . :.. :: .. .. . :.:: : :: .. . . ... NP_001 PVPTTSTISAPTTSITSAPTTSTTSAPTSS-----------TTSGPGTTPSPVPTTSITS 2310 2320 2330 2340 2350 250 260 270 280 290 300 pF1KA1 EWIVHSQEATTSAWSPSFLPALEMGELTTPSRKRNSSGPDLSWLHFYRTAASSPLLDLSS .:::: . : : . . :. . :::. . :...: .. NP_001 A----PTTSTTSAPTTSTTSA-RTSSTTSATTTSRISGPETTPSPVPTTSTTSATTTSTT 2360 2370 2380 2390 2400 2410 310 320 330 340 350 360 pF1KA1 SSESTEKLNNSTGLQSSSVSQTKTMHVATVFTDGGPRTLRS----LTVSLGPVSKTEGFP :. .: . :. .:: ::.: . :. : .:: : : ... .:...: . : NP_001 SAPTTSTTSAPTSSTTSS-PQTSTTSAPTTSTTSGPGTTPSPVPTTSTTSAPTTRTTSAP 2420 2430 2440 2450 2460 2470 370 380 390 400 410 pF1KA1 KDSRIATTSSSVLLSPSAV-ESRRNSRVTGNPGDEEFIEPSTE----NEFGLTSLRWQND :.: .....:. .: .. . .. .:..: :.: . . :: . NP_001 KSSTTSAATTSTTSGPETTPRPVPTTSTTSSPTTSTTSAPTTSTTSASTTSTTSGAGTTP 2480 2490 2500 2510 2520 2530 420 430 440 450 460 470 pF1KA1 SPTFGEHQLASSSEVQNGSPMSQTETVSRSVAPMRGGEITAHWLLTNSTTSADVTGSSAS ::. .. . ...:.:.: ... ... : : . :.::::: .: :..: NP_001 SPVPTTSTTSAPTTSTTSAPISSTTSAT-TTSTTSGPGTTPSPVPTTSTTSAPTT-STTS 2540 2550 2560 2570 2580 2590 480 490 500 510 520 530 pF1KA1 YPEGVNASVLTQFSDSTVQSGGSHTALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSR : :.. :.. : ... . ....: ::.::.. . :.:. : . . NP_001 GP-GTTPSAVPTTSITSAPTTSTNSA------PISSTTSATTTSRISGPETTPSPVPTAS 2600 2610 2620 2630 2640 540 550 560 570 580 590 pF1KA1 EPGQALGDSSANAEDRTSGVPSLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPA . . ..... : ::. .: .. :.. .. : . : . .. ::::: . .:. NP_001 TTSASTTSTTSGPGTTPSPVPTTSTISVPTTSTTSAST--TSTTSASTTSTTSGPGTTPS 2650 2660 2670 2680 2690 2700 600 610 620 630 640 650 pF1KA1 AAMHQETEGASLHVNVTDDMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHT . : .: .:. . . : .. . .... . .. .. .:::. : . NP_001 PVPTTSTTSAP----TTSTTSAPTTSTISAPTTSTTSATTTSTTSAPTPRRTSAPTT--S 2710 2720 2730 2740 2750 660 670 680 690 700 710 pF1KA1 YLSSTFTKGERALLSITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYD .:.. :. : . : ...... . . :. .: .. . ... ..: . ::: NP_001 TISASTTSTTSATTTSTTSATTTSTISAPTTSTTLSPTTSTTSTTI--TSTTSAPISSTT 2760 2770 2780 2790 2800 2810 720 730 740 750 760 pF1KA1 GEYAQPSTESPVLHTSNLPSYT--P-----TINMPNTSVVLDTDAEFVS-DSSSSSSSSS . .: .:. :.. :. : : : . :.::.. .. .: .::..:... NP_001 STPQTSTTSAPTTSTTSGPGTTSSPVPTTSTTSAPTTSTTSAPTTRTTSVPTSSTTSTAT 2820 2830 2840 2850 2860 2870 770 780 790 800 810 820 pF1KA1 SSSSSGP---PLPLPSVSQSHHLFSSILPSTRA-SVHLLKSTSDASTPWSSSPSPLPVSL .:..::: : :.:..: .. :.::. :. ..:: .: .:.:. .: NP_001 TSTTSGPGTTPSPVPTTS------TTSAPTTRTTSAPTTSTTSAPTTSTTSAPTSSTTSA 2880 2890 2900 2910 2920 830 840 850 860 870 880 pF1KA1 TTST--SAPLSVSQTTLPQSSSTPVLPRARE--TPVTSFQTSTMTSFMTMLHSSQTADLK ::.. :.: ..: :..: .. .:: : . .:.:: ... :: . .. . NP_001 TTTSTISVP-TTSTTSVPGTTPSPV-PTTSTISVPTTSTTSASTTSTTSGPGTTPSPVPT 2930 2940 2950 2960 2970 2980 890 900 910 920 930 pF1KA1 SQSTPHQEKVITESKSPSLVSLPTEST-KAVTTNSPLPPSLTESSTEQT-LPATSTNLAQ ...: : . . : .: :: :: .: ::.. : :. . .:. : .: :. . NP_001 TSTTSAPTTSTTSAPTTSTISAPTTSTPSAPTTSTTLAPTTSTTSAPTTSTTSTPTSSTT 2990 3000 3010 3020 3030 3040 940 950 960 970 980 990 pF1KA1 MSPTFTTTILKTSQPLMTTPGTLSS---TASLVTGPIAVQTTAGKQLSLTHPEILV---P :: .:: .:.. . . ::: : :.: ...: . :.:. ... : . : NP_001 SSPQTSTTSASTTS-ITSGPGTTPSPVPTTSTTSAPTTSTTSAATTSTISAPTTSTTSAP 3050 3060 3070 3080 3090 3100 1000 1010 1020 1030 1040 1050 pF1KA1 QISTEGGISTERNRVIVDATTGLIPLTSVPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQ :: .. :: . . .: . :: ::. . :: .: . . . ::.::: NP_001 TTSTTSA-STASKTSGLGTTPSPIPTTSTTSPPTTSTT----SASTASKTSGPGTTPSP- 3110 3120 3130 3140 3150 1060 1070 1080 1090 1100 pF1KA1 TTVVSTAEDLAPKSATFAVQSS--------TQSPTTVSSSASVNSCAVNPCLHNGECVAD : .:. .::...: ..... : ::. ..:.:::.. ... . .. NP_001 --VPTTSTIFAPRTSTTSASTTSTTPGPGTTPSPVPTTSTASVSKTSTSHVSISKTTHSQ 3160 3170 3180 3190 3200 3210 1110 1120 1130 1140 1150 1160 pF1KA1 NTSRGYHCRCPPSWQGDDCSVDVNECLSNPCPSTAMCNNTQGSFICKCPVGYQLEKGICN ..: : :: NP_001 PVTRDCHLRCTWTKWFDIDFPSPGPHGGDKETYNNIIRSGEKICRRPEEITRLQCRAESH 3220 3230 3240 3250 3260 3270 >>NP_001035194 (OMIM: 608424) mucin-17 precursor [Homo s (4493 aa) initn: 262 init1: 93 opt: 441 Z-score: 223.0 bits: 55.5 E(85289): 1.1e-05 Smith-Waterman score: 556; 23.0% identity (52.2% similar) in 1130 aa overlap (25-1089:2438-3538) 10 20 30 40 50 pF1KA1 MASPRASRWPPPLLLLLLPLLLLMPPAAPGTRDPPPSPARRALSLAPLAGAGLE : .: :: : :.. . .:::. . NP_001 PVVSSEASTHSTTPVDTSTPVTTSTEASSSPTTAEGTSIPTSPPSE---GTTPLASMPVS 2410 2420 2430 2440 2450 2460 60 70 80 90 100 110 pF1KA1 LQLERRPEREPPPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRAPRGGS--ADAAWKH : : : . : : . . : : . : .:.. .. . NP_001 TTPVVSSEAGTLSTTPVDTSTPMTTSTEASSSPTTAEDIVVPISTASEGSTLLTSIPVST 2470 2480 2490 2500 2510 2520 120 130 140 150 160 170 pF1KA1 WPESNTEAHVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENLTLLAETADARG : .. :: . . : ... : . . ... : : .: :. : : . NP_001 TPVASPEASTLSTTPVDSNSPVVTSTEISSSATSAEGTSMPTSTYSEGSTPLRSMPVSTK 2530 2540 2550 2560 2570 2580 180 190 200 210 220 pF1KA1 RSGSSSRTNFTILPVGYSLEIATALTSQSGNLASESLHLP-SSSSEFDERIAAF--QTKS .:: .... :: :. ..:. ..:. .... .: :. :: . .... .: NP_001 PLASSEASTLSTTPVDTSIPVTTSTETSSSPTTAKDTSMPISTPSEVSTSLTSILVSTMP 2590 2600 2610 2620 2630 2640 230 240 250 260 270 280 pF1KA1 GTASEMGTERAMGLSEEWIVHSQEATTSAWSPSFLPALEMGELTTPSRKRNSSGPDLSWL ..:: .: . .. . .: .. .:.: ::. . : .::... : : . : NP_001 VASSEASTLSTTPVDTRTLVTTSTGTSS--SPTTAEGSSM-PTSTPGER---STPLTNIL 2650 2660 2670 2680 2690 290 300 310 320 330 340 pF1KA1 HFYRTAASSPLLDLSSS--SESTEKLNNSTGLQSSSVSQTKTMHVATVFTDGGPRTLRSL :.: ::.. . :: ... . .: .... .:...: . : : :. NP_001 VSTTLLANSEASTLSTTPVDTSTPVTTSAEASSSPTTAEGTSMRIST--PSDGSTPLTSI 2700 2710 2720 2730 2740 2750 350 360 370 380 390 400 pF1KA1 TVSLGPVSKTEGFPKDSRIATTSSSVLLSPSAVESRRNSRVTGNPGDEEFIEPSTENEFG :: ::...:. .. . :: : : : : ...::. : . :: :. NP_001 LVSTLPVASSEASTVSTTAVDTSIPVTTSTEASSSPTTAEVTSMPTST----PS-ETSTP 2760 2770 2780 2790 2800 2810 410 420 430 440 450 460 pF1KA1 LTSLRWQNDSPTFGEHQLASSSEVQNGSPMSQTETVSRS-------VAPMRGGEITAHWL :::. .. . .: :.. :....:.. . .: : :.:. . . : NP_001 LTSMPVNHTPVASSEAGTLSTTPVDTSTPVTTSTKASSSPTTAEGIVVPISTASEGSTLL 2820 2830 2840 2850 2860 2870 470 480 490 500 510 pF1KA1 LTNSTTSADVTGSSASY----PEGVNASVLTQFSDSTVQSGGSHTALGDRSYSESSSTSS . .... :..: :: : .. : :. :. . . :.. . :: :. . NP_001 TSIPVSTTPVASSEASTLSTTPVDTSIPVTTSTEGSSSPTTAEGTSMPISTPSEVSTPLT 2880 2890 2900 2910 2920 2930 520 530 540 550 pF1KA1 SESLNSSAPRG--ERSTLE----DSREPGQALGDSSAN---AE----------DRTSGVP : : :..: . : ::: :.: : . ...:.. :: .: . . NP_001 S-ILVSTVPVAGSEASTLSTTPVDTRTPVTTSAEASSSPTTAEGTSMPISTPGERRTPLT 2940 2950 2960 2970 2980 2990 560 570 580 590 600 610 pF1KA1 SLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPAAA------MHQETEGASLHVN :... :. ...... :. . :.: ..:.. ..::..: . .::.. .. NP_001 SMSVSTMPVASSEASTLSRTPADTSTPVTTSTEASSSPTTAEGTGIPISTPSEGSTPLTS 3000 3010 3020 3030 3040 3050 620 630 640 650 660 670 pF1KA1 VTDDMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYLS-STFTKGERALL . .. . .. .:.:... .. .. :. : .: .. : . ::...: : NP_001 IP--VSTTPVAIPEASTLSTTPVDSNSPVVTSTEVSSSPTPAEGTSMPISTYSEGSTPLT 3060 3070 3080 3090 3100 680 690 700 710 720 pF1KA1 SI---TDNSSSSDIVESSTSYIKISN--SSHSEYSSFFHAQTERSNISSYDGEYAQPSTE .. : .:: : ::. . :. .. .: : .. : .: .: . : : NP_001 GVPVSTTPVTSSAISTLSTTPVDTSTPVTTSTEAHSSPTTSEGTSMPTSTPSEGSTPLTY 3110 3120 3130 3140 3150 3160 730 740 750 760 770 780 pF1KA1 SPVLHTSNLPSYTPTINM-P-NTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLPSVS :: . : :.. : .::. . :..: .:.... ..: .:. : :: :: NP_001 MPVSTMLVVSSEDSTLSATPVDTSTPVTTSTEATSSTTAEGTSIPTSTPSEGMTPLTSVP 3170 3180 3190 3200 3210 3220 790 800 810 820 830 pF1KA1 QSHHLFSS----ILPST--RASVHLLKSTSDASTPWSSSPSPLPVSLTTSTSAPLS---V :. .: :: .: ... : :: .:.: .. . .:.: . :.::. : NP_001 VSNTPVASSEASILSTTPVDSNTPLTTSTEASSSPPTAEGTSMPTSTPSEGSTPLTSMPV 3230 3240 3250 3260 3270 3280 840 850 860 870 880 890 pF1KA1 SQTTLPQS--SSTPVLPRARETPVTSFQTSTMTSFMTMLHSSQTADLKSQSTPHQEKVIT : ::. .: :. . : ::::... .. . .. : :. . ::: . .. NP_001 STTTVASSETSTLSTTPADTSTPVTTYSQASSSPPIADGTSMPTSTYSEGSTPLTN--MS 3290 3300 3310 3320 3330 3340 900 910 920 930 940 950 pF1KA1 ESKSPSLVS-LPTESTKAVTTNSPLPPSLTESSTEQTLPATSTNLAQMSPTFTTTILKTS : .: . : : :: : :..:. : ::.: : : .:.. ::. :: : .: NP_001 FSTTPVVSSEASTLSTTPVDTSTPVTTS-TEASLSPTT-AEGTSIPTSSPSEGTTPL-AS 3350 3360 3370 3380 3390 3400 960 970 980 990 1000 1010 pF1KA1 QPLMTTPGTLSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQISTEGGISTERNRVIVDA .:. ::: . : . .: : :. .: . . . .. : . ..: . . NP_001 MPVSTTPVVSSEVNTLSTTPVDSNTLVTTSTEASSSPTIAEGTSLPTSTTSEGSTPL--- 3410 3420 3430 3440 3450 3460 1020 1030 1040 1050 1060 pF1KA1 TTGLIPLTSVPTSAKEMTTKLGVTAEYS-PASRSLGTSPSPQTT-VVSTAEDLAPKSATF ...::...:....: .: . .. : :.. : :. :: :. :.: . : ...: NP_001 --SIMPLSTTPVASSEASTLSTTPVDTSTPVTTSSPTNSSPTTAEVTSMPTSTAGEGSTP 3470 3480 3490 3500 3510 1070 1080 1090 1100 1110 1120 pF1KA1 AVQSSTQSPTTVSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNE .. ... ..:: ::. : NP_001 LTNMPVSTTPVASSEASTLSTTPVDSNTFVTSSSQASSSPATLQVTTMRMSTPSEGSSSL 3520 3530 3540 3550 3560 3570 >>NP_002448 (OMIM: 158370) mucin-2 precursor [Homo sapie (5289 aa) initn: 268 init1: 90 opt: 386 Z-score: 195.4 bits: 50.6 E(85289): 0.00038 Smith-Waterman score: 506; 19.6% identity (48.1% similar) in 1119 aa overlap (26-1086:1931-3009) 10 20 30 40 50 pF1KA1 MASPRASRWPPPLLLLLLPLLLLMPPAAPGTRDPPPSPARRALSLAPLAGAGLEL :. ::. : :.: . ... . . NP_002 TTTVTPTPTPTSTQSTTPTPITTTNTVTPTPTPTGTQTPTPTPITTTTTMVTPTPTITST 1910 1920 1930 1940 1950 1960 60 70 80 90 100 110 pF1KA1 QLERRPEREPPPTPPRERRGPATPGP-SYRAPEPGAATQRGPSGRAPRGGSADAAWKHWP : : ::: :: : : . : . : .: .... : NP_002 QT-------PTPTPITTTTVTPTPTPTSTQRTTPTSITTTTTVTPTPTPTGTQTP-TTTP 1970 1980 1990 2000 2010 120 130 140 150 160 170 pF1KA1 ESNTEAHVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENLTLLAETADARGRS ..: . . . : .: .: : ... : . . . .: .: . .. . . NP_002 ITTTTTVTPTPTPTGTQTPTTTPISTTTMVTPTPTPTGTQTLTPTPITTTTTVTPTPTPT 2020 2030 2040 2050 2060 2070 180 190 200 210 220 pF1KA1 GSSSRTNFTILPVGYSLEIATALTSQSGNLA---SESLHLPS-----SSSEFDERIAAFQ :... :. : . : .:. .:. . . :. ... :.. NP_002 GTQTPTSTPISTTTTVTPTPTPTGTQTPTLTPITTTTTVTPTPTPTGTQTPTTTPITTTT 2080 2090 2100 2110 2120 2130 230 240 250 260 270 280 pF1KA1 TKSGTASEMGTERAM--GLSEEWIVHSQEATTSAWSPSFLPALEMGELTTPSRKRNSSGP : . : . ::. . ... .: :.. .:. : .: ... : NP_002 TVTPTPTPTGTKSTTPTSITTTTMVTPTPPPTGTQTPTTTPITTTTTVTPTPTPTGTQTP 2140 2150 2160 2170 2180 2190 290 300 310 320 330 pF1KA1 DLSWLHFYRTAASSPLLDLSSSSESTEKLNNST--------GLQSSSVSQ-TKTMHVATV . . :.. .: ... :: .:.: : :.... : : :. . NP_002 TPTPITTTTTVTPTPTPTGTQTPTSTPITTNTTVTPTPTPTGTPSTTLTPITTTTMVTPT 2200 2210 2220 2230 2240 2250 340 350 360 370 380 pF1KA1 FTDGGPRTLRSLTVS----LGPVSKTEGF--PKDSRIATTSS-------SVLLSPSAVES : : .: : .: . :. : : . :.::.. . .:... NP_002 PTPTGTQTPTSTPISTTTTVTPTPTPTGTQTPTPTPISTTTTVTPTPTPTSTQTPTTTPI 2260 2270 2280 2290 2300 2310 390 400 410 420 430 440 pF1KA1 RRNSRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTFGEHQLASSSEVQNGSPMSQTET .. :: :: :.: .:. . .:: ..... . .:.: : : NP_002 TTTTTVTPNPTPTGTQTPTTTP---ITTTTTVTPTPT------PTGTQTPTTTPISTTTT 2320 2330 2340 2350 2360 450 460 470 480 490 pF1KA1 VSRSVAPMRGGEITAHWLLTNSTTSADVTGSSASYPEGVNASVLTQFSDSTVQSGG---S :. . .: :. . :..:.. : .... : .. .. : . . . .: . NP_002 VTPTPTPTGTQTPTTTAITTTTTVTPTPTPTGTQTPTSTPITTTTTVTPTPTPTGTQTPT 2370 2380 2390 2400 2410 2420 500 510 520 530 540 550 pF1KA1 HTALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQALGDSSANAEDRTSGVPS- : ... . . : .. . . .: .:. .: : . . . .. : .:. NP_002 STPISNTTTVTPTPTPTGTQTPTVTPITTTTTVTPTRTPTGTKSTTPTSITTTTMVTPTP 2430 2440 2450 2460 2470 2480 560 570 580 590 600 pF1KA1 --LGTHTLATVTGNGERTLRSV-------TLTNTSMSTTSGEAGSPAAAMHQETEGASLH :::: .:. . :. . : : : ..::. . .:. . : .: NP_002 TPTGTHTPTTTPITTTTTVTPTPTPTGTQTPTPTPITTTTTVTPTPTPTGTQTP--TSTP 2490 2500 2510 2520 2530 2540 610 620 630 640 650 660 pF1KA1 VNVTDDMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYLSSTFTKGERAL ...: . . .... . . : : .. .: : : .: : . NP_002 ITTTTTVTPTPTPTGTQTPTTTPITTNTTVTPTPTP---TGTQTPTTVLITTTTTMTPTP 2550 2560 2570 2580 2590 670 680 690 700 710 720 pF1KA1 LSITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYAQPSTESPVL . .:.. . ..:. . . .. ... : . . .: : .:. NP_002 TPTSTKSTTVTPITTTTTVTPTPTPTGTQSTTLTPITTTTTVTPTPTPTGTQTPTTTPIS 2600 2610 2620 2630 2640 2650 730 740 750 760 770 780 pF1KA1 HTSN-LPSYTPT-----INMPNTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLPSVS :.. .:. ::: . : :... : . . ... .:. :.... : :. . NP_002 TTTTVIPTPTPTGTQTPTSTPITTTTTVTPTPTPTGTQTPTSTPISTTTTVTPTATPTGT 2660 2670 2680 2690 2700 2710 790 800 810 820 830 pF1KA1 QSHHLFSSILPSTRASVHLLKSTSDAS-TPWSSS----PSPLPVSLTTSTSAPLSVSQTT :. : .: .:. .:. . :: ... :.: :.: : ::.:.... :. NP_002 QTPTLTPITTTTTVTSTPTPTGTQTPTPTPITTTTTVTPTPTPTSTQTPTSTPITTTTTV 2720 2730 2740 2750 2760 2770 840 850 860 870 880 890 pF1KA1 LPQSSSTPVLPRARETPVTSFQTSTMTSFMTMLHSSQTADLKSQSTPHQEKVITESKSPS : ::. : . .::.:. :.: : : .. : . : ..: . .:. NP_002 TP----TPT-PTGTQTPTTTHITTTTTVTPTPTPTGTQAPTPTAIT--TTTTVTPTPTPT 2780 2790 2800 2810 2820 2830 900 910 920 930 940 950 pF1KA1 LVSLPTESTKAVTTNSPLPPSLTESSTEQTLPATSTNLAQMSPTFTTTILKTSQPLMTTP .. :: : .::.. . :. : ..:.. :.. :. . ..:: : : :. : ::: NP_002 GTQTPT--TTPITTTTTVTPTPTPTGTQSPTPTAITTTTTVTPTPTPT--GTQTPT-TTP 2840 2850 2860 2870 2880 960 970 980 990 1000 1010 pF1KA1 GTLSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQISTEGGISTERNRVIVDATTGLIPL : ..:.. . : ..:.:. .. : : : : : .: . :. :: . NP_002 ITTTTTVTPTPTPTGTQSTTLTPITTT---TTVTPIPTPTGTQTPTSTPIT--TTITVTP 2890 2900 2910 2920 2930 2940 1020 1030 1040 1050 1060 1070 pF1KA1 TSVPTSAKEMT-TKLGVTAEYSPASRSLGTSPSPQTTVVSTAEDLAPKSATFAVQSSTQS : .::... : : ...:. .:. ::. .: :: ..:. ..: . ..:. : . NP_002 TPTPTGTQTPTPTPISTTTTVTPTPTPTGTQ-TPTTTPITTTTTVTPTPTPTGTQTPTTT 2950 2960 2970 2980 2990 3000 1080 1090 1100 1110 1120 1130 pF1KA1 PTTVSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNECLSNPCPS : ....... NP_002 PISTTTTVTPTPTPTGTQTPTSTPITTTTTVTPTPTPTGTQTPTPTPITTTTTVTPTPTP 3010 3020 3030 3040 3050 3060 >>NP_001309397 (OMIM: 158372) mucin-4 isoform f precurso (7418 aa) initn: 157 init1: 95 opt: 388 Z-score: 194.4 bits: 50.9 E(85289): 0.00044 Smith-Waterman score: 504; 23.6% identity (51.8% similar) in 1087 aa overlap (63-1094:5206-6246) 40 50 60 70 80 90 pF1KA1 DPPPSPARRALSLAPLAGAGLELQLERRPEREPPPTPPRERRGPATPGPSYRAPEPGAA- : : .: : .:: : .: ... NP_001 PGTDTSSVSTGHTTPLLVTDASSVSTGDTTRLPVTSPSSASTGHTTPLPVTDTPSASTGD 5180 5190 5200 5210 5220 5230 100 110 120 130 140 pF1KA1 TQRGPSGRAPRGGSADAAWKHW--PESNTEAHVENITFYQNQEDFSTVSSKEGVMVQTSG : : : .. :. : : : . .:. . : :..:. ... . ... NP_001 TTPLPVTNASSLSTRHATSLHVTSPSSASTGHATPLPV----TDTSAASTGHATPLPVTS 5240 5250 5260 5270 5280 5290 150 160 170 180 190 200 pF1KA1 KSHAASDAPENLTLLAETADARGRSGSSSRTNFTILPVGYSLEIATALTSQSGNLASESL : :.. : . .. . :.. :: . . .:.. . .. :.... . : NP_001 TSSASTGDTTPLPVTDTSSASTGHATPLPVTNTSSVSTGHATPLHVTSPSSASTGHTTPL 5300 5310 5320 5330 5340 5350 210 220 230 240 250 260 pF1KA1 HLPSSSSEFDERIAAFQTKSGTASEMGTERAMGLSEEWIVHSQEAT----TSAWSPSFLP . ..:: . ... . .... : . ... : . .:: :: : : NP_001 PVTDASSVSTGHATSLPVTDASSVSTGHATPLPVTDASSVSTGHATPLPLTSLSSVSTGD 5360 5370 5380 5390 5400 5410 270 280 290 300 310 320 pF1KA1 ALEMGELTTPSRKRNSSGP-DLSWLHFYRTAASSPLLDLSSSSESTEKLNNSTGLQSSSV . . : : . ... : .. : :. ..:: ..:: :: ...:.: ... NP_001 TTPLPVTDTSSASTGQATPLPVTSLSSVSTGDTTPLPVTDTSSAST---GHATSLPVTDT 5420 5430 5440 5450 5460 330 340 350 360 370 pF1KA1 SQTKTMHVATV-FTDGGPRTL---RSLTVSLGPVSKTEGFPKDSRIATTSSSVL--LSPS :...: :.. . :: . . : :. .: : . : .. :::. .: NP_001 SSASTGHATPLPVTDTSSISTGHATPLHVT-SPSSASTGHATPLPVTDTSSASTGHATPL 5470 5480 5490 5500 5510 5520 380 390 400 410 420 430 pF1KA1 AVESRRNSRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTFGEHQLASSSEVQNGSPMS : : .: ::. ::. . : : .:. . . : :. : . : .: NP_001 PVTSL-SSVSTGDTTPLPVTSPSSASTGHATPL-LVTDASSASTGQ-ATPLPVTSLSSVS 5530 5540 5550 5560 5570 5580 440 450 460 470 480 490 pF1KA1 QTETVSRSV-APMRGGEITAHWLLTNSTTSADVTGSSASYPEGVNASVLTQFSDSTVQSG .:. : .: .. : : ...:.::. ::...: : ..:. : . : . NP_001 TGDTTPLPVTSPSSASTGHATSLPVTDTSSAS-TGDTTSLPVTDTSSAYTGDTTSLPVTD 5590 5600 5610 5620 5630 5640 500 510 520 530 540 550 pF1KA1 GSHTALGDRS---YSESSSTSSSESLNSSAPRGERSTLEDSRE-PGQALGDSSANAEDRT : .. :: . .:.::.:.... . .: . :.. .. : . : :::.. : : NP_001 TSSSSTGDTTPLLVTETSSASTGDT--TPVPVTDTSSVSTGHATPLPVTGLSSASTGD-T 5650 5660 5670 5680 5690 5700 560 570 580 590 600 610 pF1KA1 SGVPSLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPAAAMHQETEGASLHVNVT . .: . .: :. : . .:::: .:. :... . . : . . :: NP_001 TRLPVTDISSAST----GQAT--PLPVTNTSSVSTGDTMPLPVTSPSSASTGHATPLPVT 5710 5720 5730 5740 5750 620 630 640 650 660 pF1KA1 DDMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYL-----SSTFTKGERA . . . . . ... : :.. . . :: : :: .:. . :. . NP_001 STSSASTGHATPVPVTSTSLASTGHTTPLPVTS-PSSASTGHTTPLPVTDTSSASTGDTT 5760 5770 5780 5790 5800 5810 670 680 690 700 710 720 pF1KA1 LLSITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYAQPSTESPV : .: :.:: . ... .. : .:. . .: . . .. :: . .: : :: NP_001 PLPVT-NASSLSTGHTTPLHVTIPSSASTGDTSTLPV----TGASSASTGHATPL---PV 5820 5830 5840 5850 5860 730 740 750 760 770 pF1KA1 LHTSNLPS--YTPTINMPNTSVVL-DTDAEFVSDSSSSSS--------SSSSSSSSGPPL ::.. . :: .:: :: :.:.::.:. ...::.:.: NP_001 TDTSSVSTGHATPLPVTSFSSVSTGDTTPLPVTDASSASTGHATPLPVTDTSSASTGDTT 5870 5880 5890 5900 5910 5920 780 790 800 810 820 830 pF1KA1 PLPSVSQSHHLFSSILPSTRASVHLLKSTSDASTPWSSSPSPLPVSLTTSTSAPLSVSQT ::: .. : .: .: : :.:.: ..: .::::.. .:.: : : NP_001 PLPVTDASS---ASTGQATPLPVTSLSSVSTGDT------TPLPVTIPSSAS---SGHTT 5930 5940 5950 5960 5970 840 850 860 870 880 890 pF1KA1 TLPQS-SSTPVLPRARETPVTSFQTSTMTSFMTMLHSSQTADLKSQSTPHQEKV-ITESK .:: : .:. .: ::::... . . .: ..: .: :: : . .:... NP_001 SLPVSDTSSASTGQATPLPVTSLSSVSTGDTTPLL----VTDASSVSTGHATPLPVTDTS 5980 5990 6000 6010 6020 900 910 920 930 940 pF1KA1 SPSL---VSLPTESTKAVTTN--SPLP-PSLTESSTEQTLPATSTNLAQMSPTFTT---- : : . ::. .:....:. .::: ::. :: .: : :: ...: .: NP_001 SASTGDTTRLPVTDTSSASTGQATPLPVTSLSSVSTGDTTPLLVTNTSSVSTGHATSLPV 6030 6040 6050 6060 6070 6080 950 960 970 980 990 1000 pF1KA1 TILKTSQPLMTTPGTLSSTASLVTG---PIAVQTTAGKQLSLTHPEILVPQIS-TEGGIS :: ..:. ::: ..::.:. :: :. : . .... . . : .. : . : .. NP_001 TIPSSSSSGHTTPLPVTSTSSVSTGHVTPLHVTSPSSSSTGQATPLPVTSTSSVSTGHVT 6090 6100 6110 6120 6130 6140 1010 1020 1030 1040 1050 pF1KA1 TERNRVIVDATTGL---IPLTSVPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQTTVVST . .:.:: .:.::. ... .: : :: : .. : .:. .:: NP_001 PLHVTSPSSASTGHATPLPVTSTSSASTGHATPLPVTDASSVSTGHATPLPVTDTSSAST 6150 6160 6170 6180 6190 6200 1060 1070 1080 1090 1100 1110 pF1KA1 AEDLA-PKSATFAVQSSTQSPTTVSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPS .. : . : ..... .: :.: .::.. ..: NP_001 GDTTPLPVTDTSSASTGQATPLPVTSLSSVSTGHATPLAVSSATSASTVSSDSPLKMETS 6210 6220 6230 6240 6250 6260 1120 1130 1140 1150 1160 1170 pF1KA1 WQGDDCSVDVNECLSNPCPSTAMCNNTQGSFICKCPVGYQLEKGICNLVRTFVTEFKLKR NP_001 GMTTPSLKTDGGRRTATSPPPTTSQTIISTIPSTAMHTRSTAAPIPILPERGVSLFPYGA 6270 6280 6290 6300 6310 6320 >-- initn: 76 init1: 76 opt: 411 Z-score: 205.5 bits: 53.0 E(85289): 0.0001 Smith-Waterman score: 519; 25.6% identity (52.6% similar) in 1154 aa overlap (19-1094:1333-2421) 10 20 30 40 pF1KA1 MASPRASRWPPPLLLLLLPLLLLMPPAAP-GTRDPPPS------PARR :: . : .: : : : :. . NP_001 HVTDASSVSTGHATSLPVTSLSSASTGDTTPLPVTSPSSASSGHTTPLPVTDASSVPTGH 1310 1320 1330 1340 1350 1360 50 60 70 80 90 pF1KA1 ALSLAPLAGAGLELQLERRPEREPPPTPPRERRGPATPGP--SYRAPEPGAATQRGPSGR : :: :.. :. . : : : ::: : . . : :: : NP_001 ATSL-PVTDASSVSTGHATP--LPVTDASSVSTGHATPLPVTDTSSVSTGQATPL-PVTS 1370 1380 1390 1400 1410 100 110 120 130 140 150 pF1KA1 APRGGSADAAWKHWPESNTEAHVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPE ....:.. : ..: . . ..:.::. . . . ... : :.. NP_001 LSSASTGDTT--PLPVTDTSSASTGQDTPLPVTSLSSVSTGDTTPLPVTSPSSASTGHAT 1420 1430 1440 1450 1460 1470 160 170 180 190 200 210 pF1KA1 NLTLLAETADARGRSGSSSRTNFTILPVGYS--LEIATALTSQSGNLASESLHLPSSSSE : . .. . :.. : :. . . .:.. :... : . ..:. . . :::.: NP_001 PLLVTDASSVSTGHATSLLVTDASSVSTGHATALHVTDASSLSTGDTTPLPVTSPSSAST 1480 1490 1500 1510 1520 1530 220 230 240 250 260 270 pF1KA1 FDERIAAFQTKSGTASEMGTERAMGLSEEWIVHSQEATTSAWSPSFLPALEMGELTT-PS : : ...:: : .: .: .. .. :.:. .: ::. . . .: . NP_001 GDTTPLPV-TDTSSAS---TGHATSLP---VTDTSSASTGHATP--LPVTDTSSASTGQA 1540 1550 1560 1570 1580 280 290 300 310 320 330 pF1KA1 RKRNSSGPDLSWLHFYRTAASSPLLDLSSSSESTEKLNN--STGLQSSSVSQTKTMHV-- .::. . :. . ::: ..:: :: . . :.:.:.:...: . : NP_001 TPLPVTGPSSA-----STGHAIPLLVTDTSSASTGQATPLPVTSLSSASTGDTTPLPVTD 1590 1600 1610 1620 1630 1640 340 350 360 370 380 390 pF1KA1 ATVFTDGGPRTLRSLTVSLGPVSKTEGFPKDSRIATTSSSVLLSPSAVESRRNSRVTGNP :. . : .: ..::. :: . : ...:: .: : . .: ::. NP_001 ASSVSTGHATSLP--VTSLSSVSTGDTTPLPVTSPSSASSGHTTPLPV-TDASSVSTGDT 1650 1660 1670 1680 1690 400 410 420 430 440 pF1KA1 GDEEFIEPSTENEFGLTSLRWQNDSPTFGEHQL------ASSSEVQNGSPMSQTETVSRS ::. . : : . : . . : :::. . . .:. :.: : : NP_001 TPLPVTSPSSASSGHTTPLPVTSPSSASSGHTTPLPVTDASSASTGDTTPLPVTDTSSAS 1700 1710 1720 1730 1740 1750 450 460 470 480 490 500 pF1KA1 VAPMRGGEITA-HWLLTNSTTSADVTG-SSASYPEGVNASVLTQFSDSTVQSGGSHTALG .. .:. :..:: ::. :::: : .:. : : :....: . : : NP_001 TGHATHLPVTGLSSASTGDTTRLPVTNVSSAS--TG-HATPLPVTSTSSASTGDT-TPLP 1760 1770 1780 1790 1800 1810 510 520 530 540 550 560 pF1KA1 DRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQALGDSSANAEDRTSGVPSLGTHTL . : :. .. : ..: . :: . .: : . . :::.. .:. .: : . NP_001 GTDTSSVSTGHTTPLLVTDA--SSVSTGDTTRLP--VTSPSSAST-GHTTPLPVTDTPSA 1820 1830 1840 1850 1860 1870 570 580 590 600 610 620 pF1KA1 ATVTGNGERTLRSVTLTNTSMST---TSGEAGSPAAAMHQETEGASLHVNVTDDMGLVSR .: :. : :: . .:.:: :: .. ::..: . : . . ::: : NP_001 ST----GDTTPLPVT-NASSLSTRHTTSLHVTSPSSA----STGHATSLPVTDT---SSV 1880 1890 1900 1910 630 640 650 660 670 680 pF1KA1 SLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYLSSTFTKGERALLSITDNSSSSDI : . .. : :.. : ... : : :: :: .:: :. . : .::.::.: NP_001 STGHATPLHVTSPSSASTGDT-----TPLPVTD-TYSAST---GQATPLPVTDTSSAST- 1920 1930 1940 1950 1960 690 700 710 720 730 pF1KA1 VESSTSYIKISNSSHSEYSSFFHAQT-ERSNISSYDGEYAQP-STESP----VLHTSNLP ..:. . ....: . : :: .: :: . .: : . :: . ::. :: NP_001 --GDTTPLPVTDTSSA---STGHATPLPVTNTSSVSTGHATPLHVTSPSSASTGHTTPLP 1970 1980 1990 2000 2010 2020 740 750 760 770 780 pF1KA1 -SYTPTINMPN-TSV-VLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLP-----SVSQSHH . . ... . ::. : :... :.. ..: . ::.::: ::: ::: .: NP_001 VTDASSVSTGHATSLPVTDASSVFTGHATSLPVTIPSSASSGHTTPLPVTDASSVSTGH- 2030 2040 2050 2060 2070 2080 790 800 810 820 830 pF1KA1 LFSSILPSTRAS-VHLLKST----SDASTPWSSSPSPLPVSLTTSTSA----PLSVSQTT .. :: : :: : ..: .:::. .. .::::. :.:.:. :: ... . NP_001 --ATSLPVTDASSVSTGHATPLPVTDASSVSTGHATPLPVTDTSSVSTGHATPLPLTSLS 2090 2100 2110 2120 2130 2140 840 850 860 870 880 890 pF1KA1 LPQSSSTPVLPRARETPVTSFQTSTM--TSFMTMLHSSQT----ADLKSQSTPHQEKV-I ....: :: . . ... :.. . ::. .. .. : .: .: :: : .. . NP_001 SVSTGDTTPLPVTDTSSASTGQATPLPVTSLSSVSTGDTTPLPVTDTSSASTGHATSLPV 2150 2160 2170 2180 2190 2200 900 910 920 930 940 pF1KA1 TESKSPSL---VSLPTESTKAVTTNSPLPPSLTESSTEQT-----LPATSTNLAQMSPTF :...: : . :: .:....:. : .:..:. .: ::.:.:. :... . NP_001 TDTSSASTGHATPLPDTDTSSASTGHATPLPVTDTSSASTGHATLLPVTDTSSASIGHAT 2210 2220 2230 2240 2250 2260 950 960 970 980 990 pF1KA1 TTTILKTSQ--PLMTTPGTLSSTASLVTG---PIAVQTTAGKQLSLTHP-EILVPQISTE . ::. .:: ..: .: :: :. : :.. . . ..: .. :. .. NP_001 PLPVTDTSSISTGHATPLHVTSPSSASTGHATPLPVTDTSSASTGHANPLHVTSPSSAST 2270 2280 2290 2300 2310 2320 1000 1010 1020 1030 1040 1050 pF1KA1 GGISTERNRVIVDATTGL---IPLTSVPTSAKEMTTKLGVTAEYSPASRSLG-TSPSP-- : . .:.:: .:.::. . . :: : :: ::.: : : :.: : NP_001 GHATPLPVTDTSSASTGHATPLPVTSLSSVSTGDTTPLPVT---SPSSASTGHTTPLPVT 2330 2340 2350 2360 2370 1060 1070 1080 1090 1100 1110 pF1KA1 QTTVVSTAEDLA-PKSATFAVQSSTQSPTTVSSSASVNSCAVNPCLHNGECVADNTSRGY .:. .::.. : : ..: ..... .: :....:... ..: NP_001 DTSSASTGQATALPVTSTSSASTGDTTPLPVTDTSSASTGQATPLPVTSLSSVSTGDTTP 2380 2390 2400 2410 2420 2430 1120 1130 1140 1150 1160 1170 pF1KA1 HCRCPPSWQGDDCSVDVNECLSNPCPSTAMCNNTQGSFICKCPVGYQLEKGICNLVRTFV NP_001 LPVTSPSSASTGHATPLLVTDASSASTGQATPLPVTDTSSAYTGDTTSLPVTDTSSSSTG 2440 2450 2460 2470 2480 2490 >>XP_011514552 (OMIM: 158371) PREDICTED: mucin-3A isofor (3076 aa) initn: 198 init1: 109 opt: 372 Z-score: 191.9 bits: 49.2 E(85289): 0.0006 Smith-Waterman score: 513; 22.5% identity (52.1% similar) in 1074 aa overlap (77-1093:670-1681) 50 60 70 80 90 100 pF1KA1 PLAGAGLELQLERRPEREPPPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRA-----P .:: :: .. :. . :: . : XP_011 STNTVTSMTTTTSPPTTTNSFTSLTSMPLSSTPVPSTEVVTSGTINTIPPSILVTTLPTP 640 650 660 670 680 690 110 120 130 140 150 160 pF1KA1 RGGSADAAWKHWPESNTEAHVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENL ..: .. .:.: : ... : .. .:: . :: .:. : XP_011 NASSMTTSETTYPNSPTGPGTNSTTEITYPTTMTETSSTATSLPPTSPLVSTAKTAKTPT 700 710 720 730 740 750 170 180 190 200 210 pF1KA1 TLLAETADARGRSGSSSRTNFTILPVGYSLE--IATALTSQSGNLASESLHLPSSSSEFD : :. :. .. : : :.:: : :: .::.:: .:.. :: . XP_011 TNLVTTTT---KTTSHSTTSFTSSTV-YSTASTYTTAITSVPTTLGTMVTSTSMISSTVS 760 770 780 790 800 810 220 230 240 250 260 270 pF1KA1 ERIAAFQTKSGTASEMGTERAM----GLSEEWIVHSQEATTSAWSPSFLPALEMGELTTP : . : . : : .: .. :. . : .. : .. :: :... :.. XP_011 TGIPTSQPTTITPSSVGISGSLPMMTDLTSVYTVSNMSARPTTVIPSS-PTVQNTEISIS 820 830 840 850 860 870 280 290 300 310 320 pF1KA1 ----SRKRNSSGPDLSWLHFYRTAA---SSPLL-DLSSS-SESTEKLNNSTGLQSSSVSQ : :.:: .. . : . : :. ..::: :::. ... .. :: . XP_011 VSMTSATTPSGGPTFTSTENTPTRSLLTSFPMTHSFSSSMSESSAGTTHTESI-SSPRGT 880 890 900 910 920 930 330 340 350 360 370 pF1KA1 TKTMHVATVFTDGGPRTLRSLTVS--LGPVSKT-----EG---FPKDSRIATTSSSVLLS :.:.:. :: . .: : :.:.: . : :.: .: :: : :: .. :. XP_011 TSTLHT-TVESTPSPTTTTSFTTSTMMEPPSSTVSTTGRGQTTFP--SSTATFPETTTLT 940 950 960 970 980 990 380 390 400 410 420 430 pF1KA1 PSAVESRRN--SRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTFGEHQLASSSEVQNG :.. : . . .:. : : :.. .::.: . :: . .: . .. XP_011 PTTDISTVSLTTAMTSPPPVSSSITPTNT----MTSMRTTTYWPTATNTLSPLTSSILSS 1000 1010 1020 1030 1040 440 450 460 470 480 490 pF1KA1 SPMSQTETVSRSVAPMRGGEITAHWLLTNSTTSADVTGSSASYPEGVNASVLTQFSDSTV .:. .:: .. .. . :::. : :. . : ..:: .: . ::::. XP_011 TPVPSTEMITSHTTNTTPLSTLVTTLLTTITRSTPT--SETTYP----TSPTSIVSDSTT 1050 1060 1070 1080 1090 1100 500 510 520 530 540 550 pF1KA1 QSGGSHTALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQALGDSSANAEDRTS . : . : : . . .:: : : : .:. : .: .. :. . .. XP_011 EITYSTSITGTLSTATTLPPTSS-----SLPTTETATM----TPTTTLITTTPNTTSLST 1110 1120 1130 1140 1150 560 570 580 590 600 610 pF1KA1 GVPSLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPAAAMHQETEGASLHVNVTD ::. . :. ...... .. :.. :. .: :.. . : .. : ... . XP_011 --PSFTSSTIYSTVSTSTTAISSASPTSGTMVTSTTMTPSSLSTDTPSTTPTTITYPSVG 1160 1170 1180 1190 1200 620 630 640 650 660 670 pF1KA1 DMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYL---SSTFTKGERALLS . :... . .:.. :. : . . ..: . : ..:. . : .:. : . : .. XP_011 STGFLTTATDLTSTFTVS--SSSAMSTSVIPSSPSIQNTETSSLVSMTSATTPSLRPTIT 1210 1220 1230 1240 1250 1260 680 690 700 710 720 730 pF1KA1 ITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYAQPSTESPVLHT ::.. .:... . : ..:.: . .. :..: ::: :.. . . :: XP_011 STDSTLTSSLLTTFPSTYSFSSSMSASSAGTTHTET----ISSL------PASTNTI-HT 1270 1280 1290 1300 1310 740 750 760 770 780 790 pF1KA1 SNLPSYTPTINMPNTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLPSVSQSHHLFSS . . .:: : . :... . :.. .... .:: . . .. XP_011 TAESALAPT-----------TTTSFTTSPTMEPPSTTVATTGTGQTTFPSSTATFLETTT 1320 1330 1340 1350 1360 800 810 820 830 840 pF1KA1 ILPSTRASVHLLKSTSDASTPWSSSPSPLPV--SLTTSTSAPLSVSQTTLPQSSS----T . :.: :.. : .. .. : .:: .: . :. :.:: : ....: : .:: : XP_011 LTPTTDFSTESLTTAMTSTPPITSSITPTDTMTSMRTTTSWP-TATNTLSPLTSSILSST 1370 1380 1390 1400 1410 1420 850 860 870 880 890 900 pF1KA1 PVLPRARETPVTSFQTSTMTSFMTMLHSSQT-ADLKSQSTPHQEKVITESKSPSLVSLPT :: : .. : . .:. .....: : . : . : :... . . : ..: . .. :: XP_011 PV-PSTEVTTSHTTNTNPVSTLVTTLPITITRSTLTSETAYPSSPTSTVTESTTEITYPT 1430 1440 1450 1460 1470 1480 910 920 930 940 950 pF1KA1 ESTKAVTTNSPLPPSLTESSTEQTLPATSTNL--------AQMSPTFTT-TILKT-SQPL :.. .: . :::. . :: .: . .::: .. . .::. :: .: : : XP_011 TMTETSSTATSLPPTSSLVSTAETAKTPTTNLVTTTTKTTSHSTTSFTSSTIYSTASTPT 1490 1500 1510 1520 1530 1540 960 970 980 990 1000 1010 pF1KA1 MTTPGTLSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQ-ISTEGGIS--TERNRVIVDA . .. .. ...::. . .:.. . ..: ..:. .. :.. :. . : . . XP_011 TAITSVPTTLGTMVTSTSMIPSTVSTGIPTSQPTTITPSSVGISGSLPMMTDLTSVYTVS 1550 1560 1570 1580 1590 1600 1020 1030 1040 1050 1060 pF1KA1 TTGLIPLTSVPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQTTVVSTAEDLAPKS--ATF . . : . .:.: ..:. .. . . : :.:: : .:: :. .: ..: XP_011 SMSARPTSVIPSSPTVQNTETSIFVSMMSA-----TTPSGGPTFTST-ENTPTRSLLTSF 1610 1620 1630 1640 1650 1070 1080 1090 1100 1110 1120 pF1KA1 AVQSSTQSPTTVSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNE : : .: ..:: ..... ... XP_011 PVTHSFSSSMSASSVGTTHTQSISSPPAITSTLHTTAESTPSPTTTMSFTTFTKMETPSS 1660 1670 1680 1690 1700 1710 >>XP_016867720 (OMIM: 158371) PREDICTED: mucin-3A isofor (3143 aa) initn: 198 init1: 109 opt: 372 Z-score: 191.8 bits: 49.2 E(85289): 0.00061 Smith-Waterman score: 513; 22.5% identity (52.1% similar) in 1074 aa overlap (77-1093:670-1681) 50 60 70 80 90 100 pF1KA1 PLAGAGLELQLERRPEREPPPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRA-----P .:: :: .. :. . :: . : XP_016 STNTVTSMTTTTSPPTTTNSFTSLTSMPLSSTPVPSTEVVTSGTINTIPPSILVTTLPTP 640 650 660 670 680 690 110 120 130 140 150 160 pF1KA1 RGGSADAAWKHWPESNTEAHVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENL ..: .. .:.: : ... : .. .:: . :: .:. : XP_016 NASSMTTSETTYPNSPTGPGTNSTTEITYPTTMTETSSTATSLPPTSPLVSTAKTAKTPT 700 710 720 730 740 750 170 180 190 200 210 pF1KA1 TLLAETADARGRSGSSSRTNFTILPVGYSLE--IATALTSQSGNLASESLHLPSSSSEFD : :. :. .. : : :.:: : :: .::.:: .:.. :: . XP_016 TNLVTTTT---KTTSHSTTSFTSSTV-YSTASTYTTAITSVPTTLGTMVTSTSMISSTVS 760 770 780 790 800 810 220 230 240 250 260 270 pF1KA1 ERIAAFQTKSGTASEMGTERAM----GLSEEWIVHSQEATTSAWSPSFLPALEMGELTTP : . : . : : .: .. :. . : .. : .. :: :... :.. XP_016 TGIPTSQPTTITPSSVGISGSLPMMTDLTSVYTVSNMSARPTTVIPSS-PTVQNTEISIS 820 830 840 850 860 870 280 290 300 310 320 pF1KA1 ----SRKRNSSGPDLSWLHFYRTAA---SSPLL-DLSSS-SESTEKLNNSTGLQSSSVSQ : :.:: .. . : . : :. ..::: :::. ... .. :: . XP_016 VSMTSATTPSGGPTFTSTENTPTRSLLTSFPMTHSFSSSMSESSAGTTHTESI-SSPRGT 880 890 900 910 920 930 330 340 350 360 370 pF1KA1 TKTMHVATVFTDGGPRTLRSLTVS--LGPVSKT-----EG---FPKDSRIATTSSSVLLS :.:.:. :: . .: : :.:.: . : :.: .: :: : :: .. :. XP_016 TSTLHT-TVESTPSPTTTTSFTTSTMMEPPSSTVSTTGRGQTTFP--SSTATFPETTTLT 940 950 960 970 980 990 380 390 400 410 420 430 pF1KA1 PSAVESRRN--SRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTFGEHQLASSSEVQNG :.. : . . .:. : : :.. .::.: . :: . .: . .. XP_016 PTTDISTVSLTTAMTSPPPVSSSITPTNT----MTSMRTTTYWPTATNTLSPLTSSILSS 1000 1010 1020 1030 1040 440 450 460 470 480 490 pF1KA1 SPMSQTETVSRSVAPMRGGEITAHWLLTNSTTSADVTGSSASYPEGVNASVLTQFSDSTV .:. .:: .. .. . :::. : :. . : ..:: .: . ::::. XP_016 TPVPSTEMITSHTTNTTPLSTLVTTLLTTITRSTPT--SETTYP----TSPTSIVSDSTT 1050 1060 1070 1080 1090 1100 500 510 520 530 540 550 pF1KA1 QSGGSHTALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQALGDSSANAEDRTS . : . : : . . .:: : : : .:. : .: .. :. . .. XP_016 EITYSTSITGTLSTATTLPPTSS-----SLPTTETATM----TPTTTLITTTPNTTSLST 1110 1120 1130 1140 1150 560 570 580 590 600 610 pF1KA1 GVPSLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPAAAMHQETEGASLHVNVTD ::. . :. ...... .. :.. :. .: :.. . : .. : ... . XP_016 --PSFTSSTIYSTVSTSTTAISSASPTSGTMVTSTTMTPSSLSTDTPSTTPTTITYPSVG 1160 1170 1180 1190 1200 620 630 640 650 660 670 pF1KA1 DMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYL---SSTFTKGERALLS . :... . .:.. :. : . . ..: . : ..:. . : .:. : . : .. XP_016 STGFLTTATDLTSTFTVS--SSSAMSTSVIPSSPSIQNTETSSLVSMTSATTPSLRPTIT 1210 1220 1230 1240 1250 1260 680 690 700 710 720 730 pF1KA1 ITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYAQPSTESPVLHT ::.. .:... . : ..:.: . .. :..: ::: :.. . . :: XP_016 STDSTLTSSLLTTFPSTYSFSSSMSASSAGTTHTET----ISSL------PASTNTI-HT 1270 1280 1290 1300 1310 740 750 760 770 780 790 pF1KA1 SNLPSYTPTINMPNTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLPSVSQSHHLFSS . . .:: : . :... . :.. .... .:: . . .. XP_016 TAESALAPT-----------TTTSFTTSPTMEPPSTTVATTGTGQTTFPSSTATFLETTT 1320 1330 1340 1350 1360 800 810 820 830 840 pF1KA1 ILPSTRASVHLLKSTSDASTPWSSSPSPLPV--SLTTSTSAPLSVSQTTLPQSSS----T . :.: :.. : .. .. : .:: .: . :. :.:: : ....: : .:: : XP_016 LTPTTDFSTESLTTAMTSTPPITSSITPTDTMTSMRTTTSWP-TATNTLSPLTSSILSST 1370 1380 1390 1400 1410 1420 850 860 870 880 890 900 pF1KA1 PVLPRARETPVTSFQTSTMTSFMTMLHSSQT-ADLKSQSTPHQEKVITESKSPSLVSLPT :: : .. : . .:. .....: : . : . : :... . . : ..: . .. :: XP_016 PV-PSTEVTTSHTTNTNPVSTLVTTLPITITRSTLTSETAYPSSPTSTVTESTTEITYPT 1430 1440 1450 1460 1470 1480 910 920 930 940 950 pF1KA1 ESTKAVTTNSPLPPSLTESSTEQTLPATSTNL--------AQMSPTFTT-TILKT-SQPL :.. .: . :::. . :: .: . .::: .. . .::. :: .: : : XP_016 TMTETSSTATSLPPTSSLVSTAETAKTPTTNLVTTTTKTTSHSTTSFTSSTIYSTASTPT 1490 1500 1510 1520 1530 1540 960 970 980 990 1000 1010 pF1KA1 MTTPGTLSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQ-ISTEGGIS--TERNRVIVDA . .. .. ...::. . .:.. . ..: ..:. .. :.. :. . : . . XP_016 TAITSVPTTLGTMVTSTSMIPSTVSTGIPTSQPTTITPSSVGISGSLPMMTDLTSVYTVS 1550 1560 1570 1580 1590 1600 1020 1030 1040 1050 1060 pF1KA1 TTGLIPLTSVPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQTTVVSTAEDLAPKS--ATF . . : . .:.: ..:. .. . . : :.:: : .:: :. .: ..: XP_016 SMSARPTSVIPSSPTVQNTETSIFVSMMSA-----TTPSGGPTFTST-ENTPTRSLLTSF 1610 1620 1630 1640 1650 1070 1080 1090 1100 1110 1120 pF1KA1 AVQSSTQSPTTVSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNE : : .: ..:: ..... ... XP_016 PVTHSFSSSMSASSVGTTHTQSISSPPAITSTLHTTAESTPSPTTTMSFTTFTKMETPSS 1660 1670 1680 1690 1700 1710 >>XP_011514551 (OMIM: 158371) PREDICTED: mucin-3A isofor (3245 aa) initn: 198 init1: 109 opt: 372 Z-score: 191.6 bits: 49.2 E(85289): 0.00062 Smith-Waterman score: 513; 22.5% identity (52.1% similar) in 1074 aa overlap (77-1093:670-1681) 50 60 70 80 90 100 pF1KA1 PLAGAGLELQLERRPEREPPPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRA-----P .:: :: .. :. . :: . : XP_011 STNTVTSMTTTTSPPTTTNSFTSLTSMPLSSTPVPSTEVVTSGTINTIPPSILVTTLPTP 640 650 660 670 680 690 110 120 130 140 150 160 pF1KA1 RGGSADAAWKHWPESNTEAHVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENL ..: .. .:.: : ... : .. .:: . :: .:. : XP_011 NASSMTTSETTYPNSPTGPGTNSTTEITYPTTMTETSSTATSLPPTSPLVSTAKTAKTPT 700 710 720 730 740 750 170 180 190 200 210 pF1KA1 TLLAETADARGRSGSSSRTNFTILPVGYSLE--IATALTSQSGNLASESLHLPSSSSEFD : :. :. .. : : :.:: : :: .::.:: .:.. :: . XP_011 TNLVTTTT---KTTSHSTTSFTSSTV-YSTASTYTTAITSVPTTLGTMVTSTSMISSTVS 760 770 780 790 800 810 220 230 240 250 260 270 pF1KA1 ERIAAFQTKSGTASEMGTERAM----GLSEEWIVHSQEATTSAWSPSFLPALEMGELTTP : . : . : : .: .. :. . : .. : .. :: :... :.. XP_011 TGIPTSQPTTITPSSVGISGSLPMMTDLTSVYTVSNMSARPTTVIPSS-PTVQNTEISIS 820 830 840 850 860 870 280 290 300 310 320 pF1KA1 ----SRKRNSSGPDLSWLHFYRTAA---SSPLL-DLSSS-SESTEKLNNSTGLQSSSVSQ : :.:: .. . : . : :. ..::: :::. ... .. :: . XP_011 VSMTSATTPSGGPTFTSTENTPTRSLLTSFPMTHSFSSSMSESSAGTTHTESI-SSPRGT 880 890 900 910 920 930 330 340 350 360 370 pF1KA1 TKTMHVATVFTDGGPRTLRSLTVS--LGPVSKT-----EG---FPKDSRIATTSSSVLLS :.:.:. :: . .: : :.:.: . : :.: .: :: : :: .. :. XP_011 TSTLHT-TVESTPSPTTTTSFTTSTMMEPPSSTVSTTGRGQTTFP--SSTATFPETTTLT 940 950 960 970 980 990 380 390 400 410 420 430 pF1KA1 PSAVESRRN--SRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTFGEHQLASSSEVQNG :.. : . . .:. : : :.. .::.: . :: . .: . .. XP_011 PTTDISTVSLTTAMTSPPPVSSSITPTNT----MTSMRTTTYWPTATNTLSPLTSSILSS 1000 1010 1020 1030 1040 440 450 460 470 480 490 pF1KA1 SPMSQTETVSRSVAPMRGGEITAHWLLTNSTTSADVTGSSASYPEGVNASVLTQFSDSTV .:. .:: .. .. . :::. : :. . : ..:: .: . ::::. XP_011 TPVPSTEMITSHTTNTTPLSTLVTTLLTTITRSTPT--SETTYP----TSPTSIVSDSTT 1050 1060 1070 1080 1090 1100 500 510 520 530 540 550 pF1KA1 QSGGSHTALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQALGDSSANAEDRTS . : . : : . . .:: : : : .:. : .: .. :. . .. XP_011 EITYSTSITGTLSTATTLPPTSS-----SLPTTETATM----TPTTTLITTTPNTTSLST 1110 1120 1130 1140 1150 560 570 580 590 600 610 pF1KA1 GVPSLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPAAAMHQETEGASLHVNVTD ::. . :. ...... .. :.. :. .: :.. . : .. : ... . XP_011 --PSFTSSTIYSTVSTSTTAISSASPTSGTMVTSTTMTPSSLSTDTPSTTPTTITYPSVG 1160 1170 1180 1190 1200 620 630 640 650 660 670 pF1KA1 DMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYL---SSTFTKGERALLS . :... . .:.. :. : . . ..: . : ..:. . : .:. : . : .. XP_011 STGFLTTATDLTSTFTVS--SSSAMSTSVIPSSPSIQNTETSSLVSMTSATTPSLRPTIT 1210 1220 1230 1240 1250 1260 680 690 700 710 720 730 pF1KA1 ITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYAQPSTESPVLHT ::.. .:... . : ..:.: . .. :..: ::: :.. . . :: XP_011 STDSTLTSSLLTTFPSTYSFSSSMSASSAGTTHTET----ISSL------PASTNTI-HT 1270 1280 1290 1300 1310 740 750 760 770 780 790 pF1KA1 SNLPSYTPTINMPNTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLPSVSQSHHLFSS . . .:: : . :... . :.. .... .:: . . .. XP_011 TAESALAPT-----------TTTSFTTSPTMEPPSTTVATTGTGQTTFPSSTATFLETTT 1320 1330 1340 1350 1360 800 810 820 830 840 pF1KA1 ILPSTRASVHLLKSTSDASTPWSSSPSPLPV--SLTTSTSAPLSVSQTTLPQSSS----T . :.: :.. : .. .. : .:: .: . :. :.:: : ....: : .:: : XP_011 LTPTTDFSTESLTTAMTSTPPITSSITPTDTMTSMRTTTSWP-TATNTLSPLTSSILSST 1370 1380 1390 1400 1410 1420 850 860 870 880 890 900 pF1KA1 PVLPRARETPVTSFQTSTMTSFMTMLHSSQT-ADLKSQSTPHQEKVITESKSPSLVSLPT :: : .. : . .:. .....: : . : . : :... . . : ..: . .. :: XP_011 PV-PSTEVTTSHTTNTNPVSTLVTTLPITITRSTLTSETAYPSSPTSTVTESTTEITYPT 1430 1440 1450 1460 1470 1480 910 920 930 940 950 pF1KA1 ESTKAVTTNSPLPPSLTESSTEQTLPATSTNL--------AQMSPTFTT-TILKT-SQPL :.. .: . :::. . :: .: . .::: .. . .::. :: .: : : XP_011 TMTETSSTATSLPPTSSLVSTAETAKTPTTNLVTTTTKTTSHSTTSFTSSTIYSTASTPT 1490 1500 1510 1520 1530 1540 960 970 980 990 1000 1010 pF1KA1 MTTPGTLSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQ-ISTEGGIS--TERNRVIVDA . .. .. ...::. . .:.. . ..: ..:. .. :.. :. . : . . XP_011 TAITSVPTTLGTMVTSTSMIPSTVSTGIPTSQPTTITPSSVGISGSLPMMTDLTSVYTVS 1550 1560 1570 1580 1590 1600 1020 1030 1040 1050 1060 pF1KA1 TTGLIPLTSVPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQTTVVSTAEDLAPKS--ATF . . : . .:.: ..:. .. . . : :.:: : .:: :. .: ..: XP_011 SMSARPTSVIPSSPTVQNTETSIFVSMMSA-----TTPSGGPTFTST-ENTPTRSLLTSF 1610 1620 1630 1640 1650 1070 1080 1090 1100 1110 1120 pF1KA1 AVQSSTQSPTTVSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNE : : .: ..:: ..... ... XP_011 PVTHSFSSSMSASSVGTTHTQSISSPPAITSTLHTTAESTPSPTTTMSFTTFTKMETPSS 1660 1670 1680 1690 1700 1710 >>XP_006720482 (OMIM: 155760,165800,608361,612813) PREDI (2568 aa) initn: 257 init1: 170 opt: 369 Z-score: 191.6 bits: 48.9 E(85289): 0.00062 Smith-Waterman score: 473; 24.2% identity (50.0% similar) in 1230 aa overlap (18-1165:1185-2353) 10 20 30 40 pF1KA1 MASPRASRWPPPLLLLLLPLLLLMPPAAPGTRDPPPSPARRALSLAP :: .. ::::..: :. ..: XP_006 TAAPGVEDISGLPSGEVLETAAPGVEDISGLPSGEVLETAAPGVEDISGLPSGEVLE--- 1160 1170 1180 1190 1200 1210 50 60 70 80 90 pF1KA1 LAGAGLELQLERRPEREPPPT--PPRERRGPATPGPSYRAPEPGAATQRG-PSGR----- :. :.: .. : : : : : . : .. ::. : :::. XP_006 TAAPGVE-DISGLPSGEVLETAAPGVEDISGLPSGEVLETAAPGVEDISGLPSGEVLETA 1220 1230 1240 1250 1260 1270 100 110 120 130 140 150 pF1KA1 APRGGSADAAWKHWPESNTEAH--VENITFYQNQEDFSTVSSK-EGVMVQTSGKS-HAAS :: : : . : : ::.:. . : . :.. : . ::. ..:. XP_006 AP--GVEDISGLPSGEVLETAAPGVEDISGLPSGEVLETAAPGVEDISGLPSGEVLETAA 1280 1290 1300 1310 1320 160 170 180 190 200 210 pF1KA1 DAPENLTLLAETADARGRSGSSSRTNFTILPVGYSLEIAT-ALTSQSGNLASESLHLPSS . :... : . .... . ... :: : :: :. .. . :: ..: :. . XP_006 PGVEDISGL--PSGEVLETAAPGVEDISGLPSGEVLETAAPGVEDISGLPSGEVLETAAP 1330 1340 1350 1360 1370 1380 220 230 240 250 260 270 pF1KA1 SSEFDERIAAFQTKSGTASEMGTERAMGLSEEWIVHSQEATTSAWSPSFLPALEMGELTT . : . . .. :: :.:. :: .... .. : ::. :. : :. XP_006 GVEDISGLPSGEVLETTAP--GVEEISGLPSGEVLETTAPGVDEISG--LPSGEVLETTA 1390 1400 1410 1420 1430 1440 280 290 300 310 320 330 pF1KA1 PSRKRNSSGPDLSWLHFYRTAASSPLLDLSSSSE----STEKLNNSTGLQSSSVSQTKTM :. .. :. :. :. :.: . : : :..: :. ... .:: :. : .:.. XP_006 PGVEEISGLPSGEVLET-STSAVGDLSGLPSGGEVLEISVSGVEDISGLPSGEVVETSA- 1450 1460 1470 1480 1490 1500 340 350 360 370 380 390 pF1KA1 HVATVFTDGGPRTLRSLTVSLGPVSKTEGFPKDSRIATTSSSVLLSPSAVESRRNSRVTG .: . . : . : ... : ::. . . .: :. . ..: XP_006 --------SGIEDVSELPSGEGLETSASGVEDLSRLPSGEEVLEISASGF-----GDLSG 1510 1520 1530 1540 400 410 420 430 440 pF1KA1 NPGDEEFIEPSTENEFG--LTSLRWQNDSPTFGEHQLASSSEVQNGSPMSQTETVSRSVA :. : .: :. .: : :..: : : . ::..: .: : .. . :. . . XP_006 LPSGGEGLETSA-SEVGTDLSGL----PSGREGLETSASGAEDLSGLPSGKEDLVGSASG 1550 1560 1570 1580 1590 1600 450 460 470 480 490 500 pF1KA1 PMRGGEITAHWLLTNST--TSADVTGSSASYPEGVN-----ASVLTQFSDSTVQSGGSHT . :.. . : .... ::. .: :. : ::. : : .:: . :: . XP_006 DLDLGKLPSGTLGSGQAPETSGLPSGFSGEYS-GVDLGSGPPSGLPDFSG--LPSGFPTV 1610 1620 1630 1640 1650 510 520 530 540 550 560 pF1KA1 ALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQALGDSSANAEDRTSGVPSLGT .: : . : ..:.. :.. . : .. : : :.. : :. :.::.:: :: XP_006 SLVDSTLVEVVTASTASELEGRGTIGISGAGEISGLPSSELDISG-----RASGLPS-GT 1660 1670 1680 1690 1700 1710 570 580 590 600 pF1KA1 HTLATVTGNGERT-----LRSVTLTNTSMSTTSGE-----------AGSPAAAMHQE--T . . ..:. . . : .:. ... :::: .:.:. . . XP_006 ELSGQASGSPDVSGEIPGLFGVSGQPSGFPDTSGETSGVTELSGLSSGQPGISGEASGVL 1720 1730 1740 1750 1760 1770 610 620 630 640 650 pF1KA1 EGASLHVNVTDDMGLVSR----SLAASSALGVAGISYG---QVRGTAIEQRTSSD----H :.: ..:: : .: : :. : .: . : : ::. . :: XP_006 YGTSQPFGITDLSGETSGVPDLSGQPSGLPGFSGATSGVPDLVSGTTSGSGESSGITFVD 1780 1790 1800 1810 1820 1830 660 670 680 690 700 pF1KA1 TDHTYLSSTFTKGERALLSITDNSSSSDIVESS--TSYIKISNS-SHSEYSSFFHAQT-E :. . .. : : :..: :. .. : .. : .... .:.. : . :: : .:: : XP_006 TSLVEVAPTTFKEEEGLGSVELSGLPSGEADLSGKSGMVDVSGQFSGTVDSSGFTSQTPE 1840 1850 1860 1870 1880 1890 710 720 730 740 750 760 pF1KA1 RSNISSYDGEYAQPSTESPVLHTSNLPS--Y----TPTINMPNTSVVLDTDAEFVSDSSS :.. : .: . :... . :.::: : ::. ..:..:.: : .: :... . XP_006 FSGLPSGIAEVSGESSRAEI--GSSLPSGAYYGSGTPS-SFPTVSLVDRTLVESVTQAPT 1900 1910 1920 1930 1940 1950 770 780 790 800 810 pF1KA1 SSSSSSSSSS----SGPPLPLPSVSQSHHLFSSILPSTRASVHLLKSTSDASTPWSSSP- .. .. . :. :: :..: : : .. : : . : .::. :. XP_006 AQEAGEGPSGILELSGAHSGAPDMSGEHSGFLDL--SGLQSGLIEPSGEPPGTPYFSGDF 1960 1970 1980 1990 2000 820 830 840 850 860 870 pF1KA1 -SPLPVSLTTSTSAPLSVSQTTLPQSS--STPVLPRARETPVTSF--QTSTMTSFMTMLH : :: .:.. : . ::. . .. . . : ... : .: ... XP_006 ASTTNVSGESSVAMGTSGEASGLPEVTLITSEFVEGVTEPTISQELGQRPPVTHTPQLFE 2010 2020 2030 2040 2050 2060 880 890 900 910 920 pF1KA1 SS---QTADLKSQSTPHQEKVITESKS-PSLVSLPTESTKAVTTNSPLPPSLTESSTEQT :: .:: : .:: .: .: : : . .: : : . :.: XP_006 SSGKVSTAGDISGATPVLPGSGVEVSSVPESSSETSAYPEAGFGASAAPEASREDSGSPD 2070 2080 2090 2100 2110 2120 930 940 950 960 970 980 pF1KA1 LPATSTNLAQMSPTFTTTILKTSQPLMTTPGTLSSTASLVTGPIAVQTTAGKQLSLTHPE : :.. . . . .. . ... : : .:.: :.: .. . .: :. XP_006 LSETTSAFHEANLERSSGLGVSGSTLTFQEGE-ASAAPEVSGESTTTSDVG-----TEAP 2130 2140 2150 2160 2170 2180 990 1000 1010 1020 1030 1040 pF1KA1 ILVPQISTEGGISTERNRVIVDATT--GLIPLTSVPTSAKEMTTKLGVTAEYSPASRSLG : : .: :: . . :. :.. ::.: : . :. . .. : :: XP_006 GLPSATPTASGDRTEISGDLSGHTSQLGVVISTSIPESEWTQQTQRPAETHLEIESSSLL 2190 2200 2210 2220 2230 2240 1050 1060 1070 1080 1090 1100 pF1KA1 TSPSPQTTVVSTAEDLAPKSATFAVQSSTQSPTTVSSSASVNSCAVNPCLHNGECVADNT : . .: .: :: .: .:.. .. . . ...: . ::: .:: : : . XP_006 YS-GEETHTVETA--TSPTDASIPASPEWKRESESTAAAPARSCAEEPC-GAGTC---KE 2250 2260 2270 2280 2290 1110 1120 1130 1140 1150 1160 pF1KA1 SRGYH-CRCPPSWQGDDCSVDVNECLSNPCPSTAMCNNTQGSFICKCPVGYQLEKGICNL ..:. : :::.. :. :..:..::::.:: . : : .. :: : : .: : .:.. XP_006 TEGHVICLCPPGYTGEHCNIDIDECLSSPCLNGATCVDAIDSFTCLCLPSY--EGDLCEI 2300 2310 2320 2330 2340 2350 1170 1180 1190 1200 1210 1220 pF1KA1 VRTFVTEFKLKRTFLNTTVEKHSDLQEVENEITKTLNMCFSALPSYIRSTVHASRESNAV XP_006 DQEVCEEGWNKYQGHCYRHFPDRETWVDAERRCREQQSHLSSIVTPEEQEFVNNNAQDYQ 2360 2370 2380 2390 2400 2410 1482 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 20:49:25 2016 done: Wed Nov 2 20:49:27 2016 Total Scan time: 16.240 Total Display time: 0.670 Function used was FASTA [36.3.4 Apr, 2011]