FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3496, 1970 aa 1>>>pF1KE3496 1970 - 1970 aa - 1970 aa Library: /omim/omim.rfq.tfa 64092750 residues in 91774 sequences Statistics: Expectation_n fit: rho(ln(x))= 19.6099+/-0.000698; mu= -39.3276+/- 0.044 mean_var=1222.3770+/-260.197, 0's: 0 Z-trim(119.1): 332 B-trim: 0 in 0/58 Lambda= 0.036684 statistics sampled from 33615 (33933) to 33615 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.645), E-opt: 0.2 (0.37), width: 16 Scan time: 10.610 The best scores are: opt bits E(91774) NP_000928 (OMIM: 180660) DNA-directed RNA polymera (1970) 13279 721.1 2.9e-206 NP_008986 (OMIM: 264090,607694,614258) DNA-directe (1390) 1364 90.4 1.5e-16 XP_011521400 (OMIM: 164010,614961) charged multive ( 408) 977 69.4 9.3e-11 NP_001352825 (OMIM: 601234) nascent polypeptide-as (2078) 746 57.9 1.4e-06 NP_002448 (OMIM: 158370) mucin-2 precursor [Homo s (5289) 741 58.0 3.4e-06 NP_775082 (OMIM: 602372) zonadhesin isoform 6 prec (2721) 684 54.7 1.7e-05 NP_003377 (OMIM: 602372) zonadhesin isoform 3 prec (2812) 684 54.7 1.7e-05 NP_056240 (OMIM: 616404,616462) DNA-directed RNA p (1720) 648 52.6 4.5e-05 NP_001291288 (OMIM: 158373) mucin-5AC precursor [H (5654) 552 48.0 0.0036 NP_009096 (OMIM: 600796) splicing factor 3A subuni ( 464) 495 44.0 0.0048 XP_011514857 (OMIM: 602372) zonadhesin isoform X2 (2498) 528 46.4 0.0048 NP_001138422 (OMIM: 618194) soluble scavenger rece (1573) 504 44.9 0.0084 XP_011537078 (OMIM: 147920,602113) histone-lysine (5525) 527 46.7 0.0089 XP_006719679 (OMIM: 147920,602113) histone-lysine (5536) 527 46.7 0.0089 XP_005269219 (OMIM: 147920,602113) histone-lysine (5537) 527 46.7 0.0089 NP_003473 (OMIM: 147920,602113) histone-lysine N-m (5537) 527 46.7 0.0089 XP_006719677 (OMIM: 147920,602113) histone-lysine (5540) 527 46.7 0.0089 XP_011537076 (OMIM: 147920,602113) histone-lysine (5549) 527 46.7 0.0089 XP_011537075 (OMIM: 147920,602113) histone-lysine (5552) 527 46.7 0.0089 XP_011537074 (OMIM: 147920,602113) histone-lysine (5553) 527 46.7 0.0089 XP_011537073 (OMIM: 147920,602113) histone-lysine (5555) 527 46.7 0.0089 XP_011537072 (OMIM: 147920,602113) histone-lysine (5556) 527 46.7 0.0089 >>NP_000928 (OMIM: 180660) DNA-directed RNA polymerase I (1970 aa) initn: 13279 init1: 13279 opt: 13279 Z-score: 3824.5 bits: 721.1 E(91774): 2.9e-206 Smith-Waterman score: 13279; 100.0% identity (100.0% similar) in 1970 aa overlap (1-1970:1-1970) 10 20 30 40 50 60 pF1KE3 MHGGGPPSGDSACPLRTIKRVQFGVLSPDELKRMSVTEGGIKYPETTEGGRPKLGGLMDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 MHGGGPPSGDSACPLRTIKRVQFGVLSPDELKRMSVTEGGIKYPETTEGGRPKLGGLMDP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 RQGVIERTGRCQTCAGNMTECPGHFGHIELAKPVFHVGFLVKTMKVLRCVCFFCSKLLVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 RQGVIERTGRCQTCAGNMTECPGHFGHIELAKPVFHVGFLVKTMKVLRCVCFFCSKLLVD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 SNNPKIKDILAKSKGQPKKRLTHVYDLCKGKNICEGGEEMDNKFGVEQPEGDEDLTKEKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 SNNPKIKDILAKSKGQPKKRLTHVYDLCKGKNICEGGEEMDNKFGVEQPEGDEDLTKEKG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 HGGCGRYQPRIRRSGLELYAEWKHVNEDSQEKKILLSPERVHEIFKRISDEECFVLGMEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 HGGCGRYQPRIRRSGLELYAEWKHVNEDSQEKKILLSPERVHEIFKRISDEECFVLGMEP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 RYARPEWMIVTVLPVPPLSVRPAVVMQGSARNQDDLTHKLADIVKINNQLRRNEQNGAAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 RYARPEWMIVTVLPVPPLSVRPAVVMQGSARNQDDLTHKLADIVKINNQLRRNEQNGAAA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 HVIAEDVKLLQFHVATMVDNELPGLPRAMQKSGRPLKSLKQRLKGKEGRVRGNLMGKRVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 HVIAEDVKLLQFHVATMVDNELPGLPRAMQKSGRPLKSLKQRLKGKEGRVRGNLMGKRVD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 FSARTVITPDPNLSIDQVGVPRSIAANMTFAEIVTPFNIDRLQELVRRGNSQYPGAKYII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 FSARTVITPDPNLSIDQVGVPRSIAANMTFAEIVTPFNIDRLQELVRRGNSQYPGAKYII 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 RDNGDRIDLRFHPKPSDLHLQTGYKVERHMCDGDIVIFNRQPTLHKMSMMGHRVRILPWS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 RDNGDRIDLRFHPKPSDLHLQTGYKVERHMCDGDIVIFNRQPTLHKMSMMGHRVRILPWS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 TFRLNLSVTTPYNADFDGDEMNLHLPQSLETRAEIQELAMVPRMIVTPQSNRPVMGIVQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 TFRLNLSVTTPYNADFDGDEMNLHLPQSLETRAEIQELAMVPRMIVTPQSNRPVMGIVQD 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 TLTAVRKFTKRDVFLERGEVMNLLMFLSTWDGKVPQPAILKPRPLWTGKQIFSLIIPGHI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 TLTAVRKFTKRDVFLERGEVMNLLMFLSTWDGKVPQPAILKPRPLWTGKQIFSLIIPGHI 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 NCIRTHSTHPDDEDSGPYKHISPGDTKVVVENGELIMGILCKKSLGTSAGSLVHISYLEM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 NCIRTHSTHPDDEDSGPYKHISPGDTKVVVENGELIMGILCKKSLGTSAGSLVHISYLEM 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE3 GHDITRLFYSNIQTVINNWLLIEGHTIGIGDSIADSKTYQDIQNTIKKAKQDVIEVIEKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 GHDITRLFYSNIQTVINNWLLIEGHTIGIGDSIADSKTYQDIQNTIKKAKQDVIEVIEKA 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE3 HNNELEPTPGNTLRQTFENQVNRILNDARDKTGSSAQKSLSEYNNFKSMVVSGAKGSKIN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 HNNELEPTPGNTLRQTFENQVNRILNDARDKTGSSAQKSLSEYNNFKSMVVSGAKGSKIN 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE3 ISQVIAVVGQQNVEGKRIPFGFKHRTLPHFIKDDYGPESRGFVENSYLAGLTPTEFFFHA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 ISQVIAVVGQQNVEGKRIPFGFKHRTLPHFIKDDYGPESRGFVENSYLAGLTPTEFFFHA 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE3 MGGREGLIDTAVKTAETGYIQRRLIKSMESVMVKYDATVRNSINQVVQLRYGEDGLAGES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 MGGREGLIDTAVKTAETGYIQRRLIKSMESVMVKYDATVRNSINQVVQLRYGEDGLAGES 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE3 VEFQNLATLKPSNKAFEKKFRFDYTNERALRRTLQEDLVKDVLSNAHIQNELEREFERMR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 VEFQNLATLKPSNKAFEKKFRFDYTNERALRRTLQEDLVKDVLSNAHIQNELEREFERMR 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE3 EDREVLRVIFPTGDSKVVLPCNLLRMIWNAQKIFHINPRLPSDLHPIKVVEGVKELSKKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 EDREVLRVIFPTGDSKVVLPCNLLRMIWNAQKIFHINPRLPSDLHPIKVVEGVKELSKKL 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE3 VIVNGDDPLSRQAQENATLLFNIHLRSTLCSRRMAEEFRLSGEAFDWLLGEIESKFNQAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 VIVNGDDPLSRQAQENATLLFNIHLRSTLCSRRMAEEFRLSGEAFDWLLGEIESKFNQAI 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE3 AHPGEMVGALAAQSLGEPATQMTLNTFHYAGVSAKNVTLGVPRLKELINISKKPKTPSLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 AHPGEMVGALAAQSLGEPATQMTLNTFHYAGVSAKNVTLGVPRLKELINISKKPKTPSLT 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE3 VFLLGQSARDAERAKDILCRLEHTTLRKVTANTAIYYDPNPQSTVVAEDQEWVNVYYEMP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 VFLLGQSARDAERAKDILCRLEHTTLRKVTANTAIYYDPNPQSTVVAEDQEWVNVYYEMP 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE3 DFDVARISPWLLRVELDRKHMTDRKLTMEQIAEKINAGFGDDLNCIFNDDNAEKLVLRIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 DFDVARISPWLLRVELDRKHMTDRKLTMEQIAEKINAGFGDDLNCIFNDDNAEKLVLRIR 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE3 IMNSDENKMQEEEEVVDKMDDDVFLRCIESNMLTDMTLQGIEQISKVYMHLPQTDNKKKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 IMNSDENKMQEEEEVVDKMDDDVFLRCIESNMLTDMTLQGIEQISKVYMHLPQTDNKKKI 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE3 IITEDGEFKALQEWILETDGVSLMRVLSEKDVDPVRTTSNDIVEIFTVLGIEAVRKALER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 IITEDGEFKALQEWILETDGVSLMRVLSEKDVDPVRTTSNDIVEIFTVLGIEAVRKALER 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE3 ELYHVISFDGSYVNYRHLALLCDTMTCRGHLMAITRHGVNRQDTGPLMKCSFEETVDVLM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 ELYHVISFDGSYVNYRHLALLCDTMTCRGHLMAITRHGVNRQDTGPLMKCSFEETVDVLM 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE3 EAAAHGESDPMKGVSENIMLGQLAPAGTGCFDLLLDAEKCKYGMEIPTNIPGLGAAGPTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 EAAAHGESDPMKGVSENIMLGQLAPAGTGCFDLLLDAEKCKYGMEIPTNIPGLGAAGPTG 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE3 MFFGSAPSPMGGISPAMTPWNQGATPAYGAWSPSVGSGMTPGAAGFSPSAASDASGFSPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 MFFGSAPSPMGGISPAMTPWNQGATPAYGAWSPSVGSGMTPGAAGFSPSAASDASGFSPG 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KE3 YSPAWSPTPGSPGSPGPSSPYIPSPGGAMSPSYSPTSPAYEPRSPGGYTPQSPSYSPTSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 YSPAWSPTPGSPGSPGPSSPYIPSPGGAMSPSYSPTSPAYEPRSPGGYTPQSPSYSPTSP 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KE3 SYSPTSPSYSPTSPNYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 SYSPTSPSYSPTSPNYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSP 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KE3 TSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 TSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPS 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KE3 YSPTSPNYSPTSPNYTPTSPSYSPTSPSYSPTSPNYTPTSPNYSPTSPSYSPTSPSYSPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 YSPTSPNYSPTSPNYTPTSPSYSPTSPSYSPTSPNYTPTSPNYSPTSPSYSPTSPSYSPT 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KE3 SPSYSPSSPRYTPQSPTYTPSSPSYSPSSPSYSPTSPKYTPTSPSYSPSSPEYTPTSPKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 SPSYSPSSPRYTPQSPTYTPSSPSYSPSSPSYSPTSPKYTPTSPSYSPSSPEYTPTSPKY 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KE3 SPTSPKYSPTSPKYSPTSPTYSPTTPKYSPTSPTYSPTSPVYTPTSPKYSPTSPTYSPTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 SPTSPKYSPTSPKYSPTSPTYSPTTPKYSPTSPTYSPTSPVYTPTSPKYSPTSPTYSPTS 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 pF1KE3 PKYSPTSPTYSPTSPKGSTYSPTSPGYSPTSPTYSLTSPAISPDDSDEEN :::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 PKYSPTSPTYSPTSPKGSTYSPTSPGYSPTSPTYSLTSPAISPDDSDEEN 1930 1940 1950 1960 1970 >>NP_008986 (OMIM: 264090,607694,614258) DNA-directed RN (1390 aa) initn: 2203 init1: 656 opt: 1364 Z-score: 418.5 bits: 90.4 E(91774): 1.5e-16 Smith-Waterman score: 2501; 34.5% identity (62.0% similar) in 1493 aa overlap (16-1479:13-1368) 10 20 30 40 50 pF1KE3 MHGGGPPSGDSACPLRTIKRVQFGVLSPDELKRMSVTEGGIK--YPETTEGGRPKLGGLM . :... ::. ::.:..... . : : . .. . : : :.. NP_008 MVKEQFRETDVAKKISHICFGMKSPEEMRQQAHIQVVSKNLYSQDNQHA-PLLYGVL 10 20 30 40 50 60 70 80 90 100 110 pF1KE3 DPRQGVIERTGRCQTCAGNMTECPGHFGHIELAKPVFHVGFLVKTMKVLRCVCFFCSKLL : :.:. :. :.::. :...: ::.:.:.: : ::::.. .. .:. .: : ... NP_008 DHRMGTSEKDRPCETCGKNLADCLGHYGYIDLELPCFHVGYFRAVIGILQMICKTCCHIM 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE3 VDSNNPK-IKDILAKSKG----QPKKRLTHVYDLCKGKNICEGGEEMDNKFGVEQPEGDE ..... : . : : : : : . .. : :. ::::. .. :. . : NP_008 LSQEEKKQFLDYL-KRPGLTYLQKRGLKKKISDKCRKKNICHHCGAFN---GTVKKCGLL 120 130 140 150 160 170 180 190 200 210 220 pF1KE3 DLTKEKGHGGCGRYQPRIR------RSGLELYAEWKHVNEDSQEKKILLSPERVHEIFKR . .:: . . .: . ....: : . . .::. :.: : ..::: NP_008 KIIHEKYKTNKKVVDPIVSNFLQSFETAIEHNKEVEPLLGRAQEN---LNPLVVLNLFKR 180 190 200 210 220 230 240 250 260 270 280 pF1KE3 ISDEECFVLGMEPRYARPEWMIVTVLPVPPLSVRPAVVMQ-GSARNQDDLTHKLADIVKI : :. .: :.:. ..: .:.: : :::: .::.:: . :. :.:::: ::..:. . NP_008 IPAEDVPLLLMNPEAGKPSDLILTRLLVPPLCIRPSVVSDLKSGTNEDDLTMKLTEIIFL 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE3 NNQLRRNEQNGAAAHVIAEDVKLLQFHVATMVDNELPGLPRAMQKSGRPLKSLKQRLKGK :. ..... .:: ...: :: .::.. : ....:: :.: : . . ... :::::: NP_008 NDVIKKHRISGAKTQMIMEDWDFLQLQCALYINSELSGIPLNMAPK-KWTRGFVQRLKGK 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE3 EGRVRGNLMGKRVDFSARTVITPDPNLSIDQVGVPRSIAANMTFAEIVTPFNIDRLQELV .:: :::: :::::::.::::.::::: ::.:.:: .: .:: : :. ::. :..:: NP_008 QGRFRGNLSGKRVDFSGRTVISPDPNLRIDEVAVPVHVAKILTFPEKVNKANINFLRKLV 350 360 370 380 390 400 410 420 430 440 450 460 pF1KE3 RRGNSQYPGAKYII-RDNGDRIDLRFHPKPS-DLHLQTGYKVERHMCDGDIVIFNRQPTL . : .:::..: : . . :.. . . .:. : ::::. :::.:.:::::.: NP_008 QNGPEVHPGANFIQQRHTQMKRFLKYGNREKMAQELKYGDIVERHLIDGDVVLFNRQPSL 410 420 430 440 450 460 470 480 490 500 510 520 pF1KE3 HKMSMMGHRVRILPWSTFRLNLSVTTPYNADFDGDEMNLHLPQSLETRAEIQELAMVPRM ::.:.:.: .:. : :::.: : ::::::::::::::::::. :..:: : . NP_008 HKLSIMAHLARVKPHRTFRFNECVCTPYNADFDGDEMNLHLPQTEEAKAEALVLMGTKAN 470 480 490 500 510 520 530 540 550 560 570 pF1KE3 IVTPQSNRPVMGIVQDTLTAVRKFTKRDVFLERGEVMNLLM-FLSTWDGKV----PQPAI .:::....:... .:: ::.. .: .:.:..:... ... .: : :. : :.: NP_008 LVTPRNGEPLIAAIQDFLTGAYLLTLKDTFFDRAKACQIIASILVGKDEKIKVRLPPPTI 530 540 550 560 570 580 580 590 600 610 620 630 pF1KE3 LKPRPLWTGKQIFSLII-PGHINCIRTHSTHPDDEDSGPYKHISPGDTKVVVENGELIMG ::: :::::::::.:. :. : .:.. . : . . .:. :...:.::. : NP_008 LKPVTLWTGKQIFSVILRPSDDNPVRANLRTKGKQYCGKGEDLCANDSYVTIQNSELMSG 590 600 610 620 630 640 640 650 660 670 680 690 pF1KE3 ILCKKSLGT-SAGSLVHISYLEMGHDITRLFYSNIQTVINNWLLIEGHTIGIGDSIADSK . : .::. : ... .: . :.. . .: . . .: .: .::::: . NP_008 SMDKGTLGSGSKNNIFYILLRDWGQNEAADAMSRLARLAPVYLSNRGFSIGIGDVTPGQG 650 660 670 680 690 700 700 710 720 730 740 750 pF1KE3 TYQDIQNTIKKAKQDVIEVIEKAHNNELEPTPGNTLRQTFENQVNRILNDARDKTGSSAQ . . .. . . : :: ....:. :: : ..:.: . . :. ::..::. NP_008 LLKAKYELLNAGYKKCDEYIEALNTGKLQQQPGCTAEETLEALILKELSVIRDHAGSACL 710 720 730 740 750 760 760 770 780 790 800 810 pF1KE3 KSLSEYNNFKSMVVSGAKGSKINISQVIAVVGQQNVEGKRIPFGFKHRTLPHFIKDDYGP . :.. :. .:.. :.::: :::::.:: :::: . :.:.: ::..:.:::: : . : NP_008 RELDKSNSPLTMALCGSKGSFINISQMIACVGQQAISGSRVPDGFENRSLPHFEKHSKLP 770 780 790 800 810 820 820 830 840 850 860 870 pF1KE3 ESRGFVENSYLAGLTPTEFFFHAMGGREGLIDTAVKTAETGYIQRRLIKSMESVMVKYDA ..::: ::. .::::::::::.:.:::::.:::::::::::.::::.::.:.. .:: NP_008 AAKGFVANSFYSGLTPTEFFFHTMAGREGLVDTAVKTAETGYMQRRLVKSLEDLCSQYDL 830 840 850 860 870 880 880 890 900 910 920 930 pF1KE3 TVRNSINQVVQLRYGEDGLAGESVEFQNLATLKPSNKAFEKKFRFDYTNERALRRTLQED :::.: ....:. :: ::: :. :.: : .: NP_008 TVRSSTGDIIQFIYGGDGL-------------DPA--AMEGK---------------DEP 890 900 910 940 950 960 970 980 990 pF1KE3 LVKDVLSNAHIQNELEREFERMREDREVLRVIFPTGDSKVVLPCNLLRMIWNAQKIFHIN : ::.:. .. ....:: :. .: : ..: ....:.. . NP_008 L----------------EFKRVLDN---IKAVFPC-PSEPALSKN--ELILTTESIMKKS 920 930 940 950 1000 1010 1020 1030 1040 1050 pF1KE3 PRL---PSDLHPIK-VVEGVKELSKKLVIVNGDDPLSRQAQENATLLFNIHLRSTLCSRR : : :. :: ..::.: :: .:. ..:. .: : NP_008 EFLCCQDSFLQEIKKFIKGVSEKIKK----------TRDK-------YGINDNGTTEPRV 960 970 980 990 1060 1070 1080 1090 1100 1110 pF1KE3 MAEEFRLSGEAFDWLLGEIESKFNQAIAHPGEMVGALAAQSLGEPATQMTLNTFHYAGVS . . :.. . .: ..:. .: .:: :::: :::.:::.:::::.:::.:::. NP_008 LYQLDRITPTQVEKFLETCRDKYMRAQMEPGSAVGALCAQSIGEPGTQMTLKTFHFAGVA 1000 1010 1020 1030 1040 1050 1120 1130 1140 1150 1160 1170 pF1KE3 AKNVTLGVPRLKELINISKKPKTPSLTVFLLGQSARDAERAKDILCRLEHTTLRKVTANT . :.::::::.::.:: :: .:: .:. : .. ::. :. . :.:.: : ... NP_008 SMNITLGVPRIKEIINASKAISTPIITAQL--DKDDDADYARLVKGRIEKTLLGEIS--- 1060 1070 1080 1090 1100 1110 1180 1190 1200 1210 1220 1230 pF1KE3 AIYYDPNPQSTVVAEDQEWVNVYYEMPD--FDVARISPWLLRVELDRKHMTDRKLTMEQI :... . .:: : ....: : :..: : ... . . . NP_008 -----------------EYIEEVF-LPDDCFILVKLS--LERIRLLRLEVNAETVRYSIC 1120 1130 1140 1150 1240 1250 1260 1270 1280 1290 pF1KE3 AEKINAGFGDDLNCIFNDDNAEKLVLRIRIMNSDENKMQEEEEVVDKMDDDVFLRCIESN . :. . :: ..: .: .. ::. . :.. . .: NP_008 TSKLRVKPGDVAV------HGEAVVC----VTPRENSKSSMYYVLQFLKED--------- 1160 1170 1180 1190 1300 1310 1320 1330 1340 1350 pF1KE3 MLTDMTLQGIEQISKVYMHLPQTDNKKKIIITEDGEFKALQEWILETDGVSLMRVLSEKD : ...::: ..:.. .:. . ..:.: .: : : : .: :.. . NP_008 -LPKVVVQGIPEVSRAVIHIDEQSGKEK--------YKLLVE------GDNLRAVMATHG 1200 1210 1220 1230 1240 1360 1370 1380 1390 1400 1410 pF1KE3 VDPVRTTSNDIVEIFTVLGIEAVRKALERELYHVISFDGSYVNYRHLALLCDTMTCRGHL : .:::::. :. .:::::.: .. :. ... : .. ::. :: : :: .:.. NP_008 VKGTRTTSNNTYEVEKTLGIEAARTTIINEIQYTMVNHGMSIDRRHVMLLSDLMTYKGEV 1250 1260 1270 1280 1290 1300 1420 1430 1440 1450 1460 1470 pF1KE3 MAITRHGVNRQDTGPLMKCSFEETVDVLMEAAAHGESDPMKGVSENIMLGQLAPAGTGCF ..::: :. .. . :: :::.:.: :..:: :..: . :::: :..: ::: : NP_008 LGITRFGLAKMKESVLMLASFEKTADHLFDAAYFGQKDSVCGVSECIIMGIPMNIGTGLF 1310 1320 1330 1340 1350 1360 1480 1490 1500 1510 1520 1530 pF1KE3 DLLLDAEKCKYGMEIPTNIPGLGAAGPTGMFFGSAPSPMGGISPAMTPWNQGATPAYGAW :: :.. NP_008 KLLHKADRDPNPPKRPLIFDTNEFHIPLVT 1370 1380 1390 >>XP_011521400 (OMIM: 164010,614961) charged multivesicu (408 aa) initn: 1856 init1: 959 opt: 977 Z-score: 314.7 bits: 69.4 E(91774): 9.3e-11 Smith-Waterman score: 977; 38.0% identity (69.1% similar) in 324 aa overlap (1600-1923:75-395) 1570 1580 1590 1600 1610 1620 pF1KE3 GSPGSPGPSSPYIPSPGGAMSPSYSPTSPAYEPRSPGGYTPQSPSYSPTSPSYSPTSPSY :: .:::.. ::. .::: ..:: .: . XP_011 RHPQEERRCELASDGVPRRRSGLQGADSCDYEGGGPGGHS--SPG-DPTSAAFSPPTPRW 50 60 70 80 90 100 1630 1640 1650 1660 1670 1680 pF1KE3 SPTSPNYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTS ::: .:: .: . :: ..:: .: . :: ..:: .: . :: ..:: .: . :: XP_011 VPTSAAFSPPTPRWVSTSAAFSPPTPRWVSTSAAFSPPTPRWVSTSAAFSPPTPRWVSTS 110 120 130 140 150 160 1690 1700 1710 1720 1730 1740 pF1KE3 PSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPNYS ..:: .: . :: ..:: .: . :: ..:: .: . ::: ..:: .: . ::: .: XP_011 AAFSPPTPRWVSTSAAFSPPTPRWVSTSAAFSPPTPRWVPTSAAFSPPTPRWVPTSAAFS 170 180 190 200 210 220 1750 1760 1770 1780 1790 1800 pF1KE3 PTSPNYTPTSPSYSPTSPSYSPTSPNYTPTSPNYSPTSPSYSPTSPSYSPTSPSYSPSSP : .: ..::: ..:: .: . ::: ..: .: . ::: ..:: .: . :: ..:: .: XP_011 PPTPRWVPTSAAFSPPTPRWVPTSAAFSPPTPRWVPTSAAFSPPTPRWVSTSAAFSPRTP 230 240 250 260 270 280 1810 1820 1830 1840 1850 1860 pF1KE3 RYTPQSPTYTPSSPSYSPSSPSYSPTSPKYTPTSPSYSPSSPEYTPTSPKYSPTSPKYSP :.. : ...: .: . :.: ..:: .:... :: ..:: .:...::: .:: .:.. : XP_011 RWVSTSAAFSPPTPRWVPTSAAFSPPTPRWVSTSAAFSPPTPRWVPTSAAFSPPTPRWVP 290 300 310 320 330 340 1870 1880 1890 1900 1910 1920 pF1KE3 TSPKYSPTSPTYSPTTPKYSPTSPTYSPTSPVYTPTSPKYSPTSPTYSPTSPKYSPTSPT :: .:: .: . ::. .:: .: . :: ...: .:.. :: ..:: .:.. XP_011 TSAAFSPPTPRWVPTSAAFSPPTPHWVSTSAAFSPLTPHWVSTSAAFSPLTPHWVSMAFS 350 360 370 380 390 400 1930 1940 1950 1960 1970 pF1KE3 YSPTSPKGSTYSPTSPGYSPTSPTYSLTSPAISPDDSDEEN XP_011 VELVVFP >>NP_001352825 (OMIM: 601234) nascent polypeptide-associ (2078 aa) initn: 601 init1: 351 opt: 746 Z-score: 239.5 bits: 57.9 E(91774): 1.4e-06 Smith-Waterman score: 823; 33.2% identity (56.7% similar) in 561 aa overlap (1425-1952:633-1175) 1400 1410 1420 1430 1440 1450 pF1KE3 YRHLALLCDTMTCRGHLMAITRHGVNRQDTGPLMKCSF-EETVDVL-MEAAAHGESDPMK :::.: :. :: .. .:.: . : NP_001 KPASSMTSPLGVNSSASVIKTDSYAGPDSAGPLLKSSLITPTVAAFPLESADPAGVAPTT 610 620 630 640 650 660 1460 1470 1480 1490 1500 1510 pF1KE3 GVSENIMLGQLAPAGTGCFDLLLDAEKCKYGMEIPTNIPGLGAAGPTGMFFGSAPSPMGG . . . . .: : .: . : : :..: . .:. . ::::.. NP_001 AKGTSTYTTTASPFLEGTVSLAPKNHPVKEGTL--TTLPLVPTASEN---CPVAPSPQNT 670 680 690 700 710 1520 1530 1540 1550 1560 1570 pF1KE3 ISPAMTPWNQGATPAYGAWSPSVG-SGMTPGAAGFSPSAASDASGFSP-GYSPAWSPTPG .: : : .. :::. .: ::. . . : .:...: . :: :: NP_001 CAPLATLVLAPEIPK-SVPSPSLPPAGTPPGTKKVD--GISHTSALAPVASSPKECPTED 720 730 740 750 760 770 1580 1590 1600 1610 1620 pF1KE3 SPGSPGPSSP----YI---PSPGGAMSPSYSPTSPAYEPRSPGGYTPQSPSYSPTSP--- : .: :: :. ::: : .: : . : . : : :: . ::.:: NP_001 SGASATASSKGTLTYLADSPSPLG-VSVSPQTKRPPTKKGSAGPDTPIGNLSSPVSPVEA 780 790 800 810 820 830 1630 1640 1650 1660 1670 pF1KE3 SYSPTSPSYSPTSPNYSP-TSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYS :. : . : : . . :: :. : .: ::. .:: . .: ::. :. .:: . NP_001 SFLPEN-SLSFQGSKDSPATTHSPTPPSPKGAPTPSAVTPLSPKGVTLPPKETPTPSVVN 840 850 860 870 880 890 1680 1690 1700 1710 1720 1730 pF1KE3 PTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSP :. .:..:. .:. : :: : . . . .: . :: ::. .:: :. .: :: NP_001 LPFPKEGPATPA-PKQAPALSMTSSSPKKARATPAPKGIPASP-SPKGAPTPPAATPPSP 900 910 920 930 940 950 1740 1750 1760 1770 1780 1790 pF1KE3 SYSPT--SPNYSPTSPNYTPTSPSYSPTSPSY--SPTSPNYTPTSPNYSPTSPSY--SPT . .:. ::...:: : :: ::. .:..:: .:: : :: ::. .:..:: .:: NP_001 KGGPATPSPKWAPTPPAATPPSPKGGPATPSPKGAPTPPAATPPSPKGGPATPSPKGAPT 960 970 980 990 1000 1010 1800 1810 1820 1830 1840 pF1KE3 SPSYSPTSPSYSPSS---PRYTPQSPTYTPSSPSYSPSS---PSYSPTSPKYTPTSPSYS :. .: ::. ::.. :. . :. :: ::. ::.. :. .::.: : ::. . NP_001 PPAVTPPSPKGSPAATPFPKGASTPPAATPPSPKGSPAATPLPKGAPTTPAATLPSPKGG 1020 1030 1040 1050 1060 1070 1850 1860 1870 1880 1890 1900 pF1KE3 PSSPEY--TPTSPKYSPTSPKYSPT--SPKYSPTSPTYSPTTPKYSPTSPTY--SPTSPV :..: .:: : .: ::: .:. ::: .: :. .: .:: . ..: . .::.:. NP_001 PATPSLKGAPTPPAATPPSPKGGPATPSPKGAPMPPAATPPSPKGGLATPPHKGAPTTPA 1080 1090 1100 1110 1120 1130 1910 1920 1930 1940 1950 1960 pF1KE3 YTPTSPKYSPTSPTYSPTSPKYSPTSPTYSPTSPKGSTYSPTSPGYSPTSPTYSLTSPAI :: ::: . ..: : :: .::.:. .: ::::. .: : .::.: NP_001 ATPPSPKGGLATP---P--PKGAPTTPAATPPSPKGGLATPPPKG-APTTPAATPPSPKG 1140 1150 1160 1170 1180 1970 pF1KE3 SPDDSDEEN NP_001 GLATPSPKGAPTTPAATPPSPKGGLATPSPKGAPTTPAATPPSPKGGLATPSPKGAPTTP 1190 1200 1210 1220 1230 1240 >>NP_002448 (OMIM: 158370) mucin-2 precursor [Homo sapie (5289 aa) initn: 1191 init1: 429 opt: 741 Z-score: 232.9 bits: 58.0 E(91774): 3.4e-06 Smith-Waterman score: 750; 33.2% identity (58.1% similar) in 401 aa overlap (1568-1945:1398-1781) 1540 1550 1560 1570 1580 1590 pF1KE3 GMTPGAAGFSPSAASDASGFSPGYSPAWSPTPGSPGSPGPSSPYIPSPGGAMSPSYSPTS :: :: . :: : :. .. :. .:. NP_002 EDQFGNGPFGLCYDYKIRVNCCWPMDKCITTP-SPPTTTPSPP--PTSTTTLPPTTTPSP 1370 1380 1390 1400 1410 1420 1600 1610 1620 1630 1640 1650 pF1KE3 PAYEPRSPGGYTPQSPSYSPTSPSYSPTSPSYSPTSPNYSPTSPSYSPTSPSYSPTSPSY :. .: : :: . :. :.:: : : . .: :. .:. :. .:. :. NP_002 PTTTTTTPPPTTTPSPPITTTTTPPPTTTPS-PPISTTTTPP-PTTTPSPPTTTPSPPTT 1430 1440 1450 1460 1470 1480 1660 1670 1680 1690 1700 1710 pF1KE3 SPTSPSYSPTSP--SYSPTSPSYSPTSPSYSPTS--PSYSPTSPSYSPTSP--SYSPTSP .:. :. . :.: . .:. :. .: .: : :. :. .:. :. . :.: . .:. : NP_002 TPSPPTTTTTTPPPTTTPSPPTTTPITPPASTTTLPPTTTPSPPTTTTTTPPPTTTPSPP 1490 1500 1510 1520 1530 1540 1720 1730 1740 1750 1760 pF1KE3 SYSPTSPSYSPTS--PSYSPTSPSYSPTSP--SYSPTSPNYS-PTSPNYTPTSPSYSPTS . .: .: : :. :. .:. : . :.: . .:. :. . :. :. : :.: ::. NP_002 TTTPITPPTSTTTLPPTTTPSPPPTTTTTPPPTTTPSPPTTTTPSPPTITTTTPP--PTT 1550 1560 1570 1580 1590 1600 1770 1780 1790 1800 1810 1820 pF1KE3 PSYSPTSPNYTPTSPNYSPTSPSYSPTSPSYSPTS--PSYSPSSPRYTPQSP--TYTPSS ::. . :: :. .:. :. .: .: : :. :. .:: : : .: : ::: NP_002 TPSPPTTTTTTPP-PTTTPSPPTTTPITPPTSTTTLPPTTTPSPPPTTTTTPPPTTTPSP 1610 1620 1630 1640 1650 1830 1840 1850 1860 1870 pF1KE3 PSYSPSSPSYSPTS---PKYTPTSP-SYSPSSPEYTPT--SPKYSPTSPKYSPTSPKYSP :. . :: . :. : ::.:: . .:: : : : :: .:.:: . :.:. : NP_002 PTTTTPSPPITTTTTPPPTTTPSSPITTTPSPPTTTMTTPSPTTTPSSPITTTTTPS-ST 1660 1670 1680 1690 1700 1710 1880 1890 1900 1910 1920 1930 pF1KE3 TSPTYSPTTPKYSPTSPTYSPTSPVYTPTS-PKYSPTSP-TYSPTSPKYSPTSPTYSPTS :.:. ::: .. ::: .:. :. : :. : . .:: : .: :. .: ::.:: : NP_002 TTPSPPPTT--MTTPSPTTTPSPPTTTMTTLPPTTTSSPLTTTPLPPSITP--PTFSPFS 1720 1730 1740 1750 1760 1770 1940 1950 1960 1970 pF1KE3 PKGSTYSPTSPGYSPTSPTYSLTSPAISPDDSDEEN : .::.: NP_002 ----TTTPTTPCVPLCNWTGWLDSGKPNFHKPGGDTELIGDVCGPGWAANISCRATMYPD 1780 1790 1800 1810 1820 1830 >>NP_775082 (OMIM: 602372) zonadhesin isoform 6 precurso (2721 aa) initn: 624 init1: 624 opt: 684 Z-score: 220.3 bits: 54.7 E(91774): 1.7e-05 Smith-Waterman score: 753; 32.4% identity (52.5% similar) in 516 aa overlap (1480-1963:443-948) 1450 1460 1470 1480 1490 1500 pF1KE3 PMKGVSENIMLGQLAPAGTGCFDLLLDAEKCKYG---MEIPTNIPGLGAAGPTGMFFGSA : : .:. .. ::: . ...:: NP_775 FPNAGGHYIYLEADEFSQAGQSVRLVSRPFCAPGDICVEFAYHMYGLGEGTMLELLLGS- 420 430 440 450 460 470 1510 1520 1530 1540 1550 pF1KE3 PSPMGGISPAMTPWNQGAT--PAYGAWSPSVGSG-MTP------GAAGFSPSAASDASGF : : :: . :.. .. : . : .: :: . : : : : .:. : :: NP_775 --PAG--SPPIPLWKRVGSQRPYWQNTSVTVPSGHQQPMQLIFKGIQG-SNTASVVAMGF 480 490 500 510 520 1560 1570 1580 1590 1600 1610 pF1KE3 ---SPGYSPAWSPTPGSPGSPGPSSPYIPSPGGAMSPSYSPTSPAYEPRSPGGYT--PQS .:: :. : :: :. . : . .:. : .:. ..:. : : NP_775 ILINPGTCPVKVLPELPPVSPVSSTGPSETTGLTENPTISTKKPTVSIEKPSVTTEKPTV 530 540 550 560 570 580 1620 1630 1640 1650 1660 1670 pF1KE3 PSYSPTSPSYSPTSPSYSPTSPNYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYS :. .:: :. .:: . .:: :. .:. :: .:: :: .:: . .:: :: .:: :: . NP_775 PKEKPTIPTEKPTISTEKPTIPSEKPNMPSEKPTIPSEKPTILTEKPTIPSEKPTIPSEK 590 600 610 620 630 640 1680 1690 1700 1710 1720 pF1KE3 PTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPT--------- :: . .:: :. ::.:. :. :. :. .:. :. .:. :. .:: NP_775 PTISTEKPTVPTEEPTTPTEETTTSMEEPVIPTEKPSIPTEKPSIPTEKPTISMEETIIS 650 660 670 680 690 700 1730 1740 1750 1760 1770 pF1KE3 --SPSYSP---TSPSYSPTSPSYSPTSPNYSPTSPNYTPTSPSYSPTSPSYSPTSPNYTP .:. :: : :. .:: :. . : .::.:. :: :. .:: .::.:. : NP_775 TEKPTISPEKPTIPTEKPTIPTEKSTISPEKPTTPTEKPTIPTEKPTISPEKPTTPTEKP 710 720 730 740 750 760 1780 1790 1800 1810 1820 1830 pF1KE3 TSPNYSPTSPSYSPTSPSYSPTSPSYSPSSPRYTPQSPTYTPSSPSYSPSSPSYSPTSP- : . : :. .:: :. .:: :. .:. : .:: . . .:: : .:: : NP_775 TISPEKLTIPTEKPTIPTEKPTIPTEKPTISTEEPTTPTEETTISTEKPSIPMEKPTLPT 770 780 790 800 810 820 1840 1850 1860 1870 1880 1890 pF1KE3 KYTPTSPSYSPSSPEYTPTSPKYSPTSPKYSPTSPKYSPTSPTYSPTTPKYSPTSPTYSP . : :: . : : : : .:: .:: : .:: . : : . : :: .: NP_775 EETTTSVEETTISTEKL-TIPMEKPTISTEKPTIPTEKPTISPEKLTIPTEKLTIPTEKP 830 840 850 860 870 880 1900 1910 1920 1930 1940 1950 pF1KE3 TSPVYTPTSPKYSPTSPTYSPTSPKYSPTSPTYSPTSPKGSTYSPTSPGYSPTSPTYSLT : :. : . : :: .:: :: .:: : .: : .:: : : : .:: NP_775 TIPIEETTISTEKLTIPTEKPT---ISPEKPTISTEKPTIPTEKPTIPTEETTISTEKLT 890 900 910 920 930 940 1960 1970 pF1KE3 SPAISPDDSDEEN :. .: NP_775 IPTEKPTISPEKLTIPTEKPTISTEKPTIPTEKLTIPTEKPTIPTEKPTIPTEKLTALRP 950 960 970 980 990 1000 >>NP_003377 (OMIM: 602372) zonadhesin isoform 3 precurso (2812 aa) initn: 624 init1: 624 opt: 684 Z-score: 220.1 bits: 54.7 E(91774): 1.7e-05 Smith-Waterman score: 753; 32.4% identity (52.5% similar) in 516 aa overlap (1480-1963:443-948) 1450 1460 1470 1480 1490 1500 pF1KE3 PMKGVSENIMLGQLAPAGTGCFDLLLDAEKCKYG---MEIPTNIPGLGAAGPTGMFFGSA : : .:. .. ::: . ...:: NP_003 FPNAGGHYIYLEADEFSQAGQSVRLVSRPFCAPGDICVEFAYHMYGLGEGTMLELLLGS- 420 430 440 450 460 470 1510 1520 1530 1540 1550 pF1KE3 PSPMGGISPAMTPWNQGAT--PAYGAWSPSVGSG-MTP------GAAGFSPSAASDASGF : : :: . :.. .. : . : .: :: . : : : : .:. : :: NP_003 --PAG--SPPIPLWKRVGSQRPYWQNTSVTVPSGHQQPMQLIFKGIQG-SNTASVVAMGF 480 490 500 510 520 1560 1570 1580 1590 1600 1610 pF1KE3 ---SPGYSPAWSPTPGSPGSPGPSSPYIPSPGGAMSPSYSPTSPAYEPRSPGGYT--PQS .:: :. : :: :. . : . .:. : .:. ..:. : : NP_003 ILINPGTCPVKVLPELPPVSPVSSTGPSETTGLTENPTISTKKPTVSIEKPSVTTEKPTV 530 540 550 560 570 580 1620 1630 1640 1650 1660 1670 pF1KE3 PSYSPTSPSYSPTSPSYSPTSPNYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYS :. .:: :. .:: . .:: :. .:. :: .:: :: .:: . .:: :: .:: :: . NP_003 PKEKPTIPTEKPTISTEKPTIPSEKPNMPSEKPTIPSEKPTILTEKPTIPSEKPTIPSEK 590 600 610 620 630 640 1680 1690 1700 1710 1720 pF1KE3 PTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPT--------- :: . .:: :. ::.:. :. :. :. .:. :. .:. :. .:: NP_003 PTISTEKPTVPTEEPTTPTEETTTSMEEPVIPTEKPSIPTEKPSIPTEKPTISMEETIIS 650 660 670 680 690 700 1730 1740 1750 1760 1770 pF1KE3 --SPSYSP---TSPSYSPTSPSYSPTSPNYSPTSPNYTPTSPSYSPTSPSYSPTSPNYTP .:. :: : :. .:: :. . : .::.:. :: :. .:: .::.:. : NP_003 TEKPTISPEKPTIPTEKPTIPTEKSTISPEKPTTPTEKPTIPTEKPTISPEKPTTPTEKP 710 720 730 740 750 760 1780 1790 1800 1810 1820 1830 pF1KE3 TSPNYSPTSPSYSPTSPSYSPTSPSYSPSSPRYTPQSPTYTPSSPSYSPSSPSYSPTSP- : . : :. .:: :. .:: :. .:. : .:: . . .:: : .:: : NP_003 TISPEKLTIPTEKPTIPTEKPTIPTEKPTISTEEPTTPTEETTISTEKPSIPMEKPTLPT 770 780 790 800 810 820 1840 1850 1860 1870 1880 1890 pF1KE3 KYTPTSPSYSPSSPEYTPTSPKYSPTSPKYSPTSPKYSPTSPTYSPTTPKYSPTSPTYSP . : :: . : : : : .:: .:: : .:: . : : . : :: .: NP_003 EETTTSVEETTISTEKL-TIPMEKPTISTEKPTIPTEKPTISPEKLTIPTEKLTIPTEKP 830 840 850 860 870 880 1900 1910 1920 1930 1940 1950 pF1KE3 TSPVYTPTSPKYSPTSPTYSPTSPKYSPTSPTYSPTSPKGSTYSPTSPGYSPTSPTYSLT : :. : . : :: .:: :: .:: : .: : .:: : : : .:: NP_003 TIPIEETTISTEKLTIPTEKPT---ISPEKPTISTEKPTIPTEKPTIPTEETTISTEKLT 890 900 910 920 930 940 1960 1970 pF1KE3 SPAISPDDSDEEN :. .: NP_003 IPTEKPTISPEKLTIPTEKPTISTEKPTIPTEKLTIPTEKPTIPTEKPTIPTEKLTALRP 950 960 970 980 990 1000 >>NP_056240 (OMIM: 616404,616462) DNA-directed RNA polym (1720 aa) initn: 1614 init1: 457 opt: 648 Z-score: 212.6 bits: 52.6 E(91774): 4.5e-05 Smith-Waterman score: 1549; 27.4% identity (53.0% similar) in 1653 aa overlap (69-1473:102-1715) 40 50 60 70 80 90 pF1KE3 GGIKYPETTEGGRPKLGGLMDPRQGVIERTGRCQTCAGNMTECPGHFGHIELAK-PVFHV : : .: .: :: :. : . :..: NP_056 SNCSGHLGHIELPLTVYNPLLFDKLYLLLRGSCLNC--HMLTCPRAVIHLLLCQLRVLEV 80 90 100 110 120 100 110 120 130 140 150 pF1KE3 GFLVKTMKVLRCVCFFCSKLLVDSNNPKIKDILAKSKGQPKKRLTHVYDLCKG---KNIC : : .... : . ...: .. .:. ..: . . . . . .: ::.: NP_056 GALQAVYELERIL----NRFLEENPDPSASEIREELEQYTTEIVQNNLLGSQGAHVKNVC 130 140 150 160 170 180 160 170 180 190 200 pF1KE3 EGGEE---------MDNKFGVEQPEGDEDLTKEKGHGGCGRYQPRIRRSGLELYAEWKHV :. . :. : . : . ::.. . ..:.. . .: . NP_056 ESKSKLIALFWKAHMNAKRCPHCKTGRSVVRKEHNSKLTITFPAMVHRTAGQKDSEPLGI 190 200 210 220 230 240 210 220 230 240 250 pF1KE3 NEDSQEKKILLSPERVHEIFKRISDEECFVL----------GMEPRYARPEWMIVTVLPV .: . :. :.: ..: .. . .: : : ::: :. : ... : : NP_056 EEAQIGKRGYLTPTSAREHLSALWKNEGFFLNYLFSGMDDDGMESRFN-PSVFFLDFLVV 250 260 270 280 290 300 260 270 280 290 300 pF1KE3 PPLSVRPAVVM--QGSARNQD-DLTHKLADIVKINNQLRRNEQNGAAAHVIAEDV----- :: ::. . : . .: .: . :.: : . : :. . .: . NP_056 PPSRYRPVSRLGDQMFTNGQTVNLQAVMKDVVLIRKLLALMAQEQKLPEEVATPTTDEEK 310 320 330 340 350 360 310 320 330 340 pF1KE3 ---------------------KL------LQFHVATMVDNELPGLPRAMQKSGRPLKSLK :: :: :: . :.:. : :.: : ... NP_056 DSLIAIDRSFLSTLPGQSLIDKLYNIWIRLQSHVNIVFDSEMDKL--MMDK--YP--GIR 370 380 390 400 410 350 360 370 380 390 400 pF1KE3 QRLKGKEGRVRGNLMGKRVDFSARTVITPDPNLSIDQVGVPRSIAANMTFAEIVTPFNID : :. ::: : ..::::::..::.:: :: .. ...:.: .:...:. . :::.:.. NP_056 QILEKKEGLFRKHMMGKRVDYAARSVICPDMYINTNEIGIPMVFATKLTYPQPVTPWNVQ 420 430 440 450 460 470 410 420 430 440 pF1KE3 RLQELVRRGNSQYPGAKYIIRDNGDR-----IDLR---------FHPKPSDLHLQTGYKV .:.. : : . .:::...: ..:.: .:. . : . . : : NP_056 ELRQAVINGPNVHPGASMVINEDGSRTALSAVDMTQREAVAKQLLTPATGAPKPQGTKIV 480 490 500 510 520 530 450 460 470 480 490 500 pF1KE3 ERHMCDGDIVIFNRQPTLHKMSMMGHRVRILPW-STFRLNLSVTTPYNADFDGDEMNLHL ::. .:::...:::::::. :...::.:::: ...::. . ::::::::::: :. NP_056 CRHVKNGDILLLNRQPTLHRPSIQAHRARILPEEKVLRLHYANCKAYNADFDGDEMNAHF 540 550 560 570 580 590 510 520 530 540 550 560 pF1KE3 PQSLETRAEIQELAMVPRMIVTPQSNRPVMGIVQDTLTAVRKFTKRDVFLERGEVMNLLM ::: ::: :: . .. ..:....:. :..:: ... ..: : :. : . :.:.. NP_056 PQSELGRAEAYVLACTDQQYLVPKDGQPLAGLIQDHMVSGASMTTRGCFFTREHYMELVY 600 610 620 630 640 650 570 580 590 600 610 pF1KE3 F-LSTWDGKVP--QPAILKPRPLWTGKQIFSL----IIP-GHINC-------IRTHSTHP :. :.: .:.:::: :::::::. : ::: :: : .. NP_056 RGLTDKVGRVKLLSPSILKPFPLWTGKQVVSTLLINIIPEDHIPLNLSGKAKITGKAWVK 660 670 680 690 700 710 620 630 640 650 660 pF1KE3 DDEDSGP-YKHISPGDTKVVVENGELIMGILCKKSLGTSAGSLVHISYLEMGHDITRLFY . : : .. : ...:....:::. :.: : :.:: .::: : .: . . NP_056 ETPRSVPGFNPDSMCESQVIIREGELLCGVLDKAHYGSSAYGLVHCCYEIYGGETSGKVL 720 730 740 750 760 770 670 680 690 700 710 720 pF1KE3 SNIQTVINNWL-LIEGHTIGIGDSI----ADSKTYQDIQNTIKKAKQDV---IEVIEKAH . . ... .: : .: :.:. : . :: : . :... . . : : ... : : NP_056 TCLARLFTAYLQLYRGFTLGVEDILVKPKADVKRQRIIEESTHCGPQAVRAALNLPEAAS 780 790 800 810 820 830 730 740 750 760 770 pF1KE3 NNEL-----------EPTPGNTLRQTFENQVNRILNDARDKTGSSAQKSLSEYNNFKSMV .:. . : . :...::. :. . . :... :: NP_056 YDEVRGKWQDAHLGKDQRDFNMIDLKFKEEVNHYSNEINKACMPFGLHRQFPENSLQMMV 840 850 860 870 880 890 780 790 800 810 820 830 pF1KE3 VSGAKGSKINISQVIAVVGQQNVEGKRIPFGFKHRTLPHFIKDDYGPESRGFVENSYLAG :::::: .: :. ..:: ..::.: :. . ..:: : .. :.. ::: . .:.: NP_056 QSGAKGSTVNTMQISCLLGQIELEGRRPPLMASGKSLPCFEPYEFTPRAGGFVTGRFLTG 900 910 920 930 940 950 840 850 860 870 880 890 pF1KE3 LTPTEFFFHAMGGREGLIDTAVKTAETGYIQRRLIKSMESVMVKYDATVRNSINQVVQLR . : ::::: :.:::::.::::::...::.:: .:: .:...:.:: :::.: ..:::. NP_056 IKPPEFFFHCMAGREGLVDTAVKTSRSGYLQRCIIKHLEGLVVQYDLTVRDSDGSVVQFL 960 970 980 990 1000 1010 900 910 920 930 940 950 pF1KE3 YGEDGLAGESVEFQNLATLKPSNKAFEKKFRFDYTNERALRRTLQEDLVKDVLSNAHIQN :::::: ...: :.: :.: : .: ... .. . ...::: : .. NP_056 YGEDGLDIPKTQF-----LQP------KQFPFLASNYEVIMKSQH---LHEVLSRADPKK 1020 1030 1040 1050 1060 960 970 980 990 1000 pF1KE3 ELE-----REFERMREDREVLRVIFPTGDSKVVLPCNLLRMIWNAQKIFHINPRLPSDLH :. .... . . . : : . ..:. . :.. . . : : :. . NP_056 ALHHFRAIKKWQSKHPNTLLRRGAFLSYSQKIQEAVKALKLESENR-----NGRSPGTQE 1070 1080 1090 1100 1110 1010 1020 1030 1040 1050 pF1KE3 PIKVVEGVKELSK----KLVIVNGDDPLS--RQAQENATLLFNIHLRSTLCSRRMAEEFR ... . : :. : . . : :: : :.. ... . :.. : . . NP_056 MLRMWYELDEESRRKYQKKAAACPDPSLSVWRPDIYFASVSETFETKVDDYSQEWAAQTE 1120 1130 1140 1150 1160 1170 1060 1070 1080 1090 1100 1110 pF1KE3 LSGE----AFDWLLGEIESKFNQAIAHPGEMVGALAAQSLGEPATQMTLNTFHYAGVSAK : : ..: : .. :..... .::: :: :::::.:::.:::::::::.:: . NP_056 KSYEKSELSLDRLRTLLQLKWQRSLCEPGEAVGLLAAQSIGEPSTQMTLNTFHFAGRGEM 1180 1190 1200 1210 1220 1230 1120 1130 1140 1150 1160 1170 pF1KE3 NVTLGVPRLKELINI-SKKPKTPSLTVFLLGQSARDAERAKDILCRLEHTTLRKVTANTA :::::.:::.:.. . : . ::: ..: .:. . . .:.:.. .: .. : .: . NP_056 NVTLGIPRLREILMVASANIKTPMMSVPVLN-TKKALKRVKSLKKQLTRVCLGEVLQKID 1240 1250 1260 1270 1280 1290 1180 1190 1200 1210 1220 1230 pF1KE3 IYYDPNPQSTVVAEDQEWVNVYYEMPDF--DVARISPWLLRVELDRKHMTDR--KLTMEQ . .: . : :. .:: .: . . :: : . : : :: ::. NP_056 VQ-----ESFCMEEKQNKFQVYQLRFQFLPHAYYQQEKCLRPEDILRFMETRFFKLLMES 1300 1310 1320 1330 1340 1350 1240 1250 1260 pF1KE3 IAEKIN--------------------AG-FGDDLNCIFNDDNAEKLVLRIRIMN-----S : .: : :: .: . . .:.. : .. . . : NP_056 IKKKNNKASAFRNVNTRRATQRDLDNAGELGRSRGEQEGDEEEEGHIVDAEAEEGDADAS 1360 1370 1380 1390 1400 1410 1270 1280 1290 pF1KE3 DENKMQEEEEVVDKMDDDVFLRCIESNMLTDMT--------------------------- : .. ...:: :: ... : : : :: NP_056 DAKRKEKQEEEVDYESEEEEEREGEENDDEDMQEERNPHREGARKTQEQDEEVGLGTEED 1420 1430 1440 1450 1460 1470 1300 1310 pF1KE3 ----------------------------LQGIEQIS----------------KVYMHLP- .:....: .: ..:: NP_056 PSLPALLTQPRKPTHSQEPQGPEAMERRVQAVREIHPFIDDYQYDTEESLWCQVTVKLPL 1480 1490 1500 1510 1520 1530 1320 1330 1340 1350 pF1KE3 ---------------------QTDNKKKIIITEDGEFKALQEWILETDGVSLMRVLSEKD : . . ...: . : .: .:.:.:..: .... . NP_056 MKINFDMSSLVVSLAHGAVIYATKGITRCLLNETTNNKNEKELVLNTEGINLPELFKYAE 1540 1550 1560 1570 1580 1590 1360 1370 1380 1390 1400 1410 pF1KE3 V-DPVRTTSNDIVEIFTVLGIEAVRKALERELYHVISFDGSYVNYRHLALLCDTMTCRGH : : : :::: : .. ::::. ...:.:. :.. : :. :::.:. : : .: NP_056 VLDLRRLYSNDIHAIANTYGIEAALRVIEKEIKDVFAVYGIAVDPRHLSLVADYMCFEGV 1600 1610 1620 1630 1640 1650 1420 1430 1440 1450 1460 1470 pF1KE3 LMAITRHGVNRQDTGPLMKCSFEETVDVLMEAAAHGESDPMKGVSENIMLGQLAPAGTGC ..: :. :....::.. .:: . . : .:. : : ... : ...:... .::: NP_056 YKPLNRFGI-RSNSSPLQQMTFETSFQFLKQATMLGSHDELRSPSACLVVGKVVRGGTGL 1660 1670 1680 1690 1700 1710 1480 1490 1500 1510 1520 1530 pF1KE3 FDLLLDAEKCKYGMEIPTNIPGLGAAGPTGMFFGSAPSPMGGISPAMTPWNQGATPAYGA :.: NP_056 FELKQPLR 1720 >>NP_001291288 (OMIM: 158373) mucin-5AC precursor [Homo (5654 aa) initn: 998 init1: 370 opt: 552 Z-score: 178.4 bits: 48.0 E(91774): 0.0036 Smith-Waterman score: 571; 29.4% identity (55.2% similar) in 493 aa overlap (1495-1963:4107-4593) 1470 1480 1490 1500 1510 1520 pF1KE3 PAGTGCFDLLLDAEKCKYGMEIPTNIPGLGAAGPTGMFFGSAPS----PMGGISPAMTPW .: :. . .:.:: : . . : : NP_001 PTQSTSSWQKSRTTTLVTTSTTSTPQTSTTSAPTTSTIPASTPSTTSAPTTSTTSAPTTS 4080 4090 4100 4110 4120 4130 1530 1540 1550 1560 1570 1580 pF1KE3 NQGATPAYGAWSPSVGSGMTPGAAGFSPSAASDASGFSPGYSPAWSPTPGSPGSPGPSSP . .: . .:.... ..: .. . :: . ... .: : . : .. ..: :. NP_001 TTSAPTHRTTSGPTTSTTLAPTTS--TTSAPTTSTNSAPTTSTISASTTSTISAPTTSTI 4140 4150 4160 4170 4180 4190 1590 1600 1610 1620 1630 1640 pF1KE3 YIPSPGGAMSPSYSPTSPAYEPRSPGGYTPQSPSYSPTSPSYSPTSPSYSPTSPNYSPTS :. . . .:. : :: : . :. : :: . .. : : :: . .::. . .. NP_001 SSPTSSTTSTPQTSKTSAATSSTTSGSGTTPSPVPTTSTTSASTTSTTSAPTTS--TTSG 4200 4210 4220 4230 4240 4250 1650 1660 1670 1680 1690 pF1KE3 PSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYS-PTSPSYSPTSPSYSPTSPSYSPTSPSY :. .: :: : .. : . :: . .::. . : ::: : . . ::. . . ..:. NP_001 PGTTP-SPVPSTSTTSAATTSTTSAPTTRTTSAPTSSMTSGPGTTPSPVPTTSTTSAPTT 4260 4270 4280 4290 4300 4310 1700 1710 1720 1730 1740 1750 pF1KE3 SPTS-PSYSPTSPSYSPTSPSYSPTSPSYSP-TSPSYSPTSPSYSPTSPNYSPTSPNYTP : :: :. .: :: . .. : :: . .: ..:: ::. . : . . . .: : NP_001 STTSGPGTTP-SPVPTTSTTSAPITSTTSGPGSTPSPVPTTSTTSAPTTSTTSASTASTT 4320 4330 4340 4350 4360 4370 1760 1770 1780 1790 1800 1810 pF1KE3 TSPSYSPTS-PSYSPTSPNYTPTSPNYSPTSPSYSPTSPSYSPTSPSYSPSSPRYTPQSP ..:. .:. :. : :: : :. . .. : ..:: ::. . : . : :: : NP_001 SGPGTTPSPVPTTSTTSAPTTRTTSASTASTTSGPGSTPSPVPTTSTTSAPTTRTTPAST 4380 4390 4400 4410 4420 4430 1820 1830 1840 1850 1860 1870 pF1KE3 TYTPSSPSYSPSS-PSYSPTSPKYTPTS--PSYSPSSPEYTP--TSPKYSPTS-PKYSPT . : :.:. .:: :. : :: . : : :. : .: : ..: .:. : : : NP_001 ASTTSGPGTTPSPVPTTSTTSASTTSTISLPTTSTTSAPITSMTSGPGTTPSPVPTTSTT 4440 4450 4460 4470 4480 4490 1880 1890 1900 1910 1920 pF1KE3 S-PKYSPTSPTYSPTT--PKYSPTS-PTYSPTS-PVYTPTSPKYSPTS--P--TYSPTSP : : : :: . . :: : .:. :: : :: :. . :: . . :. : . ::. NP_001 SAPTTSTTSASTASTTSGPGTTPSPVPTTSTTSAPTTSTTSASTASTTSGPGTSLSPVPT 4500 4510 4520 4530 4540 4550 1930 1940 1950 1960 1970 pF1KE3 KYSPTSPTYSPTSPKGSTYSPTSPGYSPTSPTYSLTS-PAISPDDSDEEN . ..:: : :: :.: ::. . ..:: : :: :. .: NP_001 TSTTSAPTTSTTSGPGTTPSPVPTTSTTSAPTTSTTSGPGTTPSPVPTTSTTPVSKTSTS 4560 4570 4580 4590 4600 4610 NP_001 HLSVSKTTHSQPVTSDCHPLCAWTKWFDVDFPSPGPHGGDKETYNNIIRSGEKICRRPEE 4620 4630 4640 4650 4660 4670 >>NP_009096 (OMIM: 600796) splicing factor 3A subunit 2 (464 aa) initn: 188 init1: 86 opt: 495 Z-score: 176.1 bits: 44.0 E(91774): 0.0048 Smith-Waterman score: 507; 29.2% identity (49.2% similar) in 264 aa overlap (1595-1857:217-464) 1570 1580 1590 1600 1610 1620 pF1KE3 WSPTPGSPGSPGPSSPYIPSPGGAMSPSYSPTSPAYEPRSPGGYTPQSPSYSPTSPSYSP : .: : .: : : : : NP_009 EIDKAEGKFWTHWNRETKQFFLQFHFKMEKPPAPPSLPAGPPGVKRPPPPLMNGLPPRPP 190 200 210 220 230 240 1630 1640 1650 1660 1670 1680 pF1KE3 TSPSYSPTSPNYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPS : : :. : : . ::.: .:..: : :. : .:. : .: : . . NP_009 LPESLPPPPPGGLPL-PPMPPTGP--APSGP---PGPPQLPPPAPGVHPPAPVVHPPASG 250 260 270 280 290 300 1690 1700 1710 1720 1730 1740 pF1KE3 YSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPT : .:. : .:. : .:. : . . : .:. : .:. : .:. : .:. : NP_009 VHPPAPGVHPPAPGVHPPAPGVHPPTSGVHPPAPGVHPPAPGVHPPAPGVHPPAPGVHPP 310 320 330 340 350 360 1750 1760 1770 1780 1790 1800 pF1KE3 SPNYSPTSPNYTPTSPSYSPTSPSYSPTSPNYTPTSPNYSPTSPSYSPTSPSYSPTSPSY .:. : : : . : .:. :..: : .:. : .:.. : .:. : :. NP_009 APGVHP------PPSAGVHPQAPGVHPAAPAVHPQAPGVHPPAPGMHPQAPGVHPQPPGV 370 380 390 400 410 1810 1820 1830 1840 1850 1860 pF1KE3 SPSSPRYTPQSPTYTPSSPSYSPSSPSYSPTSPKYTPTSPSYSPSS-PEYTPTSPKYSPT ::.: :: : ::.:. : : .: : : :: .:.. : ::. NP_009 HPSAPGVHPQPPGVHPSNPGVHP--P--TPMPPMLRPPLPSEGPGNIPPPPPTN 420 430 440 450 460 1870 1880 1890 1900 1910 1920 pF1KE3 SPKYSPTSPKYSPTSPTYSPTTPKYSPTSPTYSPTSPVYTPTSPKYSPTSPTYSPTSPKY 1970 residues in 1 query sequences 64092750 residues in 91774 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Jul 16 16:08:02 2019 done: Tue Jul 16 16:08:04 2019 Total Scan time: 10.610 Total Display time: 0.380 Function used was FASTA [36.3.4 Apr, 2011]