FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3496, 1970 aa
1>>>pF1KE3496 1970 - 1970 aa - 1970 aa
Library: /omim/omim.rfq.tfa
64092750 residues in 91774 sequences
Statistics: Expectation_n fit: rho(ln(x))= 19.6099+/-0.000698; mu= -39.3276+/- 0.044
mean_var=1222.3770+/-260.197, 0's: 0 Z-trim(119.1): 332 B-trim: 0 in 0/58
Lambda= 0.036684
statistics sampled from 33615 (33933) to 33615 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.645), E-opt: 0.2 (0.37), width: 16
Scan time: 10.610
The best scores are: opt bits E(91774)
NP_000928 (OMIM: 180660) DNA-directed RNA polymera (1970) 13279 721.1 2.9e-206
NP_008986 (OMIM: 264090,607694,614258) DNA-directe (1390) 1364 90.4 1.5e-16
XP_011521400 (OMIM: 164010,614961) charged multive ( 408) 977 69.4 9.3e-11
NP_001352825 (OMIM: 601234) nascent polypeptide-as (2078) 746 57.9 1.4e-06
NP_002448 (OMIM: 158370) mucin-2 precursor [Homo s (5289) 741 58.0 3.4e-06
NP_775082 (OMIM: 602372) zonadhesin isoform 6 prec (2721) 684 54.7 1.7e-05
NP_003377 (OMIM: 602372) zonadhesin isoform 3 prec (2812) 684 54.7 1.7e-05
NP_056240 (OMIM: 616404,616462) DNA-directed RNA p (1720) 648 52.6 4.5e-05
NP_001291288 (OMIM: 158373) mucin-5AC precursor [H (5654) 552 48.0 0.0036
NP_009096 (OMIM: 600796) splicing factor 3A subuni ( 464) 495 44.0 0.0048
XP_011514857 (OMIM: 602372) zonadhesin isoform X2 (2498) 528 46.4 0.0048
NP_001138422 (OMIM: 618194) soluble scavenger rece (1573) 504 44.9 0.0084
XP_011537078 (OMIM: 147920,602113) histone-lysine (5525) 527 46.7 0.0089
XP_006719679 (OMIM: 147920,602113) histone-lysine (5536) 527 46.7 0.0089
XP_005269219 (OMIM: 147920,602113) histone-lysine (5537) 527 46.7 0.0089
NP_003473 (OMIM: 147920,602113) histone-lysine N-m (5537) 527 46.7 0.0089
XP_006719677 (OMIM: 147920,602113) histone-lysine (5540) 527 46.7 0.0089
XP_011537076 (OMIM: 147920,602113) histone-lysine (5549) 527 46.7 0.0089
XP_011537075 (OMIM: 147920,602113) histone-lysine (5552) 527 46.7 0.0089
XP_011537074 (OMIM: 147920,602113) histone-lysine (5553) 527 46.7 0.0089
XP_011537073 (OMIM: 147920,602113) histone-lysine (5555) 527 46.7 0.0089
XP_011537072 (OMIM: 147920,602113) histone-lysine (5556) 527 46.7 0.0089
>>NP_000928 (OMIM: 180660) DNA-directed RNA polymerase I (1970 aa)
initn: 13279 init1: 13279 opt: 13279 Z-score: 3824.5 bits: 721.1 E(91774): 2.9e-206
Smith-Waterman score: 13279; 100.0% identity (100.0% similar) in 1970 aa overlap (1-1970:1-1970)
10 20 30 40 50 60
pF1KE3 MHGGGPPSGDSACPLRTIKRVQFGVLSPDELKRMSVTEGGIKYPETTEGGRPKLGGLMDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 MHGGGPPSGDSACPLRTIKRVQFGVLSPDELKRMSVTEGGIKYPETTEGGRPKLGGLMDP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 RQGVIERTGRCQTCAGNMTECPGHFGHIELAKPVFHVGFLVKTMKVLRCVCFFCSKLLVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 RQGVIERTGRCQTCAGNMTECPGHFGHIELAKPVFHVGFLVKTMKVLRCVCFFCSKLLVD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 SNNPKIKDILAKSKGQPKKRLTHVYDLCKGKNICEGGEEMDNKFGVEQPEGDEDLTKEKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 SNNPKIKDILAKSKGQPKKRLTHVYDLCKGKNICEGGEEMDNKFGVEQPEGDEDLTKEKG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 HGGCGRYQPRIRRSGLELYAEWKHVNEDSQEKKILLSPERVHEIFKRISDEECFVLGMEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 HGGCGRYQPRIRRSGLELYAEWKHVNEDSQEKKILLSPERVHEIFKRISDEECFVLGMEP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 RYARPEWMIVTVLPVPPLSVRPAVVMQGSARNQDDLTHKLADIVKINNQLRRNEQNGAAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 RYARPEWMIVTVLPVPPLSVRPAVVMQGSARNQDDLTHKLADIVKINNQLRRNEQNGAAA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 HVIAEDVKLLQFHVATMVDNELPGLPRAMQKSGRPLKSLKQRLKGKEGRVRGNLMGKRVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 HVIAEDVKLLQFHVATMVDNELPGLPRAMQKSGRPLKSLKQRLKGKEGRVRGNLMGKRVD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 FSARTVITPDPNLSIDQVGVPRSIAANMTFAEIVTPFNIDRLQELVRRGNSQYPGAKYII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 FSARTVITPDPNLSIDQVGVPRSIAANMTFAEIVTPFNIDRLQELVRRGNSQYPGAKYII
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 RDNGDRIDLRFHPKPSDLHLQTGYKVERHMCDGDIVIFNRQPTLHKMSMMGHRVRILPWS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 RDNGDRIDLRFHPKPSDLHLQTGYKVERHMCDGDIVIFNRQPTLHKMSMMGHRVRILPWS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 TFRLNLSVTTPYNADFDGDEMNLHLPQSLETRAEIQELAMVPRMIVTPQSNRPVMGIVQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 TFRLNLSVTTPYNADFDGDEMNLHLPQSLETRAEIQELAMVPRMIVTPQSNRPVMGIVQD
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 TLTAVRKFTKRDVFLERGEVMNLLMFLSTWDGKVPQPAILKPRPLWTGKQIFSLIIPGHI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 TLTAVRKFTKRDVFLERGEVMNLLMFLSTWDGKVPQPAILKPRPLWTGKQIFSLIIPGHI
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 NCIRTHSTHPDDEDSGPYKHISPGDTKVVVENGELIMGILCKKSLGTSAGSLVHISYLEM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 NCIRTHSTHPDDEDSGPYKHISPGDTKVVVENGELIMGILCKKSLGTSAGSLVHISYLEM
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 GHDITRLFYSNIQTVINNWLLIEGHTIGIGDSIADSKTYQDIQNTIKKAKQDVIEVIEKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 GHDITRLFYSNIQTVINNWLLIEGHTIGIGDSIADSKTYQDIQNTIKKAKQDVIEVIEKA
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 HNNELEPTPGNTLRQTFENQVNRILNDARDKTGSSAQKSLSEYNNFKSMVVSGAKGSKIN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 HNNELEPTPGNTLRQTFENQVNRILNDARDKTGSSAQKSLSEYNNFKSMVVSGAKGSKIN
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 ISQVIAVVGQQNVEGKRIPFGFKHRTLPHFIKDDYGPESRGFVENSYLAGLTPTEFFFHA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 ISQVIAVVGQQNVEGKRIPFGFKHRTLPHFIKDDYGPESRGFVENSYLAGLTPTEFFFHA
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 MGGREGLIDTAVKTAETGYIQRRLIKSMESVMVKYDATVRNSINQVVQLRYGEDGLAGES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 MGGREGLIDTAVKTAETGYIQRRLIKSMESVMVKYDATVRNSINQVVQLRYGEDGLAGES
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE3 VEFQNLATLKPSNKAFEKKFRFDYTNERALRRTLQEDLVKDVLSNAHIQNELEREFERMR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 VEFQNLATLKPSNKAFEKKFRFDYTNERALRRTLQEDLVKDVLSNAHIQNELEREFERMR
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 EDREVLRVIFPTGDSKVVLPCNLLRMIWNAQKIFHINPRLPSDLHPIKVVEGVKELSKKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 EDREVLRVIFPTGDSKVVLPCNLLRMIWNAQKIFHINPRLPSDLHPIKVVEGVKELSKKL
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE3 VIVNGDDPLSRQAQENATLLFNIHLRSTLCSRRMAEEFRLSGEAFDWLLGEIESKFNQAI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 VIVNGDDPLSRQAQENATLLFNIHLRSTLCSRRMAEEFRLSGEAFDWLLGEIESKFNQAI
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE3 AHPGEMVGALAAQSLGEPATQMTLNTFHYAGVSAKNVTLGVPRLKELINISKKPKTPSLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 AHPGEMVGALAAQSLGEPATQMTLNTFHYAGVSAKNVTLGVPRLKELINISKKPKTPSLT
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE3 VFLLGQSARDAERAKDILCRLEHTTLRKVTANTAIYYDPNPQSTVVAEDQEWVNVYYEMP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 VFLLGQSARDAERAKDILCRLEHTTLRKVTANTAIYYDPNPQSTVVAEDQEWVNVYYEMP
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE3 DFDVARISPWLLRVELDRKHMTDRKLTMEQIAEKINAGFGDDLNCIFNDDNAEKLVLRIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 DFDVARISPWLLRVELDRKHMTDRKLTMEQIAEKINAGFGDDLNCIFNDDNAEKLVLRIR
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE3 IMNSDENKMQEEEEVVDKMDDDVFLRCIESNMLTDMTLQGIEQISKVYMHLPQTDNKKKI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 IMNSDENKMQEEEEVVDKMDDDVFLRCIESNMLTDMTLQGIEQISKVYMHLPQTDNKKKI
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE3 IITEDGEFKALQEWILETDGVSLMRVLSEKDVDPVRTTSNDIVEIFTVLGIEAVRKALER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 IITEDGEFKALQEWILETDGVSLMRVLSEKDVDPVRTTSNDIVEIFTVLGIEAVRKALER
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE3 ELYHVISFDGSYVNYRHLALLCDTMTCRGHLMAITRHGVNRQDTGPLMKCSFEETVDVLM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 ELYHVISFDGSYVNYRHLALLCDTMTCRGHLMAITRHGVNRQDTGPLMKCSFEETVDVLM
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE3 EAAAHGESDPMKGVSENIMLGQLAPAGTGCFDLLLDAEKCKYGMEIPTNIPGLGAAGPTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 EAAAHGESDPMKGVSENIMLGQLAPAGTGCFDLLLDAEKCKYGMEIPTNIPGLGAAGPTG
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE3 MFFGSAPSPMGGISPAMTPWNQGATPAYGAWSPSVGSGMTPGAAGFSPSAASDASGFSPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 MFFGSAPSPMGGISPAMTPWNQGATPAYGAWSPSVGSGMTPGAAGFSPSAASDASGFSPG
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE3 YSPAWSPTPGSPGSPGPSSPYIPSPGGAMSPSYSPTSPAYEPRSPGGYTPQSPSYSPTSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 YSPAWSPTPGSPGSPGPSSPYIPSPGGAMSPSYSPTSPAYEPRSPGGYTPQSPSYSPTSP
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE3 SYSPTSPSYSPTSPNYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 SYSPTSPSYSPTSPNYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSP
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE3 TSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 TSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPS
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE3 YSPTSPNYSPTSPNYTPTSPSYSPTSPSYSPTSPNYTPTSPNYSPTSPSYSPTSPSYSPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 YSPTSPNYSPTSPNYTPTSPSYSPTSPSYSPTSPNYTPTSPNYSPTSPSYSPTSPSYSPT
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE3 SPSYSPSSPRYTPQSPTYTPSSPSYSPSSPSYSPTSPKYTPTSPSYSPSSPEYTPTSPKY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 SPSYSPSSPRYTPQSPTYTPSSPSYSPSSPSYSPTSPKYTPTSPSYSPSSPEYTPTSPKY
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE3 SPTSPKYSPTSPKYSPTSPTYSPTTPKYSPTSPTYSPTSPVYTPTSPKYSPTSPTYSPTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 SPTSPKYSPTSPKYSPTSPTYSPTTPKYSPTSPTYSPTSPVYTPTSPKYSPTSPTYSPTS
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970
pF1KE3 PKYSPTSPTYSPTSPKGSTYSPTSPGYSPTSPTYSLTSPAISPDDSDEEN
::::::::::::::::::::::::::::::::::::::::::::::::::
NP_000 PKYSPTSPTYSPTSPKGSTYSPTSPGYSPTSPTYSLTSPAISPDDSDEEN
1930 1940 1950 1960 1970
>>NP_008986 (OMIM: 264090,607694,614258) DNA-directed RN (1390 aa)
initn: 2203 init1: 656 opt: 1364 Z-score: 418.5 bits: 90.4 E(91774): 1.5e-16
Smith-Waterman score: 2501; 34.5% identity (62.0% similar) in 1493 aa overlap (16-1479:13-1368)
10 20 30 40 50
pF1KE3 MHGGGPPSGDSACPLRTIKRVQFGVLSPDELKRMSVTEGGIK--YPETTEGGRPKLGGLM
. :... ::. ::.:..... . : : . .. . : : :..
NP_008 MVKEQFRETDVAKKISHICFGMKSPEEMRQQAHIQVVSKNLYSQDNQHA-PLLYGVL
10 20 30 40 50
60 70 80 90 100 110
pF1KE3 DPRQGVIERTGRCQTCAGNMTECPGHFGHIELAKPVFHVGFLVKTMKVLRCVCFFCSKLL
: :.:. :. :.::. :...: ::.:.:.: : ::::.. .. .:. .: : ...
NP_008 DHRMGTSEKDRPCETCGKNLADCLGHYGYIDLELPCFHVGYFRAVIGILQMICKTCCHIM
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE3 VDSNNPK-IKDILAKSKG----QPKKRLTHVYDLCKGKNICEGGEEMDNKFGVEQPEGDE
..... : . : : : : : . .. : :. ::::. .. :. . :
NP_008 LSQEEKKQFLDYL-KRPGLTYLQKRGLKKKISDKCRKKNICHHCGAFN---GTVKKCGLL
120 130 140 150 160 170
180 190 200 210 220
pF1KE3 DLTKEKGHGGCGRYQPRIR------RSGLELYAEWKHVNEDSQEKKILLSPERVHEIFKR
. .:: . . .: . ....: : . . .::. :.: : ..:::
NP_008 KIIHEKYKTNKKVVDPIVSNFLQSFETAIEHNKEVEPLLGRAQEN---LNPLVVLNLFKR
180 190 200 210 220
230 240 250 260 270 280
pF1KE3 ISDEECFVLGMEPRYARPEWMIVTVLPVPPLSVRPAVVMQ-GSARNQDDLTHKLADIVKI
: :. .: :.:. ..: .:.: : :::: .::.:: . :. :.:::: ::..:. .
NP_008 IPAEDVPLLLMNPEAGKPSDLILTRLLVPPLCIRPSVVSDLKSGTNEDDLTMKLTEIIFL
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE3 NNQLRRNEQNGAAAHVIAEDVKLLQFHVATMVDNELPGLPRAMQKSGRPLKSLKQRLKGK
:. ..... .:: ...: :: .::.. : ....:: :.: : . . ... ::::::
NP_008 NDVIKKHRISGAKTQMIMEDWDFLQLQCALYINSELSGIPLNMAPK-KWTRGFVQRLKGK
290 300 310 320 330 340
350 360 370 380 390 400
pF1KE3 EGRVRGNLMGKRVDFSARTVITPDPNLSIDQVGVPRSIAANMTFAEIVTPFNIDRLQELV
.:: :::: :::::::.::::.::::: ::.:.:: .: .:: : :. ::. :..::
NP_008 QGRFRGNLSGKRVDFSGRTVISPDPNLRIDEVAVPVHVAKILTFPEKVNKANINFLRKLV
350 360 370 380 390 400
410 420 430 440 450 460
pF1KE3 RRGNSQYPGAKYII-RDNGDRIDLRFHPKPS-DLHLQTGYKVERHMCDGDIVIFNRQPTL
. : .:::..: : . . :.. . . .:. : ::::. :::.:.:::::.:
NP_008 QNGPEVHPGANFIQQRHTQMKRFLKYGNREKMAQELKYGDIVERHLIDGDVVLFNRQPSL
410 420 430 440 450 460
470 480 490 500 510 520
pF1KE3 HKMSMMGHRVRILPWSTFRLNLSVTTPYNADFDGDEMNLHLPQSLETRAEIQELAMVPRM
::.:.:.: .:. : :::.: : ::::::::::::::::::. :..:: : .
NP_008 HKLSIMAHLARVKPHRTFRFNECVCTPYNADFDGDEMNLHLPQTEEAKAEALVLMGTKAN
470 480 490 500 510 520
530 540 550 560 570
pF1KE3 IVTPQSNRPVMGIVQDTLTAVRKFTKRDVFLERGEVMNLLM-FLSTWDGKV----PQPAI
.:::....:... .:: ::.. .: .:.:..:... ... .: : :. : :.:
NP_008 LVTPRNGEPLIAAIQDFLTGAYLLTLKDTFFDRAKACQIIASILVGKDEKIKVRLPPPTI
530 540 550 560 570 580
580 590 600 610 620 630
pF1KE3 LKPRPLWTGKQIFSLII-PGHINCIRTHSTHPDDEDSGPYKHISPGDTKVVVENGELIMG
::: :::::::::.:. :. : .:.. . : . . .:. :...:.::. :
NP_008 LKPVTLWTGKQIFSVILRPSDDNPVRANLRTKGKQYCGKGEDLCANDSYVTIQNSELMSG
590 600 610 620 630 640
640 650 660 670 680 690
pF1KE3 ILCKKSLGT-SAGSLVHISYLEMGHDITRLFYSNIQTVINNWLLIEGHTIGIGDSIADSK
. : .::. : ... .: . :.. . .: . . .: .: .::::: .
NP_008 SMDKGTLGSGSKNNIFYILLRDWGQNEAADAMSRLARLAPVYLSNRGFSIGIGDVTPGQG
650 660 670 680 690 700
700 710 720 730 740 750
pF1KE3 TYQDIQNTIKKAKQDVIEVIEKAHNNELEPTPGNTLRQTFENQVNRILNDARDKTGSSAQ
. . .. . . : :: ....:. :: : ..:.: . . :. ::..::.
NP_008 LLKAKYELLNAGYKKCDEYIEALNTGKLQQQPGCTAEETLEALILKELSVIRDHAGSACL
710 720 730 740 750 760
760 770 780 790 800 810
pF1KE3 KSLSEYNNFKSMVVSGAKGSKINISQVIAVVGQQNVEGKRIPFGFKHRTLPHFIKDDYGP
. :.. :. .:.. :.::: :::::.:: :::: . :.:.: ::..:.:::: : . :
NP_008 RELDKSNSPLTMALCGSKGSFINISQMIACVGQQAISGSRVPDGFENRSLPHFEKHSKLP
770 780 790 800 810 820
820 830 840 850 860 870
pF1KE3 ESRGFVENSYLAGLTPTEFFFHAMGGREGLIDTAVKTAETGYIQRRLIKSMESVMVKYDA
..::: ::. .::::::::::.:.:::::.:::::::::::.::::.::.:.. .::
NP_008 AAKGFVANSFYSGLTPTEFFFHTMAGREGLVDTAVKTAETGYMQRRLVKSLEDLCSQYDL
830 840 850 860 870 880
880 890 900 910 920 930
pF1KE3 TVRNSINQVVQLRYGEDGLAGESVEFQNLATLKPSNKAFEKKFRFDYTNERALRRTLQED
:::.: ....:. :: ::: :. :.: : .:
NP_008 TVRSSTGDIIQFIYGGDGL-------------DPA--AMEGK---------------DEP
890 900 910
940 950 960 970 980 990
pF1KE3 LVKDVLSNAHIQNELEREFERMREDREVLRVIFPTGDSKVVLPCNLLRMIWNAQKIFHIN
: ::.:. .. ....:: :. .: : ..: ....:.. .
NP_008 L----------------EFKRVLDN---IKAVFPC-PSEPALSKN--ELILTTESIMKKS
920 930 940 950
1000 1010 1020 1030 1040 1050
pF1KE3 PRL---PSDLHPIK-VVEGVKELSKKLVIVNGDDPLSRQAQENATLLFNIHLRSTLCSRR
: : :. :: ..::.: :: .:. ..:. .: :
NP_008 EFLCCQDSFLQEIKKFIKGVSEKIKK----------TRDK-------YGINDNGTTEPRV
960 970 980 990
1060 1070 1080 1090 1100 1110
pF1KE3 MAEEFRLSGEAFDWLLGEIESKFNQAIAHPGEMVGALAAQSLGEPATQMTLNTFHYAGVS
. . :.. . .: ..:. .: .:: :::: :::.:::.:::::.:::.:::.
NP_008 LYQLDRITPTQVEKFLETCRDKYMRAQMEPGSAVGALCAQSIGEPGTQMTLKTFHFAGVA
1000 1010 1020 1030 1040 1050
1120 1130 1140 1150 1160 1170
pF1KE3 AKNVTLGVPRLKELINISKKPKTPSLTVFLLGQSARDAERAKDILCRLEHTTLRKVTANT
. :.::::::.::.:: :: .:: .:. : .. ::. :. . :.:.: : ...
NP_008 SMNITLGVPRIKEIINASKAISTPIITAQL--DKDDDADYARLVKGRIEKTLLGEIS---
1060 1070 1080 1090 1100 1110
1180 1190 1200 1210 1220 1230
pF1KE3 AIYYDPNPQSTVVAEDQEWVNVYYEMPD--FDVARISPWLLRVELDRKHMTDRKLTMEQI
:... . .:: : ....: : :..: : ... . . .
NP_008 -----------------EYIEEVF-LPDDCFILVKLS--LERIRLLRLEVNAETVRYSIC
1120 1130 1140 1150
1240 1250 1260 1270 1280 1290
pF1KE3 AEKINAGFGDDLNCIFNDDNAEKLVLRIRIMNSDENKMQEEEEVVDKMDDDVFLRCIESN
. :. . :: ..: .: .. ::. . :.. . .:
NP_008 TSKLRVKPGDVAV------HGEAVVC----VTPRENSKSSMYYVLQFLKED---------
1160 1170 1180 1190
1300 1310 1320 1330 1340 1350
pF1KE3 MLTDMTLQGIEQISKVYMHLPQTDNKKKIIITEDGEFKALQEWILETDGVSLMRVLSEKD
: ...::: ..:.. .:. . ..:.: .: : : : .: :.. .
NP_008 -LPKVVVQGIPEVSRAVIHIDEQSGKEK--------YKLLVE------GDNLRAVMATHG
1200 1210 1220 1230 1240
1360 1370 1380 1390 1400 1410
pF1KE3 VDPVRTTSNDIVEIFTVLGIEAVRKALERELYHVISFDGSYVNYRHLALLCDTMTCRGHL
: .:::::. :. .:::::.: .. :. ... : .. ::. :: : :: .:..
NP_008 VKGTRTTSNNTYEVEKTLGIEAARTTIINEIQYTMVNHGMSIDRRHVMLLSDLMTYKGEV
1250 1260 1270 1280 1290 1300
1420 1430 1440 1450 1460 1470
pF1KE3 MAITRHGVNRQDTGPLMKCSFEETVDVLMEAAAHGESDPMKGVSENIMLGQLAPAGTGCF
..::: :. .. . :: :::.:.: :..:: :..: . :::: :..: ::: :
NP_008 LGITRFGLAKMKESVLMLASFEKTADHLFDAAYFGQKDSVCGVSECIIMGIPMNIGTGLF
1310 1320 1330 1340 1350 1360
1480 1490 1500 1510 1520 1530
pF1KE3 DLLLDAEKCKYGMEIPTNIPGLGAAGPTGMFFGSAPSPMGGISPAMTPWNQGATPAYGAW
:: :..
NP_008 KLLHKADRDPNPPKRPLIFDTNEFHIPLVT
1370 1380 1390
>>XP_011521400 (OMIM: 164010,614961) charged multivesicu (408 aa)
initn: 1856 init1: 959 opt: 977 Z-score: 314.7 bits: 69.4 E(91774): 9.3e-11
Smith-Waterman score: 977; 38.0% identity (69.1% similar) in 324 aa overlap (1600-1923:75-395)
1570 1580 1590 1600 1610 1620
pF1KE3 GSPGSPGPSSPYIPSPGGAMSPSYSPTSPAYEPRSPGGYTPQSPSYSPTSPSYSPTSPSY
:: .:::.. ::. .::: ..:: .: .
XP_011 RHPQEERRCELASDGVPRRRSGLQGADSCDYEGGGPGGHS--SPG-DPTSAAFSPPTPRW
50 60 70 80 90 100
1630 1640 1650 1660 1670 1680
pF1KE3 SPTSPNYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTS
::: .:: .: . :: ..:: .: . :: ..:: .: . :: ..:: .: . ::
XP_011 VPTSAAFSPPTPRWVSTSAAFSPPTPRWVSTSAAFSPPTPRWVSTSAAFSPPTPRWVSTS
110 120 130 140 150 160
1690 1700 1710 1720 1730 1740
pF1KE3 PSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPNYS
..:: .: . :: ..:: .: . :: ..:: .: . ::: ..:: .: . ::: .:
XP_011 AAFSPPTPRWVSTSAAFSPPTPRWVSTSAAFSPPTPRWVPTSAAFSPPTPRWVPTSAAFS
170 180 190 200 210 220
1750 1760 1770 1780 1790 1800
pF1KE3 PTSPNYTPTSPSYSPTSPSYSPTSPNYTPTSPNYSPTSPSYSPTSPSYSPTSPSYSPSSP
: .: ..::: ..:: .: . ::: ..: .: . ::: ..:: .: . :: ..:: .:
XP_011 PPTPRWVPTSAAFSPPTPRWVPTSAAFSPPTPRWVPTSAAFSPPTPRWVSTSAAFSPRTP
230 240 250 260 270 280
1810 1820 1830 1840 1850 1860
pF1KE3 RYTPQSPTYTPSSPSYSPSSPSYSPTSPKYTPTSPSYSPSSPEYTPTSPKYSPTSPKYSP
:.. : ...: .: . :.: ..:: .:... :: ..:: .:...::: .:: .:.. :
XP_011 RWVSTSAAFSPPTPRWVPTSAAFSPPTPRWVSTSAAFSPPTPRWVPTSAAFSPPTPRWVP
290 300 310 320 330 340
1870 1880 1890 1900 1910 1920
pF1KE3 TSPKYSPTSPTYSPTTPKYSPTSPTYSPTSPVYTPTSPKYSPTSPTYSPTSPKYSPTSPT
:: .:: .: . ::. .:: .: . :: ...: .:.. :: ..:: .:..
XP_011 TSAAFSPPTPRWVPTSAAFSPPTPHWVSTSAAFSPLTPHWVSTSAAFSPLTPHWVSMAFS
350 360 370 380 390 400
1930 1940 1950 1960 1970
pF1KE3 YSPTSPKGSTYSPTSPGYSPTSPTYSLTSPAISPDDSDEEN
XP_011 VELVVFP
>>NP_001352825 (OMIM: 601234) nascent polypeptide-associ (2078 aa)
initn: 601 init1: 351 opt: 746 Z-score: 239.5 bits: 57.9 E(91774): 1.4e-06
Smith-Waterman score: 823; 33.2% identity (56.7% similar) in 561 aa overlap (1425-1952:633-1175)
1400 1410 1420 1430 1440 1450
pF1KE3 YRHLALLCDTMTCRGHLMAITRHGVNRQDTGPLMKCSF-EETVDVL-MEAAAHGESDPMK
:::.: :. :: .. .:.: . :
NP_001 KPASSMTSPLGVNSSASVIKTDSYAGPDSAGPLLKSSLITPTVAAFPLESADPAGVAPTT
610 620 630 640 650 660
1460 1470 1480 1490 1500 1510
pF1KE3 GVSENIMLGQLAPAGTGCFDLLLDAEKCKYGMEIPTNIPGLGAAGPTGMFFGSAPSPMGG
. . . . .: : .: . : : :..: . .:. . ::::..
NP_001 AKGTSTYTTTASPFLEGTVSLAPKNHPVKEGTL--TTLPLVPTASEN---CPVAPSPQNT
670 680 690 700 710
1520 1530 1540 1550 1560 1570
pF1KE3 ISPAMTPWNQGATPAYGAWSPSVG-SGMTPGAAGFSPSAASDASGFSP-GYSPAWSPTPG
.: : : .. :::. .: ::. . . : .:...: . :: ::
NP_001 CAPLATLVLAPEIPK-SVPSPSLPPAGTPPGTKKVD--GISHTSALAPVASSPKECPTED
720 730 740 750 760 770
1580 1590 1600 1610 1620
pF1KE3 SPGSPGPSSP----YI---PSPGGAMSPSYSPTSPAYEPRSPGGYTPQSPSYSPTSP---
: .: :: :. ::: : .: : . : . : : :: . ::.::
NP_001 SGASATASSKGTLTYLADSPSPLG-VSVSPQTKRPPTKKGSAGPDTPIGNLSSPVSPVEA
780 790 800 810 820 830
1630 1640 1650 1660 1670
pF1KE3 SYSPTSPSYSPTSPNYSP-TSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYS
:. : . : : . . :: :. : .: ::. .:: . .: ::. :. .:: .
NP_001 SFLPEN-SLSFQGSKDSPATTHSPTPPSPKGAPTPSAVTPLSPKGVTLPPKETPTPSVVN
840 850 860 870 880 890
1680 1690 1700 1710 1720 1730
pF1KE3 PTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSP
:. .:..:. .:. : :: : . . . .: . :: ::. .:: :. .: ::
NP_001 LPFPKEGPATPA-PKQAPALSMTSSSPKKARATPAPKGIPASP-SPKGAPTPPAATPPSP
900 910 920 930 940 950
1740 1750 1760 1770 1780 1790
pF1KE3 SYSPT--SPNYSPTSPNYTPTSPSYSPTSPSY--SPTSPNYTPTSPNYSPTSPSY--SPT
. .:. ::...:: : :: ::. .:..:: .:: : :: ::. .:..:: .::
NP_001 KGGPATPSPKWAPTPPAATPPSPKGGPATPSPKGAPTPPAATPPSPKGGPATPSPKGAPT
960 970 980 990 1000 1010
1800 1810 1820 1830 1840
pF1KE3 SPSYSPTSPSYSPSS---PRYTPQSPTYTPSSPSYSPSS---PSYSPTSPKYTPTSPSYS
:. .: ::. ::.. :. . :. :: ::. ::.. :. .::.: : ::. .
NP_001 PPAVTPPSPKGSPAATPFPKGASTPPAATPPSPKGSPAATPLPKGAPTTPAATLPSPKGG
1020 1030 1040 1050 1060 1070
1850 1860 1870 1880 1890 1900
pF1KE3 PSSPEY--TPTSPKYSPTSPKYSPT--SPKYSPTSPTYSPTTPKYSPTSPTY--SPTSPV
:..: .:: : .: ::: .:. ::: .: :. .: .:: . ..: . .::.:.
NP_001 PATPSLKGAPTPPAATPPSPKGGPATPSPKGAPMPPAATPPSPKGGLATPPHKGAPTTPA
1080 1090 1100 1110 1120 1130
1910 1920 1930 1940 1950 1960
pF1KE3 YTPTSPKYSPTSPTYSPTSPKYSPTSPTYSPTSPKGSTYSPTSPGYSPTSPTYSLTSPAI
:: ::: . ..: : :: .::.:. .: ::::. .: : .::.:
NP_001 ATPPSPKGGLATP---P--PKGAPTTPAATPPSPKGGLATPPPKG-APTTPAATPPSPKG
1140 1150 1160 1170 1180
1970
pF1KE3 SPDDSDEEN
NP_001 GLATPSPKGAPTTPAATPPSPKGGLATPSPKGAPTTPAATPPSPKGGLATPSPKGAPTTP
1190 1200 1210 1220 1230 1240
>>NP_002448 (OMIM: 158370) mucin-2 precursor [Homo sapie (5289 aa)
initn: 1191 init1: 429 opt: 741 Z-score: 232.9 bits: 58.0 E(91774): 3.4e-06
Smith-Waterman score: 750; 33.2% identity (58.1% similar) in 401 aa overlap (1568-1945:1398-1781)
1540 1550 1560 1570 1580 1590
pF1KE3 GMTPGAAGFSPSAASDASGFSPGYSPAWSPTPGSPGSPGPSSPYIPSPGGAMSPSYSPTS
:: :: . :: : :. .. :. .:.
NP_002 EDQFGNGPFGLCYDYKIRVNCCWPMDKCITTP-SPPTTTPSPP--PTSTTTLPPTTTPSP
1370 1380 1390 1400 1410 1420
1600 1610 1620 1630 1640 1650
pF1KE3 PAYEPRSPGGYTPQSPSYSPTSPSYSPTSPSYSPTSPNYSPTSPSYSPTSPSYSPTSPSY
:. .: : :: . :. :.:: : : . .: :. .:. :. .:. :.
NP_002 PTTTTTTPPPTTTPSPPITTTTTPPPTTTPS-PPISTTTTPP-PTTTPSPPTTTPSPPTT
1430 1440 1450 1460 1470 1480
1660 1670 1680 1690 1700 1710
pF1KE3 SPTSPSYSPTSP--SYSPTSPSYSPTSPSYSPTS--PSYSPTSPSYSPTSP--SYSPTSP
.:. :. . :.: . .:. :. .: .: : :. :. .:. :. . :.: . .:. :
NP_002 TPSPPTTTTTTPPPTTTPSPPTTTPITPPASTTTLPPTTTPSPPTTTTTTPPPTTTPSPP
1490 1500 1510 1520 1530 1540
1720 1730 1740 1750 1760
pF1KE3 SYSPTSPSYSPTS--PSYSPTSPSYSPTSP--SYSPTSPNYS-PTSPNYTPTSPSYSPTS
. .: .: : :. :. .:. : . :.: . .:. :. . :. :. : :.: ::.
NP_002 TTTPITPPTSTTTLPPTTTPSPPPTTTTTPPPTTTPSPPTTTTPSPPTITTTTPP--PTT
1550 1560 1570 1580 1590 1600
1770 1780 1790 1800 1810 1820
pF1KE3 PSYSPTSPNYTPTSPNYSPTSPSYSPTSPSYSPTS--PSYSPSSPRYTPQSP--TYTPSS
::. . :: :. .:. :. .: .: : :. :. .:: : : .: : :::
NP_002 TPSPPTTTTTTPP-PTTTPSPPTTTPITPPTSTTTLPPTTTPSPPPTTTTTPPPTTTPSP
1610 1620 1630 1640 1650
1830 1840 1850 1860 1870
pF1KE3 PSYSPSSPSYSPTS---PKYTPTSP-SYSPSSPEYTPT--SPKYSPTSPKYSPTSPKYSP
:. . :: . :. : ::.:: . .:: : : : :: .:.:: . :.:. :
NP_002 PTTTTPSPPITTTTTPPPTTTPSSPITTTPSPPTTTMTTPSPTTTPSSPITTTTTPS-ST
1660 1670 1680 1690 1700 1710
1880 1890 1900 1910 1920 1930
pF1KE3 TSPTYSPTTPKYSPTSPTYSPTSPVYTPTS-PKYSPTSP-TYSPTSPKYSPTSPTYSPTS
:.:. ::: .. ::: .:. :. : :. : . .:: : .: :. .: ::.:: :
NP_002 TTPSPPPTT--MTTPSPTTTPSPPTTTMTTLPPTTTSSPLTTTPLPPSITP--PTFSPFS
1720 1730 1740 1750 1760 1770
1940 1950 1960 1970
pF1KE3 PKGSTYSPTSPGYSPTSPTYSLTSPAISPDDSDEEN
: .::.:
NP_002 ----TTTPTTPCVPLCNWTGWLDSGKPNFHKPGGDTELIGDVCGPGWAANISCRATMYPD
1780 1790 1800 1810 1820 1830
>>NP_775082 (OMIM: 602372) zonadhesin isoform 6 precurso (2721 aa)
initn: 624 init1: 624 opt: 684 Z-score: 220.3 bits: 54.7 E(91774): 1.7e-05
Smith-Waterman score: 753; 32.4% identity (52.5% similar) in 516 aa overlap (1480-1963:443-948)
1450 1460 1470 1480 1490 1500
pF1KE3 PMKGVSENIMLGQLAPAGTGCFDLLLDAEKCKYG---MEIPTNIPGLGAAGPTGMFFGSA
: : .:. .. ::: . ...::
NP_775 FPNAGGHYIYLEADEFSQAGQSVRLVSRPFCAPGDICVEFAYHMYGLGEGTMLELLLGS-
420 430 440 450 460 470
1510 1520 1530 1540 1550
pF1KE3 PSPMGGISPAMTPWNQGAT--PAYGAWSPSVGSG-MTP------GAAGFSPSAASDASGF
: : :: . :.. .. : . : .: :: . : : : : .:. : ::
NP_775 --PAG--SPPIPLWKRVGSQRPYWQNTSVTVPSGHQQPMQLIFKGIQG-SNTASVVAMGF
480 490 500 510 520
1560 1570 1580 1590 1600 1610
pF1KE3 ---SPGYSPAWSPTPGSPGSPGPSSPYIPSPGGAMSPSYSPTSPAYEPRSPGGYT--PQS
.:: :. : :: :. . : . .:. : .:. ..:. : :
NP_775 ILINPGTCPVKVLPELPPVSPVSSTGPSETTGLTENPTISTKKPTVSIEKPSVTTEKPTV
530 540 550 560 570 580
1620 1630 1640 1650 1660 1670
pF1KE3 PSYSPTSPSYSPTSPSYSPTSPNYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYS
:. .:: :. .:: . .:: :. .:. :: .:: :: .:: . .:: :: .:: :: .
NP_775 PKEKPTIPTEKPTISTEKPTIPSEKPNMPSEKPTIPSEKPTILTEKPTIPSEKPTIPSEK
590 600 610 620 630 640
1680 1690 1700 1710 1720
pF1KE3 PTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPT---------
:: . .:: :. ::.:. :. :. :. .:. :. .:. :. .::
NP_775 PTISTEKPTVPTEEPTTPTEETTTSMEEPVIPTEKPSIPTEKPSIPTEKPTISMEETIIS
650 660 670 680 690 700
1730 1740 1750 1760 1770
pF1KE3 --SPSYSP---TSPSYSPTSPSYSPTSPNYSPTSPNYTPTSPSYSPTSPSYSPTSPNYTP
.:. :: : :. .:: :. . : .::.:. :: :. .:: .::.:. :
NP_775 TEKPTISPEKPTIPTEKPTIPTEKSTISPEKPTTPTEKPTIPTEKPTISPEKPTTPTEKP
710 720 730 740 750 760
1780 1790 1800 1810 1820 1830
pF1KE3 TSPNYSPTSPSYSPTSPSYSPTSPSYSPSSPRYTPQSPTYTPSSPSYSPSSPSYSPTSP-
: . : :. .:: :. .:: :. .:. : .:: . . .:: : .:: :
NP_775 TISPEKLTIPTEKPTIPTEKPTIPTEKPTISTEEPTTPTEETTISTEKPSIPMEKPTLPT
770 780 790 800 810 820
1840 1850 1860 1870 1880 1890
pF1KE3 KYTPTSPSYSPSSPEYTPTSPKYSPTSPKYSPTSPKYSPTSPTYSPTTPKYSPTSPTYSP
. : :: . : : : : .:: .:: : .:: . : : . : :: .:
NP_775 EETTTSVEETTISTEKL-TIPMEKPTISTEKPTIPTEKPTISPEKLTIPTEKLTIPTEKP
830 840 850 860 870 880
1900 1910 1920 1930 1940 1950
pF1KE3 TSPVYTPTSPKYSPTSPTYSPTSPKYSPTSPTYSPTSPKGSTYSPTSPGYSPTSPTYSLT
: :. : . : :: .:: :: .:: : .: : .:: : : : .::
NP_775 TIPIEETTISTEKLTIPTEKPT---ISPEKPTISTEKPTIPTEKPTIPTEETTISTEKLT
890 900 910 920 930 940
1960 1970
pF1KE3 SPAISPDDSDEEN
:. .:
NP_775 IPTEKPTISPEKLTIPTEKPTISTEKPTIPTEKLTIPTEKPTIPTEKPTIPTEKLTALRP
950 960 970 980 990 1000
>>NP_003377 (OMIM: 602372) zonadhesin isoform 3 precurso (2812 aa)
initn: 624 init1: 624 opt: 684 Z-score: 220.1 bits: 54.7 E(91774): 1.7e-05
Smith-Waterman score: 753; 32.4% identity (52.5% similar) in 516 aa overlap (1480-1963:443-948)
1450 1460 1470 1480 1490 1500
pF1KE3 PMKGVSENIMLGQLAPAGTGCFDLLLDAEKCKYG---MEIPTNIPGLGAAGPTGMFFGSA
: : .:. .. ::: . ...::
NP_003 FPNAGGHYIYLEADEFSQAGQSVRLVSRPFCAPGDICVEFAYHMYGLGEGTMLELLLGS-
420 430 440 450 460 470
1510 1520 1530 1540 1550
pF1KE3 PSPMGGISPAMTPWNQGAT--PAYGAWSPSVGSG-MTP------GAAGFSPSAASDASGF
: : :: . :.. .. : . : .: :: . : : : : .:. : ::
NP_003 --PAG--SPPIPLWKRVGSQRPYWQNTSVTVPSGHQQPMQLIFKGIQG-SNTASVVAMGF
480 490 500 510 520
1560 1570 1580 1590 1600 1610
pF1KE3 ---SPGYSPAWSPTPGSPGSPGPSSPYIPSPGGAMSPSYSPTSPAYEPRSPGGYT--PQS
.:: :. : :: :. . : . .:. : .:. ..:. : :
NP_003 ILINPGTCPVKVLPELPPVSPVSSTGPSETTGLTENPTISTKKPTVSIEKPSVTTEKPTV
530 540 550 560 570 580
1620 1630 1640 1650 1660 1670
pF1KE3 PSYSPTSPSYSPTSPSYSPTSPNYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYS
:. .:: :. .:: . .:: :. .:. :: .:: :: .:: . .:: :: .:: :: .
NP_003 PKEKPTIPTEKPTISTEKPTIPSEKPNMPSEKPTIPSEKPTILTEKPTIPSEKPTIPSEK
590 600 610 620 630 640
1680 1690 1700 1710 1720
pF1KE3 PTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPT---------
:: . .:: :. ::.:. :. :. :. .:. :. .:. :. .::
NP_003 PTISTEKPTVPTEEPTTPTEETTTSMEEPVIPTEKPSIPTEKPSIPTEKPTISMEETIIS
650 660 670 680 690 700
1730 1740 1750 1760 1770
pF1KE3 --SPSYSP---TSPSYSPTSPSYSPTSPNYSPTSPNYTPTSPSYSPTSPSYSPTSPNYTP
.:. :: : :. .:: :. . : .::.:. :: :. .:: .::.:. :
NP_003 TEKPTISPEKPTIPTEKPTIPTEKSTISPEKPTTPTEKPTIPTEKPTISPEKPTTPTEKP
710 720 730 740 750 760
1780 1790 1800 1810 1820 1830
pF1KE3 TSPNYSPTSPSYSPTSPSYSPTSPSYSPSSPRYTPQSPTYTPSSPSYSPSSPSYSPTSP-
: . : :. .:: :. .:: :. .:. : .:: . . .:: : .:: :
NP_003 TISPEKLTIPTEKPTIPTEKPTIPTEKPTISTEEPTTPTEETTISTEKPSIPMEKPTLPT
770 780 790 800 810 820
1840 1850 1860 1870 1880 1890
pF1KE3 KYTPTSPSYSPSSPEYTPTSPKYSPTSPKYSPTSPKYSPTSPTYSPTTPKYSPTSPTYSP
. : :: . : : : : .:: .:: : .:: . : : . : :: .:
NP_003 EETTTSVEETTISTEKL-TIPMEKPTISTEKPTIPTEKPTISPEKLTIPTEKLTIPTEKP
830 840 850 860 870 880
1900 1910 1920 1930 1940 1950
pF1KE3 TSPVYTPTSPKYSPTSPTYSPTSPKYSPTSPTYSPTSPKGSTYSPTSPGYSPTSPTYSLT
: :. : . : :: .:: :: .:: : .: : .:: : : : .::
NP_003 TIPIEETTISTEKLTIPTEKPT---ISPEKPTISTEKPTIPTEKPTIPTEETTISTEKLT
890 900 910 920 930 940
1960 1970
pF1KE3 SPAISPDDSDEEN
:. .:
NP_003 IPTEKPTISPEKLTIPTEKPTISTEKPTIPTEKLTIPTEKPTIPTEKPTIPTEKLTALRP
950 960 970 980 990 1000
>>NP_056240 (OMIM: 616404,616462) DNA-directed RNA polym (1720 aa)
initn: 1614 init1: 457 opt: 648 Z-score: 212.6 bits: 52.6 E(91774): 4.5e-05
Smith-Waterman score: 1549; 27.4% identity (53.0% similar) in 1653 aa overlap (69-1473:102-1715)
40 50 60 70 80 90
pF1KE3 GGIKYPETTEGGRPKLGGLMDPRQGVIERTGRCQTCAGNMTECPGHFGHIELAK-PVFHV
: : .: .: :: :. : . :..:
NP_056 SNCSGHLGHIELPLTVYNPLLFDKLYLLLRGSCLNC--HMLTCPRAVIHLLLCQLRVLEV
80 90 100 110 120
100 110 120 130 140 150
pF1KE3 GFLVKTMKVLRCVCFFCSKLLVDSNNPKIKDILAKSKGQPKKRLTHVYDLCKG---KNIC
: : .... : . ...: .. .:. ..: . . . . . .: ::.:
NP_056 GALQAVYELERIL----NRFLEENPDPSASEIREELEQYTTEIVQNNLLGSQGAHVKNVC
130 140 150 160 170 180
160 170 180 190 200
pF1KE3 EGGEE---------MDNKFGVEQPEGDEDLTKEKGHGGCGRYQPRIRRSGLELYAEWKHV
:. . :. : . : . ::.. . ..:.. . .: .
NP_056 ESKSKLIALFWKAHMNAKRCPHCKTGRSVVRKEHNSKLTITFPAMVHRTAGQKDSEPLGI
190 200 210 220 230 240
210 220 230 240 250
pF1KE3 NEDSQEKKILLSPERVHEIFKRISDEECFVL----------GMEPRYARPEWMIVTVLPV
.: . :. :.: ..: .. . .: : : ::: :. : ... : :
NP_056 EEAQIGKRGYLTPTSAREHLSALWKNEGFFLNYLFSGMDDDGMESRFN-PSVFFLDFLVV
250 260 270 280 290 300
260 270 280 290 300
pF1KE3 PPLSVRPAVVM--QGSARNQD-DLTHKLADIVKINNQLRRNEQNGAAAHVIAEDV-----
:: ::. . : . .: .: . :.: : . : :. . .: .
NP_056 PPSRYRPVSRLGDQMFTNGQTVNLQAVMKDVVLIRKLLALMAQEQKLPEEVATPTTDEEK
310 320 330 340 350 360
310 320 330 340
pF1KE3 ---------------------KL------LQFHVATMVDNELPGLPRAMQKSGRPLKSLK
:: :: :: . :.:. : :.: : ...
NP_056 DSLIAIDRSFLSTLPGQSLIDKLYNIWIRLQSHVNIVFDSEMDKL--MMDK--YP--GIR
370 380 390 400 410
350 360 370 380 390 400
pF1KE3 QRLKGKEGRVRGNLMGKRVDFSARTVITPDPNLSIDQVGVPRSIAANMTFAEIVTPFNID
: :. ::: : ..::::::..::.:: :: .. ...:.: .:...:. . :::.:..
NP_056 QILEKKEGLFRKHMMGKRVDYAARSVICPDMYINTNEIGIPMVFATKLTYPQPVTPWNVQ
420 430 440 450 460 470
410 420 430 440
pF1KE3 RLQELVRRGNSQYPGAKYIIRDNGDR-----IDLR---------FHPKPSDLHLQTGYKV
.:.. : : . .:::...: ..:.: .:. . : . . : :
NP_056 ELRQAVINGPNVHPGASMVINEDGSRTALSAVDMTQREAVAKQLLTPATGAPKPQGTKIV
480 490 500 510 520 530
450 460 470 480 490 500
pF1KE3 ERHMCDGDIVIFNRQPTLHKMSMMGHRVRILPW-STFRLNLSVTTPYNADFDGDEMNLHL
::. .:::...:::::::. :...::.:::: ...::. . ::::::::::: :.
NP_056 CRHVKNGDILLLNRQPTLHRPSIQAHRARILPEEKVLRLHYANCKAYNADFDGDEMNAHF
540 550 560 570 580 590
510 520 530 540 550 560
pF1KE3 PQSLETRAEIQELAMVPRMIVTPQSNRPVMGIVQDTLTAVRKFTKRDVFLERGEVMNLLM
::: ::: :: . .. ..:....:. :..:: ... ..: : :. : . :.:..
NP_056 PQSELGRAEAYVLACTDQQYLVPKDGQPLAGLIQDHMVSGASMTTRGCFFTREHYMELVY
600 610 620 630 640 650
570 580 590 600 610
pF1KE3 F-LSTWDGKVP--QPAILKPRPLWTGKQIFSL----IIP-GHINC-------IRTHSTHP
:. :.: .:.:::: :::::::. : ::: :: : ..
NP_056 RGLTDKVGRVKLLSPSILKPFPLWTGKQVVSTLLINIIPEDHIPLNLSGKAKITGKAWVK
660 670 680 690 700 710
620 630 640 650 660
pF1KE3 DDEDSGP-YKHISPGDTKVVVENGELIMGILCKKSLGTSAGSLVHISYLEMGHDITRLFY
. : : .. : ...:....:::. :.: : :.:: .::: : .: . .
NP_056 ETPRSVPGFNPDSMCESQVIIREGELLCGVLDKAHYGSSAYGLVHCCYEIYGGETSGKVL
720 730 740 750 760 770
670 680 690 700 710 720
pF1KE3 SNIQTVINNWL-LIEGHTIGIGDSI----ADSKTYQDIQNTIKKAKQDV---IEVIEKAH
. . ... .: : .: :.:. : . :: : . :... . . : : ... : :
NP_056 TCLARLFTAYLQLYRGFTLGVEDILVKPKADVKRQRIIEESTHCGPQAVRAALNLPEAAS
780 790 800 810 820 830
730 740 750 760 770
pF1KE3 NNEL-----------EPTPGNTLRQTFENQVNRILNDARDKTGSSAQKSLSEYNNFKSMV
.:. . : . :...::. :. . . :... ::
NP_056 YDEVRGKWQDAHLGKDQRDFNMIDLKFKEEVNHYSNEINKACMPFGLHRQFPENSLQMMV
840 850 860 870 880 890
780 790 800 810 820 830
pF1KE3 VSGAKGSKINISQVIAVVGQQNVEGKRIPFGFKHRTLPHFIKDDYGPESRGFVENSYLAG
:::::: .: :. ..:: ..::.: :. . ..:: : .. :.. ::: . .:.:
NP_056 QSGAKGSTVNTMQISCLLGQIELEGRRPPLMASGKSLPCFEPYEFTPRAGGFVTGRFLTG
900 910 920 930 940 950
840 850 860 870 880 890
pF1KE3 LTPTEFFFHAMGGREGLIDTAVKTAETGYIQRRLIKSMESVMVKYDATVRNSINQVVQLR
. : ::::: :.:::::.::::::...::.:: .:: .:...:.:: :::.: ..:::.
NP_056 IKPPEFFFHCMAGREGLVDTAVKTSRSGYLQRCIIKHLEGLVVQYDLTVRDSDGSVVQFL
960 970 980 990 1000 1010
900 910 920 930 940 950
pF1KE3 YGEDGLAGESVEFQNLATLKPSNKAFEKKFRFDYTNERALRRTLQEDLVKDVLSNAHIQN
:::::: ...: :.: :.: : .: ... .. . ...::: : ..
NP_056 YGEDGLDIPKTQF-----LQP------KQFPFLASNYEVIMKSQH---LHEVLSRADPKK
1020 1030 1040 1050 1060
960 970 980 990 1000
pF1KE3 ELE-----REFERMREDREVLRVIFPTGDSKVVLPCNLLRMIWNAQKIFHINPRLPSDLH
:. .... . . . : : . ..:. . :.. . . : : :. .
NP_056 ALHHFRAIKKWQSKHPNTLLRRGAFLSYSQKIQEAVKALKLESENR-----NGRSPGTQE
1070 1080 1090 1100 1110
1010 1020 1030 1040 1050
pF1KE3 PIKVVEGVKELSK----KLVIVNGDDPLS--RQAQENATLLFNIHLRSTLCSRRMAEEFR
... . : :. : . . : :: : :.. ... . :.. : . .
NP_056 MLRMWYELDEESRRKYQKKAAACPDPSLSVWRPDIYFASVSETFETKVDDYSQEWAAQTE
1120 1130 1140 1150 1160 1170
1060 1070 1080 1090 1100 1110
pF1KE3 LSGE----AFDWLLGEIESKFNQAIAHPGEMVGALAAQSLGEPATQMTLNTFHYAGVSAK
: : ..: : .. :..... .::: :: :::::.:::.:::::::::.:: .
NP_056 KSYEKSELSLDRLRTLLQLKWQRSLCEPGEAVGLLAAQSIGEPSTQMTLNTFHFAGRGEM
1180 1190 1200 1210 1220 1230
1120 1130 1140 1150 1160 1170
pF1KE3 NVTLGVPRLKELINI-SKKPKTPSLTVFLLGQSARDAERAKDILCRLEHTTLRKVTANTA
:::::.:::.:.. . : . ::: ..: .:. . . .:.:.. .: .. : .: .
NP_056 NVTLGIPRLREILMVASANIKTPMMSVPVLN-TKKALKRVKSLKKQLTRVCLGEVLQKID
1240 1250 1260 1270 1280 1290
1180 1190 1200 1210 1220 1230
pF1KE3 IYYDPNPQSTVVAEDQEWVNVYYEMPDF--DVARISPWLLRVELDRKHMTDR--KLTMEQ
. .: . : :. .:: .: . . :: : . : : :: ::.
NP_056 VQ-----ESFCMEEKQNKFQVYQLRFQFLPHAYYQQEKCLRPEDILRFMETRFFKLLMES
1300 1310 1320 1330 1340 1350
1240 1250 1260
pF1KE3 IAEKIN--------------------AG-FGDDLNCIFNDDNAEKLVLRIRIMN-----S
: .: : :: .: . . .:.. : .. . . :
NP_056 IKKKNNKASAFRNVNTRRATQRDLDNAGELGRSRGEQEGDEEEEGHIVDAEAEEGDADAS
1360 1370 1380 1390 1400 1410
1270 1280 1290
pF1KE3 DENKMQEEEEVVDKMDDDVFLRCIESNMLTDMT---------------------------
: .. ...:: :: ... : : : ::
NP_056 DAKRKEKQEEEVDYESEEEEEREGEENDDEDMQEERNPHREGARKTQEQDEEVGLGTEED
1420 1430 1440 1450 1460 1470
1300 1310
pF1KE3 ----------------------------LQGIEQIS----------------KVYMHLP-
.:....: .: ..::
NP_056 PSLPALLTQPRKPTHSQEPQGPEAMERRVQAVREIHPFIDDYQYDTEESLWCQVTVKLPL
1480 1490 1500 1510 1520 1530
1320 1330 1340 1350
pF1KE3 ---------------------QTDNKKKIIITEDGEFKALQEWILETDGVSLMRVLSEKD
: . . ...: . : .: .:.:.:..: .... .
NP_056 MKINFDMSSLVVSLAHGAVIYATKGITRCLLNETTNNKNEKELVLNTEGINLPELFKYAE
1540 1550 1560 1570 1580 1590
1360 1370 1380 1390 1400 1410
pF1KE3 V-DPVRTTSNDIVEIFTVLGIEAVRKALERELYHVISFDGSYVNYRHLALLCDTMTCRGH
: : : :::: : .. ::::. ...:.:. :.. : :. :::.:. : : .:
NP_056 VLDLRRLYSNDIHAIANTYGIEAALRVIEKEIKDVFAVYGIAVDPRHLSLVADYMCFEGV
1600 1610 1620 1630 1640 1650
1420 1430 1440 1450 1460 1470
pF1KE3 LMAITRHGVNRQDTGPLMKCSFEETVDVLMEAAAHGESDPMKGVSENIMLGQLAPAGTGC
..: :. :....::.. .:: . . : .:. : : ... : ...:... .:::
NP_056 YKPLNRFGI-RSNSSPLQQMTFETSFQFLKQATMLGSHDELRSPSACLVVGKVVRGGTGL
1660 1670 1680 1690 1700 1710
1480 1490 1500 1510 1520 1530
pF1KE3 FDLLLDAEKCKYGMEIPTNIPGLGAAGPTGMFFGSAPSPMGGISPAMTPWNQGATPAYGA
:.:
NP_056 FELKQPLR
1720
>>NP_001291288 (OMIM: 158373) mucin-5AC precursor [Homo (5654 aa)
initn: 998 init1: 370 opt: 552 Z-score: 178.4 bits: 48.0 E(91774): 0.0036
Smith-Waterman score: 571; 29.4% identity (55.2% similar) in 493 aa overlap (1495-1963:4107-4593)
1470 1480 1490 1500 1510 1520
pF1KE3 PAGTGCFDLLLDAEKCKYGMEIPTNIPGLGAAGPTGMFFGSAPS----PMGGISPAMTPW
.: :. . .:.:: : . . : :
NP_001 PTQSTSSWQKSRTTTLVTTSTTSTPQTSTTSAPTTSTIPASTPSTTSAPTTSTTSAPTTS
4080 4090 4100 4110 4120 4130
1530 1540 1550 1560 1570 1580
pF1KE3 NQGATPAYGAWSPSVGSGMTPGAAGFSPSAASDASGFSPGYSPAWSPTPGSPGSPGPSSP
. .: . .:.... ..: .. . :: . ... .: : . : .. ..: :.
NP_001 TTSAPTHRTTSGPTTSTTLAPTTS--TTSAPTTSTNSAPTTSTISASTTSTISAPTTSTI
4140 4150 4160 4170 4180 4190
1590 1600 1610 1620 1630 1640
pF1KE3 YIPSPGGAMSPSYSPTSPAYEPRSPGGYTPQSPSYSPTSPSYSPTSPSYSPTSPNYSPTS
:. . . .:. : :: : . :. : :: . .. : : :: . .::. . ..
NP_001 SSPTSSTTSTPQTSKTSAATSSTTSGSGTTPSPVPTTSTTSASTTSTTSAPTTS--TTSG
4200 4210 4220 4230 4240 4250
1650 1660 1670 1680 1690
pF1KE3 PSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYS-PTSPSYSPTSPSYSPTSPSYSPTSPSY
:. .: :: : .. : . :: . .::. . : ::: : . . ::. . . ..:.
NP_001 PGTTP-SPVPSTSTTSAATTSTTSAPTTRTTSAPTSSMTSGPGTTPSPVPTTSTTSAPTT
4260 4270 4280 4290 4300 4310
1700 1710 1720 1730 1740 1750
pF1KE3 SPTS-PSYSPTSPSYSPTSPSYSPTSPSYSP-TSPSYSPTSPSYSPTSPNYSPTSPNYTP
: :: :. .: :: . .. : :: . .: ..:: ::. . : . . . .: :
NP_001 STTSGPGTTP-SPVPTTSTTSAPITSTTSGPGSTPSPVPTTSTTSAPTTSTTSASTASTT
4320 4330 4340 4350 4360 4370
1760 1770 1780 1790 1800 1810
pF1KE3 TSPSYSPTS-PSYSPTSPNYTPTSPNYSPTSPSYSPTSPSYSPTSPSYSPSSPRYTPQSP
..:. .:. :. : :: : :. . .. : ..:: ::. . : . : :: :
NP_001 SGPGTTPSPVPTTSTTSAPTTRTTSASTASTTSGPGSTPSPVPTTSTTSAPTTRTTPAST
4380 4390 4400 4410 4420 4430
1820 1830 1840 1850 1860 1870
pF1KE3 TYTPSSPSYSPSS-PSYSPTSPKYTPTS--PSYSPSSPEYTP--TSPKYSPTS-PKYSPT
. : :.:. .:: :. : :: . : : :. : .: : ..: .:. : : :
NP_001 ASTTSGPGTTPSPVPTTSTTSASTTSTISLPTTSTTSAPITSMTSGPGTTPSPVPTTSTT
4440 4450 4460 4470 4480 4490
1880 1890 1900 1910 1920
pF1KE3 S-PKYSPTSPTYSPTT--PKYSPTS-PTYSPTS-PVYTPTSPKYSPTS--P--TYSPTSP
: : : :: . . :: : .:. :: : :: :. . :: . . :. : . ::.
NP_001 SAPTTSTTSASTASTTSGPGTTPSPVPTTSTTSAPTTSTTSASTASTTSGPGTSLSPVPT
4500 4510 4520 4530 4540 4550
1930 1940 1950 1960 1970
pF1KE3 KYSPTSPTYSPTSPKGSTYSPTSPGYSPTSPTYSLTS-PAISPDDSDEEN
. ..:: : :: :.: ::. . ..:: : :: :. .:
NP_001 TSTTSAPTTSTTSGPGTTPSPVPTTSTTSAPTTSTTSGPGTTPSPVPTTSTTPVSKTSTS
4560 4570 4580 4590 4600 4610
NP_001 HLSVSKTTHSQPVTSDCHPLCAWTKWFDVDFPSPGPHGGDKETYNNIIRSGEKICRRPEE
4620 4630 4640 4650 4660 4670
>>NP_009096 (OMIM: 600796) splicing factor 3A subunit 2 (464 aa)
initn: 188 init1: 86 opt: 495 Z-score: 176.1 bits: 44.0 E(91774): 0.0048
Smith-Waterman score: 507; 29.2% identity (49.2% similar) in 264 aa overlap (1595-1857:217-464)
1570 1580 1590 1600 1610 1620
pF1KE3 WSPTPGSPGSPGPSSPYIPSPGGAMSPSYSPTSPAYEPRSPGGYTPQSPSYSPTSPSYSP
: .: : .: : : : :
NP_009 EIDKAEGKFWTHWNRETKQFFLQFHFKMEKPPAPPSLPAGPPGVKRPPPPLMNGLPPRPP
190 200 210 220 230 240
1630 1640 1650 1660 1670 1680
pF1KE3 TSPSYSPTSPNYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPS
: : :. : : . ::.: .:..: : :. : .:. : .: : . .
NP_009 LPESLPPPPPGGLPL-PPMPPTGP--APSGP---PGPPQLPPPAPGVHPPAPVVHPPASG
250 260 270 280 290 300
1690 1700 1710 1720 1730 1740
pF1KE3 YSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPT
: .:. : .:. : .:. : . . : .:. : .:. : .:. : .:. :
NP_009 VHPPAPGVHPPAPGVHPPAPGVHPPTSGVHPPAPGVHPPAPGVHPPAPGVHPPAPGVHPP
310 320 330 340 350 360
1750 1760 1770 1780 1790 1800
pF1KE3 SPNYSPTSPNYTPTSPSYSPTSPSYSPTSPNYTPTSPNYSPTSPSYSPTSPSYSPTSPSY
.:. : : : . : .:. :..: : .:. : .:.. : .:. : :.
NP_009 APGVHP------PPSAGVHPQAPGVHPAAPAVHPQAPGVHPPAPGMHPQAPGVHPQPPGV
370 380 390 400 410
1810 1820 1830 1840 1850 1860
pF1KE3 SPSSPRYTPQSPTYTPSSPSYSPSSPSYSPTSPKYTPTSPSYSPSS-PEYTPTSPKYSPT
::.: :: : ::.:. : : .: : : :: .:.. : ::.
NP_009 HPSAPGVHPQPPGVHPSNPGVHP--P--TPMPPMLRPPLPSEGPGNIPPPPPTN
420 430 440 450 460
1870 1880 1890 1900 1910 1920
pF1KE3 SPKYSPTSPKYSPTSPTYSPTTPKYSPTSPTYSPTSPVYTPTSPKYSPTSPTYSPTSPKY
1970 residues in 1 query sequences
64092750 residues in 91774 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Jul 16 16:08:02 2019 done: Tue Jul 16 16:08:04 2019
Total Scan time: 10.610 Total Display time: 0.380
Function used was FASTA [36.3.4 Apr, 2011]