FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5764, 756 aa 1>>>pF1KB5764 756 - 756 aa - 756 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.7410+/-0.00112; mu= 13.0605+/- 0.068 mean_var=94.6601+/-18.473, 0's: 0 Z-trim(104.3): 31 B-trim: 0 in 0/50 Lambda= 0.131823 statistics sampled from 7805 (7819) to 7805 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.6), E-opt: 0.2 (0.24), width: 16 Scan time: 3.110 The best scores are: opt bits E(32554) CCDS2663.1 MLH1 gene_id:4292|Hs108|chr3 ( 756) 4894 941.8 0 CCDS54562.1 MLH1 gene_id:4292|Hs108|chr3 ( 658) 4261 821.4 0 CCDS54563.1 MLH1 gene_id:4292|Hs108|chr3 ( 515) 3368 651.5 9.6e-187 CCDS5343.1 PMS2 gene_id:5395|Hs108|chr7 ( 862) 450 96.6 1.7e-19 CCDS9837.1 MLH3 gene_id:27030|Hs108|chr14 (1429) 391 85.5 6.4e-16 CCDS32123.1 MLH3 gene_id:27030|Hs108|chr14 (1453) 391 85.5 6.5e-16 CCDS46473.1 PMS1 gene_id:5378|Hs108|chr2 ( 770) 381 83.5 1.4e-15 CCDS2302.1 PMS1 gene_id:5378|Hs108|chr2 ( 932) 381 83.5 1.6e-15 CCDS46474.1 PMS1 gene_id:5378|Hs108|chr2 ( 893) 351 77.8 8.3e-14 CCDS82544.1 PMS1 gene_id:5378|Hs108|chr2 ( 181) 314 70.5 2.6e-12 CCDS82543.1 PMS1 gene_id:5378|Hs108|chr2 ( 165) 309 69.6 4.7e-12 >>CCDS2663.1 MLH1 gene_id:4292|Hs108|chr3 (756 aa) initn: 4894 init1: 4894 opt: 4894 Z-score: 5031.9 bits: 941.8 E(32554): 0 Smith-Waterman score: 4894; 99.9% identity (100.0% similar) in 756 aa overlap (1-756:1-756) 10 20 30 40 50 60 pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEVV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 GRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSVFGNAVSRELIEIGCEDKTLAF ::::::::::::::::::::::::::::::::::::::.::::::::::::::::::::: CCDS26 GRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSIFGNAVSRELIEIGCEDKTLAF 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 KMNGYISNANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 KMNGYISNANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 QNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 QNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 KSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVTEDKTDIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 KSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVTEDKTDIS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 SGRARQQDEEMLELPAPAEVAAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 SGRARQQDEEMLELPAPAEVAAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 MVEDDSRKEMTAACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 MVEDDSRKEMTAACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWAL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB5 AQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 AQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB5 DGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 DGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRL 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB5 ATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 ATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIV 670 680 690 700 710 720 730 740 750 pF1KB5 YKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC :::::::::::::::::::::::::::::::::::: CCDS26 YKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC 730 740 750 >>CCDS54562.1 MLH1 gene_id:4292|Hs108|chr3 (658 aa) initn: 4261 init1: 4261 opt: 4261 Z-score: 4382.3 bits: 821.4 E(32554): 0 Smith-Waterman score: 4261; 99.8% identity (100.0% similar) in 655 aa overlap (102-756:4-658) 80 90 100 110 120 130 pF1KB5 DLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTADGKCAYRASYS :::::::::::::::::::::::::::::: CCDS54 MAFEALASISHVAHVTITTKTADGKCAYRASYS 10 20 30 140 150 160 170 180 190 pF1KB5 DGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEVVGRYSVHNAGIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 DGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEVVGRYSVHNAGIS 40 50 60 70 80 90 200 210 220 230 240 250 pF1KB5 FSVKKQGETVADVRTLPNASTVDNIRSVFGNAVSRELIEIGCEDKTLAFKMNGYISNANY :::::::::::::::::::::::::::.:::::::::::::::::::::::::::::::: CCDS54 FSVKKQGETVADVRTLPNASTVDNIRSIFGNAVSRELIEIGCEDKTLAFKMNGYISNANY 100 110 120 130 140 150 260 270 280 290 300 310 pF1KB5 SVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 SVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTK 160 170 180 190 200 210 320 330 340 350 360 370 pF1KB5 HEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 HEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSST 220 230 240 250 260 270 380 390 400 410 420 430 pF1KB5 SGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 SGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEM 280 290 300 310 320 330 440 450 460 470 480 490 pF1KB5 LELPAPAEVAAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 LELPAPAEVAAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMT 340 350 360 370 380 390 500 510 520 530 540 550 pF1KB5 AACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 AACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLN 400 410 420 430 440 450 560 570 580 590 600 610 pF1KB5 TTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 TTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYI 460 470 480 490 500 510 620 630 640 650 660 670 pF1KB5 VEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 VEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKE 520 530 540 550 560 570 680 690 700 710 720 730 pF1KB5 CFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 CFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPP 580 590 600 610 620 630 740 750 pF1KB5 KHFTEDGNILQLANLPDLYKVFERC ::::::::::::::::::::::::: CCDS54 KHFTEDGNILQLANLPDLYKVFERC 640 650 >>CCDS54563.1 MLH1 gene_id:4292|Hs108|chr3 (515 aa) initn: 3368 init1: 3368 opt: 3368 Z-score: 3466.1 bits: 651.5 E(32554): 9.6e-187 Smith-Waterman score: 3368; 100.0% identity (100.0% similar) in 515 aa overlap (242-756:1-515) 220 230 240 250 260 270 pF1KB5 TVDNIRSVFGNAVSRELIEIGCEDKTLAFKMNGYISNANYSVKKCIFLLFINHRLVESTS :::::::::::::::::::::::::::::: CCDS54 MNGYISNANYSVKKCIFLLFINHRLVESTS 10 20 30 280 290 300 310 320 330 pF1KB5 LRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 LRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIE 40 50 60 70 80 90 340 350 360 370 380 390 pF1KB5 SKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 SKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQ 100 110 120 130 140 150 400 410 420 430 440 450 pF1KB5 KLDAFLQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEMLELPAPAEVAAKNQSLEGDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 KLDAFLQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEMLELPAPAEVAAKNQSLEGDT 160 170 180 190 200 210 460 470 480 490 500 510 pF1KB5 TKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMTAACTPRRRIINLTSVLSLQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 TKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMTAACTPRRRIINLTSVLSLQE 220 230 240 250 260 270 520 530 540 550 560 570 pF1KB5 EINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 EINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANF 280 290 300 310 320 330 580 590 600 610 620 630 pF1KB5 GVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEID 340 350 360 370 380 390 640 650 660 670 680 690 pF1KB5 EEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 EEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYI 400 410 420 430 440 450 700 710 720 730 740 750 pF1KB5 SEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 SEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYK 460 470 480 490 500 510 pF1KB5 VFERC ::::: CCDS54 VFERC >>CCDS5343.1 PMS2 gene_id:5395|Hs108|chr7 (862 aa) initn: 441 init1: 308 opt: 450 Z-score: 463.4 bits: 96.6 E(32554): 1.7e-19 Smith-Waterman score: 570; 28.1% identity (59.5% similar) in 506 aa overlap (5-477:12-494) 10 20 30 40 50 pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKE : .:. .:. :..: .:.:. ..:.::..:: ::: .:.:.. .:. CCDS53 MERAESSSTEPAKAIKPIDRKSVHQICSGQVVLSLSTAVKELVENSLDAGATNIDLKLKD 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 GGLKLIQIQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHV :. ::...::: :...:... . . :::.: : ::... :.:::::::.:. .. : CCDS53 YGVDLIEVSDNGCGVEEENFEGLTLKHHTSKIQEFADLTQVETFGFRGEALSSLCALSDV 70 80 90 100 110 120 120 130 140 150 160 pF1KB5 TITTKTADGKCAYRASYS-DGKL--KAP-PKPCAGNQGTQITVEDLFYNIATRRKAL-KN ::.: :..: . : .. .::. :.: :.: .:: ..:..:: .. .:.: . .: CCDS53 TISTCHASAKVGTRLMFDHNGKIIQKTPYPRP----RGTTVSVQQLFSTLPVRHKEFQRN 130 140 150 160 170 170 180 190 200 210 220 pF1KB5 PSEEYGKILEVVGRYSVHNAGISFSVKKQ---GETVADVRTLPNASTVDNIRSVFGNAVS ..::.:...:. : . .::: : .: :. : : . : .:: ::::. CCDS53 IKKEYAKMVQVLHAYCIISAGIRVSCTNQLGQGKRQPVVCTGGSPSIKENIGSVFGQKQL 180 190 200 210 220 230 230 240 250 260 pF1KB5 RELIEIG--------CEDKTLA--------FKMNGYISNANYSVKKCIF---LLFINHRL . :: . ::. :. : ..:.::. ...: . ..:::.: CCDS53 QSLIPFVQLPPSDSVCEEYGLSCSDALHNLFYISGFISQCTHGVGRSSTDRQFFFINRRP 240 250 260 270 280 290 270 280 290 300 310 320 pF1KB5 VESTSLRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERV . ... . .. :: : .. .::. :.. .. . ::.:: : :... .:.::..: : CCDS53 CDPAKVCRLVNEVYHMY-NRHQYPFVVLNISVDSECVDINVTPDKRQI-LLQEEKLLLAV 300 310 320 330 340 350 330 340 350 360 370 380 pF1KB5 QQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRT . .. :. ... .: : : :...: .. . ..:. . .:: CCDS53 LKTSLIGMFDSDVNKLNVSQQ--P-LLDVEGNLIKMHAADLEKPMVEKQDQSPS---LRT 360 370 380 390 400 390 400 410 420 430 440 pF1KB5 DSREQKLDAFLQPLSKPLS------SQPQAIVTEDKTDISSGRARQQDEEMLELPAPAEV :.: :. .. : . .: ..:.. : . :. : :: . . . CCDS53 G--EEKKDVSISRLREAFSLRHTTENKPHSPKTPEPRRSPLGQKRG----MLSSSTSGAI 410 420 430 440 450 460 450 460 470 480 490 500 pF1KB5 AAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMTAACTPRRRI . : : .: ..::.. . : . ..:: CCDS53 SDK-----GVLRPQKEAVSSSHGPSDPTDRAEVEKDSGHGSTSVDSEGFSIPDTGSHCSS 470 480 490 500 510 510 520 530 540 550 560 pF1KB5 INLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELF CCDS53 EYAASSPGDRGSQEHVDSQEKAPKTDDSFSDVDCHSNQEDTGCKFRVLPQPTNLATPNTK 520 530 540 550 560 570 >>CCDS9837.1 MLH3 gene_id:27030|Hs108|chr14 (1429 aa) initn: 217 init1: 161 opt: 391 Z-score: 399.2 bits: 85.5 E(32554): 6.4e-16 Smith-Waterman score: 413; 26.2% identity (57.1% similar) in 508 aa overlap (7-475:1-489) 10 20 30 40 50 60 pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ .:. :. : .. .: .:. .. ..:. : .::.. . : :. .. .: CCDS98 MIKCLSVEVQAKLRSGLAISSLGQCVEELALNSIDAEAKCVAVRVNMETFQ-VQ 10 20 30 40 50 70 80 90 100 110 pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAH-VTITTKT . ::: :. ..:.. : .:. ::: .: .:: . :::::::::.:. .: : :..: CCDS98 VIDNGFGMGSDDVEKVGNRYFTSKCHSVQDLENPRFYGFRGEALANIADMASAVEISSKK 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 ADGKCAYRASYSDGK-LKAPPKPCA-GNQGTQITVEDLFYNIATRRKALKNPSEEYGKIL .. ...:: ::: . .. :: .:: .:::.. .::: . .: :. :. CCDS98 NRTMKTFVKLFQSGKALKACEADVTRASAGTTVTVYNLFYQLPVRRKCM-DPRLEFEKVR 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 EVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTV-DNIRSVFGNAVSRELIEIGCEDK . . :. . .::::.... . . : ::... : . . ...: . :..: ::. . : CCDS98 QRIEALSLMHPSISFSLRND-VSGSMVLQLPKTKDVCSRFCQIYGLGKSQKLREISFKYK 180 190 200 210 220 230 240 250 260 270 280 pF1KB5 TLAFKMNGYISN-ANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYL----PKN---- :...::::. :.:. : . .::.:.::: :.:.: :. . ::: CCDS98 --EFELSGYISSEAHYN--KNMQFLFVNKRLVLRTKLHKLIDFLLRKESIICKPKNGPTS 240 250 260 270 280 290 300 310 320 330 pF1KB5 ----------THPFLYLSLEISPQ----NVDVNVHPTKHEVHFLHEESILERVQQHIESK . : :: :. : . :: ..:.: ..: . ...: .:. . CCDS98 RQMNSSLRHRSTPELYGIYVINVQCQFCEYDVCMEPAKTLIEFQNWDTLLFCIQEGV--- 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB5 LLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSRE--- .:.. : : .. ::: .: . .. : .. . . . :.. .: CCDS98 -------KMFLKQEKL--FVELSGEDIKEFSEDNGFSLFDATLQKRVTSDERSNFQEACN 350 360 370 380 390 400 410 420 430 440 pF1KB5 QKLDAF----LQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEML--ELPAPAEVAAKN . ::.. :: . .. . . :... : . : .: . : .:.. . CCDS98 NILDSYEMFNLQSKAVKRKTTAENVNTQSSRDSEATRKNTNDAFLYIYESGGPGHSKMTE 400 410 420 430 440 450 450 460 470 480 490 500 pF1KB5 QSLEG-DTTKGTSEMSEKRGPTSSNP--RKRHREDSDVEMVEDDSRKEMTAACTPRRRII ::.. :.. . :.: :.. ..:. ..:.. CCDS98 PSLQNKDSSCSESKMLEQETIVASEAGENEKHKKSFLEHSSLENPCGTSLEMFLSPFQTP 460 470 480 490 500 510 510 520 530 540 550 560 pF1KB5 NLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFY CCDS98 CHFEESGQDLEIWKESTTVNGMAANILKNNRIQNQPKRFKDATEVGCQPLPFATTLWGVH 520 530 540 550 560 570 >>CCDS32123.1 MLH3 gene_id:27030|Hs108|chr14 (1453 aa) initn: 217 init1: 161 opt: 391 Z-score: 399.1 bits: 85.5 E(32554): 6.5e-16 Smith-Waterman score: 413; 26.2% identity (57.1% similar) in 508 aa overlap (7-475:1-489) 10 20 30 40 50 60 pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ .:. :. : .. .: .:. .. ..:. : .::.. . : :. .. .: CCDS32 MIKCLSVEVQAKLRSGLAISSLGQCVEELALNSIDAEAKCVAVRVNMETFQ-VQ 10 20 30 40 50 70 80 90 100 110 pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAH-VTITTKT . ::: :. ..:.. : .:. ::: .: .:: . :::::::::.:. .: : :..: CCDS32 VIDNGFGMGSDDVEKVGNRYFTSKCHSVQDLENPRFYGFRGEALANIADMASAVEISSKK 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 ADGKCAYRASYSDGK-LKAPPKPCA-GNQGTQITVEDLFYNIATRRKALKNPSEEYGKIL .. ...:: ::: . .. :: .:: .:::.. .::: . .: :. :. CCDS32 NRTMKTFVKLFQSGKALKACEADVTRASAGTTVTVYNLFYQLPVRRKCM-DPRLEFEKVR 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 EVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTV-DNIRSVFGNAVSRELIEIGCEDK . . :. . .::::.... . . : ::... : . . ...: . :..: ::. . : CCDS32 QRIEALSLMHPSISFSLRND-VSGSMVLQLPKTKDVCSRFCQIYGLGKSQKLREISFKYK 180 190 200 210 220 230 240 250 260 270 280 pF1KB5 TLAFKMNGYISN-ANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYL----PKN---- :...::::. :.:. : . .::.:.::: :.:.: :. . ::: CCDS32 --EFELSGYISSEAHYN--KNMQFLFVNKRLVLRTKLHKLIDFLLRKESIICKPKNGPTS 240 250 260 270 280 290 300 310 320 330 pF1KB5 ----------THPFLYLSLEISPQ----NVDVNVHPTKHEVHFLHEESILERVQQHIESK . : :: :. : . :: ..:.: ..: . ...: .:. . CCDS32 RQMNSSLRHRSTPELYGIYVINVQCQFCEYDVCMEPAKTLIEFQNWDTLLFCIQEGV--- 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB5 LLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSRE--- .:.. : : .. ::: .: . .. : .. . . . :.. .: CCDS32 -------KMFLKQEKL--FVELSGEDIKEFSEDNGFSLFDATLQKRVTSDERSNFQEACN 350 360 370 380 390 400 410 420 430 440 pF1KB5 QKLDAF----LQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEML--ELPAPAEVAAKN . ::.. :: . .. . . :... : . : .: . : .:.. . CCDS32 NILDSYEMFNLQSKAVKRKTTAENVNTQSSRDSEATRKNTNDAFLYIYESGGPGHSKMTE 400 410 420 430 440 450 450 460 470 480 490 500 pF1KB5 QSLEG-DTTKGTSEMSEKRGPTSSNP--RKRHREDSDVEMVEDDSRKEMTAACTPRRRII ::.. :.. . :.: :.. ..:. ..:.. CCDS32 PSLQNKDSSCSESKMLEQETIVASEAGENEKHKKSFLEHSSLENPCGTSLEMFLSPFQTP 460 470 480 490 500 510 510 520 530 540 550 560 pF1KB5 NLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFY CCDS32 CHFEESGQDLEIWKESTTVNGMAANILKNNRIQNQPKRFKDATEVGCQPLPFATTLWGVH 520 530 540 550 560 570 >>CCDS46473.1 PMS1 gene_id:5378|Hs108|chr2 (770 aa) initn: 373 init1: 324 opt: 381 Z-score: 393.2 bits: 83.5 E(32554): 1.4e-15 Smith-Waterman score: 435; 28.0% identity (63.8% similar) in 329 aa overlap (8-323:1-326) 10 20 30 40 50 60 pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ ...: ..: ......: ....::.::: ::: .::..: ... :. :. CCDS46 MKQLPAATVRLLSSSQIITSVVSVVKELIENSLDAGATSVDVKLENYGFDKIE 10 20 30 40 50 70 80 90 100 110 120 pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA ..::: ::. : .. .. :::..: ::: ...:::::::::.:: .:.: :::.:: CCDS46 VRDNGEGIKAVDAPVMAMKYYTSKINSHEDLENLTTYGFRGEALGSICCIAEVLITTRTA 60 70 80 90 100 110 130 140 150 160 170 pF1KB5 -DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRK---ALKNPSEEYGKI :. . . ..:.. . :: .::: .:. :: :. .:.. . :. ..: :: CCDS46 ADNFSTQYVLDGSGHILSQ-KPSHLGQGTTVTALRLFKNLPVRKQFYSTAKKCKDEIKKI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 LEVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSVFGNAVSRELIEIGCEDK ... ... . . . .. .. . . . . . . ::.:.:: .. . ... CCDS46 QDLLMSFGILKPDLRIVFVHNKAVIWQKSRVSDHKMA--LMSVLGTAVMNNMESFQYHSE 180 190 200 210 220 230 240 250 260 270 280 pF1KB5 TLAFKMNGYIS--NANYSVKKCIF----LLFINHRLVESTSLRKAIETVYAAYLPKNT-- . ..:.. .:..: . ..::: : :.. .. : :. : :.. CCDS46 ESQIYLSGFLPKCDADHSFTSLSTPERSFIFINSRPVHQKDILKLIRHHYNLKCLKESTR 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB5 -HPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQT .: ..:.... .::::. : : .: . ..::.: CCDS46 LYPVFFLKIDVPTADVDVNLTPDKSQVLLQNKESVLIALENLMTTCYGPLPSTNSYENNK 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB5 LLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQ CCDS46 TDVSAADIVLSKTAETDVLFNKVESSGKNYSNVDTSVIPFQNDMHNDESGKNTDDCLNHQ 360 370 380 390 400 410 >>CCDS2302.1 PMS1 gene_id:5378|Hs108|chr2 (932 aa) initn: 373 init1: 324 opt: 381 Z-score: 391.9 bits: 83.5 E(32554): 1.6e-15 Smith-Waterman score: 440; 21.8% identity (55.2% similar) in 737 aa overlap (8-727:1-675) 10 20 30 40 50 60 pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ ...: ..: ......: ....::.::: ::: .::..: ... :. :. CCDS23 MKQLPAATVRLLSSSQIITSVVSVVKELIENSLDAGATSVDVKLENYGFDKIE 10 20 30 40 50 70 80 90 100 110 120 pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA ..::: ::. : .. .. :::..: ::: ...:::::::::.:: .:.: :::.:: CCDS23 VRDNGEGIKAVDAPVMAMKYYTSKINSHEDLENLTTYGFRGEALGSICCIAEVLITTRTA 60 70 80 90 100 110 130 140 150 160 170 pF1KB5 -DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRK---ALKNPSEEYGKI :. . . ..:.. . :: .::: .:. :: :. .:.. . :. ..: :: CCDS23 ADNFSTQYVLDGSGHILSQ-KPSHLGQGTTVTALRLFKNLPVRKQFYSTAKKCKDEIKKI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 LEVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSVFGNAVSRELIEIGCEDK ... ... . . . .. .. . . . . . . ::.:.:: .. . ... CCDS23 QDLLMSFGILKPDLRIVFVHNKAVIWQKSRVSDHKMA--LMSVLGTAVMNNMESFQYHSE 180 190 200 210 220 230 240 250 260 270 280 pF1KB5 TLAFKMNGYIS--NANYSVKKCIF----LLFINHRLVESTSLRKAIETVYAAYLPKNT-- . ..:.. .:..: . ..::: : :.. .. : :. : :.. CCDS23 ESQIYLSGFLPKCDADHSFTSLSTPERSFIFINSRPVHQKDILKLIRHHYNLKCLKESTR 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB5 -HPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQT .: ..:.... .::::. : : .: . ..::.: .. CCDS23 LYPVFFLKIDVPTADVDVNLTPDKSQVLLQNKESVL-------------------IALEN 300 310 320 330 350 360 370 380 390 400 pF1KB5 LLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQ :. :: . ::.: ...:. :. . . ..:: .:... .: :. CCDS23 LMTTCYGP----LPSTNSYENNKTDVSAADIVLSKTAETDVLFNKVESS----GKNYSNV 340 350 360 370 380 410 420 430 440 450 460 pF1KB5 PQAIVTEDKTDISSGRARQQDEEMLELPAPAEVAAKNQSLEGDTTKG--TSEMSEKRGPT ... ..:. . .. .. .. :. .: :: : .::.:. CCDS23 DTSVIPF-QNDMHNDESGKNTDDCLN----------HQISIGDFGYGHCSSEISN----I 390 400 410 420 470 480 490 500 510 520 pF1KB5 SSNPRKRHREDSDVEMVEDDSRKEMTAACTPRRRIINLTSVLSLQEEINEQGHEVLREML ..: .. .. : .. ..:. :.. .: ..:: : : ... : . : CCDS23 DKNTKNAFQDISMSNVSWENSQTEYSKTCF-------ISSVKHTQSENGNKDH--IDESG 430 440 450 460 470 530 540 550 560 570 580 pF1KB5 HNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDL .:. .: : . :.. .. .:... ..:.. .. .. .. :. . CCDS23 ENEEEAGLENSSEISADEWSRGNILKNS-VGENIEPVKILVPEKSLPCKVSNNNYPIPEQ 480 490 500 510 520 530 590 600 610 620 630 640 pF1KB5 AMLALDS--PESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLI : :: .:. .. . : . . . . :: : :. . .. :.. .. :: CCDS23 MNLNEDSCNKKSNVIDNKSGKVTAYDLLSNRVIKKP-MSASALFVQ-DHRPQF-----LI 540 550 560 570 580 590 650 660 670 680 690 700 pF1KB5 DNYVPPLEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSE .: :: . : .: .. .:. . :. .:. . : :. : .:: .: .... CCDS23 ENPKTSLEDATLQIEELWKTLSEEEKLKYEEKATKDLERYNSQMKRAIEQESQMSLKDGR 600 610 620 630 640 650 710 720 730 740 750 pF1KB5 VPGSIPNSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC . ..:. . .: . .: .. CCDS23 KKIKPTSAWNLAQKHKLKTSLSNQPKLDELLQSQIEKRRSQNIKMVQIPFSMKNLKINFK 660 670 680 690 700 710 >>CCDS46474.1 PMS1 gene_id:5378|Hs108|chr2 (893 aa) initn: 373 init1: 324 opt: 351 Z-score: 361.4 bits: 77.8 E(32554): 8.3e-14 Smith-Waterman score: 398; 22.7% identity (53.4% similar) in 731 aa overlap (8-727:1-636) 10 20 30 40 50 60 pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ ...: ..: ......: ....::.::: ::: .::..: ... :. :. CCDS46 MKQLPAATVRLLSSSQIITSVVSVVKELIENSLDAGATSVDVKLENYGFDKIE 10 20 30 40 50 70 80 90 100 110 120 pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA ..::: ::. : .. .. :::..: ::: ...:::::::::.:: .:.: :::.:: CCDS46 VRDNGEGIKAVDAPVMAMKYYTSKINSHEDLENLTTYGFRGEALGSICCIAEVLITTRTA 60 70 80 90 100 110 130 140 150 160 170 pF1KB5 -DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRK---ALKNPSEEYGKI :. . . ..:.. . :: .::: .:. :: :. .:.. . :. ..: :: CCDS46 ADNFSTQYVLDGSGHILSQ-KPSHLGQGTTVTALRLFKNLPVRKQFYSTAKKCKDEIKKI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 LEVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSVFGNAVSRELIEIGCEDK ... .::.. : :. .: :: : .. : : CCDS46 QDLL---------MSFGILK-----------PD------LRIVF---VHNKIYLSGFLPK 180 190 200 240 250 260 270 280 290 pF1KB5 TLAFKMNGYISNANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNT---HPFLY : . .:. . : ..::: : :.. .. : :. : :.. .: .. CCDS46 CDADHSFTSLSTPERS------FIFINSRPVHQKDILKLIRHHYNLKCLKESTRLYPVFF 210 220 230 240 250 300 310 320 330 340 350 pF1KB5 LSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLA :.... .::::. : : .: . ..::.: ..:. CCDS46 LKIDVPTADVDVNLTPDKSQVLLQNKESVL-------------------IALENLMTTCY 260 270 280 290 360 370 380 390 400 410 pF1KB5 GPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVT :: . ::.: ...:. :. . . ..:: .:... .: :. ... CCDS46 GP----LPSTNSYENNKTDVSAADIVLSKTAETDVLFNKVESS----GKNYSNVDTSVIP 300 310 320 330 340 350 420 430 440 450 460 470 pF1KB5 EDKTDISSGRARQQDEEMLELPAPAEVAAKNQSLEGDTTKG--TSEMSEKRGPTSSNPRK ..:. . .. .. .. :. .: :: : .::.:. ..: .. CCDS46 F-QNDMHNDESGKNTDDCLN----------HQISIGDFGYGHCSSEISN----IDKNTKN 360 370 380 390 480 490 500 510 520 530 pF1KB5 RHREDSDVEMVEDDSRKEMTAACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFV .. : .. ..:. :.. .: ..:: : : ... : . : .:. . CCDS46 AFQDISMSNVSWENSQTEYSKTCF-------ISSVKHTQSENGNKDH--IDESGENEEEA 400 410 420 430 440 540 550 560 570 580 590 pF1KB5 GCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALD : : . :.. .. .:... ..:.. .. .. .. :. . : : CCDS46 GLENSSEISADEWSRGNILKNS-VGENIEPVKILVPEKSLPCKVSNNNYPIPEQMNLNED 450 460 470 480 490 500 600 610 620 630 640 pF1KB5 S--PESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPP : .:. .. . : . . . . :: : :. . .. :.. .. ::.: CCDS46 SCNKKSNVIDNKSGKVTAYDLLSNRVIKKP-MSASALFVQ-DHRPQF-----LIENPKTS 510 520 530 540 550 650 660 670 680 690 700 pF1KB5 LEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIP :: . : .: .. .:. . :. .:. . : :. : .:: .: .... . CCDS46 LEDATLQIEELWKTLSEEEKLKYEEKATKDLERYNSQMKRAIEQESQMSLKDGRKKIKPT 560 570 580 590 600 610 710 720 730 740 750 pF1KB5 NSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC ..:. . .: . .: .. CCDS46 SAWNLAQKHKLKTSLSNQPKLDELLQSQIEKRRSQNIKMVQIPFSMKNLKINFKKQNKVD 620 630 640 650 660 670 >>CCDS82544.1 PMS1 gene_id:5378|Hs108|chr2 (181 aa) initn: 286 init1: 286 opt: 314 Z-score: 334.4 bits: 70.5 E(32554): 2.6e-12 Smith-Waterman score: 314; 36.6% identity (71.2% similar) in 153 aa overlap (8-159:1-149) 10 20 30 40 50 60 pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ ...: ..: ......: ....::.::: ::: .::..: ... :. :. CCDS82 MKQLPAATVRLLSSSQIITSVVSVVKELIENSLDAGATSVDVKLENYGFDKIE 10 20 30 40 50 70 80 90 100 110 120 pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA ..::: ::. : .. .. :::..: ::: ...:::::::::.:: .:.: :::.:: CCDS82 VRDNGEGIKAVDAPVMAMKYYTSKINSHEDLENLTTYGFRGEALGSICCIAEVLITTRTA 60 70 80 90 100 110 130 140 150 160 170 pF1KB5 -DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEV :. . . ..:.. . :: .:: ... :. :: CCDS82 ADNFSTQYVLDGSGHILSQ-KPSHLGQGKKVA---LYTNILYLFCLNCWFKKKKLLGEYK 120 130 140 150 160 180 190 200 210 220 230 pF1KB5 VGRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSVFGNAVSRELIEIGCEDKTLA CCDS82 YIALGLVLIKAS 170 180 756 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 16:17:51 2016 done: Sat Nov 5 16:17:51 2016 Total Scan time: 3.110 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]