FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE9442, 967 aa 1>>>pF1KE9442 967 - 967 aa - 967 aa Library: human.CCDS.faa 18921897 residues in 33420 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6375+/-0.000896; mu= 22.4453+/- 0.055 mean_var=139.6356+/-30.123, 0's: 0 Z-trim(111.2): 203 B-trim: 664 in 1/52 Lambda= 0.108537 statistics sampled from 12093 (12328) to 12093 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.706), E-opt: 0.2 (0.369), width: 16 Scan time: 2.380 The best scores are: opt bits E(33420) CCDS30971.1 LGR6 gene_id:59352|Hs109|chr1 ( 967) 6538 1036.3 0 CCDS1424.1 LGR6 gene_id:59352|Hs109|chr1 ( 915) 6010 953.6 0 CCDS30972.1 LGR6 gene_id:59352|Hs109|chr1 ( 828) 5041 801.8 0 CCDS9000.1 LGR5 gene_id:8549|Hs109|chr12 ( 907) 3297 528.7 2e-149 CCDS61195.1 LGR5 gene_id:8549|Hs109|chr12 ( 835) 2616 422.1 2.4e-117 CCDS61194.1 LGR5 gene_id:8549|Hs109|chr12 ( 883) 2381 385.3 2.9e-106 CCDS31449.1 LGR4 gene_id:55366|Hs109|chr11 ( 951) 1676 275.0 5.2e-73 CCDS86187.1 LGR4 gene_id:55366|Hs109|chr11 ( 927) 1499 247.2 1.1e-64 CCDS1844.2 FSHR gene_id:2492|Hs109|chr2 ( 669) 627 110.5 1.2e-23 CCDS1842.1 LHCGR gene_id:3973|Hs109|chr2 ( 699) 567 101.1 8.2e-21 CCDS1843.1 FSHR gene_id:2492|Hs109|chr2 ( 695) 550 98.5 5.2e-20 CCDS55602.1 PODN gene_id:127435|Hs109|chr1 ( 642) 519 93.6 1.4e-18 CCDS573.1 PODN gene_id:127435|Hs109|chr1 ( 661) 519 93.6 1.4e-18 CCDS45905.1 LINGO3 gene_id:645191|Hs109|chr19 ( 592) 472 86.2 2.2e-16 CCDS3307.1 GP5 gene_id:2814|Hs109|chr3 ( 560) 468 85.5 3.3e-16 CCDS9872.1 TSHR gene_id:7253|Hs109|chr14 ( 764) 466 85.4 5e-16 CCDS47272.1 LRRTM2 gene_id:26045|Hs109|chr5 ( 516) 441 81.2 5.9e-15 CCDS9039.1 DCN gene_id:1634|Hs109|chr12 ( 359) 434 79.9 1e-14 CCDS3306.1 LRRC15 gene_id:131578|Hs109|chr3 ( 581) 434 80.2 1.4e-14 CCDS46984.1 LRRC15 gene_id:131578|Hs109|chr3 ( 587) 434 80.2 1.4e-14 CCDS30855.1 LINGO4 gene_id:339398|Hs109|chr1 ( 593) 427 79.1 2.9e-14 CCDS44933.1 LRIG3 gene_id:121227|Hs109|chr12 (1059) 414 77.4 1.7e-13 CCDS1966.1 LRRTM1 gene_id:347730|Hs109|chr2 ( 522) 410 76.4 1.7e-13 CCDS8960.1 LRIG3 gene_id:121227|Hs109|chr12 (1119) 414 77.4 1.8e-13 CCDS42595.1 LRRC4B gene_id:94030|Hs109|chr19 ( 713) 401 75.1 5.5e-13 CCDS73766.1 LINGO1 gene_id:84894|Hs109|chr15 ( 614) 399 74.7 6.3e-13 CCDS45313.1 LINGO1 gene_id:84894|Hs109|chr15 ( 620) 399 74.8 6.3e-13 CCDS7270.1 LRRTM3 gene_id:347731|Hs109|chr10 ( 581) 392 73.6 1.3e-12 CCDS46715.1 CHADL gene_id:150356|Hs109|chr22 ( 762) 391 73.6 1.7e-12 CCDS13777.1 RTN4R gene_id:65078|Hs109|chr22 ( 473) 388 72.9 1.8e-12 CCDS47218.1 LRRC70 gene_id:100130733|Hs109|chr5 ( 622) 382 72.1 4e-12 CCDS5799.1 LRRC4 gene_id:64101|Hs109|chr7 ( 653) 380 71.8 5.1e-12 CCDS31464.1 LRRC4C gene_id:57689|Hs109|chr11 ( 640) 368 69.9 1.9e-11 CCDS12300.2 PODNL1 gene_id:79883|Hs109|chr19 ( 505) 366 69.5 2e-11 CCDS54226.1 PODNL1 gene_id:79883|Hs109|chr19 ( 510) 366 69.5 2e-11 CCDS14721.1 BGN gene_id:633|Hs109|chrX ( 368) 362 68.7 2.5e-11 CCDS1448.1 LRRN2 gene_id:10446|Hs109|chr1 ( 713) 365 69.5 2.7e-11 CCDS4953.2 LRRC1 gene_id:55227|Hs109|chr6 ( 524) 363 69.0 2.8e-11 CCDS6524.1 LINGO2 gene_id:158038|Hs109|chr9 ( 606) 354 67.7 8.2e-11 >>CCDS30971.1 LGR6 gene_id:59352|Hs109|chr1 (967 aa) initn: 6538 init1: 6538 opt: 6538 Z-score: 5538.8 bits: 1036.3 E(33420): 0 Smith-Waterman score: 6538; 99.9% identity (100.0% similar) in 967 aa overlap (1-967:1-967) 10 20 30 40 50 60 pF1KE9 MPSPPGLRALWLCAALCASRRAGGAPQPGPGPTACPAPCHCQEDGIMLSADCSELGLSAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 MPSPPGLRALWLCAALCASRRAGGAPQPGPGPTACPAPCHCQEDGIMLSADCSELGLSAV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 PGDLDPLTAYLDLSMNNLTELQPGLFHHLRFLEELRLSGNHLSHIPGQAFSGLYSLKILM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 PGDLDPLTAYLDLSMNNLTELQPGLFHHLRFLEELRLSGNHLSHIPGQAFSGLYSLKILM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 LQNNQLGGIPAEALWELPSLQSLRLDANLISLVPERSFEGLSSLRHLWLDDNALTEIPVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 LQNNQLGGIPAEALWELPSLQSLRLDANLISLVPERSFEGLSSLRHLWLDDNALTEIPVR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 ALNNLPALQAMTLALNRISHIPDYAFQNLTSLVVLHLHNNRIQHLGTHSFEGLHNLETLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 ALNNLPALQAMTLALNRISHIPDYAFQNLTSLVVLHLHNNRIQHLGTHSFEGLHNLETLD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 LNYNKLQEFPVAIRTLGRLQELGFHNNNIKAIPEKAFMGNPLLQTIHFYDNPIQFVGRSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 LNYNKLQEFPVAIRTLGRLQELGFHNNNIKAIPEKAFMGNPLLQTIHFYDNPIQFVGRSA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 FQYLPKLHTLSLNGAMDIQEFPDLKGTTSLEILTLTRAGIRLLPSGMCQQLPRLRVLELS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 FQYLPKLHTLSLNGAMDIQEFPDLKGTTSLEILTLTRAGIRLLPSGMCQQLPRLRVLELS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE9 HNQIEELPSLHRCQKLEEIGLQHNRIWEIGADTFSQLSSLQALDLSWNAIRSIHPEAFST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 HNQIEELPSLHRCQKLEEIGLQHNRIWEIGADTFSQLSSLQALDLSWNAIRSIHPEAFST 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE9 LHSLVKLDLTDNQLTTLPLAGLGGLMHLKLKGNLALSQAFSKDSFPKLRILEVPYAYQCC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 LHSLVKLDLTDNQLTTLPLAGLGGLMHLKLKGNLALSQAFSKDSFPKLRILEVPYAYQCC 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE9 PYGMCASFFKASGQWEAEDLHLDDEESSKRPLGLLARQAENHYDQDLDELQLEMEDSKPH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 PYGMCASFFKASGQWEAEDLHLDDEESSKRPLGLLARQAENHYDQDLDELQLEMEDSKPH 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE9 PSVQCSPTPGPFKPCEYLFESWGIRLAVWAIVLLSVLCNGLVLLTVFAGGPAPLPPVKFV :::::::::::::::::::::::::::::::::::::::::::::::::::.:::::::: CCDS30 PSVQCSPTPGPFKPCEYLFESWGIRLAVWAIVLLSVLCNGLVLLTVFAGGPVPLPPVKFV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE9 VGAIAGANTLTGISCGLLASVDALTFGQFSEYGARWETGLGCRATGFLAVLGSEASVLLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 VGAIAGANTLTGISCGLLASVDALTFGQFSEYGARWETGLGCRATGFLAVLGSEASVLLL 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE9 TLAAVQCSVSVSCVRAYGKSPSLGSVRAGVLGCLALAGLAAALPLASVGEYGASPLCLPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 TLAAVQCSVSVSCVRAYGKSPSLGSVRAGVLGCLALAGLAAALPLASVGEYGASPLCLPY 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE9 APPEGQPAALGFTVALVMMNSFCFLVVAGAYIKLYCDLPRGDFEAVWDCAMVRHVAWLIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 APPEGQPAALGFTVALVMMNSFCFLVVAGAYIKLYCDLPRGDFEAVWDCAMVRHVAWLIF 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE9 ADGLLYCPVAFLSFASMLGLFPVTPEAVKSVLLVVLPLPACLNPLLYLLFNPHFRDDLRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 ADGLLYCPVAFLSFASMLGLFPVTPEAVKSVLLVVLPLPACLNPLLYLLFNPHFRDDLRR 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE9 LRPRAGDSGPLAYAAAGELEKSSCDSTQALVAFSDVDLILEASEAGRPPGLETYGFPSVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 LRPRAGDSGPLAYAAAGELEKSSCDSTQALVAFSDVDLILEASEAGRPPGLETYGFPSVT 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE9 LISCQQPGAPRLEGSHCVEPEGNHFGNPQPSMDGELLLRAEGSTPAGGGLSGGGGFQPSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 LISCQQPGAPRLEGSHCVEPEGNHFGNPQPSMDGELLLRAEGSTPAGGGLSGGGGFQPSG 910 920 930 940 950 960 pF1KE9 LAFASHV ::::::: CCDS30 LAFASHV >>CCDS1424.1 LGR6 gene_id:59352|Hs109|chr1 (915 aa) initn: 6010 init1: 6010 opt: 6010 Z-score: 5092.3 bits: 953.6 E(33420): 0 Smith-Waterman score: 6010; 99.9% identity (100.0% similar) in 896 aa overlap (72-967:20-915) 50 60 70 80 90 100 pF1KE9 QEDGIMLSADCSELGLSAVPGDLDPLTAYLDLSMNNLTELQPGLFHHLRFLEELRLSGNH :::::::::::::::::::::::::::::: CCDS14 MGRPRLTLVCQVSIIISARDLSMNNLTELQPGLFHHLRFLEELRLSGNH 10 20 30 40 110 120 130 140 150 160 pF1KE9 LSHIPGQAFSGLYSLKILMLQNNQLGGIPAEALWELPSLQSLRLDANLISLVPERSFEGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LSHIPGQAFSGLYSLKILMLQNNQLGGIPAEALWELPSLQSLRLDANLISLVPERSFEGL 50 60 70 80 90 100 170 180 190 200 210 220 pF1KE9 SSLRHLWLDDNALTEIPVRALNNLPALQAMTLALNRISHIPDYAFQNLTSLVVLHLHNNR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 SSLRHLWLDDNALTEIPVRALNNLPALQAMTLALNRISHIPDYAFQNLTSLVVLHLHNNR 110 120 130 140 150 160 230 240 250 260 270 280 pF1KE9 IQHLGTHSFEGLHNLETLDLNYNKLQEFPVAIRTLGRLQELGFHNNNIKAIPEKAFMGNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 IQHLGTHSFEGLHNLETLDLNYNKLQEFPVAIRTLGRLQELGFHNNNIKAIPEKAFMGNP 170 180 190 200 210 220 290 300 310 320 330 340 pF1KE9 LLQTIHFYDNPIQFVGRSAFQYLPKLHTLSLNGAMDIQEFPDLKGTTSLEILTLTRAGIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LLQTIHFYDNPIQFVGRSAFQYLPKLHTLSLNGAMDIQEFPDLKGTTSLEILTLTRAGIR 230 240 250 260 270 280 350 360 370 380 390 400 pF1KE9 LLPSGMCQQLPRLRVLELSHNQIEELPSLHRCQKLEEIGLQHNRIWEIGADTFSQLSSLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LLPSGMCQQLPRLRVLELSHNQIEELPSLHRCQKLEEIGLQHNRIWEIGADTFSQLSSLQ 290 300 310 320 330 340 410 420 430 440 450 460 pF1KE9 ALDLSWNAIRSIHPEAFSTLHSLVKLDLTDNQLTTLPLAGLGGLMHLKLKGNLALSQAFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 ALDLSWNAIRSIHPEAFSTLHSLVKLDLTDNQLTTLPLAGLGGLMHLKLKGNLALSQAFS 350 360 370 380 390 400 470 480 490 500 510 520 pF1KE9 KDSFPKLRILEVPYAYQCCPYGMCASFFKASGQWEAEDLHLDDEESSKRPLGLLARQAEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 KDSFPKLRILEVPYAYQCCPYGMCASFFKASGQWEAEDLHLDDEESSKRPLGLLARQAEN 410 420 430 440 450 460 530 540 550 560 570 580 pF1KE9 HYDQDLDELQLEMEDSKPHPSVQCSPTPGPFKPCEYLFESWGIRLAVWAIVLLSVLCNGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 HYDQDLDELQLEMEDSKPHPSVQCSPTPGPFKPCEYLFESWGIRLAVWAIVLLSVLCNGL 470 480 490 500 510 520 590 600 610 620 630 640 pF1KE9 VLLTVFAGGPAPLPPVKFVVGAIAGANTLTGISCGLLASVDALTFGQFSEYGARWETGLG ::::::::::.::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 VLLTVFAGGPVPLPPVKFVVGAIAGANTLTGISCGLLASVDALTFGQFSEYGARWETGLG 530 540 550 560 570 580 650 660 670 680 690 700 pF1KE9 CRATGFLAVLGSEASVLLLTLAAVQCSVSVSCVRAYGKSPSLGSVRAGVLGCLALAGLAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 CRATGFLAVLGSEASVLLLTLAAVQCSVSVSCVRAYGKSPSLGSVRAGVLGCLALAGLAA 590 600 610 620 630 640 710 720 730 740 750 760 pF1KE9 ALPLASVGEYGASPLCLPYAPPEGQPAALGFTVALVMMNSFCFLVVAGAYIKLYCDLPRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 ALPLASVGEYGASPLCLPYAPPEGQPAALGFTVALVMMNSFCFLVVAGAYIKLYCDLPRG 650 660 670 680 690 700 770 780 790 800 810 820 pF1KE9 DFEAVWDCAMVRHVAWLIFADGLLYCPVAFLSFASMLGLFPVTPEAVKSVLLVVLPLPAC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 DFEAVWDCAMVRHVAWLIFADGLLYCPVAFLSFASMLGLFPVTPEAVKSVLLVVLPLPAC 710 720 730 740 750 760 830 840 850 860 870 880 pF1KE9 LNPLLYLLFNPHFRDDLRRLRPRAGDSGPLAYAAAGELEKSSCDSTQALVAFSDVDLILE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LNPLLYLLFNPHFRDDLRRLRPRAGDSGPLAYAAAGELEKSSCDSTQALVAFSDVDLILE 770 780 790 800 810 820 890 900 910 920 930 940 pF1KE9 ASEAGRPPGLETYGFPSVTLISCQQPGAPRLEGSHCVEPEGNHFGNPQPSMDGELLLRAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 ASEAGRPPGLETYGFPSVTLISCQQPGAPRLEGSHCVEPEGNHFGNPQPSMDGELLLRAE 830 840 850 860 870 880 950 960 pF1KE9 GSTPAGGGLSGGGGFQPSGLAFASHV :::::::::::::::::::::::::: CCDS14 GSTPAGGGLSGGGGFQPSGLAFASHV 890 900 910 >>CCDS30972.1 LGR6 gene_id:59352|Hs109|chr1 (828 aa) initn: 5041 init1: 5041 opt: 5041 Z-score: 4272.7 bits: 801.8 E(33420): 0 Smith-Waterman score: 5187; 89.2% identity (89.3% similar) in 896 aa overlap (72-967:29-828) 50 60 70 80 90 100 pF1KE9 QEDGIMLSADCSELGLSAVPGDLDPLTAYLDLSMNNLTELQPGLFHHLRFLEELRLSGNH :::::::::::::::::::::::::::::: CCDS30 MRLEGEGRSARAGQNLSRAGSARRGAPRDLSMNNLTELQPGLFHHLRFLEELRLSGNH 10 20 30 40 50 110 120 130 140 150 160 pF1KE9 LSHIPGQAFSGLYSLKILMLQNNQLGGIPAEALWELPSLQSLRLDANLISLVPERSFEGL :::::::::::::::::::::::::::::::::::::::::: CCDS30 LSHIPGQAFSGLYSLKILMLQNNQLGGIPAEALWELPSLQSL------------------ 60 70 80 90 100 170 180 190 200 210 220 pF1KE9 SSLRHLWLDDNALTEIPVRALNNLPALQAMTLALNRISHIPDYAFQNLTSLVVLHLHNNR CCDS30 ------------------------------------------------------------ 230 240 250 260 270 280 pF1KE9 IQHLGTHSFEGLHNLETLDLNYNKLQEFPVAIRTLGRLQELGFHNNNIKAIPEKAFMGNP :::::::::::::::::::::::::::::::::::::::::: CCDS30 ------------------DLNYNKLQEFPVAIRTLGRLQELGFHNNNIKAIPEKAFMGNP 110 120 130 140 290 300 310 320 330 340 pF1KE9 LLQTIHFYDNPIQFVGRSAFQYLPKLHTLSLNGAMDIQEFPDLKGTTSLEILTLTRAGIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 LLQTIHFYDNPIQFVGRSAFQYLPKLHTLSLNGAMDIQEFPDLKGTTSLEILTLTRAGIR 150 160 170 180 190 200 350 360 370 380 390 400 pF1KE9 LLPSGMCQQLPRLRVLELSHNQIEELPSLHRCQKLEEIGLQHNRIWEIGADTFSQLSSLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 LLPSGMCQQLPRLRVLELSHNQIEELPSLHRCQKLEEIGLQHNRIWEIGADTFSQLSSLQ 210 220 230 240 250 260 410 420 430 440 450 460 pF1KE9 ALDLSWNAIRSIHPEAFSTLHSLVKLDLTDNQLTTLPLAGLGGLMHLKLKGNLALSQAFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 ALDLSWNAIRSIHPEAFSTLHSLVKLDLTDNQLTTLPLAGLGGLMHLKLKGNLALSQAFS 270 280 290 300 310 320 470 480 490 500 510 520 pF1KE9 KDSFPKLRILEVPYAYQCCPYGMCASFFKASGQWEAEDLHLDDEESSKRPLGLLARQAEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 KDSFPKLRILEVPYAYQCCPYGMCASFFKASGQWEAEDLHLDDEESSKRPLGLLARQAEN 330 340 350 360 370 380 530 540 550 560 570 580 pF1KE9 HYDQDLDELQLEMEDSKPHPSVQCSPTPGPFKPCEYLFESWGIRLAVWAIVLLSVLCNGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 HYDQDLDELQLEMEDSKPHPSVQCSPTPGPFKPCEYLFESWGIRLAVWAIVLLSVLCNGL 390 400 410 420 430 440 590 600 610 620 630 640 pF1KE9 VLLTVFAGGPAPLPPVKFVVGAIAGANTLTGISCGLLASVDALTFGQFSEYGARWETGLG ::::::::::.::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 VLLTVFAGGPVPLPPVKFVVGAIAGANTLTGISCGLLASVDALTFGQFSEYGARWETGLG 450 460 470 480 490 500 650 660 670 680 690 700 pF1KE9 CRATGFLAVLGSEASVLLLTLAAVQCSVSVSCVRAYGKSPSLGSVRAGVLGCLALAGLAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 CRATGFLAVLGSEASVLLLTLAAVQCSVSVSCVRAYGKSPSLGSVRAGVLGCLALAGLAA 510 520 530 540 550 560 710 720 730 740 750 760 pF1KE9 ALPLASVGEYGASPLCLPYAPPEGQPAALGFTVALVMMNSFCFLVVAGAYIKLYCDLPRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 ALPLASVGEYGASPLCLPYAPPEGQPAALGFTVALVMMNSFCFLVVAGAYIKLYCDLPRG 570 580 590 600 610 620 770 780 790 800 810 820 pF1KE9 DFEAVWDCAMVRHVAWLIFADGLLYCPVAFLSFASMLGLFPVTPEAVKSVLLVVLPLPAC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 DFEAVWDCAMVRHVAWLIFADGLLYCPVAFLSFASMLGLFPVTPEAVKSVLLVVLPLPAC 630 640 650 660 670 680 830 840 850 860 870 880 pF1KE9 LNPLLYLLFNPHFRDDLRRLRPRAGDSGPLAYAAAGELEKSSCDSTQALVAFSDVDLILE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 LNPLLYLLFNPHFRDDLRRLRPRAGDSGPLAYAAAGELEKSSCDSTQALVAFSDVDLILE 690 700 710 720 730 740 890 900 910 920 930 940 pF1KE9 ASEAGRPPGLETYGFPSVTLISCQQPGAPRLEGSHCVEPEGNHFGNPQPSMDGELLLRAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 ASEAGRPPGLETYGFPSVTLISCQQPGAPRLEGSHCVEPEGNHFGNPQPSMDGELLLRAE 750 760 770 780 790 800 950 960 pF1KE9 GSTPAGGGLSGGGGFQPSGLAFASHV :::::::::::::::::::::::::: CCDS30 GSTPAGGGLSGGGGFQPSGLAFASHV 810 820 >>CCDS9000.1 LGR5 gene_id:8549|Hs109|chr12 (907 aa) initn: 2808 init1: 1977 opt: 3297 Z-score: 2796.4 bits: 528.7 E(33420): 2e-149 Smith-Waterman score: 3297; 55.9% identity (81.3% similar) in 894 aa overlap (23-904:22-906) 10 20 30 40 50 pF1KE9 MPSPPGLRALWLCAALCASRRAGGAPQPGPGPTACPAPCHCQEDG-IMLSADCSELGLSA :..:. : .::. :::. :: ..: .:::.:::: CCDS90 MDTSRLGVLLSLPVLLQLATGGSSPRSGVLLRGCPTHCHCEPDGRMLLRVDCSDLGLSE 10 20 30 40 50 60 70 80 90 100 110 pF1KE9 VPGDLDPLTAYLDLSMNNLTELQPGLFHHLRFLEELRLSGNHLSHIPGQAFSGLYSLKIL .:..:. .:.::::::::...: :. . :::::::::.:: :..:: ::.::::::.: CCDS90 LPSNLSVFTSYLDLSMNNISQLLPNPLPSLRFLEELRLAGNALTYIPKGAFTGLYSLKVL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE9 MLQNNQLGGIPAEALWELPSLQSLRLDANLISLVPERSFEGLSSLRHLWLDDNALTEIPV ::::::: .:.::: .: :::::::::: :: :: : :: ::::::::::::::::: CCDS90 MLQNNQLRHVPTEALQNLRSLQSLRLDANHISYVPPSCFSGLHSLRHLWLDDNALTEIPV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE9 RALNNLPALQAMTLALNRISHIPDYAFQNLTSLVVLHLHNNRIQHLGTHSFEGLHNLETL .:. .: ::::::::::.: ::::::: ::.::::::::::::. :: . :.:::.:::: CCDS90 QAFRSLSALQAMTLALNKIHHIPDYAFGNLSSLVVLHLHNNRIHSLGKKCFDGLHSLETL 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE9 DLNYNKLQEFPVAIRTLGRLQELGFHNNNIKAIPEKAFMGNPLLQTIHFYDNPIQFVGRS :::::.:.:::.:::::. :.:::::.:::..::::::.::: : ::::::::::::::: CCDS90 DLNYNNLDEFPTAIRTLSNLKELGFHSNNIRSIPEKAFVGNPSLITIHFYDNPIQFVGRS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE9 AFQYLPKLHTLSLNGAMDIQEFPDLKGTTSLEILTLTRAGIRLLPSGMCQQLPRLRVLEL :::.::.:.::.:::: .: ::::: ::..:: :::: : : ::. .:.::: :.::.: CCDS90 AFQHLPELRTLTLNGASQITEFPDLTGTANLESLTLTGAQISSLPQTVCNQLPNLQVLDL 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE9 SHNQIEELPSLHRCQKLEEIGLQHNRIWEIGADTFSQLSSLQALDLSWNAIRSIHPEAFS :.: .:.:::. ::::..: :.::.:.:: .:::.:: ::..:.:.:: : :::.::: CCDS90 SYNLLEDLPSFSVCQKLQKIDLRHNEIYEIKVDTFQQLLSLRSLNLAWNKIAIIHPNAFS 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE9 TLHSLVKLDLTDNQLTTLPLAGLGGLMHLKLKGNLALSQAFSKDSFPKLRILEVPYAYQC :: ::.::::..: :...:..:: :: :::: :: ::.. .:...::.:...:.:::::: CCDS90 TLPSLIKLDLSSNLLSSFPITGLHGLTHLKLTGNHALQSLISSENFPELKVIEMPYAYQC 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE9 CPYGMCASFFKASGQW-EAEDLHLDDEESSKRPLGLLARQAENHYDQDLDELQLEME-DS : .:.: . .: :.:: .... .:: . :. :.. ::.. ..::... :..: : CCDS90 CAFGVCENAYKISNQWNKGDNSSMDDLH--KKDAGMF--QAQD--ERDLEDFLLDFEEDL 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE9 KPHPSVQCSPTPGPFKPCEYLFESWGIRLAVWAIVLLSVLCNGLVLLTVFAGGPAPLPPV : ::::::.::::::::.:...: ::..::.:..:.. ::.:: ::: . : . :. CCDS90 KALHSVQCSPSPGPFKPCEHLLDGWLIRIGVWTIAVLALTCNALVTSTVFRS-PLYISPI 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE9 KFVVGAIAGANTLTGISCGLLASVDALTFGQFSEYGARWETGLGCRATGFLAVLGSEASV :...:.::..: :::.: ..::.:::.:::.:...:: ::.:.::.. :::....::.:: CCDS90 KLLIGVIAAVNMLTGVSSAVLAGVDAFTFGSFARHGAWWENGVGCHVIGFLSIFASESSV 600 610 620 630 640 650 660 670 680 690 700 710 pF1KE9 LLLTLAAVQCSVSVSCVRAYGKSPSLGSVRAGVLGCLALAGLAAALPLASVGEYGASPLC .::::::.. . ::. . . ..:... .: : :: ::.:: . ..::::::: CCDS90 FLLTLAALERGFSVKYSAKFETKAPFSSLKVIILLCALLALTMAAVPLLGGSKYGASPLC 660 670 680 690 700 710 720 730 740 750 760 770 pF1KE9 LPYAPPEGQPAALGFTVALVMMNSFCFLVVAGAYIKLYCDLPRGDFEAVWDCAMVRHVAW :: : :.:...:. :::...::.:::... :: ::::.: .::.: .:::.::.:.: CCDS90 LPL--PFGEPSTMGYMVALILLNSLCFLMMTIAYTKLYCNLDKGDLENIWDCSMVKHIAL 720 730 740 750 760 770 780 790 800 810 820 830 pF1KE9 LIFADGLLYCPVAFLSFASMLGLFPVTPEAVKSVLLVVLPLPACLNPLLYLLFNPHFRDD :.:.. .: ::::::::.:...: ..::..: .::::.:::::::::::.::::::..: CCDS90 LLFTNCILNCPVAFLSFSSLINLTFISPEVIKFILLVVVPLPACLNPLLYILFNPHFKED 780 790 800 810 820 830 840 850 860 870 880 pF1KE9 LRRLRPRAG----DSGP-LAYAAAGELEKSSCDSTQALVAF--SDVDLILEASEAGRP-- : :: .. .. : : . ..::.:::::::::.: :.. : : . : CCDS90 LVSLRKQTYVWTRSKHPSLMSINSDDVEKQSCDSTQALVTFTSSSITYDLPPSSVPSPAY 840 850 860 870 880 890 890 900 910 920 930 940 pF1KE9 PGLETYGFPSVTLISCQQPGAPRLEGSHCVEPEGNHFGNPQPSMDGELLLRAEGSTPAGG : :. . ::... : CCDS90 PVTESCHLSSVAFVPCL 900 >>CCDS61195.1 LGR5 gene_id:8549|Hs109|chr12 (835 aa) initn: 2198 init1: 1367 opt: 2616 Z-score: 2220.5 bits: 422.1 E(33420): 2.4e-117 Smith-Waterman score: 2794; 49.6% identity (74.3% similar) in 894 aa overlap (23-904:22-834) 10 20 30 40 50 pF1KE9 MPSPPGLRALWLCAALCASRRAGGAPQPGPGPTACPAPCHCQEDG-IMLSADCSELGLSA :..:. : .::. :::. :: ..: .:::.:::: CCDS61 MDTSRLGVLLSLPVLLQLATGGSSPRSGVLLRGCPTHCHCEPDGRMLLRVDCSDLGLSE 10 20 30 40 50 60 70 80 90 100 110 pF1KE9 VPGDLDPLTAYLDLSMNNLTELQPGLFHHLRFLEELRLSGNHLSHIPGQAFSGLYSLKIL .:..:. .:.::::::::...: :. . :::::::::.:: :..:: ::.::::::.: CCDS61 LPSNLSVFTSYLDLSMNNISQLLPNPLPSLRFLEELRLAGNALTYIPKGAFTGLYSLKVL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE9 MLQNNQLGGIPAEALWELPSLQSLRLDANLISLVPERSFEGLSSLRHLWLDDNALTEIPV ::::::: CCDS61 MLQNNQL----------------------------------------------------- 120 180 190 200 210 220 230 pF1KE9 RALNNLPALQAMTLALNRISHIPDYAFQNLTSLVVLHLHNNRIQHLGTHSFEGLHNLETL :.: :.::: :: ::::::::. :: . :.:::.:::: CCDS61 -------------------RHVPTEALQNLRSLQSLHLHNNRIHSLGKKCFDGLHSLETL 130 140 150 160 240 250 260 270 280 290 pF1KE9 DLNYNKLQEFPVAIRTLGRLQELGFHNNNIKAIPEKAFMGNPLLQTIHFYDNPIQFVGRS :::::.:.:::.:::::. :.:::::.:::..::::::.::: : ::::::::::::::: CCDS61 DLNYNNLDEFPTAIRTLSNLKELGFHSNNIRSIPEKAFVGNPSLITIHFYDNPIQFVGRS 170 180 190 200 210 220 300 310 320 330 340 350 pF1KE9 AFQYLPKLHTLSLNGAMDIQEFPDLKGTTSLEILTLTRAGIRLLPSGMCQQLPRLRVLEL :::.::.:.::.:::: .: ::::: ::..:: :::: : : ::. .:.::: :.::.: CCDS61 AFQHLPELRTLTLNGASQITEFPDLTGTANLESLTLTGAQISSLPQTVCNQLPNLQVLDL 230 240 250 260 270 280 360 370 380 390 400 410 pF1KE9 SHNQIEELPSLHRCQKLEEIGLQHNRIWEIGADTFSQLSSLQALDLSWNAIRSIHPEAFS :.: .:.:::. ::::..: :.::.:.:: .:::.:: ::..:.:.:: : :::.::: CCDS61 SYNLLEDLPSFSVCQKLQKIDLRHNEIYEIKVDTFQQLLSLRSLNLAWNKIAIIHPNAFS 290 300 310 320 330 340 420 430 440 450 460 470 pF1KE9 TLHSLVKLDLTDNQLTTLPLAGLGGLMHLKLKGNLALSQAFSKDSFPKLRILEVPYAYQC :: ::.::::..: :...:..:: :: :::: :: ::.. .:...::.:...:.:::::: CCDS61 TLPSLIKLDLSSNLLSSFPITGLHGLTHLKLTGNHALQSLISSENFPELKVIEMPYAYQC 350 360 370 380 390 400 480 490 500 510 520 530 pF1KE9 CPYGMCASFFKASGQW-EAEDLHLDDEESSKRPLGLLARQAENHYDQDLDELQLEME-DS : .:.: . .: :.:: .... .:: . :. :.. ::.. ..::... :..: : CCDS61 CAFGVCENAYKISNQWNKGDNSSMDDLH--KKDAGMF--QAQD--ERDLEDFLLDFEEDL 410 420 430 440 450 460 540 550 560 570 580 590 pF1KE9 KPHPSVQCSPTPGPFKPCEYLFESWGIRLAVWAIVLLSVLCNGLVLLTVFAGGPAPLPPV : ::::::.::::::::.:...: ::..::.:..:.. ::.:: ::: . : . :. CCDS61 KALHSVQCSPSPGPFKPCEHLLDGWLIRIGVWTIAVLALTCNALVTSTVFRS-PLYISPI 470 480 490 500 510 520 600 610 620 630 640 650 pF1KE9 KFVVGAIAGANTLTGISCGLLASVDALTFGQFSEYGARWETGLGCRATGFLAVLGSEASV :...:.::..: :::.: ..::.:::.:::.:...:: ::.:.::.. :::....::.:: CCDS61 KLLIGVIAAVNMLTGVSSAVLAGVDAFTFGSFARHGAWWENGVGCHVIGFLSIFASESSV 530 540 550 560 570 580 660 670 680 690 700 710 pF1KE9 LLLTLAAVQCSVSVSCVRAYGKSPSLGSVRAGVLGCLALAGLAAALPLASVGEYGASPLC .::::::.. . ::. . . ..:... .: : :: ::.:: . ..::::::: CCDS61 FLLTLAALERGFSVKYSAKFETKAPFSSLKVIILLCALLALTMAAVPLLGGSKYGASPLC 590 600 610 620 630 640 720 730 740 750 760 770 pF1KE9 LPYAPPEGQPAALGFTVALVMMNSFCFLVVAGAYIKLYCDLPRGDFEAVWDCAMVRHVAW :: : :.:...:. :::...::.:::... :: ::::.: .::.: .:::.::.:.: CCDS61 LPL--PFGEPSTMGYMVALILLNSLCFLMMTIAYTKLYCNLDKGDLENIWDCSMVKHIAL 650 660 670 680 690 780 790 800 810 820 830 pF1KE9 LIFADGLLYCPVAFLSFASMLGLFPVTPEAVKSVLLVVLPLPACLNPLLYLLFNPHFRDD :.:.. .: ::::::::.:...: ..::..: .::::.:::::::::::.::::::..: CCDS61 LLFTNCILNCPVAFLSFSSLINLTFISPEVIKFILLVVVPLPACLNPLLYILFNPHFKED 700 710 720 730 740 750 840 850 860 870 880 pF1KE9 LRRLRPRAG----DSGP-LAYAAAGELEKSSCDSTQALVAF--SDVDLILEASEAGRP-- : :: .. .. : : . ..::.:::::::::.: :.. : : . : CCDS61 LVSLRKQTYVWTRSKHPSLMSINSDDVEKQSCDSTQALVTFTSSSITYDLPPSSVPSPAY 760 770 780 790 800 810 890 900 910 920 930 940 pF1KE9 PGLETYGFPSVTLISCQQPGAPRLEGSHCVEPEGNHFGNPQPSMDGELLLRAEGSTPAGG : :. . ::... : CCDS61 PVTESCHLSSVAFVPCL 820 830 >>CCDS61194.1 LGR5 gene_id:8549|Hs109|chr12 (883 aa) initn: 2089 init1: 1054 opt: 2381 Z-score: 2021.4 bits: 385.3 E(33420): 2.9e-106 Smith-Waterman score: 3114; 53.9% identity (78.9% similar) in 894 aa overlap (23-904:22-882) 10 20 30 40 50 pF1KE9 MPSPPGLRALWLCAALCASRRAGGAPQPGPGPTACPAPCHCQEDG-IMLSADCSELGLSA :..:. : .::. :::. :: ..: .:::.:::: CCDS61 MDTSRLGVLLSLPVLLQLATGGSSPRSGVLLRGCPTHCHCEPDGRMLLRVDCSDLGLSE 10 20 30 40 50 60 70 80 90 100 110 pF1KE9 VPGDLDPLTAYLDLSMNNLTELQPGLFHHLRFLEELRLSGNHLSHIPGQAFSGLYSLKIL .:..:. .:.::::::::...: :. . :::::::::.:: :..:: ::.::::::.: CCDS61 LPSNLSVFTSYLDLSMNNISQLLPNPLPSLRFLEELRLAGNALTYIPKGAFTGLYSLKVL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE9 MLQNNQLGGIPAEALWELPSLQSLRLDANLISLVPERSFEGLSSLRHLWLDDNALTEIPV ::::::: .:.::: .: :::::::::: :: :: : :: ::::::::::::::::: CCDS61 MLQNNQLRHVPTEALQNLRSLQSLRLDANHISYVPPSCFSGLHSLRHLWLDDNALTEIPV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE9 RALNNLPALQAMTLALNRISHIPDYAFQNLTSLVVLHLHNNRIQHLGTHSFEGLHNLETL .:. .: ::::::::::.: ::::::: ::.::::::::::::. :: . :.:::.:::: CCDS61 QAFRSLSALQAMTLALNKIHHIPDYAFGNLSSLVVLHLHNNRIHSLGKKCFDGLHSLETL 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE9 DLNYNKLQEFPVAIRTLGRLQELGFHNNNIKAIPEKAFMGNPLLQTIHFYDNPIQFVGRS :::::.:.:::.:::::. :.:: ::::::::::::: CCDS61 DLNYNNLDEFPTAIRTLSNLKEL------------------------HFYDNPIQFVGRS 240 250 260 270 300 310 320 330 340 350 pF1KE9 AFQYLPKLHTLSLNGAMDIQEFPDLKGTTSLEILTLTRAGIRLLPSGMCQQLPRLRVLEL :::.::.:.::.:::: .: ::::: ::..:: :::: : : ::. .:.::: :.::.: CCDS61 AFQHLPELRTLTLNGASQITEFPDLTGTANLESLTLTGAQISSLPQTVCNQLPNLQVLDL 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE9 SHNQIEELPSLHRCQKLEEIGLQHNRIWEIGADTFSQLSSLQALDLSWNAIRSIHPEAFS :.: .:.:::. ::::..: :.::.:.:: .:::.:: ::..:.:.:: : :::.::: CCDS61 SYNLLEDLPSFSVCQKLQKIDLRHNEIYEIKVDTFQQLLSLRSLNLAWNKIAIIHPNAFS 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE9 TLHSLVKLDLTDNQLTTLPLAGLGGLMHLKLKGNLALSQAFSKDSFPKLRILEVPYAYQC :: ::.::::..: :...:..:: :: :::: :: ::.. .:...::.:...:.:::::: CCDS61 TLPSLIKLDLSSNLLSSFPITGLHGLTHLKLTGNHALQSLISSENFPELKVIEMPYAYQC 400 410 420 430 440 450 480 490 500 510 520 530 pF1KE9 CPYGMCASFFKASGQW-EAEDLHLDDEESSKRPLGLLARQAENHYDQDLDELQLEME-DS : .:.: . .: :.:: .... .:: . :. :.. ::.. ..::... :..: : CCDS61 CAFGVCENAYKISNQWNKGDNSSMDDLH--KKDAGMF--QAQD--ERDLEDFLLDFEEDL 460 470 480 490 500 540 550 560 570 580 590 pF1KE9 KPHPSVQCSPTPGPFKPCEYLFESWGIRLAVWAIVLLSVLCNGLVLLTVFAGGPAPLPPV : ::::::.::::::::.:...: ::..::.:..:.. ::.:: ::: . : . :. CCDS61 KALHSVQCSPSPGPFKPCEHLLDGWLIRIGVWTIAVLALTCNALVTSTVFRS-PLYISPI 510 520 530 540 550 560 600 610 620 630 640 650 pF1KE9 KFVVGAIAGANTLTGISCGLLASVDALTFGQFSEYGARWETGLGCRATGFLAVLGSEASV :...:.::..: :::.: ..::.:::.:::.:...:: ::.:.::.. :::....::.:: CCDS61 KLLIGVIAAVNMLTGVSSAVLAGVDAFTFGSFARHGAWWENGVGCHVIGFLSIFASESSV 570 580 590 600 610 620 660 670 680 690 700 710 pF1KE9 LLLTLAAVQCSVSVSCVRAYGKSPSLGSVRAGVLGCLALAGLAAALPLASVGEYGASPLC .::::::.. . ::. . . ..:... .: : :: ::.:: . ..::::::: CCDS61 FLLTLAALERGFSVKYSAKFETKAPFSSLKVIILLCALLALTMAAVPLLGGSKYGASPLC 630 640 650 660 670 680 720 730 740 750 760 770 pF1KE9 LPYAPPEGQPAALGFTVALVMMNSFCFLVVAGAYIKLYCDLPRGDFEAVWDCAMVRHVAW :: : :.:...:. :::...::.:::... :: ::::.: .::.: .:::.::.:.: CCDS61 LPL--PFGEPSTMGYMVALILLNSLCFLMMTIAYTKLYCNLDKGDLENIWDCSMVKHIAL 690 700 710 720 730 740 780 790 800 810 820 830 pF1KE9 LIFADGLLYCPVAFLSFASMLGLFPVTPEAVKSVLLVVLPLPACLNPLLYLLFNPHFRDD :.:.. .: ::::::::.:...: ..::..: .::::.:::::::::::.::::::..: CCDS61 LLFTNCILNCPVAFLSFSSLINLTFISPEVIKFILLVVVPLPACLNPLLYILFNPHFKED 750 760 770 780 790 800 840 850 860 870 880 pF1KE9 LRRLRPRAG----DSGP-LAYAAAGELEKSSCDSTQALVAF--SDVDLILEASEAGRP-- : :: .. .. : : . ..::.:::::::::.: :.. : : . : CCDS61 LVSLRKQTYVWTRSKHPSLMSINSDDVEKQSCDSTQALVTFTSSSITYDLPPSSVPSPAY 810 820 830 840 850 860 890 900 910 920 930 940 pF1KE9 PGLETYGFPSVTLISCQQPGAPRLEGSHCVEPEGNHFGNPQPSMDGELLLRAEGSTPAGG : :. . ::... : CCDS61 PVTESCHLSSVAFVPCL 870 880 >>CCDS31449.1 LGR4 gene_id:55366|Hs109|chr11 (951 aa) initn: 2229 init1: 1613 opt: 1676 Z-score: 1424.4 bits: 275.0 E(33420): 5.2e-73 Smith-Waterman score: 2648; 47.5% identity (72.3% similar) in 918 aa overlap (1-907:1-892) 10 20 30 40 50 60 pF1KE9 MPSPPGLRALWLCAALCASRRAGGAPQPGPGPTACPAPCHCQEDGIMLSADCSELGLSAV ::.: :: :: . : :.: : .: : ::: :. : .::: ::.:: CCDS31 MPGPLGL----LC--FLALGLLGSAGPSGAAPPLCAAPCSCDGDR---RVDCSGKGLTAV 10 20 30 40 50 70 80 90 100 110 120 pF1KE9 PGDLDPLTAYLDLSMNNLTELQPGLFHHLRFLEELRLSGNHLSHIPGQAFSGLYSLKILM : :. .: ::.::::.:.: :... :::::.:.:: :: : .:.::: ::.: CCDS31 PEGLSAFTQALDISMNNITQLPEDAFKNFPFLEELQLAGNDLSFIHPKALSGLKELKVLT 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE9 LQNNQLGGIPAEALWELPSLQSLRLDANLISLVPERSFEGLSSLRHLWLDDNALTEIPVR :::::: .:.::. : .::::::::: :. ::: ::::: .:::::::::.:::.::. CCDS31 LQNNQLKTVPSEAIRGLSALQSLRLDANHITSVPEDSFEGLVQLRHLWLDDNSLTEVPVH 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE9 ALNNLPALQAMTLALNRISHIPDYAFQNLTSLVVLHLHNNRIQHLGTHSFEGLHNLETLD :.:::.:::.:::::.:: :::.:: ::.::::::::::.:. :. : :.:: :::::: CCDS31 PLSNLPTLQALTLALNKISSIPDFAFTNLSSLVVLHLHNNKIRSLSQHCFDGLDNLETLD 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE9 LNYNKLQEFPVAIRTLGRLQELGFHNNNIKAIPEKAFMGNPLLQTIHFYDNPIQFVGRSA ::::.: ::: ::..: :.:::::.:.:..::. :: :::::.:::.::::..::: :: CCDS31 LNYNNLGEFPQAIKALPSLKELGFHSNSISVIPDGAFDGNPLLRTIHLYDNPLSFVGNSA 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE9 FQYLPKLHTLSLNGAMDIQEFPDLKGTTSLEILTLTRAGIRLLPSGMCQQLPRLRVLELS :. : ::.: . :: .:.::.: ::. :: :::: . : .:...::. ::.:.:: CCDS31 FHNLSDLHSLVIRGASMVQQFPNLTGTVHLESLTLTGTKISSIPNNLCQEQKMLRTLDLS 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE9 HNQIEELPSLHRCQKLEEIGLQHNRIWEIGADTFSQLSSLQALDLSWNAIRSIHPEAFST .:.:..:::.. :. ::::.::.:.:..: ::. : ::. :::: : :. :: .::.: CCDS31 YNNIRDLPSFNGCHALEEISLQRNQIYQIKEGTFQGLISLRILDLSRNLIHEIHSRAFAT 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE9 LHSLVKLDLTDNQLTTLPLAGLGGLMHLKLKGNLALSQAFSKDSFPKLRILEVPYAYQCC : ...::.. :.::..: ::.:: .::: ::. :..:.. .: .:: : :::::::: CCDS31 LGPITNLDVSFNELTSFPTEGLNGLNQLKLVGNFKLKEALAAKDFVNLRSLSVPYAYQCC 420 430 440 450 460 470 490 500 510 520 530 540 pF1KE9 PYGMCASFFKASGQWEAEDLHLDDEESSKRPLGLLARQAENHYDQDLDELQLEMEDSKPH . : :. .. ..:: :.:. . : .. : :: :. . . CCDS31 AFWGCDSY----ANLNTEDNSLQDHSVA---------QEKGTADAANVTSTLENEEHS-Q 480 490 500 510 550 560 570 580 590 600 pF1KE9 PSVQCSPTPGPFKPCEYLFESWGIRLAVWAIVLLSVLCNGLVLLTVFAGGPAPLPPVKFV ..:.:. : :::::::. :: :::.:: : :.... : ::.::.::. . :: :. CCDS31 IIIHCTPSTGAFKPCEYLLGSWMIRLTVWFIFLVALFFNLLVILTTFASCTS-LPSSKLF 520 530 540 550 560 570 610 620 630 640 650 660 pF1KE9 VGAIAGANTLTGISCGLLASVDALTFGQFSEYGARWETGLGCRATGFLAVLGSEASVLLL .: :. .: . :: :.:. .::...:.:.:.: :::: ::...:::::..::....:: CCDS31 IGLISVSNLFMGIYTGILTFLDAVSWGRFAEFGIWWETGSGCKVAGFLAVFSSESAIFLL 580 590 600 610 620 630 670 680 690 700 710 720 pF1KE9 TLAAVQCSVSVSCVRAYGKSPSLGSVRAGVLGCLALAGLAAALPLASVGEYGASPLCLPY ::.:. :.:.. . ::: : . :...: . : .:. .:: :::.:::::::. CCDS31 MLATVERSLSAKDIMKNGKSNHLKQFRVAALLAFLGATVAGCFPLFHRGEYSASPLCLPF 640 650 660 670 680 690 730 740 750 760 770 780 pF1KE9 APPEGQPAALGFTVALVMMNSFCFLVVAGAYIKLYCDLPRGDFEAVWDCAMVRHVAWLIF : :. .:::::.::..::. ::..: : ::::.: . :. . .:..::::::: CCDS31 --PTGETPSLGFTVTLVLLNSLAFLLMAVIYTKLYCNLEKEDLSENSQSSMIKHVAWLIF 700 710 720 730 740 750 790 800 810 820 830 pF1KE9 ADGLLYCPVAFLSFASMLGLFPVTPEAVKSVLLVVLPLPACLNPLLYLLFNPHFRDDL-- .. ...:::::.::: .. . ..:: .::: :. .::::::::.::..:::.:..: CCDS31 TNCIFFCPVAFFSFAPLITAISISPEIMKSVTLIFFPLPACLNPVLYVFFNPKFKEDWKL 760 770 780 790 800 810 840 850 860 870 880 890 pF1KE9 --RRLRPRAGDSGPLAYAAAGELEKS---SCDSTQALVAFSDVDLILEASEAGRPPG--- ::. ..:. . . .: ::.. .: . : . : :. .: . CCDS31 LKRRVTKKSGSVSVSISSQGGCLEQDFYYDCGMYSHLQGNLTVCDCCESFLLTKPVSCKH 820 830 840 850 860 870 900 910 920 930 940 pF1KE9 -LETYGFPSVTLISCQQPGAPRLEGSHCVEPEGNHFGNPQPSMDGELLLRAEGSTPAGGG ..... :.... :::.: CCDS31 LIKSHSCPALAVASCQRPEGYWSDCGTQSAHSDYADEEDSFVSDSSDQVQACGRACFYQS 880 890 900 910 920 930 >>CCDS86187.1 LGR4 gene_id:55366|Hs109|chr11 (927 aa) initn: 2097 init1: 1481 opt: 1499 Z-score: 1274.7 bits: 247.2 E(33420): 1.1e-64 Smith-Waterman score: 2515; 46.2% identity (70.5% similar) in 918 aa overlap (1-907:1-868) 10 20 30 40 50 60 pF1KE9 MPSPPGLRALWLCAALCASRRAGGAPQPGPGPTACPAPCHCQEDGIMLSADCSELGLSAV ::.: :: :: . : :.: : .: : ::: :. : .::: ::.:: CCDS86 MPGPLGL----LC--FLALGLLGSAGPSGAAPPLCAAPCSCDGDR---RVDCSGKGLTAV 10 20 30 40 50 70 80 90 100 110 120 pF1KE9 PGDLDPLTAYLDLSMNNLTELQPGLFHHLRFLEELRLSGNHLSHIPGQAFSGLYSLKILM : . :.: : . :.:.:: :: : .:.::: ::.: CCDS86 P---EGLSA---------------------FTQALQLAGNDLSFIHPKALSGLKELKVLT 60 70 80 130 140 150 160 170 180 pF1KE9 LQNNQLGGIPAEALWELPSLQSLRLDANLISLVPERSFEGLSSLRHLWLDDNALTEIPVR :::::: .:.::. : .::::::::: :. ::: ::::: .:::::::::.:::.::. CCDS86 LQNNQLKTVPSEAIRGLSALQSLRLDANHITSVPEDSFEGLVQLRHLWLDDNSLTEVPVH 90 100 110 120 130 140 190 200 210 220 230 240 pF1KE9 ALNNLPALQAMTLALNRISHIPDYAFQNLTSLVVLHLHNNRIQHLGTHSFEGLHNLETLD :.:::.:::.:::::.:: :::.:: ::.::::::::::.:. :. : :.:: :::::: CCDS86 PLSNLPTLQALTLALNKISSIPDFAFTNLSSLVVLHLHNNKIRSLSQHCFDGLDNLETLD 150 160 170 180 190 200 250 260 270 280 290 300 pF1KE9 LNYNKLQEFPVAIRTLGRLQELGFHNNNIKAIPEKAFMGNPLLQTIHFYDNPIQFVGRSA ::::.: ::: ::..: :.:::::.:.:..::. :: :::::.:::.::::..::: :: CCDS86 LNYNNLGEFPQAIKALPSLKELGFHSNSISVIPDGAFDGNPLLRTIHLYDNPLSFVGNSA 210 220 230 240 250 260 310 320 330 340 350 360 pF1KE9 FQYLPKLHTLSLNGAMDIQEFPDLKGTTSLEILTLTRAGIRLLPSGMCQQLPRLRVLELS :. : ::.: . :: .:.::.: ::. :: :::: . : .:...::. ::.:.:: CCDS86 FHNLSDLHSLVIRGASMVQQFPNLTGTVHLESLTLTGTKISSIPNNLCQEQKMLRTLDLS 270 280 290 300 310 320 370 380 390 400 410 420 pF1KE9 HNQIEELPSLHRCQKLEEIGLQHNRIWEIGADTFSQLSSLQALDLSWNAIRSIHPEAFST .:.:..:::.. :. ::::.::.:.:..: ::. : ::. :::: : :. :: .::.: CCDS86 YNNIRDLPSFNGCHALEEISLQRNQIYQIKEGTFQGLISLRILDLSRNLIHEIHSRAFAT 330 340 350 360 370 380 430 440 450 460 470 480 pF1KE9 LHSLVKLDLTDNQLTTLPLAGLGGLMHLKLKGNLALSQAFSKDSFPKLRILEVPYAYQCC : ...::.. :.::..: ::.:: .::: ::. :..:.. .: .:: : :::::::: CCDS86 LGPITNLDVSFNELTSFPTEGLNGLNQLKLVGNFKLKEALAAKDFVNLRSLSVPYAYQCC 390 400 410 420 430 440 490 500 510 520 530 540 pF1KE9 PYGMCASFFKASGQWEAEDLHLDDEESSKRPLGLLARQAENHYDQDLDELQLEMEDSKPH . : :. .. ..:: :.:. . : .. : :: :. . . CCDS86 AFWGCDSY----ANLNTEDNSLQDHSVA---------QEKGTADAANVTSTLENEEHS-Q 450 460 470 480 490 550 560 570 580 590 600 pF1KE9 PSVQCSPTPGPFKPCEYLFESWGIRLAVWAIVLLSVLCNGLVLLTVFAGGPAPLPPVKFV ..:.:. : :::::::. :: :::.:: : :.... : ::.::.::. . :: :. CCDS86 IIIHCTPSTGAFKPCEYLLGSWMIRLTVWFIFLVALFFNLLVILTTFASCTS-LPSSKLF 500 510 520 530 540 550 610 620 630 640 650 660 pF1KE9 VGAIAGANTLTGISCGLLASVDALTFGQFSEYGARWETGLGCRATGFLAVLGSEASVLLL .: :. .: . :: :.:. .::...:.:.:.: :::: ::...:::::..::....:: CCDS86 IGLISVSNLFMGIYTGILTFLDAVSWGRFAEFGIWWETGSGCKVAGFLAVFSSESAIFLL 560 570 580 590 600 610 670 680 690 700 710 720 pF1KE9 TLAAVQCSVSVSCVRAYGKSPSLGSVRAGVLGCLALAGLAAALPLASVGEYGASPLCLPY ::.:. :.:.. . ::: : . :...: . : .:. .:: :::.:::::::. CCDS86 MLATVERSLSAKDIMKNGKSNHLKQFRVAALLAFLGATVAGCFPLFHRGEYSASPLCLPF 620 630 640 650 660 670 730 740 750 760 770 780 pF1KE9 APPEGQPAALGFTVALVMMNSFCFLVVAGAYIKLYCDLPRGDFEAVWDCAMVRHVAWLIF : :. .:::::.::..::. ::..: : ::::.: . :. . .:..::::::: CCDS86 --PTGETPSLGFTVTLVLLNSLAFLLMAVIYTKLYCNLEKEDLSENSQSSMIKHVAWLIF 680 690 700 710 720 730 790 800 810 820 830 pF1KE9 ADGLLYCPVAFLSFASMLGLFPVTPEAVKSVLLVVLPLPACLNPLLYLLFNPHFRDDL-- .. ...:::::.::: .. . ..:: .::: :. .::::::::.::..:::.:..: CCDS86 TNCIFFCPVAFFSFAPLITAISISPEIMKSVTLIFFPLPACLNPVLYVFFNPKFKEDWKL 740 750 760 770 780 790 840 850 860 870 880 890 pF1KE9 --RRLRPRAGDSGPLAYAAAGELEKS---SCDSTQALVAFSDVDLILEASEAGRPPG--- ::. ..:. . . .: ::.. .: . : . : :. .: . CCDS86 LKRRVTKKSGSVSVSISSQGGCLEQDFYYDCGMYSHLQGNLTVCDCCESFLLTKPVSCKH 800 810 820 830 840 850 900 910 920 930 940 pF1KE9 -LETYGFPSVTLISCQQPGAPRLEGSHCVEPEGNHFGNPQPSMDGELLLRAEGSTPAGGG ..... :.... :::.: CCDS86 LIKSHSCPALAVASCQRPEGYWSDCGTQSAHSDYADEEDSFVSDSSDQVQACGRACFYQS 860 870 880 890 900 910 >>CCDS1844.2 FSHR gene_id:2492|Hs109|chr2 (669 aa) initn: 604 init1: 187 opt: 627 Z-score: 538.3 bits: 110.5 E(33420): 1.2e-23 Smith-Waterman score: 636; 25.2% identity (57.9% similar) in 596 aa overlap (261-846:50-619) 240 250 260 270 280 290 pF1KE9 EGLHNLETLDLNYNKLQEFPVAIRTLGRLQELGFHNNNIKAIPEKAFMGNPLLQTIHFYD :: : .....: . :: : :. :.. . CCDS18 HRICHCSNRVFLCQESKVTEIPSDLPRNAIELRFVLTKLRVIQKGAFSGFGDLEKIEISQ 20 30 40 50 60 70 300 310 320 330 340 pF1KE9 NPI-QFVGRSAFQYLPKLHTLSLNGAMDIQEFPDLKGTTSLEILTLTRAGIRLLPSGMCQ : . . . ..:. ::::: . .. : .. . . : .. : CCDS18 NDVLEVIEADVFSNLPKLHEIRIEKANNL---------------------LYINPEAF-Q 80 90 100 110 350 360 370 380 390 400 pF1KE9 QLPRLRVLELSHNQIEELPSLHRCQKLEEIGLQHNR--IWEIGADTFSQLSSLQALDLS- .:: :. : .:.. :..::..:. ..:... : :. : :: .:. ..:. :.:: CCDS18 NLPNLQYLLISNTGIKHLPDVHKIHSLQKVLLWLNKNGIQEIHNCAFNG-TQLDELNLSD 120 130 140 150 160 170 410 420 430 440 450 460 pF1KE9 WNAIRSIHPEAFSTLHSLVKLDLTDNQLTTLPLAGLGGLMHLKLKGNLALSQAFSKDSFP : .. . ..: . : ::.. ... .:: :: .: .:. ... :.. . ... CCDS18 NNNLEELPNDVFHGASGPVILDISRTRIHSLPSYGLENLKKLRARSTYNLKKLPTLEKLV 180 190 200 210 220 230 470 480 490 500 510 520 pF1KE9 KLRILEVPYAYQCCPYGM---CASFFKASGQWEAEDLHLDDEESSKRPLGLLARQAENHY : . : .:: .. : .. . ..: ... . ::.. :. : CCDS18 ALMEASLTYPSHCCAFANWRRQISELHPICNKSILRQEVDYMTQARGQRSSLAEDNESSY 240 250 260 270 280 290 530 540 550 560 570 580 pF1KE9 DQDLDELQLEMEDSKPHP--SVQCSPTPGPFKPCEYLFESWGIRLAVWAIVLLSVLCNGL .. .: :.. . . .: ::: : :.::: .. .:. .: : .:.. : . CCDS18 SRGFDMTYTEFDYDLCNEVVDVTCSPKPDAFNPCEDIMGYNILRVLIWFISILAITGN-I 300 310 320 330 340 350 590 600 610 620 630 640 pF1KE9 VLLTVFAGGPAPLPPVKFVVGAIAGANTLTGISCGLLASVDALTFGQFSEYGARWETGLG ..:.... . : .:.. .: :. :: :.:::: : .:. .:. :.:: : CCDS18 IVLVILTTSQYKLTVPRFLMCNLAFADLCIGIYLLLIASVDIHTKSQYHNYAIDWQTGAG 360 370 380 390 400 410 650 660 670 680 690 700 pF1KE9 CRATGFLAVLGSEASVLLLTLAAVQCSVSVSCVRAYGKSPSLGSVRAGVLGCLALAGLAA : :.::..:..:: :: :: ... ... . . .: . . .. .: :: CCDS18 CDAAGFFTVFASELSVYTLTAITLERWHTITHAMQLDCKVQLRHAASVMVMGWIFAFAAA 420 430 440 450 460 470 710 720 730 740 750 760 pF1KE9 ALPLASVGEYGASPLCLPYAPPEGQPAALGFTVALVMMNSFCFLVVAGAYIKLYCDLPRG .:. ... : .:::. .: . ....:...: . :.:. : ::..: . CCDS18 LFPIFGISSYMKVSICLPMDID--SPLSQLYVMSLLVLNVLAFVVICGCYIHIYLTVRNP 480 490 500 510 520 530 770 780 790 800 810 820 pF1KE9 DF-EAVWDCAMVRHVAWLIFADGLLYCPVAFLSFASMLGLFPVTPEAVKSVLLVVLPLPA .. . : .....: :::.: : . :..:..... : . .: .: .:.. :. . CCDS18 NIVSSSSDTRIAKRMAMLIFTDFLCMAPISFFAISASLKVPLITVSKAKILLVLFHPINS 540 550 560 570 580 590 830 840 850 860 870 880 pF1KE9 CLNPLLYLLFNPHFRDDLRRLRPRAGDSGPLAYAAAGELEKSSCDSTQALVAFSDVDLIL : ::.:: .:. .:: :. : . : CCDS18 CANPFLYAIFTKNFRRDFFILLSKCGCYEMQAQIYRTETSSTVHNTHPRNGHCSSAPRVT 600 610 620 630 640 650 >>CCDS1842.1 LHCGR gene_id:3973|Hs109|chr2 (699 aa) initn: 359 init1: 188 opt: 567 Z-score: 487.4 bits: 101.1 E(33420): 8.2e-21 Smith-Waterman score: 567; 24.4% identity (58.3% similar) in 595 aa overlap (269-846:61-642) 240 250 260 270 280 290 pF1KE9 LDLNYNKLQEFPVAIRTLGRLQELGFHNNNIKAIPEKAFMG-NPLLQTIHFYDNPIQFVG .:.:: .:: : : ... . .. . CCDS18 PEPCNCVPDGALRCPGPTAGLTRLSLAYLPVKVIPSQAFRGLNEVIKIEISQIDSLERIE 40 50 60 70 80 90 300 310 320 330 340 350 pF1KE9 RSAFQYLPKLHTLSLNGAMDIQ--EFPDLKGTTSLEILTLTRAGIRLLP--SGMCQQLPR .::. : .: . .... ... : . . :. :.. .::: .: . . .. CCDS18 ANAFDNLLNLSEILIQNTKNLRYIEPGAFINLPRLKYLSICNTGIRKFPDVTKVFSSESN 100 110 120 130 140 150 360 370 380 390 400 pF1KE9 LRVLELSHN-QIEELP-SLHRCQKLEEIGLQ--HNRIWEIGADTFSQLSSLQALDLSWNA . .::. : .: .: . . .. : . :. : . :. . .:. ..: .:.:. :. CCDS18 F-ILEICDNLHITTIPGNAFQGMNNESVTLKLYGNGFEEVQSHAFNG-TTLTSLELKENV 160 170 180 190 200 410 420 430 440 450 460 pF1KE9 -IRSIHPEAFSTLHSLVKLDLTDNQLTTLPLAGLGGLMHLKLKGNLALSQAFSKDSFPKL ....: :: . ::.....: .:: :: ....: .. .:.. :...: .: CCDS18 HLEKMHNGAFRGATGPKTLDISSTKLQALPSYGLESIQRLIATSSYSLKKLPSRETFVNL 210 220 230 240 250 260 470 480 490 500 510 520 pF1KE9 RILEVPYAYQCCPYGMCASFFKASGQWEAEDLHLDDEESSKRPLGLLARQAENH--YDQD . : .:: :. : . : .:. ::. . . :...:. :.. CCDS18 LEATLTYPSHCCA-------FRNLPTKEQNFSHSISENFSKQCESTV-RKVNNKTLYSSM 270 280 290 300 310 320 530 540 550 560 570 580 pF1KE9 LDELQLEMEDSKPH---PSV-QCSPTPGPFKPCEYLFESWGIRLAVWAIVLLSVLCNGLV : : .: : . :.. .:.: : :.::: .. .:. .: : .:... : : CCDS18 LAESELSGWDYEYGFCLPKTPRCAPEPDAFNPCEDIMGYDFLRVLIWLINILAIMGNMTV 330 340 350 360 370 380 590 600 610 620 630 640 pF1KE9 LLTVFAGGPAPLPPVKFVVGAIAGANTLTGISCGLLASVDALTFGQFSEYGARWETGLGC :...... : .:.. .. :. :. :.::::. : ::. ... :.:: :: CCDS18 LFVLLTSRYKLTVP-RFLMCNLSFADFCMGLYLLLIASVDSQTKGQYYNHAIDWQTGSGC 390 400 410 420 430 650 660 670 680 690 700 pF1KE9 RATGFLAVLGSEASVLLLTLAAVQCSVSVSCVRAYGKSPSLGSVRAGVLGCLALAGLAAA ..::..:..:: :: ::. ... ... . .. : . .:: ...: : CCDS18 STAGFFTVFASELSVYTLTVITLERWHTITYAIHLDQKLRLRHAILIMLGGWLFSSLIAM 440 450 460 470 480 490 710 720 730 740 750 760 pF1KE9 LPLASVGEYGASPLCLPYAPPEGQPAALGFTVALVMMNSFCFLVVAGAYIKLYCDLPRGD :::..:..: .:.:. . . ......: :... . :::.: . . CCDS18 LPLVGVSNYMKVSICFPMDVETTLSQV--YILTILILNVVAFFIICACYIKIYFAVRNPE 500 510 520 530 540 550 770 780 790 800 810 820 pF1KE9 FEAV-WDCAMVRHVAWLIFADGLLYCPVAFLSFASMLGLFPVTPEAVKSVLLVVLPLPAC . :. : .....: :::.: . :..:..... . . .: : .:.. :. .: CCDS18 LMATNKDTKIAKKMAILIFTDFTCMAPISFFAISAAFKVPLITVTNSKVLLVLFYPINSC 560 570 580 590 600 610 830 840 850 860 870 880 pF1KE9 LNPLLYLLFNPHFRDDLRRLRPRAGDSGPLAYAAAGELEKSSCDSTQALVAFSDVDLILE ::.:: .:. :. :. : . : CCDS18 ANPFLYAIFTKTFQRDFFLLLSKFGCCKRRAELYRRKDFSAYTSNCKNGFTGSNKPSQST 620 630 640 650 660 670 967 residues in 1 query sequences 18921897 residues in 33420 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Oct 24 21:36:44 2019 done: Thu Oct 24 21:36:45 2019 Total Scan time: 2.380 Total Display time: 0.210 Function used was FASTA [36.3.4 Apr, 2011]