FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5093, 951 aa 1>>>pF1KB5093 951 - 951 aa - 951 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5967+/-0.00121; mu= 21.6227+/- 0.072 mean_var=146.2194+/-34.855, 0's: 0 Z-trim(105.7): 224 B-trim: 512 in 1/48 Lambda= 0.106065 statistics sampled from 8305 (8562) to 8305 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.614), E-opt: 0.2 (0.263), width: 16 Scan time: 3.770 The best scores are: opt bits E(32554) CCDS31449.1 LGR4 gene_id:55366|Hs108|chr11 ( 951) 6343 984.0 0 CCDS9000.1 LGR5 gene_id:8549|Hs108|chr12 ( 907) 1748 280.8 8.2e-75 CCDS30971.1 LGR6 gene_id:59352|Hs108|chr1 ( 967) 1676 269.8 1.8e-71 CCDS1424.1 LGR6 gene_id:59352|Hs108|chr1 ( 915) 1558 251.7 4.7e-66 CCDS61195.1 LGR5 gene_id:8549|Hs108|chr12 ( 835) 1171 192.5 3e-48 CCDS61194.1 LGR5 gene_id:8549|Hs108|chr12 ( 883) 1041 172.6 3e-42 CCDS30972.1 LGR6 gene_id:59352|Hs108|chr1 ( 828) 969 161.6 6e-39 CCDS9872.1 TSHR gene_id:7253|Hs108|chr14 ( 764) 685 118.1 6.9e-26 CCDS1844.2 FSHR gene_id:2492|Hs108|chr2 ( 669) 682 117.5 8.7e-26 CCDS1843.1 FSHR gene_id:2492|Hs108|chr2 ( 695) 651 112.8 2.4e-24 CCDS10446.1 IGFALS gene_id:3483|Hs108|chr16 ( 605) 592 103.7 1.1e-21 CCDS53982.1 IGFALS gene_id:3483|Hs108|chr16 ( 643) 592 103.7 1.2e-21 CCDS73766.1 LINGO1 gene_id:84894|Hs108|chr15 ( 614) 533 94.7 6e-19 CCDS45313.1 LINGO1 gene_id:84894|Hs108|chr15 ( 620) 533 94.7 6.1e-19 CCDS1842.1 LHCGR gene_id:3973|Hs108|chr2 ( 699) 531 94.4 8.1e-19 CCDS3306.1 LRRC15 gene_id:131578|Hs108|chr3 ( 581) 514 91.7 4.4e-18 CCDS46984.1 LRRC15 gene_id:131578|Hs108|chr3 ( 587) 514 91.7 4.4e-18 CCDS6524.1 LINGO2 gene_id:158038|Hs108|chr9 ( 606) 481 86.7 1.5e-16 CCDS45905.1 LINGO3 gene_id:645191|Hs108|chr19 ( 592) 459 83.3 1.5e-15 CCDS9039.1 DCN gene_id:1634|Hs108|chr12 ( 359) 423 77.5 5.1e-14 CCDS43276.1 RXFP1 gene_id:59350|Hs108|chr4 ( 757) 426 78.4 5.8e-14 CCDS13777.1 RTN4R gene_id:65078|Hs108|chr22 ( 473) 420 77.2 8.3e-14 CCDS46715.1 CHADL gene_id:150356|Hs108|chr22 ( 762) 420 77.5 1.1e-13 CCDS75204.1 RXFP1 gene_id:59350|Hs108|chr4 ( 784) 419 77.4 1.2e-13 CCDS30855.1 LINGO4 gene_id:339398|Hs108|chr1 ( 593) 416 76.7 1.5e-13 CCDS58930.1 RXFP1 gene_id:59350|Hs108|chr4 ( 724) 416 76.9 1.6e-13 CCDS3846.1 TLR3 gene_id:7098|Hs108|chr4 ( 904) 417 77.1 1.7e-13 CCDS1448.1 LRRN2 gene_id:10446|Hs108|chr1 ( 713) 407 75.5 4.2e-13 CCDS31464.1 LRRC4C gene_id:57689|Hs108|chr11 ( 640) 401 74.5 7.5e-13 CCDS47272.1 LRRTM2 gene_id:26045|Hs108|chr5 ( 516) 399 74.1 8.1e-13 CCDS5799.1 LRRC4 gene_id:64101|Hs108|chr7 ( 653) 395 73.6 1.4e-12 CCDS33783.1 LRIG1 gene_id:26018|Hs108|chr3 (1093) 396 74.0 1.7e-12 CCDS42595.1 LRRC4B gene_id:94030|Hs108|chr19 ( 713) 393 73.3 1.9e-12 CCDS47218.1 LRRC70 gene_id:100130733|Hs108|chr5 ( 622) 389 72.6 2.6e-12 CCDS14721.1 BGN gene_id:633|Hs108|chrX ( 368) 385 71.7 2.9e-12 CCDS33920.1 CPN2 gene_id:1370|Hs108|chr3 ( 545) 387 72.3 3e-12 CCDS55124.1 LRRD1 gene_id:401387|Hs108|chr7 ( 860) 382 71.8 6.7e-12 CCDS54226.1 PODNL1 gene_id:79883|Hs108|chr19 ( 510) 376 70.5 9.2e-12 CCDS12300.1 PODNL1 gene_id:79883|Hs108|chr19 ( 512) 376 70.5 9.3e-12 CCDS75111.1 SLIT2 gene_id:9353|Hs108|chr4 (1521) 375 71.0 2e-11 CCDS75110.1 SLIT2 gene_id:9353|Hs108|chr4 (1525) 375 71.0 2e-11 CCDS3426.1 SLIT2 gene_id:9353|Hs108|chr4 (1529) 375 71.0 2e-11 CCDS7453.1 SLIT1 gene_id:6585|Hs108|chr10 (1534) 371 70.4 3e-11 CCDS44933.1 LRIG3 gene_id:121227|Hs108|chr12 (1059) 368 69.7 3.3e-11 CCDS8960.1 LRIG3 gene_id:121227|Hs108|chr12 (1119) 368 69.8 3.4e-11 CCDS11192.1 FLII gene_id:2314|Hs108|chr17 (1269) 364 69.2 5.7e-11 CCDS58521.1 FLII gene_id:2314|Hs108|chr17 (1258) 363 69.1 6.3e-11 CCDS81341.1 LRRC7 gene_id:57554|Hs108|chr1 (1495) 361 68.9 8.6e-11 CCDS645.1 LRRC7 gene_id:57554|Hs108|chr1 (1537) 361 68.9 8.7e-11 CCDS4369.1 SLIT3 gene_id:6586|Hs108|chr5 (1523) 360 68.7 9.6e-11 >>CCDS31449.1 LGR4 gene_id:55366|Hs108|chr11 (951 aa) initn: 6343 init1: 6343 opt: 6343 Z-score: 5256.4 bits: 984.0 E(32554): 0 Smith-Waterman score: 6343; 100.0% identity (100.0% similar) in 951 aa overlap (1-951:1-951) 10 20 30 40 50 60 pF1KB5 MPGPLGLLCFLALGLLGSAGPSGAAPPLCAAPCSCDGDRRVDCSGKGLTAVPEGLSAFTQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MPGPLGLLCFLALGLLGSAGPSGAAPPLCAAPCSCDGDRRVDCSGKGLTAVPEGLSAFTQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 ALDISMNNITQLPEDAFKNFPFLEELQLAGNDLSFIHPKALSGLKELKVLTLQNNQLKTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ALDISMNNITQLPEDAFKNFPFLEELQLAGNDLSFIHPKALSGLKELKVLTLQNNQLKTV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 PSEAIRGLSALQSLRLDANHITSVPEDSFEGLVQLRHLWLDDNSLTEVPVHPLSNLPTLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PSEAIRGLSALQSLRLDANHITSVPEDSFEGLVQLRHLWLDDNSLTEVPVHPLSNLPTLQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 ALTLALNKISSIPDFAFTNLSSLVVLHLHNNKIRSLSQHCFDGLDNLETLDLNYNNLGEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ALTLALNKISSIPDFAFTNLSSLVVLHLHNNKIRSLSQHCFDGLDNLETLDLNYNNLGEF 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 PQAIKALPSLKELGFHSNSISVIPDGAFDGNPLLRTIHLYDNPLSFVGNSAFHNLSDLHS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PQAIKALPSLKELGFHSNSISVIPDGAFDGNPLLRTIHLYDNPLSFVGNSAFHNLSDLHS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 LVIRGASMVQQFPNLTGTVHLESLTLTGTKISSIPNNLCQEQKMLRTLDLSYNNIRDLPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LVIRGASMVQQFPNLTGTVHLESLTLTGTKISSIPNNLCQEQKMLRTLDLSYNNIRDLPS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 FNGCHALEEISLQRNQIYQIKEGTFQGLISLRILDLSRNLIHEIHSRAFATLGPITNLDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 FNGCHALEEISLQRNQIYQIKEGTFQGLISLRILDLSRNLIHEIHSRAFATLGPITNLDV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 SFNELTSFPTEGLNGLNQLKLVGNFKLKEALAAKDFVNLRSLSVPYAYQCCAFWGCDSYA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SFNELTSFPTEGLNGLNQLKLVGNFKLKEALAAKDFVNLRSLSVPYAYQCCAFWGCDSYA 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 NLNTEDNSLQDHSVAQEKGTADAANVTSTLENEEHSQIIIHCTPSTGAFKPCEYLLGSWM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 NLNTEDNSLQDHSVAQEKGTADAANVTSTLENEEHSQIIIHCTPSTGAFKPCEYLLGSWM 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB5 IRLTVWFIFLVALFFNLLVILTTFASCTSLPSSKLFIGLISVSNLFMGIYTGILTFLDAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 IRLTVWFIFLVALFFNLLVILTTFASCTSLPSSKLFIGLISVSNLFMGIYTGILTFLDAV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB5 SWGRFAEFGIWWETGSGCKVAGFLAVFSSESAIFLLMLATVERSLSAKDIMKNGKSNHLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SWGRFAEFGIWWETGSGCKVAGFLAVFSSESAIFLLMLATVERSLSAKDIMKNGKSNHLK 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB5 QFRVAALLAFLGATVAGCFPLFHRGEYSASPLCLPFPTGETPSLGFTVTLVLLNSLAFLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QFRVAALLAFLGATVAGCFPLFHRGEYSASPLCLPFPTGETPSLGFTVTLVLLNSLAFLL 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB5 MAVIYTKLYCNLEKEDLSENSQSSMIKHVAWLIFTNCIFFCPVAFFSFAPLITAISISPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MAVIYTKLYCNLEKEDLSENSQSSMIKHVAWLIFTNCIFFCPVAFFSFAPLITAISISPE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB5 IMKSVTLIFFPLPACLNPVLYVFFNPKFKEDWKLLKRRVTKKSGSVSVSISSQGGCLEQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 IMKSVTLIFFPLPACLNPVLYVFFNPKFKEDWKLLKRRVTKKSGSVSVSISSQGGCLEQD 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB5 FYYDCGMYSHLQGNLTVCDCCESFLLTKPVSCKHLIKSHSCPALAVASCQRPEGYWSDCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 FYYDCGMYSHLQGNLTVCDCCESFLLTKPVSCKHLIKSHSCPALAVASCQRPEGYWSDCG 850 860 870 880 890 900 910 920 930 940 950 pF1KB5 TQSAHSDYADEEDSFVSDSSDQVQACGRACFYQSRGFPLVRYAYNLPRVKD ::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TQSAHSDYADEEDSFVSDSSDQVQACGRACFYQSRGFPLVRYAYNLPRVKD 910 920 930 940 950 >>CCDS9000.1 LGR5 gene_id:8549|Hs108|chr12 (907 aa) initn: 2687 init1: 1688 opt: 1748 Z-score: 1456.6 bits: 280.8 E(32554): 8.2e-75 Smith-Waterman score: 2731; 50.9% identity (76.0% similar) in 845 aa overlap (5-832:10-854) 10 20 30 40 50 pF1KB5 MPGPLGLLCFLALGLLGSAGPSGAAPPLCAAPCSCDGDRR----VDCSGKGLTAV :.: .: :. ::. ::. : . : :. : : :::: ::. . CCDS90 MDTSRLGVLLSLPVLLQLATGGSSPRSGVLLRGCPTHCHCEPDGRMLLRVDCSDLGLSEL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 PEGLSAFTQALDISMNNITQLPEDAFKNFPFLEELQLAGNDLSFIHPKALSGLKELKVLT : .::.::. ::.:::::.:: . . .. :::::.:::: :..: :..:: :::: CCDS90 PSNLSVFTSYLDLSMNNISQLLPNPLPSLRFLEELRLAGNALTYIPKGAFTGLYSLKVLM 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB5 LQNNQLKTVPSEAIRGLSALQSLRLDANHITSVPEDSFEGLVQLRHLWLDDNSLTEVPVH ::::::. ::.::...: .:::::::::::. :: . : :: .:::::::::.:::.::. CCDS90 LQNNQLRHVPTEALQNLRSLQSLRLDANHISYVPPSCFSGLHSLRHLWLDDNALTEIPVQ 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB5 PLSNLPTLQALTLALNKISSIPDFAFTNLSSLVVLHLHNNKIRSLSQHCFDGLDNLETLD . .: .:::.::::::: :::.:: :::::::::::::.:.::...::::: .::::: CCDS90 AFRSLSALQAMTLALNKIHHIPDYAFGNLSSLVVLHLHNNRIHSLGKKCFDGLHSLETLD 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB5 LNYNNLGEFPQAIKALPSLKELGFHSNSISVIPDGAFDGNPLLRTIHLYDNPLSFVGNSA :::::: ::: ::..: .:::::::::.: ::. :: ::: : :::.::::..::: :: CCDS90 LNYNNLDEFPTAIRTLSNLKELGFHSNNIRSIPEKAFVGNPSLITIHFYDNPIQFVGRSA 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB5 FHNLSDLHSLVIRGASMVQQFPNLTGTVHLESLTLTGTKISSIPNNLCQEQKMLRTLDLS :..: .:..:.. :::.. .::.::::..::::::::..:::.:...:.. :..:::: CCDS90 FQHLPELRTLTLNGASQITEFPDLTGTANLESLTLTGAQISSLPQTVCNQLPNLQVLDLS 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB5 YNNIRDLPSFNGCHALEEISLQRNQIYQIKEGTFQGLISLRILDLSRNLIHEIHSRAFAT :: ..:::::. :. :..:.:..:.::.:: ::: :.::: :.:. : : :: ::.: CCDS90 YNLLEDLPSFSVCQKLQKIDLRHNEIYEIKVDTFQQLLSLRSLNLAWNKIAIIHPNAFST 370 380 390 400 410 420 420 430 440 450 460 470 pF1KB5 LGPITNLDVSFNELTSFPTEGLNGLNQLKLVGNFKLKEALAAKDFVNLRSLSVPYAYQCC : . .::.: : :.::: ::.::..:::.:: :. .....: .:. . .::::::: CCDS90 LPSLIKLDLSSNLLSSFPITGLHGLTHLKLTGNHALQSLISSENFPELKVIEMPYAYQCC 430 440 450 460 470 480 480 490 500 510 520 pF1KB5 AFWGCDSYANLNTE----DNSLQDHSVAQEKG---TADAANVTSTLENEEHSQIIIH--- :: :.. ..... ::: .: .. : . : .. . : . :.. .: CCDS90 AFGVCENAYKISNQWNKGDNSSMDDLHKKDAGMFQAQDERDLEDFLLDFEEDLKALHSVQ 490 500 510 520 530 540 530 540 550 560 570 580 pF1KB5 CTPSTGAFKPCEYLLGSWMIRLTVWFIFLVALFFNLLVILTTFASCTSLPSSKLFIGLIS :.:: : :::::.:: .:.::. :: : ..:: : :: :.: : . ::.::.:. CCDS90 CSPSPGPFKPCEHLLDGWLIRIGVWTIAVLALTCNALVTSTVFRSPLYISPIKLLIGVIA 550 560 570 580 590 600 590 600 610 620 630 640 pF1KB5 VSNLFMGIYTGILTFLDAVSWGRFAEFGIWWETGSGCKVAGFLAVFSSESAIFLLMLATV . :.. :. ...:. .:: ..: ::. : :::.: ::.: :::..:.:::..::: ::.. CCDS90 AVNMLTGVSSAVLAGVDAFTFGSFARHGAWWENGVGCHVIGFLSIFASESSVFLLTLAAL 610 620 630 640 650 660 650 660 670 680 690 700 pF1KB5 ERSLSAKDIMKNGKSNHLKQFRVAALLAFLGATVAGCFPLFHRGEYSASPLCLPFPTGET ::..:.: : . .....: :: : : . . ::. ..:.:::::::.: :: CCDS90 ERGFSVKYSAKFETKAPFSSLKVIILLCALLALTMAAVPLLGGSKYGASPLCLPLPFGEP 670 680 690 700 710 720 710 720 730 740 750 760 pF1KB5 PSLGFTVTLVLLNSLAFLLMAVIYTKLYCNLEKEDLSENSQSSMIKHVAWLIFTNCIFFC ..:. :.:.::::: ::.:.. ::::::::.: :: . . ::.::.: :.:::::. : CCDS90 STMGYMVALILLNSLCFLMMTIAYTKLYCNLDKGDLENIWDCSMVKHIALLLFTNCILNC 730 740 750 760 770 780 770 780 790 800 810 pF1KB5 PVAFFSFAPLITAISISPEIMKSVTLIFFPLPACLNPVLYVFFNPKFKEDWKLLKRRV-- ::::.::. ::. ::::..: . :. ::::::::.::..:::.:::: :.... CCDS90 PVAFLSFSSLINLTFISPEVIKFILLVVVPLPACLNPLLYILFNPHFKEDLVSLRKQTYV 790 800 810 820 830 840 820 830 840 850 860 870 pF1KB5 -TKKSGSVSVSISSQGGCLEQDFYYDCGMYSHLQGNLTVCDCCESFLLTKPVSCKHLIKS :... .::.: CCDS90 WTRSKHPSLMSINSDDVEKQSCDSTQALVTFTSSSITYDLPPSSVPSPAYPVTESCHLSS 850 860 870 880 890 900 >>CCDS30971.1 LGR6 gene_id:59352|Hs108|chr1 (967 aa) initn: 2229 init1: 1613 opt: 1676 Z-score: 1396.7 bits: 269.8 E(32554): 1.8e-71 Smith-Waterman score: 2647; 47.5% identity (72.3% similar) in 918 aa overlap (1-892:1-907) 10 20 30 40 50 pF1KB5 MPGPLGL----LC--FLALGLLGSAGPSGAAPPLCAAPCSCDGDR---RVDCSGKGLTAV ::.: :: :: . : :.: : .: : ::: :. : .::: ::.:: CCDS30 MPSPPGLRALWLCAALCASRRAGGAPQPGPGPTACPAPCHCQEDGIMLSADCSELGLSAV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 PEGLSAFTQALDISMNNITQLPEDAFKNFPFLEELQLAGNDLSFIHPKALSGLKELKVLT : :. .: ::.::::.:.: :... :::::.:.:: :: : .:.::: ::.: CCDS30 PGDLDPLTAYLDLSMNNLTELQPGLFHHLRFLEELRLSGNHLSHIPGQAFSGLYSLKILM 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB5 LQNNQLKTVPSEAIRGLSALQSLRLDANHITSVPEDSFEGLVQLRHLWLDDNSLTEVPVH :::::: .:.::. : .::::::::: :. ::: ::::: .:::::::::.:::.::. CCDS30 LQNNQLGGIPAEALWELPSLQSLRLDANLISLVPERSFEGLSSLRHLWLDDNALTEIPVR 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB5 PLSNLPTLQALTLALNKISSIPDFAFTNLSSLVVLHLHNNKIRSLSQHCFDGLDNLETLD :.:::.:::.:::::.:: :::.:: ::.::::::::::.:. :. : :.:: :::::: CCDS30 ALNNLPALQAMTLALNRISHIPDYAFQNLTSLVVLHLHNNRIQHLGTHSFEGLHNLETLD 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB5 LNYNNLGEFPQAIKALPSLKELGFHSNSISVIPDGAFDGNPLLRTIHLYDNPLSFVGNSA ::::.: ::: ::..: :.:::::.:.:..::. :: :::::.:::.::::..::: :: CCDS30 LNYNKLQEFPVAIRTLGRLQELGFHNNNIKAIPEKAFMGNPLLQTIHFYDNPIQFVGRSA 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB5 FHNLSDLHSLVIRGASMVQQFPNLTGTVHLESLTLTGTKISSIPNNLCQEQKMLRTLDLS :. : ::.: . :: .:.::.: ::. :: :::: . : .:...::. ::.:.:: CCDS30 FQYLPKLHTLSLNGAMDIQEFPDLKGTTSLEILTLTRAGIRLLPSGMCQQLPRLRVLELS 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB5 YNNIRDLPSFNGCHALEEISLQRNQIYQIKEGTFQGLISLRILDLSRNLIHEIHSRAFAT .:.:..:::.. :. ::::.::.:.:..: ::. : ::. :::: : :. :: .::.: CCDS30 HNQIEELPSLHRCQKLEEIGLQHNRIWEIGADTFSQLSSLQALDLSWNAIRSIHPEAFST 370 380 390 400 410 420 420 430 440 450 460 470 pF1KB5 LGPITNLDVSFNELTSFPTEGLNGLNQLKLVGNFKLKEALAAKDFVNLRSLSVPYAYQCC : ...::.. :.::..: ::.:: .::: ::. :..:.. .: .:: : :::::::: CCDS30 LHSLVKLDLTDNQLTTLPLAGLGGLMHLKLKGNLALSQAFSKDSFPKLRILEVPYAYQCC 430 440 450 460 470 480 480 490 500 510 pF1KB5 AFWGCDSY----ANLNTEDNSLQDHSVA---------QEKGTADAANVTSTLENEEHS-Q . : :. .. ..:: :.:. . : .. : :: :. . . CCDS30 PYGMCASFFKASGQWEAEDLHLDDEESSKRPLGLLARQAENHYDQDLDELQLEMEDSKPH 490 500 510 520 530 540 520 530 540 550 560 570 pF1KB5 IIIHCTPSTGAFKPCEYLLGSWMIRLTVWFIFLVALFFNLLVILTTFASC-TSLPSSKLF ..:.:. : :::::::. :: :::.:: : :.... : ::.::.::. . :: :. CCDS30 PSVQCSPTPGPFKPCEYLFESWGIRLAVWAIVLLSVLCNGLVLLTVFAGGPVPLPPVKFV 550 560 570 580 590 600 580 590 600 610 620 630 pF1KB5 IGLISVSNLFMGIYTGILTFLDAVSWGRFAEFGIWWETGSGCKVAGFLAVFSSESAIFLL .: :. .: . :: :.:. .::...:.:.:.: :::: ::...:::::..::....:: CCDS30 VGAIAGANTLTGISCGLLASVDALTFGQFSEYGARWETGLGCRATGFLAVLGSEASVLLL 610 620 630 640 650 660 640 650 660 670 680 690 pF1KB5 MLATVERSLSAKDIMKNGKSNHLKQFRVAALLAFLGATVAGCFPLFHRGEYSASPLCLPF ::.:. :.:.. . ::: : . :...: . : .:. .:: :::.:::::::. CCDS30 TLAAVQCSVSVSCVRAYGKSPSLGSVRAGVLGCLALAGLAAALPLASVGEYGASPLCLPY 670 680 690 700 710 720 700 710 720 730 740 750 pF1KB5 --PTGETPSLGFTVTLVLLNSLAFLLMAVIYTKLYCNLEKEDLSENSQSSMIKHVAWLIF : :. .:::::.::..::. ::..: : ::::.: . :. . .:..::::::: CCDS30 APPEGQPAALGFTVALVMMNSFCFLVVAGAYIKLYCDLPRGDFEAVWDCAMVRHVAWLIF 730 740 750 760 770 780 760 770 780 790 800 810 pF1KB5 TNCIFFCPVAFFSFAPLITAISISPEIMKSVTLIFFPLPACLNPVLYVFFNPKFKEDWKL .. ...:::::.::: .. . ..:: .::: :. .::::::::.::..:::.:..: CCDS30 ADGLLYCPVAFLSFASMLGLFPVTPEAVKSVLLVVLPLPACLNPLLYLLFNPHFRDDL-- 790 800 810 820 830 820 830 840 850 860 870 pF1KB5 LKRRVTKKSGSVSVSISSQGGCLEQDFYYDCGMYSHLQGNLTVCDCCESFLLTKPVSCKH ::. ..:. . . .: ::.. .: . : . : :. .: . CCDS30 --RRLRPRAGDSGPLAYAAAGELEKS---SCDSTQALVAFSDVDLILEASEAGRPPG--- 840 850 860 870 880 890 880 890 900 910 920 930 pF1KB5 LIKSHSCPALAVASCQRPEGYWSDCGTQSAHSDYADEEDSFVSDSSDQVQACGRACFYQS ..... :.... :::.: CCDS30 -LETYGFPSVTLISCQQPGAPRLEGSHCVEPEGNHFGNPQPSMDGELLLRAEGSTPAGGG 900 910 920 930 940 >>CCDS1424.1 LGR6 gene_id:59352|Hs108|chr1 (915 aa) initn: 2172 init1: 1556 opt: 1558 Z-score: 1299.4 bits: 251.7 E(32554): 4.7e-66 Smith-Waterman score: 2515; 47.8% identity (73.8% similar) in 855 aa overlap (55-892:12-855) 30 40 50 60 70 80 pF1KB5 APPLCAAPCSCDGDRRVDCSGKGLTAVPEGLSAFTQALDISMNNITQLPEDAFKNFPFLE .: . .: :.::::.:.: :... ::: CCDS14 MGRPRLTLVCQVSIIISARDLSMNNLTELQPGLFHHLRFLE 10 20 30 40 90 100 110 120 130 140 pF1KB5 ELQLAGNDLSFIHPKALSGLKELKVLTLQNNQLKTVPSEAIRGLSALQSLRLDANHITSV ::.:.:: :: : .:.::: ::.: :::::: .:.::. : .::::::::: :. : CCDS14 ELRLSGNHLSHIPGQAFSGLYSLKILMLQNNQLGGIPAEALWELPSLQSLRLDANLISLV 50 60 70 80 90 100 150 160 170 180 190 200 pF1KB5 PEDSFEGLVQLRHLWLDDNSLTEVPVHPLSNLPTLQALTLALNKISSIPDFAFTNLSSLV :: ::::: .:::::::::.:::.::. :.:::.:::.:::::.:: :::.:: ::.::: CCDS14 PERSFEGLSSLRHLWLDDNALTEIPVRALNNLPALQAMTLALNRISHIPDYAFQNLTSLV 110 120 130 140 150 160 210 220 230 240 250 260 pF1KB5 VLHLHNNKIRSLSQHCFDGLDNLETLDLNYNNLGEFPQAIKALPSLKELGFHSNSISVIP :::::::.:. :. : :.:: ::::::::::.: ::: ::..: :.:::::.:.:..:: CCDS14 VLHLHNNRIQHLGTHSFEGLHNLETLDLNYNKLQEFPVAIRTLGRLQELGFHNNNIKAIP 170 180 190 200 210 220 270 280 290 300 310 320 pF1KB5 DGAFDGNPLLRTIHLYDNPLSFVGNSAFHNLSDLHSLVIRGASMVQQFPNLTGTVHLESL . :: :::::.:::.::::..::: :::. : ::.: . :: .:.::.: ::. :: : CCDS14 EKAFMGNPLLQTIHFYDNPIQFVGRSAFQYLPKLHTLSLNGAMDIQEFPDLKGTTSLEIL 230 240 250 260 270 280 330 340 350 360 370 380 pF1KB5 TLTGTKISSIPNNLCQEQKMLRTLDLSYNNIRDLPSFNGCHALEEISLQRNQIYQIKEGT ::: . : .:...::. ::.:.::.:.:..:::.. :. ::::.::.:.:..: : CCDS14 TLTRAGIRLLPSGMCQQLPRLRVLELSHNQIEELPSLHRCQKLEEIGLQHNRIWEIGADT 290 300 310 320 330 340 390 400 410 420 430 440 pF1KB5 FQGLISLRILDLSRNLIHEIHSRAFATLGPITNLDVSFNELTSFPTEGLNGLNQLKLVGN :. : ::. :::: : :. :: .::.:: ...::.. :.::..: ::.:: .::: :: CCDS14 FSQLSSLQALDLSWNAIRSIHPEAFSTLHSLVKLDLTDNQLTTLPLAGLGGLMHLKLKGN 350 360 370 380 390 400 450 460 470 480 490 pF1KB5 FKLKEALAAKDFVNLRSLSVPYAYQCCAFWGCDSY----ANLNTEDNSLQDHSVA----- . :..:.. .: .:: : :::::::: . : :. .. ..:: :.:. . CCDS14 LALSQAFSKDSFPKLRILEVPYAYQCCPYGMCASFFKASGQWEAEDLHLDDEESSKRPLG 410 420 430 440 450 460 500 510 520 530 540 550 pF1KB5 ----QEKGTADAANVTSTLENEEHS-QIIIHCTPSTGAFKPCEYLLGSWMIRLTVWFIFL : .. : :: :. . . ..:.:. : :::::::. :: :::.:: : : CCDS14 LLARQAENHYDQDLDELQLEMEDSKPHPSVQCSPTPGPFKPCEYLFESWGIRLAVWAIVL 470 480 490 500 510 520 560 570 580 590 600 pF1KB5 VALFFNLLVILTTFASC-TSLPSSKLFIGLISVSNLFMGIYTGILTFLDAVSWGRFAEFG .... : ::.::.::. . :: :. .: :. .: . :: :.:. .::...:.:.:.: CCDS14 LSVLCNGLVLLTVFAGGPVPLPPVKFVVGAIAGANTLTGISCGLLASVDALTFGQFSEYG 530 540 550 560 570 580 610 620 630 640 650 660 pF1KB5 IWWETGSGCKVAGFLAVFSSESAIFLLMLATVERSLSAKDIMKNGKSNHLKQFRVAALLA :::: ::...:::::..::....:: ::.:. :.:.. . ::: : . :...: CCDS14 ARWETGLGCRATGFLAVLGSEASVLLLTLAAVQCSVSVSCVRAYGKSPSLGSVRAGVLGC 590 600 610 620 630 640 670 680 690 700 710 720 pF1KB5 FLGATVAGCFPLFHRGEYSASPLCLPF--PTGETPSLGFTVTLVLLNSLAFLLMAVIYTK . : .:. .:: :::.:::::::. : :. .:::::.::..::. ::..: : : CCDS14 LALAGLAAALPLASVGEYGASPLCLPYAPPEGQPAALGFTVALVMMNSFCFLVVAGAYIK 650 660 670 680 690 700 730 740 750 760 770 780 pF1KB5 LYCNLEKEDLSENSQSSMIKHVAWLIFTNCIFFCPVAFFSFAPLITAISISPEIMKSVTL :::.: . :. . .:..:::::::.. ...:::::.::: .. . ..:: .::: : CCDS14 LYCDLPRGDFEAVWDCAMVRHVAWLIFADGLLYCPVAFLSFASMLGLFPVTPEAVKSVLL 710 720 730 740 750 760 790 800 810 820 830 840 pF1KB5 IFFPLPACLNPVLYVFFNPKFKEDWKLLKRRVTKKSGSVSVSISSQGGCLEQDFYYDCGM . .::::::::.::..:::.:..: ::. ..:. . . .: ::.. .: CCDS14 VVLPLPACLNPLLYLLFNPHFRDDL----RRLRPRAGDSGPLAYAAAGELEKS---SCDS 770 780 790 800 810 850 860 870 880 890 900 pF1KB5 YSHLQGNLTVCDCCESFLLTKPVSCKHLIKSHSCPALAVASCQRPEGYWSDCGTQSAHSD . : . : :. .: . ..... :.... :::.: CCDS14 TQALVAFSDVDLILEASEAGRPPG----LETYGFPSVTLISCQQPGAPRLEGSHCVEPEG 820 830 840 850 860 870 910 920 930 940 950 pF1KB5 YADEEDSFVSDSSDQVQACGRACFYQSRGFPLVRYAYNLPRVKD CCDS14 NHFGNPQPSMDGELLLRAEGSTPAGGGLSGGGGFQPSGLAFASHV 880 890 900 910 >>CCDS61195.1 LGR5 gene_id:8549|Hs108|chr12 (835 aa) initn: 2075 init1: 1076 opt: 1171 Z-score: 979.8 bits: 192.5 E(32554): 3e-48 Smith-Waterman score: 2254; 45.0% identity (68.8% similar) in 845 aa overlap (5-832:10-782) 10 20 30 40 50 pF1KB5 MPGPLGLLCFLALGLLGSAGPSGAAPPLCAAPCSCDGDRR----VDCSGKGLTAV :.: .: :. ::. ::. : . : :. : : :::: ::. . CCDS61 MDTSRLGVLLSLPVLLQLATGGSSPRSGVLLRGCPTHCHCEPDGRMLLRVDCSDLGLSEL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 PEGLSAFTQALDISMNNITQLPEDAFKNFPFLEELQLAGNDLSFIHPKALSGLKELKVLT : .::.::. ::.:::::.:: . . .. :::::.:::: :..: :..:: :::: CCDS61 PSNLSVFTSYLDLSMNNISQLLPNPLPSLRFLEELRLAGNALTYIPKGAFTGLYSLKVLM 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB5 LQNNQLKTVPSEAIRGLSALQSLRLDANHITSVPEDSFEGLVQLRHLWLDDNSLTEVPVH ::::::. ::.::...: .:::: CCDS61 LQNNQLRHVPTEALQNLRSLQSL------------------------------------- 130 140 180 190 200 210 220 230 pF1KB5 PLSNLPTLQALTLALNKISSIPDFAFTNLSSLVVLHLHNNKIRSLSQHCFDGLDNLETLD :::::.:.::...::::: .::::: CCDS61 -----------------------------------HLHNNRIHSLGKKCFDGLHSLETLD 150 160 240 250 260 270 280 290 pF1KB5 LNYNNLGEFPQAIKALPSLKELGFHSNSISVIPDGAFDGNPLLRTIHLYDNPLSFVGNSA :::::: ::: ::..: .:::::::::.: ::. :: ::: : :::.::::..::: :: CCDS61 LNYNNLDEFPTAIRTLSNLKELGFHSNNIRSIPEKAFVGNPSLITIHFYDNPIQFVGRSA 170 180 190 200 210 220 300 310 320 330 340 350 pF1KB5 FHNLSDLHSLVIRGASMVQQFPNLTGTVHLESLTLTGTKISSIPNNLCQEQKMLRTLDLS :..: .:..:.. :::.. .::.::::..::::::::..:::.:...:.. :..:::: CCDS61 FQHLPELRTLTLNGASQITEFPDLTGTANLESLTLTGAQISSLPQTVCNQLPNLQVLDLS 230 240 250 260 270 280 360 370 380 390 400 410 pF1KB5 YNNIRDLPSFNGCHALEEISLQRNQIYQIKEGTFQGLISLRILDLSRNLIHEIHSRAFAT :: ..:::::. :. :..:.:..:.::.:: ::: :.::: :.:. : : :: ::.: CCDS61 YNLLEDLPSFSVCQKLQKIDLRHNEIYEIKVDTFQQLLSLRSLNLAWNKIAIIHPNAFST 290 300 310 320 330 340 420 430 440 450 460 470 pF1KB5 LGPITNLDVSFNELTSFPTEGLNGLNQLKLVGNFKLKEALAAKDFVNLRSLSVPYAYQCC : . .::.: : :.::: ::.::..:::.:: :. .....: .:. . .::::::: CCDS61 LPSLIKLDLSSNLLSSFPITGLHGLTHLKLTGNHALQSLISSENFPELKVIEMPYAYQCC 350 360 370 380 390 400 480 490 500 510 520 pF1KB5 AFWGCDSYANLNTE----DNSLQDHSVAQEKG---TADAANVTSTLENEEHSQIIIH--- :: :.. ..... ::: .: .. : . : .. . : . :.. .: CCDS61 AFGVCENAYKISNQWNKGDNSSMDDLHKKDAGMFQAQDERDLEDFLLDFEEDLKALHSVQ 410 420 430 440 450 460 530 540 550 560 570 580 pF1KB5 CTPSTGAFKPCEYLLGSWMIRLTVWFIFLVALFFNLLVILTTFASCTSLPSSKLFIGLIS :.:: : :::::.:: .:.::. :: : ..:: : :: :.: : . ::.::.:. CCDS61 CSPSPGPFKPCEHLLDGWLIRIGVWTIAVLALTCNALVTSTVFRSPLYISPIKLLIGVIA 470 480 490 500 510 520 590 600 610 620 630 640 pF1KB5 VSNLFMGIYTGILTFLDAVSWGRFAEFGIWWETGSGCKVAGFLAVFSSESAIFLLMLATV . :.. :. ...:. .:: ..: ::. : :::.: ::.: :::..:.:::..::: ::.. CCDS61 AVNMLTGVSSAVLAGVDAFTFGSFARHGAWWENGVGCHVIGFLSIFASESSVFLLTLAAL 530 540 550 560 570 580 650 660 670 680 690 700 pF1KB5 ERSLSAKDIMKNGKSNHLKQFRVAALLAFLGATVAGCFPLFHRGEYSASPLCLPFPTGET ::..:.: : . .....: :: : : . . ::. ..:.:::::::.: :: CCDS61 ERGFSVKYSAKFETKAPFSSLKVIILLCALLALTMAAVPLLGGSKYGASPLCLPLPFGEP 590 600 610 620 630 640 710 720 730 740 750 760 pF1KB5 PSLGFTVTLVLLNSLAFLLMAVIYTKLYCNLEKEDLSENSQSSMIKHVAWLIFTNCIFFC ..:. :.:.::::: ::.:.. ::::::::.: :: . . ::.::.: :.:::::. : CCDS61 STMGYMVALILLNSLCFLMMTIAYTKLYCNLDKGDLENIWDCSMVKHIALLLFTNCILNC 650 660 670 680 690 700 770 780 790 800 810 pF1KB5 PVAFFSFAPLITAISISPEIMKSVTLIFFPLPACLNPVLYVFFNPKFKEDWKLLKRRV-- ::::.::. ::. ::::..: . :. ::::::::.::..:::.:::: :.... CCDS61 PVAFLSFSSLINLTFISPEVIKFILLVVVPLPACLNPLLYILFNPHFKEDLVSLRKQTYV 710 720 730 740 750 760 820 830 840 850 860 870 pF1KB5 -TKKSGSVSVSISSQGGCLEQDFYYDCGMYSHLQGNLTVCDCCESFLLTKPVSCKHLIKS :... .::.: CCDS61 WTRSKHPSLMSINSDDVEKQSCDSTQALVTFTSSSITYDLPPSSVPSPAYPVTESCHLSS 770 780 790 800 810 820 >>CCDS61194.1 LGR5 gene_id:8549|Hs108|chr12 (883 aa) initn: 1941 init1: 1013 opt: 1041 Z-score: 872.0 bits: 172.6 E(32554): 3e-42 Smith-Waterman score: 2575; 49.0% identity (73.8% similar) in 845 aa overlap (5-832:10-830) 10 20 30 40 50 pF1KB5 MPGPLGLLCFLALGLLGSAGPSGAAPPLCAAPCSCDGDRR----VDCSGKGLTAV :.: .: :. ::. ::. : . : :. : : :::: ::. . CCDS61 MDTSRLGVLLSLPVLLQLATGGSSPRSGVLLRGCPTHCHCEPDGRMLLRVDCSDLGLSEL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 PEGLSAFTQALDISMNNITQLPEDAFKNFPFLEELQLAGNDLSFIHPKALSGLKELKVLT : .::.::. ::.:::::.:: . . .. :::::.:::: :..: :..:: :::: CCDS61 PSNLSVFTSYLDLSMNNISQLLPNPLPSLRFLEELRLAGNALTYIPKGAFTGLYSLKVLM 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB5 LQNNQLKTVPSEAIRGLSALQSLRLDANHITSVPEDSFEGLVQLRHLWLDDNSLTEVPVH ::::::. ::.::...: .:::::::::::. :: . : :: .:::::::::.:::.::. CCDS61 LQNNQLRHVPTEALQNLRSLQSLRLDANHISYVPPSCFSGLHSLRHLWLDDNALTEIPVQ 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB5 PLSNLPTLQALTLALNKISSIPDFAFTNLSSLVVLHLHNNKIRSLSQHCFDGLDNLETLD . .: .:::.::::::: :::.:: :::::::::::::.:.::...::::: .::::: CCDS61 AFRSLSALQAMTLALNKIHHIPDYAFGNLSSLVVLHLHNNRIHSLGKKCFDGLHSLETLD 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB5 LNYNNLGEFPQAIKALPSLKELGFHSNSISVIPDGAFDGNPLLRTIHLYDNPLSFVGNSA :::::: ::: ::..: .:::: :.::::..::: :: CCDS61 LNYNNLDEFPTAIRTLSNLKEL------------------------HFYDNPIQFVGRSA 250 260 270 300 310 320 330 340 350 pF1KB5 FHNLSDLHSLVIRGASMVQQFPNLTGTVHLESLTLTGTKISSIPNNLCQEQKMLRTLDLS :..: .:..:.. :::.. .::.::::..::::::::..:::.:...:.. :..:::: CCDS61 FQHLPELRTLTLNGASQITEFPDLTGTANLESLTLTGAQISSLPQTVCNQLPNLQVLDLS 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB5 YNNIRDLPSFNGCHALEEISLQRNQIYQIKEGTFQGLISLRILDLSRNLIHEIHSRAFAT :: ..:::::. :. :..:.:..:.::.:: ::: :.::: :.:. : : :: ::.: CCDS61 YNLLEDLPSFSVCQKLQKIDLRHNEIYEIKVDTFQQLLSLRSLNLAWNKIAIIHPNAFST 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB5 LGPITNLDVSFNELTSFPTEGLNGLNQLKLVGNFKLKEALAAKDFVNLRSLSVPYAYQCC : . .::.: : :.::: ::.::..:::.:: :. .....: .:. . .::::::: CCDS61 LPSLIKLDLSSNLLSSFPITGLHGLTHLKLTGNHALQSLISSENFPELKVIEMPYAYQCC 400 410 420 430 440 450 480 490 500 510 520 pF1KB5 AFWGCDSYANLNTE----DNSLQDHSVAQEKG---TADAANVTSTLENEEHSQIIIH--- :: :.. ..... ::: .: .. : . : .. . : . :.. .: CCDS61 AFGVCENAYKISNQWNKGDNSSMDDLHKKDAGMFQAQDERDLEDFLLDFEEDLKALHSVQ 460 470 480 490 500 510 530 540 550 560 570 580 pF1KB5 CTPSTGAFKPCEYLLGSWMIRLTVWFIFLVALFFNLLVILTTFASCTSLPSSKLFIGLIS :.:: : :::::.:: .:.::. :: : ..:: : :: :.: : . ::.::.:. CCDS61 CSPSPGPFKPCEHLLDGWLIRIGVWTIAVLALTCNALVTSTVFRSPLYISPIKLLIGVIA 520 530 540 550 560 570 590 600 610 620 630 640 pF1KB5 VSNLFMGIYTGILTFLDAVSWGRFAEFGIWWETGSGCKVAGFLAVFSSESAIFLLMLATV . :.. :. ...:. .:: ..: ::. : :::.: ::.: :::..:.:::..::: ::.. CCDS61 AVNMLTGVSSAVLAGVDAFTFGSFARHGAWWENGVGCHVIGFLSIFASESSVFLLTLAAL 580 590 600 610 620 630 650 660 670 680 690 700 pF1KB5 ERSLSAKDIMKNGKSNHLKQFRVAALLAFLGATVAGCFPLFHRGEYSASPLCLPFPTGET ::..:.: : . .....: :: : : . . ::. ..:.:::::::.: :: CCDS61 ERGFSVKYSAKFETKAPFSSLKVIILLCALLALTMAAVPLLGGSKYGASPLCLPLPFGEP 640 650 660 670 680 690 710 720 730 740 750 760 pF1KB5 PSLGFTVTLVLLNSLAFLLMAVIYTKLYCNLEKEDLSENSQSSMIKHVAWLIFTNCIFFC ..:. :.:.::::: ::.:.. ::::::::.: :: . . ::.::.: :.:::::. : CCDS61 STMGYMVALILLNSLCFLMMTIAYTKLYCNLDKGDLENIWDCSMVKHIALLLFTNCILNC 700 710 720 730 740 750 770 780 790 800 810 pF1KB5 PVAFFSFAPLITAISISPEIMKSVTLIFFPLPACLNPVLYVFFNPKFKEDWKLLKRRV-- ::::.::. ::. ::::..: . :. ::::::::.::..:::.:::: :.... CCDS61 PVAFLSFSSLINLTFISPEVIKFILLVVVPLPACLNPLLYILFNPHFKEDLVSLRKQTYV 760 770 780 790 800 810 820 830 840 850 860 870 pF1KB5 -TKKSGSVSVSISSQGGCLEQDFYYDCGMYSHLQGNLTVCDCCESFLLTKPVSCKHLIKS :... .::.: CCDS61 WTRSKHPSLMSINSDDVEKQSCDSTQALVTFTSSSITYDLPPSSVPSPAYPVTESCHLSS 820 830 840 850 860 870 >>CCDS30972.1 LGR6 gene_id:59352|Hs108|chr1 (828 aa) initn: 1583 init1: 967 opt: 969 Z-score: 812.8 bits: 161.6 E(32554): 6e-39 Smith-Waterman score: 1926; 42.9% identity (71.1% similar) in 750 aa overlap (160-892:30-768) 130 140 150 160 170 180 pF1KB5 ALQSLRLDANHITSVPEDSFEGLVQLRHLWLDDNSLTEVPVHPLSNLPTLQALTLALNKI :. :.:::. . .: :. : :. :.. CCDS30 MRLEGEGRSARAGQNLSRAGSARRGAPRDLSMNNLTELQPGLFHHLRFLEELRLSGNHL 10 20 30 40 50 190 200 210 220 230 240 pF1KB5 SSIPDFAFTNLSSLVVLHLHNNKIRSLSQHCFDGLDNLETLDLNYNNLGEFPQAIKALPS : :: ::..: :: .: :.::.. .. . . : .:..::::::.: ::: ::..: CCDS30 SHIPGQAFSGLYSLKILMLQNNQLGGIPAEALWELPSLQSLDLNYNKLQEFPVAIRTLGR 60 70 80 90 100 110 250 260 270 280 290 300 pF1KB5 LKELGFHSNSISVIPDGAFDGNPLLRTIHLYDNPLSFVGNSAFHNLSDLHSLVIRGASMV :.:::::.:.:..::. :: :::::.:::.::::..::: :::. : ::.: . :: . CCDS30 LQELGFHNNNIKAIPEKAFMGNPLLQTIHFYDNPIQFVGRSAFQYLPKLHTLSLNGAMDI 120 130 140 150 160 170 310 320 330 340 350 360 pF1KB5 QQFPNLTGTVHLESLTLTGTKISSIPNNLCQEQKMLRTLDLSYNNIRDLPSFNGCHALEE :.::.: ::. :: :::: . : .:...::. ::.:.::.:.:..:::.. :. ::: CCDS30 QEFPDLKGTTSLEILTLTRAGIRLLPSGMCQQLPRLRVLELSHNQIEELPSLHRCQKLEE 180 190 200 210 220 230 370 380 390 400 410 420 pF1KB5 ISLQRNQIYQIKEGTFQGLISLRILDLSRNLIHEIHSRAFATLGPITNLDVSFNELTSFP :.::.:.:..: ::. : ::. :::: : :. :: .::.:: ...::.. :.::..: CCDS30 IGLQHNRIWEIGADTFSQLSSLQALDLSWNAIRSIHPEAFSTLHSLVKLDLTDNQLTTLP 240 250 260 270 280 290 430 440 450 460 470 480 pF1KB5 TEGLNGLNQLKLVGNFKLKEALAAKDFVNLRSLSVPYAYQCCAFWGCDSY----ANLNTE ::.:: .::: ::. :..:.. .: .:: : :::::::: . : :. .. ..: CCDS30 LAGLGGLMHLKLKGNLALSQAFSKDSFPKLRILEVPYAYQCCPYGMCASFFKASGQWEAE 300 310 320 330 340 350 490 500 510 520 530 pF1KB5 DNSLQDHSVA---------QEKGTADAANVTSTLENEEHS-QIIIHCTPSTGAFKPCEYL : :.:. . : .. : :: :. . . ..:.:. : ::::::: CCDS30 DLHLDDEESSKRPLGLLARQAENHYDQDLDELQLEMEDSKPHPSVQCSPTPGPFKPCEYL 360 370 380 390 400 410 540 550 560 570 580 590 pF1KB5 LGSWMIRLTVWFIFLVALFFNLLVILTTFASC-TSLPSSKLFIGLISVSNLFMGIYTGIL . :: :::.:: : :.... : ::.::.::. . :: :. .: :. .: . :: :.: CCDS30 FESWGIRLAVWAIVLLSVLCNGLVLLTVFAGGPVPLPPVKFVVGAIAGANTLTGISCGLL 420 430 440 450 460 470 600 610 620 630 640 650 pF1KB5 TFLDAVSWGRFAEFGIWWETGSGCKVAGFLAVFSSESAIFLLMLATVERSLSAKDIMKNG . .::...:.:.:.: :::: ::...:::::..::....:: ::.:. :.:.. . : CCDS30 ASVDALTFGQFSEYGARWETGLGCRATGFLAVLGSEASVLLLTLAAVQCSVSVSCVRAYG 480 490 500 510 520 530 660 670 680 690 700 710 pF1KB5 KSNHLKQFRVAALLAFLGATVAGCFPLFHRGEYSASPLCLPF--PTGETPSLGFTVTLVL :: : . :...: . : .:. .:: :::.:::::::. : :. .:::::.::. CCDS30 KSPSLGSVRAGVLGCLALAGLAAALPLASVGEYGASPLCLPYAPPEGQPAALGFTVALVM 540 550 560 570 580 590 720 730 740 750 760 770 pF1KB5 LNSLAFLLMAVIYTKLYCNLEKEDLSENSQSSMIKHVAWLIFTNCIFFCPVAFFSFAPLI .::. ::..: : ::::.: . :. . .:..:::::::.. ...:::::.::: .. CCDS30 MNSFCFLVVAGAYIKLYCDLPRGDFEAVWDCAMVRHVAWLIFADGLLYCPVAFLSFASML 600 610 620 630 640 650 780 790 800 810 820 830 pF1KB5 TAISISPEIMKSVTLIFFPLPACLNPVLYVFFNPKFKEDWKLLKRRVTKKSGSVSVSISS . ..:: .::: :. .::::::::.::..:::.:..: ::. ..:. . . CCDS30 GLFPVTPEAVKSVLLVVLPLPACLNPLLYLLFNPHFRDDL----RRLRPRAGDSGPLAYA 660 670 680 690 700 710 840 850 860 870 880 890 pF1KB5 QGGCLEQDFYYDCGMYSHLQGNLTVCDCCESFLLTKPVSCKHLIKSHSCPALAVASCQRP .: ::.. .: . : . : :. .: . ..... :.... :::.: CCDS30 AAGELEKS---SCDSTQALVAFSDVDLILEASEAGRPPG----LETYGFPSVTLISCQQP 720 730 740 750 760 900 910 920 930 940 950 pF1KB5 EGYWSDCGTQSAHSDYADEEDSFVSDSSDQVQACGRACFYQSRGFPLVRYAYNLPRVKD CCDS30 GAPRLEGSHCVEPEGNHFGNPQPSMDGELLLRAEGSTPAGGGLSGGGGFQPSGLAFASHV 770 780 790 800 810 820 >>CCDS9872.1 TSHR gene_id:7253|Hs108|chr14 (764 aa) initn: 730 init1: 384 opt: 685 Z-score: 578.3 bits: 118.1 E(32554): 6.9e-26 Smith-Waterman score: 685; 25.8% identity (60.7% similar) in 670 aa overlap (165-811:44-688) 140 150 160 170 180 190 pF1KB5 RLDANHITSVPEDSFEGLVQLRHLWLDDNSLTEVPVHPLSNLPTLQALTLALNKISSIPD . ..: : :. :.: : ... .::. CCDS98 DLPRDLGGMGCSSPPCECHQEEDFRVTCKDIQRIPSLP----PSTQTLKLIETHLRTIPS 20 30 40 50 60 200 210 220 230 240 250 pF1KB5 FAFTNLSSLVVLHLHNN-KIRSLSQHCFDGLDNLETLDL-NYNNLGEF-PQAIKALPSLK ::.:: .. ... . ...: .: : .:... ... : :: . :.:.: :: :: CCDS98 HAFSNLPNISRIYVSIDVTLQQLESHSFYNLSKVTHIEIRNTRNLTYIDPDALKELPLLK 70 80 90 100 110 120 260 270 280 290 300 pF1KB5 ELGFHSNSISVIPD-GAFDGNPLLRTIHLYDNP-LSFVGNSAFHNLSDLHSLVIR----G ::. .......:: .. .. ... ::: .. . .::..: . ..:... : CCDS98 FLGIFNTGLKMFPDLTKVYSTDIFFILEITDNPYMTSIPVNAFQGLCN-ETLTLKLYNNG 130 140 150 160 170 180 310 320 330 340 350 360 pF1KB5 ASMVQQFPNLTGTVHLESLTLTGTKISSI--PNNLCQEQKMLRTLDLSYNNIRDLPSFNG . :: . ..:: .:... :. .: .. . . . ::.: ... ::: .: CCDS98 FTSVQGYA-FNGT-KLDAVYLNKNKYLTVIDKDAFGGVYSGPSLLDVSQTSVTALPS-KG 190 200 210 220 230 240 370 380 390 400 410 420 pF1KB5 CHALEEISLQRNQIYQIKEGTFQGLISLRILDLSR-NLIHEIHSRAFATLGPITNLDVSF . :.:. . :: . .:. .:: .: :.: .: . : :: . : .. :. CCDS98 LEHLKEL-IARNT-WTLKKLP----LSLSFLHLTRADLSYPSHCCAFKNQKKIRGILESL 250 260 270 280 290 430 440 450 460 470 480 pF1KB5 NELTSFPTEGLNGLNQLKLVGNFKLKEALAAKDFVNLRSLSVPYAYQCCAFWGCDSYANL : ....: : : :. :. : . :: . : : . : . :. CCDS98 MCNES----SMQSLRQRKSVNA--LNSPLHQEYEENLGDSIVGYKEKS-KFQDTHNNAHY 300 310 320 330 340 350 490 500 510 520 530 pF1KB5 -----NTEDNSL---QDHSVAQEKGT-ADAANVTSTLENEEHSQIIIHCTPSTGAFKPCE . ::. . :. . ::. : .. :. .. .... :::.. :.::: CCDS98 YVFFEEQEDEIIGFGQELKNPQEETLQAFDSHYDYTICGDSEDMV---CTPKSDEFNPCE 360 370 380 390 400 540 550 560 570 580 590 pF1KB5 YLLGSWMIRLTVWFIFLVALFFNLLVILTTFASCTSLPSSKLFIGLISVSNLFMGIYTGI ..: ..:..:::. :.::. :..:.: ..: .: .... .. ... ::.: . CCDS98 DIMGYKFLRIVVWFVSLLALLGNVFVLLILLTSHYKLNVPRFLMCNLAFADFCMGMYLLL 410 420 430 440 450 460 600 610 620 630 640 650 pF1KB5 LTFLDAVSWGRFAEFGIWWETGSGCKVAGFLAVFSSESAIFLLMLATVERSLSAKDIMKN .. .: . ... . .: :.:: ::..:::..::.:: ... : . :.:: . :. CCDS98 IASVDLYTHSEYYNHAIDWQTGPGCNTAGFFTVFASELSVYTLTVITLERWYAITFAMRL 470 480 490 500 510 520 660 670 680 690 700 710 pF1KB5 GKSNHLKQFRVAALLAFLGATVAGCFPLFHRGEYSASPLCLPFPTGETP-SLGFTVTLVL .. .:.. . . ... . . .:: . :. .:::. : ::: .:.. : .. CCDS98 DRKIRLRHACAIMVGGWVCCFLLALLPLVGISSYAKVSICLPMDT-ETPLALAYIVFVLT 530 540 550 560 570 580 720 730 740 750 760 770 pF1KB5 LNSLAFLLMAVIYTKLYCNLEKEDLSENSQSSMI-KHVAWLIFTNCIFFCPVAFFSFAPL :: .::... :.:.: .... . . ..... : :..: ::::. : . :..:.... . CCDS98 LNIVAFVIVCCCYVKIYITVRNPQYNPGDKDTKIAKRMAVLIFTDFICMAPISFYALSAI 590 600 610 620 630 640 780 790 800 810 820 830 pF1KB5 ITAISISPEIMKSVTLIFFPLPACLNPVLYVFFNPKFKEDWKLLKRRVTKKSGSVSVSIS .. :. : . ..:.:: .: :: ::..:. :..: CCDS98 LNKPLITVSNSKILLVLFYPLNSCANPFLYAIFTKAFQRDVFILLSKFGICKRQAQAYRG 650 660 670 680 690 700 840 850 860 870 880 890 pF1KB5 SQGGCLEQDFYYDCGMYSHLQGNLTVCDCCESFLLTKPVSCKHLIKSHSCPALAVASCQR CCDS98 QRVPPKNSTDIQVQKVTHEMRQGLHNMEDVYELIENSHLTPKKQGQISEEYMQTVL 710 720 730 740 750 760 >>CCDS1844.2 FSHR gene_id:2492|Hs108|chr2 (669 aa) initn: 673 init1: 355 opt: 682 Z-score: 576.4 bits: 117.5 E(32554): 8.7e-26 Smith-Waterman score: 734; 26.8% identity (61.2% similar) in 590 aa overlap (252-815:50-614) 230 240 250 260 270 280 pF1KB5 DGLDNLETLDLNYNNLGEFPQAIKALPSLKELGFHSNSISVIPDGAFDGNPLLRTIHLYD :: : ... :: :::.: :. :.. . CCDS18 HRICHCSNRVFLCQESKVTEIPSDLPRNAIELRFVLTKLRVIQKGAFSGFGDLEKIEISQ 20 30 40 50 60 70 290 300 310 320 330 340 pF1KB5 NP-LSFVGNSAFHNLSDLHSLVIRGASMVQQFPNLTGTVHLESLTLTGTKISSIPNNLCQ : : . ..: :: :: . :. :. :: : .. ....:: CCDS18 NDVLEVIEADVFSNLPKLHEIRIEKAN------NL--------LYINPEAFQNLPN---- 80 90 100 110 120 350 360 370 380 390 pF1KB5 EQKMLRTLDLSYNNIRDLPSFNGCHALEEISL--QRNQIYQIKEGTFQGLISLRILDLS- :. : .: ..:. ::. . :.:... : ..: : .:.. .:.: .: :.:: CCDS18 ----LQYLLISNTGIKHLPDVHKIHSLQKVLLWLNKNGIQEIHNCAFNGT-QLDELNLSD 130 140 150 160 170 400 410 420 430 440 450 pF1KB5 RNLIHEIHSRAF-ATLGPITNLDVSFNELTSFPTEGLNGLNQLKLVGNFKLKEALAAKDF : ..:. . .: .. ::. ::.: ... :.:. ::..:..:. ....::. . . . CCDS18 NNNLEELPNDVFHGASGPVI-LDISRTRIHSLPSYGLENLKKLRARSTYNLKKLPTLEKL 180 190 200 210 220 230 460 470 480 490 500 pF1KB5 VNLRSLSVPYAYQCCAF--WG---------CDSYANLNTEDNSL-----QDHSVAQEKGT : : :. : .:::: : :.. . : : . . : :.:... . CCDS18 VALMEASLTYPSHCCAFANWRRQISELHPICNK-SILRQEVDYMTQARGQRSSLAEDNES 240 250 260 270 280 290 510 520 530 540 550 pF1KB5 ADAANVTSTLENEEH---SQII-IHCTPSTGAFKPCEYLLGSWMIRLTVWFIFLVALFFN . . . : . .. .... . :.:. ::.::: ..: ..:. .::: ..:. : CCDS18 SYSRGFDMTYTEFDYDLCNEVVDVTCSPKPDAFNPCEDIMGYNILRVLIWFISILAITGN 300 310 320 330 340 350 560 570 580 590 600 610 pF1KB5 LLVILTTFASCTSLPSSKLFIGLISVSNLFMGIYTGILTFLDAVSWGRFAEFGIWWETGS ..:.. .: .: .... .. ..: .::: ... .: . ... ...: :.::. CCDS18 IIVLVILTTSQYKLTVPRFLMCNLAFADLCIGIYLLLIASVDIHTKSQYHNYAIDWQTGA 360 370 380 390 400 410 620 630 640 650 660 670 pF1KB5 GCKVAGFLAVFSSESAIFLLMLATVERSLSAKDIMKNGKSNHLKQFRVAALLAFLGATVA :: .:::..::.:: ... : :.:: . :. . .:.. . ..... : .: CCDS18 GCDAAGFFTVFASELSVYTLTAITLERWHTITHAMQLDCKVQLRHAASVMVMGWIFAFAA 420 430 440 450 460 470 680 690 700 710 720 730 pF1KB5 GCFPLFHRGEYSASPLCLPFPTGETPSLGFTVTLVLLNSLAFLLMAVIYTKLYCNLEKED . ::.: . : .:::. : ....:..:: :::... : ..: .... . CCDS18 ALFPIFGISSYMKVSICLPMDIDSPLSQLYVMSLLVLNVLAFVVICGCYIHIYLTVRNPN 480 490 500 510 520 530 740 750 760 770 780 790 pF1KB5 L-SENSQSSMIKHVAWLIFTNCIFFCPVAFFSFAPLITAISISPEIMKSVTLIFFPLPAC . : .:.. . :..: ::::. . . :..::... . . :. : . ..: :. .: CCDS18 IVSSSSDTRIAKRMAMLIFTDFLCMAPISFFAISASLKVPLITVSKAKILLVLFHPINSC 540 550 560 570 580 590 800 810 820 830 840 850 pF1KB5 LNPVLYVFFNPKFKEDWKLLKRRVTKKSGSVSVSISSQGGCLEQDFYYDCGMYSHLQGNL :: ::..:. .:..:. .: CCDS18 ANPFLYAIFTKNFRRDFFILLSKCGCYEMQAQIYRTETSSTVHNTHPRNGHCSSAPRVTS 600 610 620 630 640 650 >>CCDS1843.1 FSHR gene_id:2492|Hs108|chr2 (695 aa) initn: 671 init1: 355 opt: 651 Z-score: 550.6 bits: 112.8 E(32554): 2.4e-24 Smith-Waterman score: 748; 27.5% identity (62.0% similar) in 600 aa overlap (252-815:50-640) 230 240 250 260 270 280 pF1KB5 DGLDNLETLDLNYNNLGEFPQAIKALPSLKELGFHSNSISVIPDGAFDGNPLLRTIHLYD :: : ... :: :::.: :. :.. . CCDS18 HRICHCSNRVFLCQESKVTEIPSDLPRNAIELRFVLTKLRVIQKGAFSGFGDLEKIEISQ 20 30 40 50 60 70 290 300 310 320 330 pF1KB5 NP-LSFVGNSAFHNLSDLHSLVIRGASMV-----QQFPNLTGTVHLESLTLTGTKISSIP : : . ..: :: :: . :. :. . . : :: .:. : ...: :. .: CCDS18 NDVLEVIEADVFSNLPKLHEIRIEKANNLLYINPEAFQNLP---NLQYLLISNTGIKHLP 80 90 100 110 120 130 340 350 360 370 380 pF1KB5 N--NLCQEQKMLRTLDLSYN-NIRDLP--SFNGCHALEEISL--QRNQIYQIKEGTFQGL . .. . ::.: ::.. : ::. . :: : ..: . : ..: : .:.. .:.: CCDS18 DVHKIHSLQKVL--LDIQDNINIHTIERNSFVGL-SFESVILWLNKNGIQEIHNCAFNGT 140 150 160 170 180 190 390 400 410 420 430 440 pF1KB5 ISLRILDLS-RNLIHEIHSRAF-ATLGPITNLDVSFNELTSFPTEGLNGLNQLKLVGNFK .: :.:: : ..:. . .: .. ::. ::.: ... :.:. ::..:..:. .... CCDS18 -QLDELNLSDNNNLEELPNDVFHGASGPVI-LDISRTRIHSLPSYGLENLKKLRARSTYN 200 210 220 230 240 250 450 460 470 480 490 pF1KB5 LKEALAAKDFVNLRSLSVPYAYQCCAF--WG---------CDSYANLNTEDNSL-----Q ::. . . .: : :. : .:::: : :.. . : : . . : CCDS18 LKKLPTLEKLVALMEASLTYPSHCCAFANWRRQISELHPICNK-SILRQEVDYMTQARGQ 260 270 280 290 300 310 500 510 520 530 540 pF1KB5 DHSVAQEKGTADAANVTSTLENEEH---SQII-IHCTPSTGAFKPCEYLLGSWMIRLTVW :.:... .. . . : . .. .... . :.:. ::.::: ..: ..:. .: CCDS18 RSSLAEDNESSYSRGFDMTYTEFDYDLCNEVVDVTCSPKPDAFNPCEDIMGYNILRVLIW 320 330 340 350 360 370 550 560 570 580 590 600 pF1KB5 FIFLVALFFNLLVILTTFASCTSLPSSKLFIGLISVSNLFMGIYTGILTFLDAVSWGRFA :: ..:. :..:.. .: .: .... .. ..: .::: ... .: . ... CCDS18 FISILAITGNIIVLVILTTSQYKLTVPRFLMCNLAFADLCIGIYLLLIASVDIHTKSQYH 380 390 400 410 420 430 610 620 630 640 650 660 pF1KB5 EFGIWWETGSGCKVAGFLAVFSSESAIFLLMLATVERSLSAKDIMKNGKSNHLKQFRVAA ...: :.::.:: .:::..::.:: ... : :.:: . :. . .:.. . CCDS18 NYAIDWQTGAGCDAAGFFTVFASELSVYTLTAITLERWHTITHAMQLDCKVQLRHAASVM 440 450 460 470 480 490 670 680 690 700 710 720 pF1KB5 LLAFLGATVAGCFPLFHRGEYSASPLCLPFPTGETPSLGFTVTLVLLNSLAFLLMAVIYT ..... : .:. ::.: . : .:::. : ....:..:: :::... : CCDS18 VMGWIFAFAAALFPIFGISSYMKVSICLPMDIDSPLSQLYVMSLLVLNVLAFVVICGCYI 500 510 520 530 540 550 730 740 750 760 770 780 pF1KB5 KLYCNLEKEDL-SENSQSSMIKHVAWLIFTNCIFFCPVAFFSFAPLITAISISPEIMKSV ..: .... .. : .:.. . :..: ::::. . . :..::... . . :. : . CCDS18 HIYLTVRNPNIVSSSSDTRIAKRMAMLIFTDFLCMAPISFFAISASLKVPLITVSKAKIL 560 570 580 590 600 610 790 800 810 820 830 840 pF1KB5 TLIFFPLPACLNPVLYVFFNPKFKEDWKLLKRRVTKKSGSVSVSISSQGGCLEQDFYYDC ..: :. .: :: ::..:. .:..:. .: CCDS18 LVLFHPINSCANPFLYAIFTKNFRRDFFILLSKCGCYEMQAQIYRTETSSTVHNTHPRNG 620 630 640 650 660 670 951 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 15:59:14 2016 done: Thu Nov 3 15:59:15 2016 Total Scan time: 3.770 Total Display time: 0.340 Function used was FASTA [36.3.4 Apr, 2011]