FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5711, 785 aa 1>>>pF1KB5711 785 - 785 aa - 785 aa Library: human.CCDS.faa 18921897 residues in 33420 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1139+/-0.00113; mu= 16.0009+/- 0.068 mean_var=78.5094+/-15.443, 0's: 0 Z-trim(103.5): 198 B-trim: 26 in 1/46 Lambda= 0.144748 statistics sampled from 7317 (7523) to 7317 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.58), E-opt: 0.2 (0.225), width: 16 Scan time: 1.720 The best scores are: opt bits E(33420) CCDS11993.1 CDH7 gene_id:1005|Hs109|chr18 ( 785) 5105 1076.4 0 CCDS82259.1 CDH7 gene_id:1005|Hs109|chr18 ( 630) 4023 850.4 0 CCDS11977.1 CDH20 gene_id:28316|Hs109|chr18 ( 801) 3250 689.1 7.9e-198 CCDS10802.1 CDH8 gene_id:1006|Hs109|chr16 ( 799) 3211 680.9 2.2e-195 CCDS3892.1 CDH10 gene_id:1008|Hs109|chr5 ( 788) 3185 675.5 9.4e-194 CCDS3894.1 CDH6 gene_id:1004|Hs109|chr5 ( 790) 3180 674.4 2e-193 CCDS3889.1 CDH18 gene_id:1016|Hs109|chr5 ( 790) 3179 674.2 2.3e-193 CCDS3893.1 CDH9 gene_id:1007|Hs109|chr5 ( 789) 3122 662.3 8.6e-190 CCDS3890.1 CDH12 gene_id:1010|Hs109|chr5 ( 794) 3088 655.2 1.2e-187 CCDS10803.1 CDH11 gene_id:1009|Hs109|chr16 ( 796) 3063 650.0 4.4e-186 CCDS13395.1 CDH22 gene_id:64405|Hs109|chr20 ( 828) 2667 567.3 3.6e-161 CCDS81992.1 CDH11 gene_id:1009|Hs109|chr16 ( 670) 2654 564.6 2e-160 CCDS11994.1 CDH19 gene_id:28513|Hs109|chr18 ( 772) 2607 554.8 2e-157 CCDS9586.1 CDH24 gene_id:64403|Hs109|chr14 ( 781) 2549 542.7 9e-154 CCDS81993.1 CDH11 gene_id:1009|Hs109|chr16 ( 693) 2409 513.4 5.1e-145 CCDS82991.1 CDH12 gene_id:1010|Hs109|chr5 ( 754) 2196 468.9 1.3e-131 CCDS75229.1 CDH18 gene_id:1016|Hs109|chr5 ( 575) 2188 467.2 3.4e-131 CCDS54835.1 CDH18 gene_id:1016|Hs109|chr5 ( 574) 2187 467.0 3.9e-131 CCDS10804.1 CDH5 gene_id:1003|Hs109|chr16 ( 784) 1785 383.1 9.6e-106 CCDS9585.1 CDH24 gene_id:64403|Hs109|chr14 ( 819) 1665 358.1 3.5e-98 CCDS59325.1 CDH19 gene_id:28513|Hs109|chr18 ( 490) 1577 339.6 7.5e-93 CCDS10976.1 CDH15 gene_id:1013|Hs109|chr16 ( 814) 1341 290.4 8.1e-78 CCDS58784.1 CDH4 gene_id:1002|Hs109|chr20 ( 842) 1211 263.3 1.2e-69 CCDS13488.1 CDH4 gene_id:1002|Hs109|chr20 ( 916) 1211 263.3 1.3e-69 CCDS77172.1 CDH2 gene_id:1000|Hs109|chr18 ( 875) 1173 255.3 3.1e-67 CCDS11891.1 CDH2 gene_id:1000|Hs109|chr18 ( 906) 1173 255.3 3.2e-67 CCDS11893.1 DSC2 gene_id:1824|Hs109|chr18 ( 847) 938 206.3 1.8e-52 CCDS11892.1 DSC2 gene_id:1824|Hs109|chr18 ( 901) 938 206.3 1.9e-52 CCDS32810.1 DSC3 gene_id:1825|Hs109|chr18 ( 896) 909 200.2 1.3e-50 CCDS11895.1 DSC1 gene_id:1823|Hs109|chr18 ( 840) 897 197.7 6.8e-50 CCDS11894.1 DSC1 gene_id:1823|Hs109|chr18 ( 894) 897 197.7 7.2e-50 CCDS82004.1 CDH3 gene_id:1001|Hs109|chr16 ( 784) 891 196.4 1.5e-49 CCDS58487.1 CDH13 gene_id:1012|Hs109|chr16 ( 674) 767 170.5 8.3e-42 CCDS58486.1 CDH13 gene_id:1012|Hs109|chr16 ( 713) 767 170.5 8.7e-42 CCDS58485.1 CDH13 gene_id:1012|Hs109|chr16 ( 760) 767 170.5 9.2e-42 CCDS42423.1 DSG2 gene_id:1829|Hs109|chr18 (1118) 709 158.5 5.7e-38 CCDS13485.1 CDH26 gene_id:60437|Hs109|chr20 ( 832) 681 152.6 2.5e-36 CCDS4317.1 FAT2 gene_id:2196|Hs109|chr5 (4349) 673 151.2 3.5e-35 CCDS11897.1 DSG4 gene_id:147409|Hs109|chr18 (1040) 639 143.9 1.4e-33 CCDS45845.1 DSG4 gene_id:147409|Hs109|chr18 (1059) 639 143.9 1.4e-33 CCDS82005.1 CDH1 gene_id:999|Hs109|chr16 ( 821) 615 138.8 3.5e-32 CCDS11898.1 DSG3 gene_id:1830|Hs109|chr18 ( 999) 616 139.0 3.7e-32 CCDS10869.1 CDH1 gene_id:999|Hs109|chr16 ( 882) 605 136.7 1.6e-31 CCDS58472.1 CDH16 gene_id:1014|Hs109|chr16 ( 732) 602 136.1 2.1e-31 CCDS10823.1 CDH16 gene_id:1014|Hs109|chr16 ( 829) 602 136.1 2.3e-31 CCDS14076.1 CELSR1 gene_id:9620|Hs109|chr22 (3014) 588 133.4 5.6e-30 CCDS43375.1 PCDH1 gene_id:5097|Hs109|chr5 (1060) 564 128.2 7.1e-29 CCDS4267.1 PCDH1 gene_id:5097|Hs109|chr5 (1237) 564 128.2 8.2e-29 CCDS75350.1 PCDHGC5 gene_id:56097|Hs109|chr5 ( 878) 559 127.1 1.2e-28 CCDS4263.1 PCDHGC5 gene_id:56097|Hs109|chr5 ( 944) 559 127.1 1.3e-28 >>CCDS11993.1 CDH7 gene_id:1005|Hs109|chr18 (785 aa) initn: 5105 init1: 5105 opt: 5105 Z-score: 5759.1 bits: 1076.4 E(33420): 0 Smith-Waterman score: 5105; 99.7% identity (100.0% similar) in 785 aa overlap (1-785:1-785) 10 20 30 40 50 60 pF1KB5 MKLGKVEFCHFLQLIALFLCFSGMSQAELSRSRSKPYFQSGRSRTKRSWVWNQFFVLEEY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MKLGKVEFCHFLQLIALFLCFSGMSQAELSRSRSKPYFQSGRSRTKRSWVWNQFFVLEEY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 MGSDPLYVGKLHSDVDKGDGSIKYILSGEGASSIFIIDENTGDIHATKRLDREEQAYYTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MGSDPLYVGKLHSDVDKGDGSIKYILSGEGASSIFIIDENTGDIHATKRLDREEQAYYTL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 RAQALDRLTNEPVEPESEFVIKIQDINDNEPKFLDGPYTAGVPEMSPVGTSVVQVTATDA ::::::::::.::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RAQALDRLTNKPVEPESEFVIKIQDINDNEPKFLDGPYTAGVPEMSPVGTSVVQVTATDA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 DDPTYGNSARVVYSILQGQPYFSVEPKTGVIKTALPNMDREAKDQYLLVIQAKDMVGQNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 DDPTYGNSARVVYSILQGQPYFSVEPKTGVIKTALPNMDREAKDQYLLVIQAKDMVGQNG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 GLSGTTSVTVTLTDVNDNPPRFPRRSYQYNVPESLPVASVVARIKAADADIGANAEMEYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GLSGTTSVTVTLTDVNDNPPRFPRRSYQYNVPESLPVASVVARIKAADADIGANAEMEYK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 IVDGDGLGIFKISVDKETQEGIITIQKELDFEAKTSYTLRIEAANKDADPRFLSLGPFSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 IVDGDGLGIFKISVDKETQEGIITIQKELDFEAKTSYTLRIEAANKDADPRFLSLGPFSD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 TTTVKIIVEDVDEPPVFSSPLYPMEVSEATQVGNIIGTVAAHDPDSSNSPVRYSIDRNTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 TTTVKIIVEDVDEPPVFSSPLYPMEVSEATQVGNIIGTVAAHDPDSSNSPVRYSIDRNTD 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 LERYFNIDANSGVITTAKSLDRETNAIHNITVLAMESQNPSQVGRGYVAITILDINDNAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LERYFNIDANSGVITTAKSLDRETNAIHNITVLAMESQNPSQVGRGYVAITILDINDNAP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 EFAMDYETTVCENAQPGQVIQKISAVDKDEPSNGHQFYFSLTTDATNNHNFSLKDNKDNT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 EFAMDYETTVCENAQPGQVIQKISAVDKDEPSNGHQFYFSLTTDATNNHNFSLKDNKDNT 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB5 ASILTRRNGFRRQEQSVYYLPIFIVDSGSPSLSSTSTLTIRVCDCDADGVAQTCNAEAYV :::::::::::::::::::::::::::::::::::.:::::::::::::::::::::::: CCDS11 ASILTRRNGFRRQEQSVYYLPIFIVDSGSPSLSSTNTLTIRVCDCDADGVAQTCNAEAYV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB5 LPAGLSTGALIAILACVLTLLVLILLIVTMRRRKKEPLIFDEERDIRENIVRYDDEGGGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LPAGLSTGALIAILACVLTLLVLILLIVTMRRRKKEPLIFDEERDIRENIVRYDDEGGGE 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB5 EDTEAFDMAALRNLNVIRDTKTRRDVTPEIQFLSRPAFKSIPDNVIFREFIWERLKEADV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 EDTEAFDMAALRNLNVIRDTKTRRDVTPEIQFLSRPAFKSIPDNVIFREFIWERLKEADV 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB5 DPGAPPYDSLQTYAFEGNGSVAESLSSLDSISSNSDQNYDYLSDWGPRFKRLADMYGTGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 DPGAPPYDSLQTYAFEGNGSVAESLSSLDSISSNSDQNYDYLSDWGPRFKRLADMYGTGQ 730 740 750 760 770 780 pF1KB5 ESLYS ::::: CCDS11 ESLYS >>CCDS82259.1 CDH7 gene_id:1005|Hs109|chr18 (630 aa) initn: 4023 init1: 4023 opt: 4023 Z-score: 4539.4 bits: 850.4 E(33420): 0 Smith-Waterman score: 4023; 99.7% identity (100.0% similar) in 621 aa overlap (1-621:1-621) 10 20 30 40 50 60 pF1KB5 MKLGKVEFCHFLQLIALFLCFSGMSQAELSRSRSKPYFQSGRSRTKRSWVWNQFFVLEEY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 MKLGKVEFCHFLQLIALFLCFSGMSQAELSRSRSKPYFQSGRSRTKRSWVWNQFFVLEEY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 MGSDPLYVGKLHSDVDKGDGSIKYILSGEGASSIFIIDENTGDIHATKRLDREEQAYYTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 MGSDPLYVGKLHSDVDKGDGSIKYILSGEGASSIFIIDENTGDIHATKRLDREEQAYYTL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 RAQALDRLTNEPVEPESEFVIKIQDINDNEPKFLDGPYTAGVPEMSPVGTSVVQVTATDA ::::::::::.::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 RAQALDRLTNKPVEPESEFVIKIQDINDNEPKFLDGPYTAGVPEMSPVGTSVVQVTATDA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 DDPTYGNSARVVYSILQGQPYFSVEPKTGVIKTALPNMDREAKDQYLLVIQAKDMVGQNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 DDPTYGNSARVVYSILQGQPYFSVEPKTGVIKTALPNMDREAKDQYLLVIQAKDMVGQNG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 GLSGTTSVTVTLTDVNDNPPRFPRRSYQYNVPESLPVASVVARIKAADADIGANAEMEYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 GLSGTTSVTVTLTDVNDNPPRFPRRSYQYNVPESLPVASVVARIKAADADIGANAEMEYK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 IVDGDGLGIFKISVDKETQEGIITIQKELDFEAKTSYTLRIEAANKDADPRFLSLGPFSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 IVDGDGLGIFKISVDKETQEGIITIQKELDFEAKTSYTLRIEAANKDADPRFLSLGPFSD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 TTTVKIIVEDVDEPPVFSSPLYPMEVSEATQVGNIIGTVAAHDPDSSNSPVRYSIDRNTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 TTTVKIIVEDVDEPPVFSSPLYPMEVSEATQVGNIIGTVAAHDPDSSNSPVRYSIDRNTD 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 LERYFNIDANSGVITTAKSLDRETNAIHNITVLAMESQNPSQVGRGYVAITILDINDNAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 LERYFNIDANSGVITTAKSLDRETNAIHNITVLAMESQNPSQVGRGYVAITILDINDNAP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 EFAMDYETTVCENAQPGQVIQKISAVDKDEPSNGHQFYFSLTTDATNNHNFSLKDNKDNT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 EFAMDYETTVCENAQPGQVIQKISAVDKDEPSNGHQFYFSLTTDATNNHNFSLKDNKDNT 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB5 ASILTRRNGFRRQEQSVYYLPIFIVDSGSPSLSSTSTLTIRVCDCDADGVAQTCNAEAYV :::::::::::::::::::::::::::::::::::.:::::::::::::::::::::::: CCDS82 ASILTRRNGFRRQEQSVYYLPIFIVDSGSPSLSSTNTLTIRVCDCDADGVAQTCNAEAYV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB5 LPAGLSTGALIAILACVLTLLVLILLIVTMRRRKKEPLIFDEERDIRENIVRYDDEGGGE ::::::::::::::::::::: CCDS82 LPAGLSTGALIAILACVLTLLGRYCFQGLL 610 620 630 >>CCDS11977.1 CDH20 gene_id:28316|Hs109|chr18 (801 aa) initn: 3251 init1: 2896 opt: 3250 Z-score: 3665.4 bits: 689.1 E(33420): 7.9e-198 Smith-Waterman score: 3250; 63.1% identity (83.9% similar) in 785 aa overlap (1-780:14-795) 10 20 30 40 pF1KB5 MKLG-KVEFCHFLQLIALFLCFSGMSQAELSRSRS-KPYFQSGRSRT . :: .. : ...: . : . :.:: : :: :: ..:: CCDS11 MWTSGRMSNAKNWLGLGMSLYFWGLMDLTTTVLSDTPTPQGELEALLSDKP--QS-HQRT 10 20 30 40 50 50 60 70 80 90 100 pF1KB5 KRSWVWNQFFVLEEYMGSDPLYVGKLHSDVDKGDGSIKYILSGEGASSIFIIDENTGDIH ::::::::::::::: :.:::::::::::.:.::::::::::::::. .: ::..::::: CCDS11 KRSWVWNQFFVLEEYTGTDPLYVGKLHSDMDRGDGSIKYILSGEGAGIVFTIDDTTGDIH 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB5 ATKRLDREEQAYYTLRAQALDRLTNEPVEPESEFVIKIQDINDNEPKFLDGPYTAGVPEM : .::::::.: :::::::::: :..:.::::::.::::::::::::::::::.: :::: CCDS11 AIQRLDREERAQYTLRAQALDRRTGRPMEPESEFIIKIQDINDNEPKFLDGPYVATVPEM 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB5 SPVGTSVVQVTATDADDPTYGNSARVVYSILQGQPYFSVEPKTGVIKTALPNMDREAKDQ :::::::.:::::::::::::::::::::::::::::::. :::::.::: :::::::. CCDS11 SPVGTSVIQVTATDADDPTYGNSARVVYSILQGQPYFSVDSKTGVIRTALMNMDREAKEY 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB5 YLLVIQAKDMVGQNGGLSGTTSVTVTLTDVNDNPPRFPRRSYQYNVPESLPVASVVARIK : ..:::::: :: :::.:::.:..::.::::::::::.. ::..: :: :..:.:.:. CCDS11 YEVIIQAKDMGGQLGGLAGTTTVNITLSDVNDNPPRFPQKHYQMSVLESAPISSTVGRVF 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB5 AADADIGANAEMEYKIVDGDGLGIFKISVDKETQEGIITIQKELDFEAKTSYTLRIEAAN : : : : ::::.: :::::: : ::.: . : ::::..: :.::.: ::::..:.:: CCDS11 AKDLDEGINAEMKYTIVDGDGADAFDISTDPNFQVGIITVKKPLSFESKKSYTLKVEGAN 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB5 KDADPRFLSLGPFSDTTTVKIIVEDVDEPPVFSSPLYPMEVSEATQVGNIIGTVAAHDPD . :::.::::.:::::.: :::::::::: .: .:: : . .:. : ..:.::: CCDS11 PHLEMRFLNLGPFQDTTTVHISVEDVDEPPVFEPGFYFVEVPEDVAIGTTIQIISAKDPD 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB5 SSNSPVRYSIDRNTDLERYFNIDANSGVITTAKSLDRETNAIHNITVLAMESQNPSQVGR .:. .::::::..: :.: .: ..:.. ::. :::: . ::::::::: .:::::: CCDS11 VTNNSIRYSIDRSSDPGRFFYVDITTGALMTARPLDREEFSWHNITVLAMEMNNPSQVGS 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB5 GYVAITILDINDNAPEFAMDYETTVCENAQPGQVIQKISAVDKDEPSNGHQFYFSLTTDA :.: .::.::::::: ::. :::::. ::.:: .::::.:.: ::..::.::. .: CCDS11 VPVTIKVLDVNDNAPEFPRFYEAFVCENAKAGQLIQTVSAVDQDDPRNGQHFYYSLAPEA 480 490 500 510 520 530 530 540 550 560 570 580 pF1KB5 TNNHNFSLKDNKDNTASILTRRNGFRRQEQSVYYLPIFIVDSGSPSLSSTSTLTIRVCDC .:: ::...::.:::: :::::.:::.:::::..:::.:.:::.: ::::.::::.::.: CCDS11 ANNPNFTIRDNQDNTARILTRRSGFRQQEQSVFHLPILIADSGQPVLSSTGTLTIQVCSC 540 550 560 570 580 590 590 600 610 620 630 640 pF1KB5 DADGVAQTCNAEAYVLPAGLSTGALIAILACVLTLLVLILLIVTMRRRKKEPLIFDEERD : :: ...:. :::.::..:: :::::::::...::::.:::..:::..:.: :.:.:.. CCDS11 DDDGHVMSCSPEAYMLPVSLSRGALIAILACIFVLLVLVLLILSMRRHRKQPYIIDDEEN 600 610 620 630 640 650 650 660 670 680 690 700 pF1KB5 IRENIVRYDDEGGGEEDTEAFDMAAL---RNLNVIRDTKTRRDVTPEIQFLSRPAFKSIP :.::::::::::::::::::::.::. :. .. :::.:. :::. ::: . .. CCDS11 IHENIVRYDDEGGGEEDTEAFDIAAMWNPREAQAGAAPKTRQDMLPEIESLSRYVPQTCA 660 670 680 690 700 710 710 720 730 740 750 760 pF1KB5 DNVIFREFIWERLKEADVDPGAPPYDSLQTYAFEGNGSVAESLSSLDSISSNSDQNYDYL : . .. .: :::.: :::.:::::: :::.:::: :::::.: .:.:.:..:.: CCDS11 VNSTVHSYVLAKLYEADMDLWAPPFDSLQTYMFEGDGSVAGSLSSLQSATSDSEQSFDFL 720 730 740 750 760 770 770 780 pF1KB5 SDWGPRFKRLADMYGTGQESLYS .::::::..::..::... CCDS11 TDWGPRFRKLAELYGASEGPAPLW 780 790 800 >>CCDS10802.1 CDH8 gene_id:1006|Hs109|chr16 (799 aa) initn: 3367 init1: 3201 opt: 3211 Z-score: 3621.4 bits: 680.9 E(33420): 2.2e-195 Smith-Waterman score: 3211; 62.7% identity (85.9% similar) in 738 aa overlap (43-780:57-794) 20 30 40 50 60 70 pF1KB5 QLIALFLCFSGMSQAELSRSRSKPYFQSGRSRTKRSWVWNQFFVLEEYMGSDPLYVGKLH .:.::.:::::.:::::. : .:. ::.:: CCDS10 IYMAPMNQSQVLMSGSPLELNSLGEEQRILNRSKRGWVWNQMFVLEEFSGPEPILVGRLH 30 40 50 60 70 80 80 90 100 110 120 130 pF1KB5 SDVDKGDGSIKYILSGEGASSIFIIDENTGDIHATKRLDREEQAYYTLRAQALDRLTNEP .:.: :. .:::::::.::..:: :.. :::::: :::::::.: ::: :::.: :..: CCDS10 TDLDPGSKKIKYILSGDGAGTIFQINDVTGDIHAIKRLDREEKAEYTLTAQAVDWETSKP 90 100 110 120 130 140 140 150 160 170 180 190 pF1KB5 VEPESEFVIKIQDINDNEPKFLDGPYTAGVPEMSPVGTSVVQVTATDADDPTYGNSARVV .:: :::.::.:::::: :.::.::: : ::::: .::::..:::::::::.:::::..: CCDS10 LEPPSEFIIKVQDINDNAPEFLNGPYHATVPEMSILGTSVTNVTATDADDPVYGNSAKLV 150 160 170 180 190 200 200 210 220 230 240 250 pF1KB5 YSILQGQPYFSVEPKTGVIKTALPNMDREAKDQYLLVIQAKDMVGQNGGLSGTTSVTVTL ::::.::::::.::.:..:::::::::::::..::.::::::: :..:::::::..:::: CCDS10 YSILEGQPYFSIEPETAIIKTALPNMDREAKEEYLVVIQAKDMGGHSGGLSGTTTLTVTL 210 220 230 240 250 260 260 270 280 290 300 310 pF1KB5 TDVNDNPPRFPRRSYQYNVPESLPVASVVARIKAADADIGANAEMEYKIVDGDGLGIFKI ::::::::.: . :...:::.. ......:.:: : ::: ::. : :.:::: ..:.: CCDS10 TDVNDNPPKFAQSLYHFSVPEDVVLGTAIGRVKANDQDIGENAQSSYDIIDGDGTALFEI 270 280 290 300 310 320 320 330 340 350 360 370 pF1KB5 SVDKETQEGIITIQKELDFEAKTSYTLRIEAANKDADPRFLSLGPFSDTTTVKIIVEDVD . : ..:.::: ..: ::::.: ::::..:::: :::: . :::.::.::::.:::.: CCDS10 TSDAQAQDGIIRLRKPLDFETKKSYTLKVEAANVHIDPRFSGRGPFKDTATVKIVVEDAD 330 340 350 360 370 380 380 390 400 410 420 430 pF1KB5 EPPVFSSPLYPMEVSEATQVGNIIGTVAAHDPDSSNSPVRYSIDRNTDLERYFNIDANSG :::::::: : .:: : . ....:: :.:.::: ..::.:.::::.::::: :::.:..: CCDS10 EPPVFSSPTYLLEVHENAALNSVIGQVTARDPDITSSPIRFSIDRHTDLERQFNINADDG 390 400 410 420 430 440 440 450 460 470 480 490 pF1KB5 VITTAKSLDRETNAIHNITVLAMESQNPSQVGRGYVAITILDINDNAPEFAMDYETTVCE :: : :::: .. ::::..: : .: ::..: ::: .::.:::::::: .::. .:: CCDS10 KITLATPLDRELSVWHNITIIATEIRNHSQISRVPVAIKVLDVNDNAPEFASEYEAFLCE 450 460 470 480 490 500 500 510 520 530 540 550 pF1KB5 NAQPGQVIQKISAVDKDEPSNGHQFYFSLTTDATNNHNFSLKDNKDNTASILTRRNGFRR :..:::::: .::.:::.:.::: : .:: . .:: ::..: :.::. :::...::: : CCDS10 NGKPGQVIQTVSAMDKDDPKNGHYFLYSLLPEMVNNPNFTIKKNEDNSLSILAKHNGFNR 510 520 530 540 550 560 560 570 580 590 600 610 pF1KB5 QEQSVYYLPIFIVDSGSPSLSSTSTLTIRVCDCDADGVAQTCNAEAYVLPAGLSTGALIA :.: :: :::.: :::.: :::::::::::: :. :::.:.::.:::::: ::: ::::: CCDS10 QKQEVYLLPIIISDSGNPPLSSTSTLTIRVCGCSNDGVVQSCNVEAYVLPIGLSMGALIA 570 580 590 600 610 620 620 630 640 650 660 670 pF1KB5 ILACVLTLLVLILLIVTMRRRKKEPLIFDEERDIRENIVRYDDEGGGEEDTEAFDMAALR ::::.. :::...:.::.::.:.::::. ...:.::::.::::::::::::::::.:.:. CCDS10 ILACIILLLVIVVLFVTLRRHKNEPLIIKDDEDVRENIIRYDDEGGGEEDTEAFDIATLQ 630 640 650 660 670 680 680 690 700 710 720 730 pF1KB5 NLNVIRDTKTRRDVTPEIQFLSRPAFKSIPDNVIFREFIWERLKEADVDPGAPPYDSLQT : . : :.:. :..::. : .. .:..: ::: ::.::: :: ::::::.: CCDS10 NPDGINGFLPRKDIKPDLQFMPRQGLAPVPNGVDVDEFINVRLHEADNDPTAPPYDSIQI 690 700 710 720 730 740 740 750 760 770 780 pF1KB5 YAFEGNGSVAESLSSLDSISSNSDQNYDYLSDWGPRFKRLADMYGTGQESLYS :..:: :::: :::::.: .:.::::.:::::::::::::...:..:. CCDS10 YGYEGRGSVAGSLSSLESTTSDSDQNFDYLSDWGPRFKRLGELYSVGESDKET 750 760 770 780 790 >>CCDS3892.1 CDH10 gene_id:1008|Hs109|chr5 (788 aa) initn: 3208 init1: 2163 opt: 3185 Z-score: 3592.1 bits: 675.5 E(33420): 9.4e-194 Smith-Waterman score: 3188; 61.9% identity (82.3% similar) in 785 aa overlap (10-780:5-783) 10 20 30 40 pF1KB5 MKLGKVEFCHFLQLIALFLCFSGMSQAELSRSRSKPYFQ----SGR---------SRTKR .:: :. ...:. . . :. :. : : :.: : :: CCDS38 MTIHQFLLLFLFWVCLPHFCSPEIMFRRT-PVPQQRILSSRVPRSDGKILHRQKR 10 20 30 40 50 50 60 70 80 90 100 pF1KB5 SWVWNQFFVLEEYMGSDPLYVGKLHSDVDKGDGSIKYILSGEGASSIFIIDENTGDIHAT .:.:::::.:::: ::: :::::::: ::::::.::::::.::...:::::.::::::: CCDS38 GWMWNQFFLLEEYTGSDYQYVGKLHSDQDKGDGSLKYILSGDGAGTLFIIDEKTGDIHAT 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB5 KRLDREEQAYYTLRAQALDRLTNEPVEPESEFVIKIQDINDNEPKFLDGPYTAGVPEMSP .:.::::.:.:::::::..: : .::::::::::::.::::::: : . :::.::::: CCDS38 RRIDREEKAFYTLRAQAINRRTLRPVEPESEFVIKIHDINDNEPTFPEEIYTASVPEMSV 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB5 VGTSVVQVTATDADDPTYGNSARVVYSILQGQPYFSVEPKTGVIKTALPNMDREAKDQYL ::::::::::::::::.:::::::.::::::::::::::.::.:.::::::.:: ..:: CCDS38 VGTSVVQVTATDADDPSYGNSARVIYSILQGQPYFSVEPETGIIRTALPNMNRENREQYQ 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB5 LVIQAKDMVGQNGGLSGTTSVTVTLTDVNDNPPRFPRRSYQYNVPESLPVASVVARIKAA .::::::: :: :::::::.:..:::::::::::::. . . : :: ::..... .::. CCDS38 VVIQAKDMGGQMGGLSGTTTVNITLTDVNDNPPRFPQNTIHLRVLESSPVGTAIGSVKAT 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB5 DADIGANAEMEYKIVDGDGLGIFKISVDKETQEGIITIQKELDFEAKTSYTLRIEAANKD ::: : :::.::.:.:::: .: : ..:.:::::::..: ::.:.. :::..:: : CCDS38 DADTGKNAEVEYRIIDGDGTDMFDIVTEKDTQEGIITVKKPLDYESRRLYTLKVEAENTH 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB5 ADPRFLSLGPFSDTTTVKIIVEDVDEPPVFSSPLYPMEVSEATQVGNIIGTVAAHDPDSS .:::: ::::.::: ::: .:::::::::: : .:: : .::.::::: :.:::: CCDS38 VDPRFYYLGPFKDTTIVKISIEDVDEPPVFSRSSYLFEVHEDIEVGTIIGTVMARDPDSI 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB5 NSPVRYSIDRNTDLERYFNIDANSGVITTAKSLDRETNAIHNITVLAMESQNPSQVGRGY .::.:.:.::.:::.: ::: ...: . :.: :::: . ::.::.: : .::... : CCDS38 SSPIRFSLDRHTDLDRIFNIHSGNGSLYTSKPLDRELSQWHNLTVIAAEINNPKETTRVA 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB5 VAITILDINDNAPEFAMDYETTVCENAQPGQVIQKISAVDKDEPSNGHQFYFSLTTDATN : . :::.:::::.::. :.: :::::.:::.:: :::::::.: .:..:.::: :. CCDS38 VFVRILDVNDNAPQFAVFYDTFVCENARPGQLIQTISAVDKDDPLGGQKFFFSL---AAV 480 490 500 510 520 530 530 540 550 560 570 580 pF1KB5 NHNFSLKDNKDNTASILTRRNGFRRQEQSVYYLPIFIVDSGSPSLSSTSTLTIRVCDCDA : ::...::.:::: ::::.::: :.: :.: ::. : :. : :::.::::::: ::. CCDS38 NPNFTVQDNEDNTARILTRKNGFNRHEISTYLLPVVISDNDYPIQSSTGTLTIRVCACDS 540 550 560 570 580 590 590 600 610 620 630 640 pF1KB5 DGVAQTCNAEAYVLPAGLSTGALIAILACVLTLLVLILLIVTMRR-RKKEPLIFDEERDI .: :.:.::: .:::::::::::::: :.. :::...:.....: :::::::...: :: CCDS38 QGNMQSCSAEALLLPAGLSTGALIAILLCIIILLVIVVLFAALKRQRKKEPLILSKE-DI 600 610 620 630 640 650 650 660 670 680 690 700 pF1KB5 RENIVRYDDEGGGEEDTEAFDMAALRNLNVIRDTKTRRDVTPEIQFLSRPAFKSIPDNVI :.::: :.:::::::::.:::...::: .:.. : :::. :: :. : . . :::. CCDS38 RDNIVSYNDEGGGEEDTQAFDIGTLRNPAAIEEKKLRRDIIPETLFIPRRT-PTAPDNTD 660 670 680 690 700 710 720 730 740 750 760 pF1KB5 FREFIWERLKEADVDPGAPPYDSLQTYAFEGNGSVAESLSSLDSISSNSDQNYDYLSDWG :.:: ::::: :.:: ::::::: :::.::: :.:::::::.: ....::::::: .:: CCDS38 VRDFINERLKEHDLDPTAPPYDSLATYAYEGNDSIAESLSSLESGTTEGDQNYDYLREWG 710 720 730 740 750 760 770 780 pF1KB5 PRFKRLADMYGTGQESLYS :::..::.::: :. CCDS38 PRFNKLAEMYGGGESDKDS 770 780 >>CCDS3894.1 CDH6 gene_id:1004|Hs109|chr5 (790 aa) initn: 3312 init1: 2776 opt: 3180 Z-score: 3586.5 bits: 674.4 E(33420): 2e-193 Smith-Waterman score: 3180; 64.0% identity (85.6% similar) in 736 aa overlap (43-777:49-782) 20 30 40 50 60 70 pF1KB5 QLIALFLCFSGMSQAELSRSRSKPYFQSGRSRTKRSWVWNQFFVLEEYMGSDPLYVGKLH .:.::::.:::::.:::: ::: :::::: CCDS38 TLSTPLSKRTSGFPAKKRALELSGNSKNELNRSKRSWMWNQFFLLEEYTGSDYQYVGKLH 20 30 40 50 60 70 80 90 100 110 120 130 pF1KB5 SDVDKGDGSIKYILSGEGASSIFIIDENTGDIHATKRLDREEQAYYTLRAQALDRLTNEP :: :.::::.::::::.::...:::.::::::.:::::::::. : :::::..: :..: CCDS38 SDQDRGDGSLKYILSGDGAGDLFIINENTGDIQATKRLDREEKPVYILRAQAINRRTGRP 80 90 100 110 120 130 140 150 160 170 180 190 pF1KB5 VEPESEFVIKIQDINDNEPKFLDGPYTAGVPEMSPVGTSVVQVTATDADDPTYGNSARVV :::::::.:::.::::::: : ::: ::::: ::: ::::::::::::::::::.:: CCDS38 VEPESEFIIKIHDINDNEPIFTKEVYTATVPEMSDVGTFVVQVTATDADDPTYGNSAKVV 140 150 160 170 180 190 200 210 220 230 240 250 pF1KB5 YSILQGQPYFSVEPKTGVIKTALPNMDREAKDQYLLVIQAKDMVGQNGGLSGTTSVTVTL ::::::::::::: .::.::::: ::::: ..:: .::::::: :: :::::::.:..:: CCDS38 YSILQGQPYFSVESETGIIKTALLNMDRENREQYQVVIQAKDMGGQMGGLSGTTTVNITL 200 210 220 230 240 250 260 270 280 290 300 310 pF1KB5 TDVNDNPPRFPRRSYQYNVPESLPVASVVARIKAADADIGANAEMEYKIVDGDGLGIFKI :::::::::::. .::...::: : .. ..::::.:::.: :::.::.:.::.:: .: . CCDS38 TDVNDNPPRFPQSTYQFKTPESSPPGTPIGRIKASDADVGENAEIEYSITDGEGLDMFDV 260 270 280 290 300 310 320 330 340 350 360 370 pF1KB5 SVDKETQEGIITIQKELDFEAKTSYTLRIEAANKDADPRFLSLGPFSDTTTVKIIVEDVD .:.::::::::..: :::: : :::..::.: ..:::: ::::.:..::.:.::::: CCDS38 ITDQETQEGIITVKKLLDFEKKKVYTLKVEASNPYVEPRFLYLGPFKDSATVRIVVEDVD 320 330 340 350 360 370 380 390 400 410 420 430 pF1KB5 EPPVFSSPLYPMEVSEATQVGNIIGTVAAHDPDSSNSPVRYSIDRNTDLERYFNIDANSG ::::::. : ... : .:... ::.:.:.:::.. .::.::.::.::..: ::::...: CCDS38 EPPVFSKLAYILQIREDAQINTTIGSVTAQDPDAARNPVKYSVDRHTDMDRIFNIDSGNG 380 390 400 410 420 430 440 450 460 470 480 490 pF1KB5 VITTAKSLDRETNAIHNITVLAMESQNPSQVGRGYVAITILDINDNAPEFAMDYETTVCE : :.: ::::: :::::.: : .::.: .: . : .::.:::::::: ::: ::: CCDS38 SIFTSKLLDRETLLWHNITVIATEINNPKQSSRVPLYIKVLDVNDNAPEFAEFYETFVCE 440 450 460 470 480 490 500 510 520 530 540 550 pF1KB5 NAQPGQVIQKISAVDKDEPSNGHQFYFSLTTDATNNHNFSLKDNKDNTASILTRRNGFRR .:. :.:: . :::::.: .:::: :::. .:... ::...:::::::.::::.::. : CCDS38 KAKADQLIQTLHAVDKDDPYSGHQFSFSLAPEAASGSNFTIQDNKDNTAGILTRKNGYNR 500 510 520 530 540 550 560 570 580 590 600 610 pF1KB5 QEQSVYYLPIFIVDSGSPSLSSTSTLTIRVCDCDADGVAQTCNAEAYVLPAGLSTGALIA .:.:.: ::. : :. : :::.:.:.::: :: : :.:.::: . :.:::::::.: CCDS38 HEMSTYLLPVVISDNDYPVQSSTGTVTVRVCACDHHGNMQSCHAEALIHPTGLSTGALVA 560 570 580 590 600 610 620 630 640 650 660 670 pF1KB5 ILACVLTLLVLILLIVTMRR-RKKEPLIFDEERDIRENIVRYDDEGGGEEDTEAFDMAAL :: :.. ::: ..:....:: :::::::...: :::.::: :.:::::::::.:::...: CCDS38 ILLCIVILLVTVVLFAALRRQRKKEPLIISKE-DIRDNIVSYNDEGGGEEDTQAFDIGTL 620 630 640 650 660 670 680 690 700 710 720 730 pF1KB5 RNLNVIRDTKTRRDVTPEIQFLSRPAFKSIPDNVIFREFIWERLKEADVDPGAPPYDSLQ :: ..:.:.: :::..:: :: : . . ::. :.:: .:::: :.:: ::::::: CCDS38 RNPEAIEDNKLRRDIVPEALFLPRRT-PTARDNTDVRDFINQRLKENDTDPTAPPYDSLA 680 690 700 710 720 730 740 750 760 770 780 pF1KB5 TYAFEGNGSVAESLSSLDSISSNSDQNYDYLSDWGPRFKRLADMYGTGQESLYS :::.::.::::.:::::.:.....::.::::::::::::.:::::: CCDS38 TYAYEGTGSVADSLSSLESVTTDADQDYDYLSDWGPRFKKLADMYGGVDSDKDS 740 750 760 770 780 790 >>CCDS3889.1 CDH18 gene_id:1016|Hs109|chr5 (790 aa) initn: 2843 init1: 2645 opt: 3179 Z-score: 3585.3 bits: 674.2 E(33420): 2.3e-193 Smith-Waterman score: 3179; 62.5% identity (83.6% similar) in 762 aa overlap (20-777:22-782) 10 20 30 40 50 pF1KB5 MKLGKVEFCHFLQLIALFLCFSGMSQAELSRSRSKPYFQSGRS----RTKRSWVWNQF :.. .. .. :.. :.. : ::.:::::: CCDS38 MKITSTSCICPVLVCLCFVQRCYGTAHHSSIKVMRNQTKHIEGETEVHHRPKRGWVWNQF 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 FVLEEYMGSDPLYVGKLHSDVDKGDGSIKYILSGEGASSIFIIDENTGDIHATKRLDREE :::::.:: :: :::::::. ::::::.::::.::::..:::::..:::::.:: ::::. CCDS38 FVLEEHMGPDPQYVGKLHSNSDKGDGSVKYILTGEGAGTIFIIDDTTGDIHSTKSLDREQ 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB5 QAYYTLRAQALDRLTNEPVEPESEFVIKIQDINDNEPKFLDGPYTAGVPEMSPVGTSVVQ ...:.:.:::.:: ::.:.::::::.::.:::::: ::: :::: . ::::: .::::.: CCDS38 KTHYVLHAQAIDRRTNKPLEPESEFIIKVQDINDNAPKFTDGPYIVTVPEMSDMGTSVLQ 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB5 VTATDADDPTYGNSARVVYSILQGQPYFSVEPKTGVIKTALPNMDREAKDQYLLVIQAKD ::::::::::::::::::::::::::::::.::::::.::: ::::::...: .:::::: CCDS38 VTATDADDPTYGNSARVVYSILQGQPYFSVDPKTGVIRTALHNMDREAREHYSVVIQAKD 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB5 MVGQNGGLSGTTSVTVTLTDVNDNPPRFPRRSYQYNVPESLPVASVVARIKAADADIGAN :.:: :::::.:.:..:::::::::::::.. :: :::: :.:.:..::: ::: :.: CCDS38 MAGQVGGLSGSTTVNITLTDVNDNPPRFPQKHYQLYVPESAQVGSAVGKIKANDADTGSN 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB5 AEMEYKIVDGDGLGIFKISVDKETQEGIITIQKELDFEAKTSYTLRIEAANKDADPRFLS :.: :.:..:::.:::.::.::::.:::....: :..: : :::: ::.:: : :: CCDS38 ADMTYSIINGDGMGIFSISTDKETREGILSLKKPLNYEKKKSYTLNIEGANTHLDFRFSH 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB5 LGPFSDTTTVKIIVEDVDEPPVFSSPLYPMEVSEATQVGNIIGTVAAHDPDSSNSPVRYS ::::.:.: .:::: ::::::.:: : : ::: : ...:...::: :.::::.:: ::: CCDS38 LGPFKDATMLKIIVGDVDEPPLFSMPSYLMEVYENAKIGTVVGTVLAQDPDSTNSLVRYF 370 380 390 400 410 420 420 430 440 450 460 470 pF1KB5 IDRNTDLERYFNIDANSGVITTAKSLDRETNAIHNITVLAMESQNPSQVGRGYVAITILD :. :.. .:.::::::.:.: :.: :::: . .:::: : : .::. ... :.: .:: CCDS38 INYNVEDDRFFNIDANTGTIRTTKVLDREETPWYNITVTASEIDNPDLLSHVTVGIRVLD 430 440 450 460 470 480 480 490 500 510 520 530 pF1KB5 INDNAPEFAMDYETTVCENAQPGQVIQKISAVDKDEPSNGHQFYFSLTTDATNNHNFSLK .::: ::.: .:. ::::..:::::. :::.:::. .:: .: : : : ::.:: CCDS38 VNDNPPELAREYDIIVCENSKPGQVIHTISATDKDDFANGPRFNFFLDERLPVNPNFTLK 490 500 510 520 530 540 540 550 560 570 580 590 pF1KB5 DNKDNTASILTRRNGFRRQEQSVYYLPIFIVDSGSPSLSSTSTLTIRVCDCDADGVAQTC ::.:::::::::: : : :.::::::.: :.: :::::.:::::::: :. :: ..:: CCDS38 DNEDNTASILTRRRRFSRTVQDVYYLPIMISDGGIPSLSSSSTLTIRVCACERDGRVRTC 550 560 570 580 590 600 600 610 620 630 640 650 pF1KB5 NAEAYVLPAGLSTGALIAILACVLTLLVLILLIVTMRRRKKEPLIFDEERDIRENIVRYD .:::.. :::::::::::: ::: ::....:..:.:: ::::::..:: :.:::.: :: CCDS38 HAEAFLSSAGLSTGALIAILLCVLILLAIVVLFITLRRSKKEPLIISEE-DVRENVVTYD 610 620 630 640 650 660 670 680 690 700 710 pF1KB5 DEGGGEEDTEAFDMAALRNLNVIRDTKTRRDVTPEIQFLSRPAFKSIPDNVIFREFIWER :::::::::::::..:::: .. .. : :::. ::... : .: ... .::: .: CCDS38 DEGGGEEDTEAFDITALRNPSAAEELKYRRDIRPEVKLTPRHQTSSTLESIDVQEFIKQR 660 670 680 690 700 710 720 730 740 750 760 770 pF1KB5 LKEADVDPGAPPYDSLQTYAFEGNGSVAESLSSLDSISSNSDQNYDYLSDWGPRFKRLAD : :::.::..::::::::::.::. : : :.::::: ...:::.: ::.::::.::.::. CCDS38 LAEADLDPSVPPYDSLQTYAYEGQRSEAGSISSLDSATTQSDQDYHYLGDWGPEFKKLAE 720 730 740 750 760 770 780 pF1KB5 MYGTGQESLYS .:: CCDS38 LYGEIESERTT 780 790 >>CCDS3893.1 CDH9 gene_id:1007|Hs109|chr5 (789 aa) initn: 3359 init1: 2739 opt: 3122 Z-score: 3521.0 bits: 662.3 E(33420): 8.6e-190 Smith-Waterman score: 3122; 62.0% identity (85.2% similar) in 742 aa overlap (44-782:50-786) 20 30 40 50 60 70 pF1KB5 LIALFLCFSGMSQAELSRSRSKPYFQSGRSRTKRSWVWNQFFVLEEYMGSDPLYVGKLHS ::::.:.:::::.:::: :.: ::::::. CCDS38 DTILLQEKPNSYLSSKKIAGLTKDDGKMLRRTKRGWMWNQFFLLEEYTGTDTQYVGKLHT 20 30 40 50 60 70 80 90 100 110 120 130 pF1KB5 DVDKGDGSIKYILSGEGASSIFIIDENTGDIHATKRLDREEQAYYTLRAQALDRLTNEPV : :::::..::::.:.::.:.:.::::::::::.:.:::::.. : :::.:.:: :.. : CCDS38 DQDKGDGNLKYILTGDGAGSLFVIDENTGDIHAAKKLDREEKSLYILRAKAIDRKTGRQV 80 90 100 110 120 130 140 150 160 170 180 190 pF1KB5 EPESEFVIKIQDINDNEPKFLDGPYTAGVPEMSPVGTSVVQVTATDADDPTYGNSARVVY ::::::.:::.::::::::: :::.::::: :::::.::::::::: .:::::.::: CCDS38 EPESEFIIKIHDINDNEPKFTKDLYTASVPEMSGVGTSVIQVTATDADDANYGNSAKVVY 140 150 160 170 180 190 200 210 220 230 240 250 pF1KB5 SILQGQPYFSVEPKTGVIKTALPNMDREAKDQYLLVIQAKDMVGQNGGLSGTTSVTVTLT :::::::::::.:..:.::::::.:.:: ..:: .::::::: :: :::::::.:..::: CCDS38 SILQGQPYFSVDPESGIIKTALPDMSRENREQYQVVIQAKDMGGQMGGLSGTTTVNITLT 200 210 220 230 240 250 260 270 280 290 300 310 pF1KB5 DVNDNPPRFPRRSYQYNVPESLPVASVVARIKAADADIGANAEMEYKIVDGDGLGIFKIS :::.::::::. .::.: :::.:... ..:::: : :.: ::::::.:..::: .: . CCDS38 DVNNNPPRFPQSTYQFNSPESVPLGTHLGRIKANDPDVGENAEMEYSIAEGDGADMFDVI 260 270 280 290 300 310 320 330 340 350 360 370 pF1KB5 VDKETQEGIITIQKELDFEAKTSYTLRIEAANKDADPRFLSLGPFSDTTTVKIIVEDVDE .::.:::::::....:::: . ::::..:.: ::::: ::::.::..::: :::.:: CCDS38 TDKDTQEGIITVKQNLDFENQMLYTLRVDASNTHPDPRFLHLGPFKDTAVVKISVEDIDE 320 330 340 350 360 370 380 390 400 410 420 430 pF1KB5 PPVFSSPLYPMEVSEATQVGNIIGTVAAHDPDSSNSPVRYSIDRNTDLERYFNIDANSGV ::::.. : .::.: .. :.::: :.:.:::. :. ..::.::.::..: :.: ...: CCDS38 PPVFTKVSYLIEVDEDVKEGSIIGQVTAYDPDARNNLIKYSVDRHTDMDRIFGIHSENGS 380 390 400 410 420 430 440 450 460 470 480 490 pF1KB5 ITTAKSLDRETNAIHNITVLAMESQNPSQVGRGYVAITILDINDNAPEFAMDYETTVCEN : : :.::::.. ::::: : : .::.: .. : : ::::::.:::::: ::: :::: CCDS38 IFTLKALDRESSPWHNITVTATEINNPKQSSHIPVFIRILDINDHAPEFAMYYETFVCEN 440 450 460 470 480 490 500 510 520 530 540 550 pF1KB5 AQPGQVIQKISAVDKDEPSNGHQFYFSLTTDATNNHNFSLKDNKDNTASILTRRNGFRRQ :.:::.:: .:..:::.: ::.:.: . . : : ::.. :::::::.:.::..:. :. CCDS38 AKPGQLIQTVSVMDKDDPPRGHKFFFEPVPEFTLNPNFTIVDNKDNTAGIMTRKDGYSRN 500 510 520 530 540 550 560 570 580 590 600 610 pF1KB5 EQSVYYLPIFIVDSGSPSLSSTSTLTIRVCDCDADGVAQTCNAEAYVLPAGLSTGALIAI ..:.: :::.: :. : :::.::::::: :: .: :.:.::: .: ::::::::.:: CCDS38 KMSTYLLPILIFDNDYPIQSSTGTLTIRVCACDNQGNMQSCTAEALILSAGLSTGALVAI 560 570 580 590 600 610 620 630 640 650 660 670 pF1KB5 LACVLTLLVLILLIVTMRR-RKKEPLIFDEERDIRENIVRYDDEGGGEEDTEAFDMAALR : ::: ::.:..:.....: :::::::.... :.:.::: :.:::::::::.:::...:: CCDS38 LLCVLILLILVVLFAALKRQRKKEPLIISKD-DVRDNIVTYNDEGGGEEDTQAFDIGTLR 620 630 640 650 660 670 680 690 700 710 720 730 pF1KB5 NLNVIRDTKTRRDVTPEIQFLSRPAFKSIP--DNVIFREFIWERLKEADVDPGAPPYDSL : .. .:.: :::: :: : : ...: .:. ..:: .:::: :.::.::::::: CCDS38 NPEAREDSKLRRDVMPETIFQIR---RTVPLWENIDVQDFIHRRLKENDADPSAPPYDSL 680 690 700 710 720 730 740 750 760 770 780 pF1KB5 QTYAFEGNGSVAESLSSLDSISSNSDQNYDYLSDWGPRFKRLADMYGTGQESLYS :::.::: :.:.:::::.:.... .:.::::::::::::.:::::: :..: CCDS38 ATYAYEGNDSIADSLSSLESLTADCNQDYDYLSDWGPRFKKLADMYG-GDDSDRD 740 750 760 770 780 >>CCDS3890.1 CDH12 gene_id:1010|Hs109|chr5 (794 aa) initn: 3305 init1: 2707 opt: 3088 Z-score: 3482.6 bits: 655.2 E(33420): 1.2e-187 Smith-Waterman score: 3088; 60.6% identity (84.4% similar) in 742 aa overlap (36-777:43-783) 10 20 30 40 50 60 pF1KB5 VEFCHFLQLIALFLCFSGMSQAELSRSRSKPYFQSGRSRTKRSWVWNQFFVLEEYMGSDP : .: .:.::.::::::::::::.::.: CCDS38 VLFDGGLLTPLQPQPQQTLATEPRENVIHLPGQRSHFQRVKRGWVWNQFFVLEEYVGSEP 20 30 40 50 60 70 70 80 90 100 110 120 pF1KB5 LYVGKLHSDVDKGDGSIKYILSGEGASSIFIIDENTGDIHATKRLDREEQAYYTLRAQAL ::::::::.:::.:..:: :::.::...: :::.:::::: . :::::. .:::::::. CCDS38 QYVGKLHSDLDKGEGTVKYTLSGDGAGTVFTIDETTGDIHAIRSLDREEKPFYTLRAQAV 80 90 100 110 120 130 130 140 150 160 170 180 pF1KB5 DRLTNEPVEPESEFVIKIQDINDNEPKFLDGPYTAGVPEMSPVGTSVVQVTATDADDPTY : : .:.::::::.::.:::::::::::::::.: ::::::::. :.:: ::::::::: CCDS38 DIETRKPLEPESEFIIKVQDINDNEPKFLDGPYVATVPEMSPVGAYVLQVKATDADDPTY 140 150 160 170 180 190 190 200 210 220 230 240 pF1KB5 GNSARVVYSILQGQPYFSVEPKTGVIKTALPNMDREAKDQYLLVIQAKDMVGQNGGLSGT ::::::::::::::::::..::::::.:::::::::.:.:: ..:::::: :: :::.:: CCDS38 GNSARVVYSILQGQPYFSIDPKTGVIRTALPNMDREVKEQYQVLIQAKDMGGQLGGLAGT 200 210 220 230 240 250 250 260 270 280 290 300 pF1KB5 TSVTVTLTDVNDNPPRFPRRSYQYNVPESLPVASVVARIKAADADIGANAEMEYKIVDGD : :..:::::::::::::. .. .:::: :..:...::.:.: :.: :::.::.:: :: CCDS38 TIVNITLTDVNDNPPRFPKSIFHLKVPESSPIGSAIGRIRAVDPDFGQNAEIEYNIVPGD 260 270 280 290 300 310 310 320 330 340 350 360 pF1KB5 GLGIFKISVDKETQEGIITIQKELDFEAKTSYTLRIEAANKDADPRFLSLGPFSDTTTVK : ..: : .:..::::.: ..: ::::.: .::...::.: : :: : :::.::.::: CCDS38 GGNLFDIVTDEDTQEGVIKLKKPLDFETKKAYTFKVEASNLHLDHRFHSAGPFKDTATVK 320 330 340 350 360 370 370 380 390 400 410 420 pF1KB5 IIVEDVDEPPVFSSPLYPMEVSEATQVGNIIGTVAAHDPDSSNSPVRYSIDRNTDLERYF : : :::::::::.::: ::: : : ::.:::.:.:.: : ..: ::: :: ..: . :: CCDS38 ISVLDVDEPPVFSKPLYTMEVYEDTPVGTIIGAVTAQDLDVGSSAVRYFIDWKSDGDSYF 380 390 400 410 420 430 430 440 450 460 470 480 pF1KB5 NIDANSGVITTAKSLDRETNAIHNITVLAMESQNPSQVGRGYVAITILDINDNAPEFAMD .::.: :.:.: . ::::..: .:....: . .:: ... . :..::.:. ::... CCDS38 TIDGNEGTIATNELLDRESTAQYNFSIIASKVSNPLLTSKVNILINVLDVNEFPPEISVP 440 450 460 470 480 490 490 500 510 520 530 540 pF1KB5 YETTVCENAQPGQVIQKISAVDKDEPSNGHQFYFSLTTDATNNHNFSLKDNKDNTASILT :::.:::::.:::.:: .::.:.: :.:: : :. .:. . ::...: ..:::.: : CCDS38 YETAVCENAKPGQIIQIVSAADRDLSPAGQQFSFRLSPEAAIKPNFTVRDFRNNTAGIET 500 510 520 530 540 550 550 560 570 580 590 600 pF1KB5 RRNGFRRQEQSVYYLPIFIVDSGSPSLSSTSTLTIRVCDCDADGVAQTCNAEAYVLPAGL ::::. :..: .:.::. : ::. : :::.:.::::: ::.::. .::.:: ::.:: CCDS38 RRNGYSRRQQELYFLPVVIEDSSYPVQSSTNTMTIRVCRCDSDGTILSCNVEAIFLPVGL 560 570 580 590 600 610 610 620 630 640 650 660 pF1KB5 STGALIAILACVLTLLVLILLIVTMRRRKKEPLIFDEERDIRENIVRYDDEGGGEEDTEA ::::::::: :.. ::....: :..::.::. .. ..:::.:...:::::::::::.: CCDS38 STGALIAILLCIVILLAIVVLYVALRRQKKKDTLMTSKEDIRDNVIHYDDEGGGEEDTQA 620 630 640 650 660 670 670 680 690 700 710 720 pF1KB5 FDMAALRNLNVIRDTKTRRDVTPEIQFLSRPAFKSIPDNVIFREFIWERLKEADVDPGAP ::..:::: .::...: :::. :. : : . ::. .:.:: .::.: :::: :: CCDS38 FDIGALRNPKVIEENKIRRDIKPDSLCLPRQR-PPMEDNTDIRDFIHQRLQENDVDPTAP 680 690 700 710 720 730 730 740 750 760 770 780 pF1KB5 PYDSLQTYAFEGNGSVAESLSSLDSISSNSDQNYDYLSDWGPRFKRLADMYGTGQESLYS ::::: :::.::.:::::::::.::.....::.::::.::::::: ::::.: CCDS38 PYDSLATYAYEGSGSVAESLSSIDSLTTEADQDYDYLTDWGPRFKVLADMFGEEESYNPD 740 750 760 770 780 790 CCDS38 KVT >>CCDS10803.1 CDH11 gene_id:1009|Hs109|chr16 (796 aa) initn: 3062 init1: 1937 opt: 3063 Z-score: 3454.4 bits: 650.0 E(33420): 4.4e-186 Smith-Waterman score: 3079; 58.6% identity (80.7% similar) in 788 aa overlap (5-778:2-788) 10 20 30 40 50 pF1KB5 MKLGKVEFCHFLQLIAL-FLCFSGMSQAELSRSRSKPYF----QSGR-----SRTKRSWV : ..: :. : .:: : : :.. .: : ..:. .:.::.:: CCDS10 MKENYCLQAALVCLGMLCHSHAFAPE-RRGHLRPSFHGHHEKGKEGQVLQRSKRGWV 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 WNQFFVLEEYMGSDPLYVGKLHSDVDKGDGSIKYILSGEGASSIFIIDENTGDIHATKRL ::::::.::: : ::. ::.::::.:.:::.::::::::::..::.::...:.::::: : CCDS10 WNQFFVIEEYTGPDPVLVGRLHSDIDSGDGNIKYILSGEGAGTIFVIDDKSGNIHATKTL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 DREEQAYYTLRAQALDRLTNEPVEPESEFVIKIQDINDNEPKFLDGPYTAGVPEMSPVGT ::::.: ::: :::.:: ::.:.:: :::..:.:::::: :.:: : :.::: : ::: CCDS10 DREERAQYTLMAQAVDRDTNRPLEPPSEFIVKVQDINDNPPEFLHETYHANVPERSNVGT 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 SVVQVTATDADDPTYGNSARVVYSILQGQPYFSVEPKTGVIKTALPNMDREAKDQYLLVI ::.::::.:::::::::::..:::::.:::::::: .::.:.:::::::::::..: .:: CCDS10 SVIQVTASDADDPTYGNSAKLVYSILEGQPYFSVEAQTGIIRTALPNMDREAKEEYHVVI 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB5 QAKDMVGQNGGLSGTTSVTVTLTDVNDNPPRFPRRSYQYNVPESLPVASVVARIKAADAD ::::: :. :::::::.::.::::::::::.::. ::..: :. . :.:.:: : : CCDS10 QAKDMGGHMGGLSGTTKVTITLTDVNDNPPKFPQSVYQMSVSEAAVPGEEVGRVKAKDPD 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB5 IGANAEMEYKIVDGDGLGIFKISVDKETQEGIITIQKELDFEAKTSYTLRIEAANKDADP :: :. . :.::::::. :.:..: :::::.: ..: .:::.: .:.:..:::: :: CCDS10 IGENGLVTYNIVDGDGMESFEITTDYETQEGVIKLKKPVDFETKRAYSLKVEAANVHIDP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB5 RFLSLGPFSDTTTVKIIVEDVDEPPVFSSPLYPMEVSEATQVGNIIGTVAAHDPDSSNSP .:.: :::.::.:::: :::.::::.: .: : ::.: . .:...: : :.:::..::: CCDS10 KFISNGPFKDTVTVKISVEDADEPPMFLAPSYIHEVQENAAAGTVVGRVHAKDPDAANSP 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB5 VRYSIDRNTDLERYFNIDANSGVITTAKSLDRETNAIHNITVLAMESQNPSQVGRGYVAI .::::::.:::.:.:.:. ..: : :.: :::: .: ::::.: : .: : .. ::: CCDS10 IRYSIDRHTDLDRFFTINPEDGFIKTTKPLDREETAWLNITVFAAEIHNRHQEAKVPVAI 420 430 440 450 460 470 480 490 500 510 520 pF1KB5 TILDINDNAPEFAMDYETTVCENAQ--P--GQVIQKISAVDKDEPSNGHQFYFSLTTDAT .::.:::::.:: :: .::. : : .: : ::: :::. .:: .: ::: . CCDS10 RVLDVNDNAPKFAAPYEGFICESDQTKPLSNQPIVTISADDKDDTANGPRFIFSLPPEII 480 490 500 510 520 530 530 540 550 560 570 580 pF1KB5 NNHNFSLKDNKDNTASILTRRNGFRRQEQSVYYLPIFIVDSGSPSLSSTSTLTIRVCDCD .: ::...::.::::.. .::.:: ::.:..: ::: : :.: : .:::.::::.:: :: CCDS10 HNPNFTVRDNRDNTAGVYARRGGFSRQKQDLYLLPIVISDGGIPPMSSTNTLTIKVCGCD 540 550 560 570 580 590 590 600 610 620 630 640 pF1KB5 ADGVAQTCNAEAYVLPAGLSTGALIAILACVLTLLVLILLIVTMRRRKKEPLIFDEERDI ..:. .::::::.: ::::::::::::::.. :::...:.::.::.:::::: ::.:. CCDS10 VNGALLSCNAEAYILNAGLSTGALIAILACIVILLVIVVLFVTLRRQKKEPLIVFEEEDV 600 610 620 630 640 650 650 660 670 680 690 700 pF1KB5 RENIVRYDDEGGGEEDTEAFDMAALRNLNVIRDTKTRRDVTPEIQFLSRPAFKSIPDNVI ::::. :::::::::::::::.:.:.: . : :.:. :: :.. ::... :..: CCDS10 RENIITYDDEGGGEEDTEAFDIATLQNPDGINGFIPRKDIKPEYQYMPRPGLRPAPNSVD 660 670 680 690 700 710 710 720 730 740 750 760 pF1KB5 FREFIWERLKEADVDPGAPPYDSLQTYAFEGNGSVAESLSSLDSISSNSDQNYDYLSDWG .:: :..::: :: ::::::.: :..:: :::: :::::.: ...:: .::::..:: CCDS10 VDDFINTRIQEADNDPTAPPYDSIQIYGYEGRGSVAGSLSSLESATTDSDLDYDYLQNWG 720 730 740 750 760 770 770 780 pF1KB5 PRFKRLADMYGTGQESLYS ::::.:::.::. CCDS10 PRFKKLADLYGSKDTFDDDS 780 790 785 residues in 1 query sequences 18921897 residues in 33420 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Aug 1 17:01:10 2019 done: Thu Aug 1 17:01:11 2019 Total Scan time: 1.720 Total Display time: 0.170 Function used was FASTA [36.3.4 Apr, 2011]