FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1775, 859 aa 1>>>pF1KA1775 859 - 859 aa - 859 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.2852+/-0.0011; mu= 3.2893+/- 0.067 mean_var=205.1716+/-41.152, 0's: 0 Z-trim(110.4): 189 B-trim: 0 in 0/54 Lambda= 0.089540 statistics sampled from 11364 (11555) to 11364 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.677), E-opt: 0.2 (0.355), width: 16 Scan time: 3.790 The best scores are: opt bits E(32554) CCDS7372.1 CDHR1 gene_id:92211|Hs108|chr10 ( 859) 5629 740.4 3.1e-213 CCDS53548.1 CDHR1 gene_id:92211|Hs108|chr10 ( 745) 4450 588.1 1.9e-167 CCDS81473.1 CDH23 gene_id:64072|Hs108|chr10 (1061) 732 107.9 9.8e-23 CCDS81472.1 CDH23 gene_id:64072|Hs108|chr10 (1381) 732 108.0 1.2e-22 CCDS44429.1 CDH23 gene_id:64072|Hs108|chr10 ( 530) 720 106.2 1.6e-22 CCDS7771.1 DCHS1 gene_id:8642|Hs108|chr11 (3298) 705 104.7 2.8e-21 CCDS33971.1 PCDH7 gene_id:5099|Hs108|chr4 (1069) 529 81.7 7.7e-15 CCDS75116.1 PCDH7 gene_id:5099|Hs108|chr4 (1072) 529 81.7 7.7e-15 CCDS3785.1 DCHS2 gene_id:54798|Hs108|chr4 (2916) 517 80.4 5.2e-14 CCDS14076.1 CELSR1 gene_id:9620|Hs108|chr22 (3014) 501 78.3 2.2e-13 CCDS81993.1 CDH11 gene_id:1009|Hs108|chr16 ( 693) 480 75.2 4.3e-13 CCDS10803.1 CDH11 gene_id:1009|Hs108|chr16 ( 796) 480 75.3 4.9e-13 CCDS796.1 CELSR2 gene_id:1952|Hs108|chr1 (2923) 481 75.7 1.3e-12 CCDS34297.1 CDHR2 gene_id:54825|Hs108|chr5 (1310) 466 73.6 2.6e-12 CCDS10802.1 CDH8 gene_id:1006|Hs108|chr16 ( 799) 458 72.4 3.5e-12 CCDS3732.3 FAT4 gene_id:79633|Hs108|chr4 (4981) 471 74.6 5e-12 CCDS9586.1 CDH24 gene_id:64403|Hs108|chr14 ( 781) 446 70.9 1e-11 CCDS2775.1 CELSR3 gene_id:1951|Hs108|chr3 (3312) 459 72.9 1e-11 CCDS75336.1 PCDHGA7 gene_id:56108|Hs108|chr5 ( 817) 445 70.8 1.1e-11 CCDS3894.1 CDH6 gene_id:1004|Hs108|chr5 ( 790) 444 70.6 1.2e-11 CCDS54927.1 PCDHGA7 gene_id:56108|Hs108|chr5 ( 932) 445 70.8 1.3e-11 CCDS75329.1 PCDHGA3 gene_id:56112|Hs108|chr5 ( 829) 440 70.1 1.8e-11 CCDS81992.1 CDH11 gene_id:1009|Hs108|chr16 ( 670) 437 69.7 2e-11 CCDS47290.1 PCDHGA3 gene_id:56112|Hs108|chr5 ( 932) 440 70.2 2e-11 CCDS54918.1 PCDHA7 gene_id:56141|Hs108|chr5 ( 937) 432 69.1 4.1e-11 >>CCDS7372.1 CDHR1 gene_id:92211|Hs108|chr10 (859 aa) initn: 5629 init1: 5629 opt: 5629 Z-score: 3941.8 bits: 740.4 E(32554): 3.1e-213 Smith-Waterman score: 5629; 100.0% identity (100.0% similar) in 859 aa overlap (1-859:1-859) 10 20 30 40 50 60 pF1KA1 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVGSHVYTLNGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVGSHVYTLNGT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 DPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLNLVAEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 DPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLNLVAEK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 VVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQNLHSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 VVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQNLHSP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 FAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVNVEDVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 FAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVNVEDVQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 DMAPVFVGTPYYGYVYEDTLPGSEVLKVVAMDGDRGKPNRILYSLVNGNDGAFEINETSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 DMAPVFVGTPYYGYVYEDTLPGSEVLKVVAMDGDRGKPNRILYSLVNGNDGAFEINETSG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 AISITQSPAQLQREVYELHVQVTEMSPAGSPAAQATVPVTIRIVDLNNHPPTFYGESGPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 AISITQSPAQLQREVYELHVQVTEMSPAGSPAAQATVPVTIRIVDLNNHPPTFYGESGPQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 NRFELSMNEHPPQGEILRGLKITVNDSDQGANAKFNLQLVGPRGIFRVVPQTVLNEAQVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 NRFELSMNEHPPQGEILRGLKITVNDSDQGANAKFNLQLVGPRGIFRVVPQTVLNEAQVT 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 IIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDTNDNVPKFDSLYYVAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 IIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDTNDNVPKFDSLYYVAR 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 IPENAPGGSSVVAVTAVDPDTGPWGEVKYSTYGTGADLFLIHPSTGLIYTQPWASLDAEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 IPENAPGGSSVVAVTAVDPDTGPWGEVKYSTYGTGADLFLIHPSTGLIYTQPWASLDAEA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 TARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGKSVQKKTMVLGTPVKIEAIDEDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 TARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGKSVQKKTMVLGTPVKIEAIDEDA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 EEPNNLVDYSITHAEPANVFDINSHTGEIWLKNSIRSLDALHNITPGRDCLWSLEVQAKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 EEPNNLVDYSITHAEPANVFDINSHTGEIWLKNSIRSLDALHNITPGRDCLWSLEVQAKD 610 620 630 640 650 660 670 680 690 700 710 720 pF1KA1 RGSPSFSTTALLKIDITDAETLSRSPMAAFLIQTKDNPMKAVGVLAGTMATVVAITVLIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 RGSPSFSTTALLKIDITDAETLSRSPMAAFLIQTKDNPMKAVGVLAGTMATVVAITVLIS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KA1 TATFWRNKKSNKVLPMRRVLRKRPSPAPRTIRIEWLKSKSTKAATKFMLKEKPPNENCNN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 TATFWRNKKSNKVLPMRRVLRKRPSPAPRTIRIEWLKSKSTKAATKFMLKEKPPNENCNN 730 740 750 760 770 780 790 800 810 820 830 840 pF1KA1 NSPESSLLPRAPALPPPPSVAPSTGAAQWTVPTVSGSLTPQPTQPPPKPKTMGSPVQSTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 NSPESSLLPRAPALPPPPSVAPSTGAAQWTVPTVSGSLTPQPTQPPPKPKTMGSPVQSTL 790 800 810 820 830 840 850 pF1KA1 ISELKQKFEKKSVHNKAYF ::::::::::::::::::: CCDS73 ISELKQKFEKKSVHNKAYF 850 >>CCDS53548.1 CDHR1 gene_id:92211|Hs108|chr10 (745 aa) initn: 4450 init1: 4450 opt: 4450 Z-score: 3119.6 bits: 588.1 E(32554): 1.9e-167 Smith-Waterman score: 4450; 100.0% identity (100.0% similar) in 680 aa overlap (1-680:1-680) 10 20 30 40 50 60 pF1KA1 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVGSHVYTLNGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVGSHVYTLNGT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 DPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLNLVAEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 DPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLNLVAEK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 VVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQNLHSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 VVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQNLHSP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 FAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVNVEDVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 FAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVNVEDVQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 DMAPVFVGTPYYGYVYEDTLPGSEVLKVVAMDGDRGKPNRILYSLVNGNDGAFEINETSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 DMAPVFVGTPYYGYVYEDTLPGSEVLKVVAMDGDRGKPNRILYSLVNGNDGAFEINETSG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 AISITQSPAQLQREVYELHVQVTEMSPAGSPAAQATVPVTIRIVDLNNHPPTFYGESGPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 AISITQSPAQLQREVYELHVQVTEMSPAGSPAAQATVPVTIRIVDLNNHPPTFYGESGPQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 NRFELSMNEHPPQGEILRGLKITVNDSDQGANAKFNLQLVGPRGIFRVVPQTVLNEAQVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 NRFELSMNEHPPQGEILRGLKITVNDSDQGANAKFNLQLVGPRGIFRVVPQTVLNEAQVT 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 IIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDTNDNVPKFDSLYYVAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 IIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDTNDNVPKFDSLYYVAR 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 IPENAPGGSSVVAVTAVDPDTGPWGEVKYSTYGTGADLFLIHPSTGLIYTQPWASLDAEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 IPENAPGGSSVVAVTAVDPDTGPWGEVKYSTYGTGADLFLIHPSTGLIYTQPWASLDAEA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 TARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGKSVQKKTMVLGTPVKIEAIDEDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 TARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGKSVQKKTMVLGTPVKIEAIDEDA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 EEPNNLVDYSITHAEPANVFDINSHTGEIWLKNSIRSLDALHNITPGRDCLWSLEVQAKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 EEPNNLVDYSITHAEPANVFDINSHTGEIWLKNSIRSLDALHNITPGRDCLWSLEVQAKD 610 620 630 640 650 660 670 680 690 700 710 720 pF1KA1 RGSPSFSTTALLKIDITDAETLSRSPMAAFLIQTKDNPMKAVGVLAGTMATVVAITVLIS :::::::::::::::::::: CCDS53 RGSPSFSTTALLKIDITDAEVRRLRYMKNSNFPGTTKSVRKPKFKPKKPHSSQGLFLHPH 670 680 690 700 710 720 >>CCDS81473.1 CDH23 gene_id:64072|Hs108|chr10 (1061 aa) initn: 732 init1: 261 opt: 732 Z-score: 521.7 bits: 107.9 E(32554): 9.8e-23 Smith-Waterman score: 1062; 33.1% identity (61.1% similar) in 720 aa overlap (4-705:9-691) 10 20 30 40 50 pF1KA1 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVGSHVY :. : : : :. : .:.: : :: : .: . . ::::::: : CCDS81 MGRHVATSCHVAWL-LVLISGCWGQVNRLP-FFTNHFFDT-----YLLISEDTPVGSSVT 10 20 30 40 50 60 70 80 90 100 110 pF1KA1 TLNGTDPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLN : . : ..::. . .: . ..: :.:.: : . : . :::: ..:. . .:.:: . CCDS81 QLLAQDMDNDPLVFGVSGEEASR-FFAVEPDTGVVWLRQPLDRETKSEFTVEFSVSDHQG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KA1 LVAEKVVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQ ....:: : : :.::.:: : ..:: . .::. :.:. :: :.:.: : :.:::: : .: CCDS81 VITRKVNIQVGDVNDNAPTFHNQPYSVRIPENTPVGTPIFIVNATDPDLGAGGSVLYSFQ 120 130 140 150 160 170 180 190 200 210 220 230 pF1KA1 NLHSPFAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVN . ::.: :.. . :::: .... .:: : : . .:. ..... CCDS81 PPSQFFAIDSARGIVTVIR--ELDYETTQAYQLTVNATD-----QDKTRPLSTLANLAII 180 190 200 210 220 240 250 260 270 280 290 pF1KA1 VEDVQDMAPVFVGTPYYGYVYEDTLPGSEVLKVVAMDGDRGKPNRILYSLVNGN-DGAFE . ::::: :.:.. :: .:: . ::. : ..:.: :.:.: : :..:.:: .. : CCDS81 ITDVQDMDPIFINLPYSTNIYEHSPPGTTVRIITAIDQDKGRPRGIGYTIVSGNTNSIFA 230 240 250 260 270 280 300 310 320 330 340 350 pF1KA1 INETSGAISIT---QSPAQLQREVYELHVQVTEMSPAGSPA-AQATVPVTIRIVDLNNHP .. ::..... . : . . : :. ::.. .:. : .:. .: ..:.:.. CCDS81 LDYISGVLTLNGLLDRENPLYSHGFILTVKGTELNDDRTPSDATVTTTFNILVIDINDNA 290 300 310 320 330 340 360 370 380 390 400 pF1KA1 PTFYGESGPQNRFELSMNEHPPQGEILRGLKITVNDSDQ--GANAKFNLQLVGPRGI-FR : : .... ....: : : : : : :.:. : :. :.. ::: . : CCDS81 PEFN-----SSEYSVAITELAQVGFAL-PLFIQVVDKDENLGLNSMFEVYLVGNNSHHFI 350 360 370 380 390 410 420 430 440 450 460 pF1KA1 VVPQTVLNEAQVTIIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDTND . : .: ..:.. : : . .:.: : :.: : ..:.. . : : : :.. :: CCDS81 ISPTSVQGKADIRIRV--AIPLDYETVDRYDFDLFANE-SVPDHVGY-AKVKITLINEND 400 410 420 430 440 450 470 480 490 500 510 520 pF1KA1 NVPKFDSLYYVARIPENAPGGSSVVAVTAVDPDTGPWGEVKYSTYGTGADLFLIHPSTGL : : :.. : . ::. :.::..: :.: :.: .:::.: .. : : . .::: CCDS81 NRPIFSQPLYNISLYENVTVGTSVLTVLATDNDAGTFGEVSY-FFSDDPDRFSLDKDTGL 460 470 480 490 500 510 530 540 550 560 570 580 pF1KA1 IYTQPWASLDAEATARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGKSVQKKTMVL :. : :: : :... . :.: :. ....: :..:::::. : : :.. .. CCDS81 IMLI--ARLDYELIQRFTLTIIARDGGGEETTGRVRINVLDVNDNVPTFQKDAYVGALRE 520 530 540 550 560 570 590 600 610 620 630 640 pF1KA1 GTP-----VKIEAIDEDAEEPNNLVDYSITHAEP-ANVFDINSHTGEIWLKNSIRSLDAL . : :...: :::. ::: . :::. : .. :::. . : .. : : :: CCDS81 NEPSVTQLVRLRATDEDSP-PNNQITYSIVSASAFGSYFDISLYEGYGVISVS-RPLD-Y 580 590 600 610 620 650 660 670 680 690 pF1KA1 HNITPGRDCLWSLEVQAKDRGSPSFSTTALLKIDITDAE----TLSRSPMAAFLIQTKDN ..:. : : : :.: : :.: ...:. . :.. : . :.:. : :..... .: CCDS81 EQISNG---LIYLTVMAMDAGNPPLNSTVPVTIEVFDENDNPPTFSK-P--AYFVSVVEN 630 640 650 660 670 680 700 710 720 730 740 750 pF1KA1 PMKAVGVLAGTMATVVAITVLISTATFWRNKKSNKVLPMRRVLRKRPSPAPRTIRIEWLK : .. :: CCDS81 IMAGATVLFLNATDLDRSREYGQESIIYSLEGSTQFRINARSGEITTTSLLDRETKSEYI 690 700 710 720 730 740 >>CCDS81472.1 CDH23 gene_id:64072|Hs108|chr10 (1381 aa) initn: 732 init1: 261 opt: 732 Z-score: 519.9 bits: 108.0 E(32554): 1.2e-22 Smith-Waterman score: 1062; 33.1% identity (61.1% similar) in 720 aa overlap (4-705:9-691) 10 20 30 40 50 pF1KA1 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVGSHVY :. : : : :. : .:.: : :: : .: . . ::::::: : CCDS81 MGRHVATSCHVAWL-LVLISGCWGQVNRLP-FFTNHFFDT-----YLLISEDTPVGSSVT 10 20 30 40 50 60 70 80 90 100 110 pF1KA1 TLNGTDPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLN : . : ..::. . .: . ..: :.:.: : . : . :::: ..:. . .:.:: . CCDS81 QLLAQDMDNDPLVFGVSGEEASR-FFAVEPDTGVVWLRQPLDRETKSEFTVEFSVSDHQG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KA1 LVAEKVVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQ ....:: : : :.::.:: : ..:: . .::. :.:. :: :.:.: : :.:::: : .: CCDS81 VITRKVNIQVGDVNDNAPTFHNQPYSVRIPENTPVGTPIFIVNATDPDLGAGGSVLYSFQ 120 130 140 150 160 170 180 190 200 210 220 230 pF1KA1 NLHSPFAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVN . ::.: :.. . :::: .... .:: : : . .:. ..... CCDS81 PPSQFFAIDSARGIVTVIR--ELDYETTQAYQLTVNATD-----QDKTRPLSTLANLAII 180 190 200 210 220 240 250 260 270 280 290 pF1KA1 VEDVQDMAPVFVGTPYYGYVYEDTLPGSEVLKVVAMDGDRGKPNRILYSLVNGN-DGAFE . ::::: :.:.. :: .:: . ::. : ..:.: :.:.: : :..:.:: .. : CCDS81 ITDVQDMDPIFINLPYSTNIYEHSPPGTTVRIITAIDQDKGRPRGIGYTIVSGNTNSIFA 230 240 250 260 270 280 300 310 320 330 340 350 pF1KA1 INETSGAISIT---QSPAQLQREVYELHVQVTEMSPAGSPA-AQATVPVTIRIVDLNNHP .. ::..... . : . . : :. ::.. .:. : .:. .: ..:.:.. CCDS81 LDYISGVLTLNGLLDRENPLYSHGFILTVKGTELNDDRTPSDATVTTTFNILVIDINDNA 290 300 310 320 330 340 360 370 380 390 400 pF1KA1 PTFYGESGPQNRFELSMNEHPPQGEILRGLKITVNDSDQ--GANAKFNLQLVGPRGI-FR : : .... ....: : : : : : :.:. : :. :.. ::: . : CCDS81 PEFN-----SSEYSVAITELAQVGFAL-PLFIQVVDKDENLGLNSMFEVYLVGNNSHHFI 350 360 370 380 390 410 420 430 440 450 460 pF1KA1 VVPQTVLNEAQVTIIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDTND . : .: ..:.. : : . .:.: : :.: : ..:.. . : : : :.. :: CCDS81 ISPTSVQGKADIRIRV--AIPLDYETVDRYDFDLFANE-SVPDHVGY-AKVKITLINEND 400 410 420 430 440 450 470 480 490 500 510 520 pF1KA1 NVPKFDSLYYVARIPENAPGGSSVVAVTAVDPDTGPWGEVKYSTYGTGADLFLIHPSTGL : : :.. : . ::. :.::..: :.: :.: .:::.: .. : : . .::: CCDS81 NRPIFSQPLYNISLYENVTVGTSVLTVLATDNDAGTFGEVSY-FFSDDPDRFSLDKDTGL 460 470 480 490 500 510 530 540 550 560 570 580 pF1KA1 IYTQPWASLDAEATARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGKSVQKKTMVL :. : :: : :... . :.: :. ....: :..:::::. : : :.. .. CCDS81 IMLI--ARLDYELIQRFTLTIIARDGGGEETTGRVRINVLDVNDNVPTFQKDAYVGALRE 520 530 540 550 560 570 590 600 610 620 630 640 pF1KA1 GTP-----VKIEAIDEDAEEPNNLVDYSITHAEP-ANVFDINSHTGEIWLKNSIRSLDAL . : :...: :::. ::: . :::. : .. :::. . : .. : : :: CCDS81 NEPSVTQLVRLRATDEDSP-PNNQITYSIVSASAFGSYFDISLYEGYGVISVS-RPLD-Y 580 590 600 610 620 650 660 670 680 690 pF1KA1 HNITPGRDCLWSLEVQAKDRGSPSFSTTALLKIDITDAE----TLSRSPMAAFLIQTKDN ..:. : : : :.: : :.: ...:. . :.. : . :.:. : :..... .: CCDS81 EQISNG---LIYLTVMAMDAGNPPLNSTVPVTIEVFDENDNPPTFSK-P--AYFVSVVEN 630 640 650 660 670 680 700 710 720 730 740 750 pF1KA1 PMKAVGVLAGTMATVVAITVLISTATFWRNKKSNKVLPMRRVLRKRPSPAPRTIRIEWLK : .. :: CCDS81 IMAGATVLFLNATDLDRSREYGQESIIYSLEGSTQFRINARSGEITTTSLLDRETKSEYI 690 700 710 720 730 740 >-- initn: 291 init1: 153 opt: 659 Z-score: 469.0 bits: 98.5 E(32554): 8.4e-20 Smith-Waterman score: 662; 27.6% identity (55.6% similar) in 691 aa overlap (72-733:712-1364) 50 60 70 80 90 100 pF1KA1 FSLPEDTPVGSHVYTLNGTDPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDRERE :.. ::. : .. :.:: . :::: . CCDS81 ENIMAGATVLFLNATDLDRSREYGQESIIYSLEGSTQ--FRINARSGEITTTSLLDRETK 690 700 710 720 730 110 120 130 140 150 pF1KA1 DEIEAIISISDGLNLVAEK-----VVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFK .: :. :: .: : : . : ::. : . . :: . : : : . CCDS81 SEYILIVRAVDGGVGHNQKTGIATVNITLLDINDNHPTWKDAPYYINLVEMTPPDSDVTT 740 750 760 770 780 790 160 170 180 190 200 210 pF1KA1 VHAVDRDTGSGGSVTYFLQNLHSPFAVDRHSGVLRLQAGATLDYERSRTHYIT-----VV : ::: : : .:...: .: .. .... .: .: . : :: : : :: CCDS81 VVAVDPDLGENGTLVYSIQPPNKFYSLNSTTGKIRT-THAMLDRENPDPHEAELMRKIVV 800 810 820 830 840 850 220 230 240 250 260 270 pF1KA1 AKDGGGRLHGADVVFSATTTVTVNVEDVQDMAPVFVGTPYYGYVYEDTLPGSEVLKVVAM . :: . ....:: ::. :..: :.: . :. . : : : . .:::. CCDS81 SVTDCGR---PPLKATSSATVFVNLLDLNDNDPTFQNLPFVAEVLEGIPAGVSIYQVVAI 860 870 880 890 900 910 280 290 300 310 320 pF1KA1 DGDRGKPNRILYSLVNGNDGA-FEINETSGAISITQSPAQLQRE-VYELHVQVTEMSPAG : :.: . . : . : : :: .::.. : ..:.:: . : ...:. : :: CCDS81 DLDEGLNGLVSYRMPVGMPRMDFLINSSSGVVVTT---TELDRERIAEYQLRVVA-SDAG 920 930 940 950 960 970 330 340 350 360 370 380 pF1KA1 SPAAQATVPVTIRIVDLNNHPPTFYGESGPQNRFELSMNEHPPQGEILRGLKITVNDSDQ .:. ..: .::...:.:.. :::. : ...:..: :. .: . .. .:.: CCDS81 TPTKSSTSTLTIHVLDVNDETPTFF----PAV-YNVSVSEDVPRE--FRVVWLNCTDNDV 980 990 1000 1010 1020 390 400 410 420 430 440 pF1KA1 GANAKFNLQLVGPR--GIFRVVPQTVLNEAQVTIIVENSAAIDFEKSKVLTFKLLAVEVN : ::... ..: : : : . .:.. ...: : . . . : :.. : CCDS81 GLNAELSYFITGGNVDGKFSV--------GYRDAVVRTVVGLDRETTAAYMLILEAID-N 1030 1040 1050 1060 1070 450 460 470 480 490 500 pF1KA1 TP--EKFSSTADVVIQLLDTNDNVPKFDSLYYVARIPENAPGGSSVVAVTAVDPDTGPWG : .. ..:: : . .::.::: : : . : : .::. : : :.. . :.: : : .: CCDS81 GPVGKRHTGTATVFVTVLDVNDNRPIFLQSSYEASVPEDIPEGHSILQLKATDADEGEFG 1080 1090 1100 1110 1120 1130 510 520 530 540 550 560 pF1KA1 EVKYST-YGTGADLFLIHPSTGLIYTQPWASLDAEATARYNFYVKA--EDMEGKYSVAEV .: : .:. .. : :: :.::.. : :: : .. . . :.: .:. : ..: CCDS81 RVWYRILHGNHGNNFRIHVSNGLLMRGP-RPLDRERNSSHVLIVEAYNHDLGPMRSSVRV 1140 1150 1160 1170 1180 1190 570 580 590 600 610 pF1KA1 FITLLDVNDHPP-----QFGKSVQKKTMVLGTPVKI-EAIDEDAEEPNNLVDYSITHAEP .. . :.::. : :... ..: .:: : . .: :.:. . ..::.: : . CCDS81 IVYVEDINDEAPVFTQQQYSRLGLRETAGIGTSVIVVQATDRDSGD-GGLVNYRILSGAE 1200 1210 1220 1230 1240 1250 620 630 640 650 660 670 pF1KA1 ANVFDINSHTGEIWLKNSIRSLDALHNITPGRDCLWSLEVQAKDRGSP---SFSTTAL-L .. :.:. :: : .. :: . . . ..:.: :.. : .: .. . : CCDS81 GK-FEIDESTGLII---TVNYLDYETKTS------YMMNVSATDQAPPFNQGFCSVYITL 1260 1270 1280 1290 1300 680 690 700 710 720 730 pF1KA1 KIDITDAETLSRSPMAAFLIQTKDNPMKAVGVLAGTMATVVAITVLISTATFWRNKKSNK .. .: .: . . : .... . : : : .. .. :: ... : . : : CCDS81 LNELDEAVQFSNASYEAAILENLALGTEIVRVQAYSIDNLNQITYRFNAYTSTQAKALFK 1310 1320 1330 1340 1350 1360 740 750 760 770 780 790 pF1KA1 VLPMRRVLRKRPSPAPRTIRIEWLKSKSTKAATKFMLKEKPPNENCNNNSPESSLLPRAP . CCDS81 IDAITVRGWGQGAPFLPI 1370 1380 >>CCDS44429.1 CDH23 gene_id:64072|Hs108|chr10 (530 aa) initn: 516 init1: 261 opt: 720 Z-score: 517.8 bits: 106.2 E(32554): 1.6e-22 Smith-Waterman score: 789; 33.1% identity (61.0% similar) in 510 aa overlap (4-503:9-492) 10 20 30 40 50 pF1KA1 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVGSHVY :. : : : :. : .:.: : :: : .: . . ::::::: : CCDS44 MGRHVATSCHVAWL-LVLISGCWGQVNRLP-FFTNHFFDT-----YLLISEDTPVGSSVT 10 20 30 40 50 60 70 80 90 100 110 pF1KA1 TLNGTDPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLN : . : ..::. . .: . ..: :.:.: : . : . :::: ..:. . .:.:: . CCDS44 QLLAQDMDNDPLVFGVSGEEASR-FFAVEPDTGVVWLRQPLDRETKSEFTVEFSVSDHQG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KA1 LVAEKVVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQ ....:: : : :.::.:: : ..:: . .::. :.:. :: :.:.: : :.:::: : .: CCDS44 VITRKVNIQVGDVNDNAPTFHNQPYSVRIPENTPVGTPIFIVNATDPDLGAGGSVLYSFQ 120 130 140 150 160 170 180 190 200 210 220 230 pF1KA1 NLHSPFAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVN . ::.: :.. . :::: .... .:: : : . .:. ..... CCDS44 PPSQFFAIDSARGIVTVI--RELDYETTQAYQLTVNATD-----QDKTRPLSTLANLAII 180 190 200 210 220 240 250 260 270 280 290 pF1KA1 VEDVQDMAPVFVGTPYYGYVYEDTLPGSEVLKVVAMDGDRGKPNRILYSLVNGN-DGAFE . ::::: :.:.. :: .:: . ::. : ..:.: :.:.: : :..:.:: .. : CCDS44 ITDVQDMDPIFINLPYSTNIYEHSPPGTTVRIITAIDQDKGRPRGIGYTIVSGNTNSIFA 230 240 250 260 270 280 300 310 320 330 340 350 pF1KA1 INETSGAISIT---QSPAQLQREVYELHVQVTEMSPAGSPA-AQATVPVTIRIVDLNNHP .. ::..... . : . . : :. ::.. .:. : .:. .: ..:.:.. CCDS44 LDYISGVLTLNGLLDRENPLYSHGFILTVKGTELNDDRTPSDATVTTTFNILVIDINDNA 290 300 310 320 330 340 360 370 380 390 400 pF1KA1 PTFYGESGPQNRFELSMNEHPPQGEILRGLKITVNDSDQ--GANAKFNLQLVGPRGI-FR : : . ... ....: : : : : : :.:. : :. :.. ::: . : CCDS44 PEFNS-----SEYSVAITELAQVGFAL-PLFIQVVDKDENLGLNSMFEVYLVGNNSHHFI 350 360 370 380 390 410 420 430 440 450 460 pF1KA1 VVPQTVLNEAQVTIIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDTND . : .: ..:.. : : . .:.: : :.: : ..:.. . : : : :.. :: CCDS44 ISPTSVQGKADIRIRV--AIPLDYETVDRYDFDLFANE-SVPDHVGY-AKVKITLINEND 400 410 420 430 440 450 470 480 490 500 510 520 pF1KA1 NVPKFDSLYYVARIPENAPGGSSVVAVTAVDP--DTGPWGEVKYSTYGTGADLFLIHPST : : :.. : . ::. :.::..: :.: .:: CCDS44 NRPIFSQPLYNISLYENVTVGTSVLTVL-VSPRFTAGPLSSPGPTVVRHPEGFCPRDLSN 460 470 480 490 500 510 530 540 550 560 570 580 pF1KA1 GLIYTQPWASLDAEATARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGKSVQKKTM CCDS44 QGRRHPQIPELCLLVY 520 530 >>CCDS7771.1 DCHS1 gene_id:8642|Hs108|chr11 (3298 aa) initn: 441 init1: 276 opt: 705 Z-score: 495.5 bits: 104.7 E(32554): 2.8e-21 Smith-Waterman score: 715; 27.8% identity (57.1% similar) in 753 aa overlap (46-748:2287-2998) 20 30 40 50 60 70 pF1KA1 LCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVGSHVYTLNGTDPEGDPISYHISFDP ::. .::.. ..:.: .. :. ... ..: CCDS77 LVGSATLTVMVIDTNDNRPTIPQPWELRVSEDALLGSEIAQVTGNDVDSGPVLWYV-LSP 2260 2270 2280 2290 2300 2310 80 90 100 110 120 130 pF1KA1 S-TRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLNLVAEKVVILVTDANDEAPR : .. ::: : ..:. :: :. :. . . :: . ....:: :.::.:: CCDS77 SGPQDPFSVGRYGGRVSLTGPLDFEQCDRYQLQLLAHDGPHEGRANLTVLVEDVNDNAPA 2320 2330 2340 2350 2360 2370 140 150 160 170 180 190 pF1KA1 FIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQNLHSPFAVDRHSGVLRLQA : : : ... : : :: :..: :.:::.:..: ..: : . . :.:: ..:.: . CCDS77 FSQSLYQVMLLEHTPPGSAILSVSATDRDSGANGHISYHLASPADGFSVDPNNGTLFTIV 2380 2390 2400 2410 2420 2430 200 210 220 230 240 250 pF1KA1 GAT-LDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVNVEDVQDMAPVFVGTPYYG :.. : .. : . ... :.: ::: .: .:: :...: .: :: :. . : CCDS77 GTVALGHDGSGAVDVVLEARD-----HGAPGR-AARATVHVQLQDQNDHAPSFTLSHYRV 2440 2450 2460 2470 2480 260 270 280 290 300 pF1KA1 YVYEDTLPGSEVLKVVAMDGDRGKPNRIL-YSLVNGNDG-AF-------EINETSG---- : :: ::: .: . : :.: .. . . ::...:: : .: : .:..: CCDS77 AVTEDLPPGSTLLTLEATDADGSRSHAAVDYSIISGNWGRVFQLEPRLAEAGESAGPGPR 2490 2500 2510 2520 2530 2540 310 320 330 340 350 360 pF1KA1 AISITQSPAQLQREVYELHVQVTEMSPAGSPAAQATVPVTIRIVDLNNHPPTFYGESGPQ :.. :. : . .. . :.: ...::::. ..:.:..::.: : CCDS77 ALGCLVLLEPLDFESLTQYNLTVAAADRGQPPQSSVVPVTVTVLDVNDNPPVFTRAS--- 2550 2560 2570 2580 2590 2600 370 380 390 400 410 pF1KA1 NRFELSMNEHPPQGEILRGLKITVNDSDQGANA--KFNLQLVGPRGIFRVVPQTVLNEAQ ..... : : : : :.. ..:.: : .. .:... : :.:. :.:.. CCDS77 --YRVTVPEDTPVGAEL--LHVEASDADPGPHGLVRFTVSSGDPSGLFE------LDESS 2610 2620 2630 2640 2650 420 430 440 450 460 470 pF1KA1 VTIIVENSAAIDFEKSKVLTFKLLAVEVNTPE-KFSSTADVVIQLLDTNDNVPKFDSLYY :. . . :.: : . . . :.:.. : . : :.:.. :.::. : : CCDS77 GTLRLAH--ALDCETQ---ARHQLVVQAADPAGAHFALAPVTIEVQDVNDHGPAFPLNLL 2660 2670 2680 2690 2700 2710 480 490 500 510 520 530 pF1KA1 VARIPENAPGGSSVVAVTAVDPDTGPWGEVKYSTY--GTGAD---LFLIHPSTGLIYTQP . . :: : :. :... :.: :.: .:...:: : : . : .. ::: . .. CCDS77 STSVAENQPPGTLVTTLHAIDGDAGAFGRLRYSLLEAGPGPEGREAFALNSSTGELRAR- 2720 2730 2740 2750 2760 2770 540 550 560 570 580 pF1KA1 WASLDAEATARYNFYVKAEDMEGKYSVA---EVFITLLDVNDH---PPQFGKSVQKKTMV . .: : : . . : : : :. :.. :..: : : : : .: . . CCDS77 -VPFDYEHTESFRLLVGAADA-GNLSASVTVSVLVTGEDEYDPVFLAPAFHFQVPEGARR 2780 2790 2800 2810 2820 590 600 610 620 630 640 pF1KA1 LGTPVKIEAIDEDAEEPNNLVDYSITHAEPANVFDINSHTGEIWLKNSIRSLDALHNITP . ...: :::. ..:: ::.. . : : ::. :: ..:. . :. . . CCDS77 GHSLGHVQATDEDGGA-DGLVLYSLATSSP--YFGINQTTGALYLRVDSRAPGSGTATSG 2830 2840 2850 2860 2870 2880 650 660 670 680 690 pF1KA1 G-----RDCLWSLEVQAKDRGS-P-SFSTTALLKIDITDAETLSRSPMAAFLIQTKDNPM : :. :.... :: : : :.:. . .::: . .:. .: .:. CCDS77 GGGRTRREAPRELRLEVIARGPLPGSRSATVPVTVDITHT-ALGLAPDLNLLL------- 2890 2900 2910 2920 2930 700 710 720 730 740 pF1KA1 KAVGVLAGTMATVV--AITVLISTATFWRNKKS-------NKVLPM-----RRVLRKRPS ::..:.....:: :...:. . :..:. ... :. ... :. :: CCDS77 --VGAVAASLGVVVVLALAALVLGLVRARSRKAEAAPGPMSQAAPLASDSLQKLGREPPS 2940 2950 2960 2970 2980 2990 750 760 770 780 790 800 pF1KA1 PAPRTIRIEWLKSKSTKAATKFMLKEKPPNENCNNNSPESSLLPRAPALPPPPSVAPSTG : : CCDS77 PPPSEHLYHQTLPSYGGPGAGGPYPRGGSLDPSHSSGRGSAEAAEDDEIRMINEFPRVAS 3000 3010 3020 3030 3040 3050 >-- initn: 423 init1: 173 opt: 620 Z-score: 436.1 bits: 93.7 E(32554): 5.7e-18 Smith-Waterman score: 688; 29.7% identity (56.5% similar) in 644 aa overlap (66-678:75-677) 40 50 60 70 80 90 pF1KA1 NGNMALFSLPEDTPVGSHVYTLNGTDPEGDPISYHISFDPSTR--SVFSVDPTFGNITLV :. : :: . .. . ...: : . . CCDS77 GSLDLQIDEEQPAGTLIGDISAGLPAGTAAPLMYFISAQEGSGVGTDLAIDEHSGVVRTA 50 60 70 80 90 100 100 110 120 130 140 150 pF1KA1 EELDREREDEIEAIISISDGLNLVAEKVVILVTDANDEAPRFIQEPYVALVPEDIPAGSI . ::::..:. . :: .. .:.. :.: ::.:: : : . ::: :. CCDS77 RVLDREQRDRYRFTAVTPDGATV---EVTVRVADINDHAPAFPQARAALQVPEHTAFGTR 110 120 130 140 150 160 160 170 180 190 200 pF1KA1 IFKVHAVDRDTGSGGSVTYFLQNLHS--PFAVDRHSG-----VLRLQAGATLDYERSRTH : : :.: :. : :.. . : .. . : : .: . . :: : .:.: CCDS77 YPLEPARDADAGRLGTQGYALSGDGAGETFRLETRPGPDGTPVPELVVTGELDRE-NRSH 170 180 190 200 210 220 210 220 230 240 250 260 pF1KA1 YITVV-AKDGGGRLHGADVVFSATTTVTVNVEDVQDMAPVFVGTPYYGYVYEDTLPGSEV :. . : :::. . :......: :..: ::.: . :.. : :. ::: : CCDS77 YMLQLEAYDGGSPPRRAQALLDVTLL------DINDHAPAFNQSRYHAVVSESLAPGSPV 230 240 250 260 270 270 280 290 300 310 320 pF1KA1 LKVVAMDGDRGKPNRILYSLV---NGNDGAFEINETSGAISITQSPAQL-QREVYELHVQ :.: : :.: : . . : . . .:: : :. .: ... . : .. ::.:.:: :: CCDS77 LQVFASDADAGVNGAVTYEINRRQSEGDGPFSIDAHTGLLQL-ERPLDFEQRRVHELVVQ 280 290 300 310 320 330 330 340 350 360 370 pF1KA1 VTEMSPAGSPAAQATVPVTIRIVDLNNHPPT----FYGESG-PQNRFELSMNEHPPQGEI . . .:. ... ::... : :.. :. : . .: :: ..: : :.. CCDS77 ARD---GGAHPELGSAFVTVHVRDANDNQPSMTVIFLSADGSPQ------VSEAAPPGQL 340 350 360 370 380 380 390 400 410 420 430 pF1KA1 LRGLKITVNDSDQGANAKFNLQLVGPRGIFRVVPQTVLNEAQVTIIVENSAAIDFEKSKV . .:.:.: :.: :. :..: : .: : . : .: .: . .: :. . CCDS77 VA--RISVSDPDDGDFAHVNVSLEGGEGHFALSTQD-----SVIYLVCVARRLDREERDA 390 400 410 420 430 440 450 460 470 480 490 pF1KA1 LTFKLLAVEVNTPEKFSSTADVVIQLLDTNDNVPKFD-SLYYVARIPENAPGGSSVVAVT .... :.. ..: . . : :... :.:::.: :: .:: .:: : :: :: :: CCDS77 YNLRVTATDSGSPP-LRAEAAFVLHVTDVNDNAPAFDRQLYRPEPLPEVALPGSFVVRVT 440 450 460 470 480 490 500 510 520 530 540 550 pF1KA1 AVDPDTGPWGEVKYSTY-GTGADLFLIHPSTGLIYTQPWASLDAEATARYNFYVKAED-- : ::: : :.: :: :. . : : :..:.: : :::: : . .. : : : CCDS77 ARDPDQGTNGQVTYSLAPGAHTHWFSIDPTSGIITTA--ASLDYELEPQPQLIVVATDGG 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 MEGKYSVAEVFITLLDVNDHPPQFGKSVQKKTMVLGT-P----VKIEAIDEDAEEPNNLV . : : : ..: ::::. ::: .. . .. :: : ... : : :. : .:. CCDS77 LPPLASSATVSVALQDVNDNEPQFQRTFYNASLPEGTQPGTCFLQVTATDADSG-PFGLL 560 570 580 590 600 610 610 620 630 640 650 660 pF1KA1 DYSI---THAEPANVFDINSHTGEIWLKNSIRSLDALHNITPGRDCLWSLEVQAKDRGSP .::. . . : :..:.:.. . :.:: .. :. ... : : : :. CCDS77 SYSLGAGLGSSGSPPFRIDAHSGDV---CTTRTLD--RDQGPSS---FDFTVTAVDGGG- 620 630 640 650 660 670 680 690 700 710 720 pF1KA1 SFSTTALLKIDITDAETLSRSPMAAFLIQTKDNPMKAVGVLAGTMATVVAITVLISTATF ... . .:. ..: CCDS77 -LKSMVYVKVFLSDENDNPPQFYPREYAASISAQSPPGTAVLRLRAHDPDQGSHGRLSYH 670 680 690 700 710 720 >>CCDS33971.1 PCDH7 gene_id:5099|Hs108|chr4 (1069 aa) initn: 294 init1: 191 opt: 529 Z-score: 379.9 bits: 81.7 E(32554): 7.7e-15 Smith-Waterman score: 573; 26.2% identity (55.5% similar) in 762 aa overlap (21-731:201-910) 10 20 30 40 50 pF1KA1 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPV :. ::. .: :...:. . . :. CCDS33 DFGRNGIERYELLQEPGGGGSGGESRRAGAADSAPYPGGGGNGASGGGSGGSKRRLDASE 180 190 200 210 220 230 60 70 80 90 100 110 pF1KA1 GSHVYTLNGTDPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISI :. .::.: : .... . . .: .. . ::::..: : . . CCDS33 GG-----GGTNPGGRSSVFELQVADTPDG--EKQP---QLIVKGALDREQRDSYELTLRV 240 250 260 270 280 120 130 140 150 160 pF1KA1 SDGLN--LVAEKVV-ILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSG :: . .. .. .:.::.::..::: . : : . :. :. :....:.: :.: . CCDS33 RDGGDPPRSSQAILRVLITDVNDNSPRFEKSVYEADLAENSAPGTPILQLRAADLDVGVN 290 300 310 320 330 340 170 180 190 200 210 220 pF1KA1 GSVTYFL----QNLHSPFAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGAD :.. : . .... . .:. :: : . .: :. .::.:.: : . .: CCDS33 GQIEYVFGAATESVRRLLRLDETSGWLSVLH--RIDREEVNQLRFTVMARDRG-QPPKTD 350 360 370 380 390 230 240 250 260 270 pF1KA1 VVFSATTTVTVNVEDVQDMAPVF----VGT-PY---YGYVYEDTLPGSEVLKVVAMDGDR .::..:..: .: .: . .: : . : ::.: . . : . : :. CCDS33 -----KATVVLNIKDENDNVPSIEIRKIGRIPLKDGVANVAEDVLVDTPIALVQVSDRDQ 400 410 420 430 440 450 280 290 300 310 320 pF1KA1 GKPNRILYSLVNGNDGAFEI---NETSGAIS----ITQSPAQLQREV-YELHVQVTEMSP :. : .. : : : :.. ..: : . . .. . :. :. :..: .. .. CCDS33 GE-NGVVTCTVVG-DVPFQLKPASDTEGDQNKKKYFLHTSTPLDYEATREFNVVIVAVD- 460 470 480 490 500 330 340 350 360 370 380 pF1KA1 AGSPAAQATVPVTIRIVDLNNHPPTFYGESGPQNRFELSMNEHPPQGEILRGLKITVNDS .:::. ... . ... : :..:: : : :. :. . :. :: : . ..:. CCDS33 SGSPSLSSNNSLIVKVGDTNDNPPMF----G-QSVVEVYFPENNIPGE--RVATVLATDA 510 520 530 540 550 560 390 400 410 420 430 440 pF1KA1 DQGANAKFNLQLVGP-RGIFRVVPQTVLNEAQVTIIVENSAAIDFEKSKVLTFKLLAVEV :.: ::.. .: . ::: . :.. :.: ....: :.. ::. : . CCDS33 DSGKNAEIAYSLDSSVMGIFAIDPDSG------DILV--NTVLDREQTDRYEFKVNAKDK 570 580 590 600 610 450 460 470 480 490 500 pF1KA1 NTPEKFSSTADVVIQLLDTNDNVPKFDSLYYVARIPENAPGGSSVVAVTAVDPDTGPWGE . : .::. :..:. : ::: ::: . .. . :: .: : ::..: : : .: CCDS33 GIPVLQGSTT-VIVQVADKNDNDPKFMQDVFTFYVKENLQPNSPVGMVTVMDADKGRNAE 620 630 640 650 660 670 510 520 530 540 550 560 pF1KA1 VKYSTY-GTGADLFLIHPSTGLIYTQPWASLDAEATARYNFYVKAEDM--EGKYSVAEVF . : : . ..: :. .:: ::. :.: : . :.: ::: : . ..: : CCDS33 M--SLYIEENNNIFSIENDTGTIYST--MSFDREHQTTYTFRVKAVDGGDPPRSATATVS 680 690 700 710 720 570 580 590 600 610 pF1KA1 ITLLDVNDHPPQ--FGKSVQKKTMVLGTPVK-----IEAIDEDAEEPNNLVDYSITHAEP . ..: ::. : . :... . .. :. . : : : . : ..:::. ..: CCDS33 LFVMDENDNAPTVTLPKNISYTLLPPSSNVRTVVATVLATDSD-DGINADLNYSIVGGNP 730 740 750 760 770 780 620 630 640 650 660 670 pF1KA1 ANVFDINSHTGEIWLKNSIRSLDALHNITPGRDCLWSLEVQAKDRGSPSFSTTALLKI-- ..:.:. .: . : . ..: . : : ::..: :.:: :::.:... CCDS33 FKLFEIDPTSGVVSL---------VGKLTQKHYGLHRLVVQVNDSGQPSQSTTTLVHVFV 790 800 810 820 830 680 690 700 710 pF1KA1 --DITDAETLSRSPMAAFLIQ-TKD---NPMK---------AVGVLAGTMATVVAITVLI ....: ... . .. : :.: .: ..::.:: : ::. : ... CCDS33 NESVSNATAIDSQIARSLHIPLTQDIAGDPSYEISKQRLSIVIGVVAGIM-TVILIILIV 840 850 860 870 880 890 720 730 740 750 760 770 pF1KA1 STATFWRNKKSNKVLPMRRVLRKRPSPAPRTIRIEWLKSKSTKAATKFMLKEKPPNENCN : . :.:..: CCDS33 VMARYCRSKNKNGYEAGKKDHEDFFTPQQHDKSKKPKKDKKNKKSKQPLYSSIVTVEASK 900 910 920 930 940 950 >>CCDS75116.1 PCDH7 gene_id:5099|Hs108|chr4 (1072 aa) initn: 294 init1: 191 opt: 529 Z-score: 379.9 bits: 81.7 E(32554): 7.7e-15 Smith-Waterman score: 573; 26.2% identity (55.5% similar) in 762 aa overlap (21-731:201-910) 10 20 30 40 50 pF1KA1 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPV :. ::. .: :...:. . . :. CCDS75 DFGRNGIERYELLQEPGGGGSGGESRRAGAADSAPYPGGGGNGASGGGSGGSKRRLDASE 180 190 200 210 220 230 60 70 80 90 100 110 pF1KA1 GSHVYTLNGTDPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISI :. .::.: : .... . . .: .. . ::::..: : . . CCDS75 GG-----GGTNPGGRSSVFELQVADTPDG--EKQP---QLIVKGALDREQRDSYELTLRV 240 250 260 270 280 120 130 140 150 160 pF1KA1 SDGLN--LVAEKVV-ILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSG :: . .. .. .:.::.::..::: . : : . :. :. :....:.: :.: . CCDS75 RDGGDPPRSSQAILRVLITDVNDNSPRFEKSVYEADLAENSAPGTPILQLRAADLDVGVN 290 300 310 320 330 340 170 180 190 200 210 220 pF1KA1 GSVTYFL----QNLHSPFAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGAD :.. : . .... . .:. :: : . .: :. .::.:.: : . .: CCDS75 GQIEYVFGAATESVRRLLRLDETSGWLSVLH--RIDREEVNQLRFTVMARDRG-QPPKTD 350 360 370 380 390 230 240 250 260 270 pF1KA1 VVFSATTTVTVNVEDVQDMAPVF----VGT-PY---YGYVYEDTLPGSEVLKVVAMDGDR .::..:..: .: .: . .: : . : ::.: . . : . : :. CCDS75 -----KATVVLNIKDENDNVPSIEIRKIGRIPLKDGVANVAEDVLVDTPIALVQVSDRDQ 400 410 420 430 440 450 280 290 300 310 320 pF1KA1 GKPNRILYSLVNGNDGAFEI---NETSGAIS----ITQSPAQLQREV-YELHVQVTEMSP :. : .. : : : :.. ..: : . . .. . :. :. :..: .. .. CCDS75 GE-NGVVTCTVVG-DVPFQLKPASDTEGDQNKKKYFLHTSTPLDYEATREFNVVIVAVD- 460 470 480 490 500 330 340 350 360 370 380 pF1KA1 AGSPAAQATVPVTIRIVDLNNHPPTFYGESGPQNRFELSMNEHPPQGEILRGLKITVNDS .:::. ... . ... : :..:: : : :. :. . :. :: : . ..:. CCDS75 SGSPSLSSNNSLIVKVGDTNDNPPMF----G-QSVVEVYFPENNIPGE--RVATVLATDA 510 520 530 540 550 560 390 400 410 420 430 440 pF1KA1 DQGANAKFNLQLVGP-RGIFRVVPQTVLNEAQVTIIVENSAAIDFEKSKVLTFKLLAVEV :.: ::.. .: . ::: . :.. :.: ....: :.. ::. : . CCDS75 DSGKNAEIAYSLDSSVMGIFAIDPDSG------DILV--NTVLDREQTDRYEFKVNAKDK 570 580 590 600 610 450 460 470 480 490 500 pF1KA1 NTPEKFSSTADVVIQLLDTNDNVPKFDSLYYVARIPENAPGGSSVVAVTAVDPDTGPWGE . : .::. :..:. : ::: ::: . .. . :: .: : ::..: : : .: CCDS75 GIPVLQGSTT-VIVQVADKNDNDPKFMQDVFTFYVKENLQPNSPVGMVTVMDADKGRNAE 620 630 640 650 660 670 510 520 530 540 550 560 pF1KA1 VKYSTY-GTGADLFLIHPSTGLIYTQPWASLDAEATARYNFYVKAEDM--EGKYSVAEVF . : : . ..: :. .:: ::. :.: : . :.: ::: : . ..: : CCDS75 M--SLYIEENNNIFSIENDTGTIYST--MSFDREHQTTYTFRVKAVDGGDPPRSATATVS 680 690 700 710 720 570 580 590 600 610 pF1KA1 ITLLDVNDHPPQ--FGKSVQKKTMVLGTPVK-----IEAIDEDAEEPNNLVDYSITHAEP . ..: ::. : . :... . .. :. . : : : . : ..:::. ..: CCDS75 LFVMDENDNAPTVTLPKNISYTLLPPSSNVRTVVATVLATDSD-DGINADLNYSIVGGNP 730 740 750 760 770 780 620 630 640 650 660 670 pF1KA1 ANVFDINSHTGEIWLKNSIRSLDALHNITPGRDCLWSLEVQAKDRGSPSFSTTALLKI-- ..:.:. .: . : . ..: . : : ::..: :.:: :::.:... CCDS75 FKLFEIDPTSGVVSL---------VGKLTQKHYGLHRLVVQVNDSGQPSQSTTTLVHVFV 790 800 810 820 830 680 690 700 710 pF1KA1 --DITDAETLSRSPMAAFLIQ-TKD---NPMK---------AVGVLAGTMATVVAITVLI ....: ... . .. : :.: .: ..::.:: : ::. : ... CCDS75 NESVSNATAIDSQIARSLHIPLTQDIAGDPSYEISKQRLSIVIGVVAGIM-TVILIILIV 840 850 860 870 880 890 720 730 740 750 760 770 pF1KA1 STATFWRNKKSNKVLPMRRVLRKRPSPAPRTIRIEWLKSKSTKAATKFMLKEKPPNENCN : . :.:..: CCDS75 VMARYCRSKNKNGYEAGKKDHEDFFTPQQHDKSKKPKKDKKNKKSKQPLYSSIVTVEASK 900 910 920 930 940 950 >>CCDS3785.1 DCHS2 gene_id:54798|Hs108|chr4 (2916 aa) initn: 343 init1: 206 opt: 517 Z-score: 365.0 bits: 80.4 E(32554): 5.2e-14 Smith-Waterman score: 698; 25.7% identity (56.6% similar) in 770 aa overlap (44-780:1900-2605) 20 30 40 50 60 pF1KA1 LRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVG---SHVYTLNGTDPEGDPI-SY . ::. : .:: ... .: .. : :. CCDS37 PRLSNTTVIKVQVTDINDNAPAFLPSEAVEITEDSLPGVIVTHV-SVHDVDLNSAFIFSF 1870 1880 1890 1900 1910 1920 70 80 90 100 110 120 pF1KA1 HISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLNLVAEKVVILVTDAN .:.:. :..: . : ..::. :: :. : : .:.:::... . .:. : :.: CCDS37 AKESNPGTK--FAIDQNTGVVVLVKTLDFEEMTEYELLIQISDSVHYTEGALVVRVLDVN 1930 1940 1950 1960 1970 1980 130 140 150 160 170 180 pF1KA1 DEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQNLHSPFAVDRHSGV :. : : :. : . :::.::.: .. . :.: . :. ...: . . . :..: ..:. CCDS37 DNPPVFSQDFYQVTVPESIPVGYSVLTLSATDLE--SNENISYRILSSSKEFSIDPKNGT 1990 2000 2010 2020 2030 2040 190 200 210 220 230 240 pF1KA1 LRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVNVEDVQDMAPVFVGT . . . : : :... : :.:::. :. : : : ...::....:: :. CCDS37 IFTISPVLLLDTISTTQFL-VEASDGGN----PDL--RALTLVEIGIEDMNNYAPEFTVK 2050 2060 2070 2080 2090 250 260 270 280 290 pF1KA1 PYYGYVYEDTLPGSEVLKVVAMDGDRGKPNR-ILYSLVNGND-GAFEIN----------E : . ::.: :: .. .: : . : . ::...::. . :... . CCDS37 SYNLSLSEDALVGSTLVTFSNIDHDWTRENTYVEYSIISGNSQNNFHVETKFFHSEYPYK 2100 2110 2120 2130 2140 2150 300 310 320 330 340 350 pF1KA1 TSGAISITQSPAQLQREVYELHVQVTEMSPAGSPAAQATVPVTIRIVDLNNHPPTFYGES : . . .: :.::. : : : .: : ..:. ..:...:.:..::.: . : CCDS37 QVGYLVLLHS---LDREASASHELVILASDSGCPPLSSTAVISIQVLDVNDNPPNFSSLS 2160 2170 2180 2190 2200 2210 360 370 380 390 400 410 pF1KA1 GPQNRFELSMNEHPPQGEILRGLKITVNDSDQGANAK--FNLQLVGPRGIFRVVPQTVLN .. ..: : : . ...:: : :..:. .:. . .: : . .: CCDS37 -----YHTHVKESTPLGSHI--TVVSANDRDTGSHAEIIYNIISGNEKGHFYLEENT--- 2220 2230 2240 2250 2260 420 430 440 450 460 470 pF1KA1 EAQVTIIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDTNDNVPKFDSL : ... .:.: :. : : . .. .: : : : ...:: ::..:.: CCDS37 --GVLYLIK---PLDYE--KMTKFTLTVQASDAEKKHFSFAVVFVSVLDDNDHAPQFMFS 2270 2280 2290 2300 2310 480 490 500 510 520 pF1KA1 YYVARIPENAPGGSSVVAVTAVDPDTGPWGEVKYS-------TYGTGAD--LFLIHPSTG . .::: : .:.. ...:.: :.::.::. :: :.: . : :::: : :: CCDS37 SFSCIVPENLPISSTICSINALDFDAGPYGELTYSIVSPCFLTHGMSYDHDLFLIDPLTG 2320 2330 2340 2350 2360 2370 530 540 550 560 570 580 pF1KA1 LIYTQPWASLDAEATARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGK-----SVQ :... :: : .: . :.:.: . :.. . ... : : . .. CCDS37 DIHAKQ--ILDYENGNKYCLTVQAKDKGDATASLVVWVDIEGIDEFEPIFTQDQYFFTLP 2380 2390 2400 2410 2420 2430 590 600 610 620 630 640 pF1KA1 KKTMVLGTPVKIEAIDEDAEEPNNLVDYSITHAEPANVFDINSHTGEIWLKNSIRSLDAL .:. ..:: : :: .... ::. . : :..:. .:.:.: ::.: . CCDS37 EKNKDRQLIGRVEASDADAG-IDGVILYSLGTSSP--FFSVNKTNGNIYL---IRALPLI 2440 2450 2460 2470 2480 650 660 670 680 690 700 pF1KA1 HNITPGRDCLWSLEVQAKDRGSPSF-STTALLKIDITDAETLSRSPMAAFLIQTKDNPMK .. .: : . . ... .: : :......... : :.:.: . CCDS37 KSQLNKEDTLEMKIIAHSPKSDSKFASCTVFVNVSFSSEGT----PLAVFASSF------ 2490 2500 2510 2520 2530 710 720 730 740 750 760 pF1KA1 AVGVLAGTMATVVAITVLISTATFWRNKKSNKVLPMRRVLRKRPSPAPRTIRIEWLKSKS ....... .. .. : .:: . . :.:... . ... :. : .:. CCDS37 SISLVVSFLVFLILICILI--VMILRHKQKDTINNYEE---KKTSSLDADLRV------- 2540 2550 2560 2570 2580 770 780 790 800 810 820 pF1KA1 TKAATKFMLKEKPPNENCNNNSPESSLLPRAPALPPPPSVAPSTGAAQWTVPTVSGSLTP :. :. .:: ...:.: CCDS37 TRDAS--VLKAFQKTDDCSNEVVPVDATPEWLSLISIMEKDIVNLYRHSNSSGHCSVEGE 2590 2600 2610 2620 2630 2640 >>CCDS14076.1 CELSR1 gene_id:9620|Hs108|chr22 (3014 aa) initn: 406 init1: 198 opt: 501 Z-score: 353.6 bits: 78.3 E(32554): 2.2e-13 Smith-Waterman score: 662; 32.1% identity (60.0% similar) in 517 aa overlap (32-526:677-1158) 10 20 30 40 50 pF1KA1 RRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLP-------EDTPVGSHV : ..: : .:. : ::. ::: : CCDS14 REEVEHYSFGVEAVDHGSPPMSSSTSVSITVLDVNDNDPVFTQPTYELRLNEDAAVGSSV 650 660 670 680 690 700 60 70 80 90 100 110 pF1KA1 YTLNGTDPEGDP-ISYHISFDPSTRSVFSVDPTFGN--ITLVEELDREREDEIEAIISIS ::.. : ... :.:... .::. :... :. :::. :: ..:.. .. : CCDS14 LTLQARDRDANSVITYQLT-GGNTRNRFALSSQRGGGLITLALPLDYKQEQQYVLAVTAS 710 720 730 740 750 760 120 130 140 150 160 170 pF1KA1 DGLNLVAEKVVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVT :: . .:.: ::::: . : : . :.. : :: :.:. : . : :.::: .. .: CCDS14 DGTRSHTAHVLINVTDANTHRPVFQSSHYTVSVSEDRPVGTSIATLSANDEDTGENARIT 770 780 790 800 810 820 180 190 200 210 220 230 pF1KA1 YFLQNLHSPFAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTT : .:. : .: ::.. . :::: . .. .:..:.:.: . : ::: CCDS14 YVIQDPVPQFRIDPDSGTMYTMM--ELDYENQVAYTLTIMAQDNGIPQK------SDTTT 830 840 850 860 870 240 250 260 270 280 290 pF1KA1 VTVNVEDVQDMAPVFVGTPYYGYVYEDTLPGSEVLKVVAMDGDRGKPNRILYSLVNGNDG . . . :..: :: :. : : ..::. :.. .:.: : : : : .:.::.. .:.:: CCDS14 LEILILDANDNAPQFLWDFYQGSIFEDAPPSTSILQVSATDRDSGPNGRLLYTFQGGDDG 880 890 900 910 920 930 300 310 320 330 340 pF1KA1 A--FEINETSGAISITQSPAQLQRE---VYELHVQVTEMSPAGSPAA-QATVPVTIRIVD : :. :::.: .. .:.:: ::.: . ... :::. .:.: . . :.: CCDS14 DGDFYIEPTSGVI---RTQRRLDRENVAVYNLWALAVDR---GSPTPLSASVEIQVTILD 940 950 960 970 980 990 350 360 370 380 390 400 pF1KA1 LNNHPPTFYGESGPQNRFELSMNEHPPQGEILRGLKITVNDSDQGANAKFNLQLVGPRGI .:.. : : ....:: ..:. : : .. :: .:: :.: ::.. :.: .: CCDS14 INDNAPMF-----EKDELELFVEENNPVGSVVA--KIRANDPDEGPNAQIMYQIV--EGD 1000 1010 1020 1030 1040 410 420 430 440 450 460 pF1KA1 FRVVPQTVLNEAQVTIIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDT .: : : .... .:: .::: . . :.. ...: . : : : : :.: CCDS14 MRHFFQLDLLNGDLRAMVE----LDFEVRR--EYVLVVQATSAP--LVSRATVHILLVDQ 1050 1060 1070 1080 1090 470 480 490 500 510 pF1KA1 NDN---VPKFDSLY--YVARIPENAPGGSSVVAVTAVDPDTGPWGEVKYS-TYGTGADLF ::: .: :. :. ::. .. : : . . : :::.. ..:. . :. :. CCDS14 NDNPPVLPDFQILFNNYVTNKSNSFPTGV-IGCIPAHDPDVS--DSLNYTFVQGNELRLL 1100 1110 1120 1130 1140 1150 520 530 540 550 560 570 pF1KA1 LIHPSTGLIYTQPWASLDAEATARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGKS :. :.:: CCDS14 LLDPATGELQLSRDLDNNRPLEALMEVSVSDGIHSVTAFCTLRVTIITDDMLTNSITVRL 1160 1170 1180 1190 1200 1210 859 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 01:48:55 2016 done: Fri Nov 4 01:48:56 2016 Total Scan time: 3.790 Total Display time: 0.270 Function used was FASTA [36.3.4 Apr, 2011]