FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1775, 859 aa
1>>>pF1KA1775 859 - 859 aa - 859 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.2852+/-0.0011; mu= 3.2893+/- 0.067
mean_var=205.1716+/-41.152, 0's: 0 Z-trim(110.4): 189 B-trim: 0 in 0/54
Lambda= 0.089540
statistics sampled from 11364 (11555) to 11364 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.677), E-opt: 0.2 (0.355), width: 16
Scan time: 3.790
The best scores are: opt bits E(32554)
CCDS7372.1 CDHR1 gene_id:92211|Hs108|chr10 ( 859) 5629 740.4 3.1e-213
CCDS53548.1 CDHR1 gene_id:92211|Hs108|chr10 ( 745) 4450 588.1 1.9e-167
CCDS81473.1 CDH23 gene_id:64072|Hs108|chr10 (1061) 732 107.9 9.8e-23
CCDS81472.1 CDH23 gene_id:64072|Hs108|chr10 (1381) 732 108.0 1.2e-22
CCDS44429.1 CDH23 gene_id:64072|Hs108|chr10 ( 530) 720 106.2 1.6e-22
CCDS7771.1 DCHS1 gene_id:8642|Hs108|chr11 (3298) 705 104.7 2.8e-21
CCDS33971.1 PCDH7 gene_id:5099|Hs108|chr4 (1069) 529 81.7 7.7e-15
CCDS75116.1 PCDH7 gene_id:5099|Hs108|chr4 (1072) 529 81.7 7.7e-15
CCDS3785.1 DCHS2 gene_id:54798|Hs108|chr4 (2916) 517 80.4 5.2e-14
CCDS14076.1 CELSR1 gene_id:9620|Hs108|chr22 (3014) 501 78.3 2.2e-13
CCDS81993.1 CDH11 gene_id:1009|Hs108|chr16 ( 693) 480 75.2 4.3e-13
CCDS10803.1 CDH11 gene_id:1009|Hs108|chr16 ( 796) 480 75.3 4.9e-13
CCDS796.1 CELSR2 gene_id:1952|Hs108|chr1 (2923) 481 75.7 1.3e-12
CCDS34297.1 CDHR2 gene_id:54825|Hs108|chr5 (1310) 466 73.6 2.6e-12
CCDS10802.1 CDH8 gene_id:1006|Hs108|chr16 ( 799) 458 72.4 3.5e-12
CCDS3732.3 FAT4 gene_id:79633|Hs108|chr4 (4981) 471 74.6 5e-12
CCDS9586.1 CDH24 gene_id:64403|Hs108|chr14 ( 781) 446 70.9 1e-11
CCDS2775.1 CELSR3 gene_id:1951|Hs108|chr3 (3312) 459 72.9 1e-11
CCDS75336.1 PCDHGA7 gene_id:56108|Hs108|chr5 ( 817) 445 70.8 1.1e-11
CCDS3894.1 CDH6 gene_id:1004|Hs108|chr5 ( 790) 444 70.6 1.2e-11
CCDS54927.1 PCDHGA7 gene_id:56108|Hs108|chr5 ( 932) 445 70.8 1.3e-11
CCDS75329.1 PCDHGA3 gene_id:56112|Hs108|chr5 ( 829) 440 70.1 1.8e-11
CCDS81992.1 CDH11 gene_id:1009|Hs108|chr16 ( 670) 437 69.7 2e-11
CCDS47290.1 PCDHGA3 gene_id:56112|Hs108|chr5 ( 932) 440 70.2 2e-11
CCDS54918.1 PCDHA7 gene_id:56141|Hs108|chr5 ( 937) 432 69.1 4.1e-11
>>CCDS7372.1 CDHR1 gene_id:92211|Hs108|chr10 (859 aa)
initn: 5629 init1: 5629 opt: 5629 Z-score: 3941.8 bits: 740.4 E(32554): 3.1e-213
Smith-Waterman score: 5629; 100.0% identity (100.0% similar) in 859 aa overlap (1-859:1-859)
10 20 30 40 50 60
pF1KA1 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVGSHVYTLNGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVGSHVYTLNGT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 DPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLNLVAEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 DPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLNLVAEK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 VVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQNLHSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 VVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQNLHSP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 FAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVNVEDVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 FAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVNVEDVQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 DMAPVFVGTPYYGYVYEDTLPGSEVLKVVAMDGDRGKPNRILYSLVNGNDGAFEINETSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 DMAPVFVGTPYYGYVYEDTLPGSEVLKVVAMDGDRGKPNRILYSLVNGNDGAFEINETSG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 AISITQSPAQLQREVYELHVQVTEMSPAGSPAAQATVPVTIRIVDLNNHPPTFYGESGPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 AISITQSPAQLQREVYELHVQVTEMSPAGSPAAQATVPVTIRIVDLNNHPPTFYGESGPQ
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 NRFELSMNEHPPQGEILRGLKITVNDSDQGANAKFNLQLVGPRGIFRVVPQTVLNEAQVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 NRFELSMNEHPPQGEILRGLKITVNDSDQGANAKFNLQLVGPRGIFRVVPQTVLNEAQVT
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 IIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDTNDNVPKFDSLYYVAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 IIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDTNDNVPKFDSLYYVAR
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 IPENAPGGSSVVAVTAVDPDTGPWGEVKYSTYGTGADLFLIHPSTGLIYTQPWASLDAEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 IPENAPGGSSVVAVTAVDPDTGPWGEVKYSTYGTGADLFLIHPSTGLIYTQPWASLDAEA
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 TARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGKSVQKKTMVLGTPVKIEAIDEDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 TARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGKSVQKKTMVLGTPVKIEAIDEDA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 EEPNNLVDYSITHAEPANVFDINSHTGEIWLKNSIRSLDALHNITPGRDCLWSLEVQAKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 EEPNNLVDYSITHAEPANVFDINSHTGEIWLKNSIRSLDALHNITPGRDCLWSLEVQAKD
610 620 630 640 650 660
670 680 690 700 710 720
pF1KA1 RGSPSFSTTALLKIDITDAETLSRSPMAAFLIQTKDNPMKAVGVLAGTMATVVAITVLIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 RGSPSFSTTALLKIDITDAETLSRSPMAAFLIQTKDNPMKAVGVLAGTMATVVAITVLIS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KA1 TATFWRNKKSNKVLPMRRVLRKRPSPAPRTIRIEWLKSKSTKAATKFMLKEKPPNENCNN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 TATFWRNKKSNKVLPMRRVLRKRPSPAPRTIRIEWLKSKSTKAATKFMLKEKPPNENCNN
730 740 750 760 770 780
790 800 810 820 830 840
pF1KA1 NSPESSLLPRAPALPPPPSVAPSTGAAQWTVPTVSGSLTPQPTQPPPKPKTMGSPVQSTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS73 NSPESSLLPRAPALPPPPSVAPSTGAAQWTVPTVSGSLTPQPTQPPPKPKTMGSPVQSTL
790 800 810 820 830 840
850
pF1KA1 ISELKQKFEKKSVHNKAYF
:::::::::::::::::::
CCDS73 ISELKQKFEKKSVHNKAYF
850
>>CCDS53548.1 CDHR1 gene_id:92211|Hs108|chr10 (745 aa)
initn: 4450 init1: 4450 opt: 4450 Z-score: 3119.6 bits: 588.1 E(32554): 1.9e-167
Smith-Waterman score: 4450; 100.0% identity (100.0% similar) in 680 aa overlap (1-680:1-680)
10 20 30 40 50 60
pF1KA1 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVGSHVYTLNGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVGSHVYTLNGT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 DPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLNLVAEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 DPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLNLVAEK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 VVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQNLHSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 VVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQNLHSP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 FAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVNVEDVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 FAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVNVEDVQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 DMAPVFVGTPYYGYVYEDTLPGSEVLKVVAMDGDRGKPNRILYSLVNGNDGAFEINETSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 DMAPVFVGTPYYGYVYEDTLPGSEVLKVVAMDGDRGKPNRILYSLVNGNDGAFEINETSG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 AISITQSPAQLQREVYELHVQVTEMSPAGSPAAQATVPVTIRIVDLNNHPPTFYGESGPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 AISITQSPAQLQREVYELHVQVTEMSPAGSPAAQATVPVTIRIVDLNNHPPTFYGESGPQ
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 NRFELSMNEHPPQGEILRGLKITVNDSDQGANAKFNLQLVGPRGIFRVVPQTVLNEAQVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 NRFELSMNEHPPQGEILRGLKITVNDSDQGANAKFNLQLVGPRGIFRVVPQTVLNEAQVT
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 IIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDTNDNVPKFDSLYYVAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 IIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDTNDNVPKFDSLYYVAR
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 IPENAPGGSSVVAVTAVDPDTGPWGEVKYSTYGTGADLFLIHPSTGLIYTQPWASLDAEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 IPENAPGGSSVVAVTAVDPDTGPWGEVKYSTYGTGADLFLIHPSTGLIYTQPWASLDAEA
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 TARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGKSVQKKTMVLGTPVKIEAIDEDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGKSVQKKTMVLGTPVKIEAIDEDA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 EEPNNLVDYSITHAEPANVFDINSHTGEIWLKNSIRSLDALHNITPGRDCLWSLEVQAKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 EEPNNLVDYSITHAEPANVFDINSHTGEIWLKNSIRSLDALHNITPGRDCLWSLEVQAKD
610 620 630 640 650 660
670 680 690 700 710 720
pF1KA1 RGSPSFSTTALLKIDITDAETLSRSPMAAFLIQTKDNPMKAVGVLAGTMATVVAITVLIS
::::::::::::::::::::
CCDS53 RGSPSFSTTALLKIDITDAEVRRLRYMKNSNFPGTTKSVRKPKFKPKKPHSSQGLFLHPH
670 680 690 700 710 720
>>CCDS81473.1 CDH23 gene_id:64072|Hs108|chr10 (1061 aa)
initn: 732 init1: 261 opt: 732 Z-score: 521.7 bits: 107.9 E(32554): 9.8e-23
Smith-Waterman score: 1062; 33.1% identity (61.1% similar) in 720 aa overlap (4-705:9-691)
10 20 30 40 50
pF1KA1 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVGSHVY
:. : : : :. : .:.: : :: : .: . . ::::::: :
CCDS81 MGRHVATSCHVAWL-LVLISGCWGQVNRLP-FFTNHFFDT-----YLLISEDTPVGSSVT
10 20 30 40 50
60 70 80 90 100 110
pF1KA1 TLNGTDPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLN
: . : ..::. . .: . ..: :.:.: : . : . :::: ..:. . .:.:: .
CCDS81 QLLAQDMDNDPLVFGVSGEEASR-FFAVEPDTGVVWLRQPLDRETKSEFTVEFSVSDHQG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KA1 LVAEKVVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQ
....:: : : :.::.:: : ..:: . .::. :.:. :: :.:.: : :.:::: : .:
CCDS81 VITRKVNIQVGDVNDNAPTFHNQPYSVRIPENTPVGTPIFIVNATDPDLGAGGSVLYSFQ
120 130 140 150 160 170
180 190 200 210 220 230
pF1KA1 NLHSPFAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVN
. ::.: :.. . :::: .... .:: : : . .:. .....
CCDS81 PPSQFFAIDSARGIVTVIR--ELDYETTQAYQLTVNATD-----QDKTRPLSTLANLAII
180 190 200 210 220
240 250 260 270 280 290
pF1KA1 VEDVQDMAPVFVGTPYYGYVYEDTLPGSEVLKVVAMDGDRGKPNRILYSLVNGN-DGAFE
. ::::: :.:.. :: .:: . ::. : ..:.: :.:.: : :..:.:: .. :
CCDS81 ITDVQDMDPIFINLPYSTNIYEHSPPGTTVRIITAIDQDKGRPRGIGYTIVSGNTNSIFA
230 240 250 260 270 280
300 310 320 330 340 350
pF1KA1 INETSGAISIT---QSPAQLQREVYELHVQVTEMSPAGSPA-AQATVPVTIRIVDLNNHP
.. ::..... . : . . : :. ::.. .:. : .:. .: ..:.:..
CCDS81 LDYISGVLTLNGLLDRENPLYSHGFILTVKGTELNDDRTPSDATVTTTFNILVIDINDNA
290 300 310 320 330 340
360 370 380 390 400
pF1KA1 PTFYGESGPQNRFELSMNEHPPQGEILRGLKITVNDSDQ--GANAKFNLQLVGPRGI-FR
: : .... ....: : : : : : :.:. : :. :.. ::: . :
CCDS81 PEFN-----SSEYSVAITELAQVGFAL-PLFIQVVDKDENLGLNSMFEVYLVGNNSHHFI
350 360 370 380 390
410 420 430 440 450 460
pF1KA1 VVPQTVLNEAQVTIIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDTND
. : .: ..:.. : : . .:.: : :.: : ..:.. . : : : :.. ::
CCDS81 ISPTSVQGKADIRIRV--AIPLDYETVDRYDFDLFANE-SVPDHVGY-AKVKITLINEND
400 410 420 430 440 450
470 480 490 500 510 520
pF1KA1 NVPKFDSLYYVARIPENAPGGSSVVAVTAVDPDTGPWGEVKYSTYGTGADLFLIHPSTGL
: : :.. : . ::. :.::..: :.: :.: .:::.: .. : : . .:::
CCDS81 NRPIFSQPLYNISLYENVTVGTSVLTVLATDNDAGTFGEVSY-FFSDDPDRFSLDKDTGL
460 470 480 490 500 510
530 540 550 560 570 580
pF1KA1 IYTQPWASLDAEATARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGKSVQKKTMVL
:. : :: : :... . :.: :. ....: :..:::::. : : :.. ..
CCDS81 IMLI--ARLDYELIQRFTLTIIARDGGGEETTGRVRINVLDVNDNVPTFQKDAYVGALRE
520 530 540 550 560 570
590 600 610 620 630 640
pF1KA1 GTP-----VKIEAIDEDAEEPNNLVDYSITHAEP-ANVFDINSHTGEIWLKNSIRSLDAL
. : :...: :::. ::: . :::. : .. :::. . : .. : : ::
CCDS81 NEPSVTQLVRLRATDEDSP-PNNQITYSIVSASAFGSYFDISLYEGYGVISVS-RPLD-Y
580 590 600 610 620
650 660 670 680 690
pF1KA1 HNITPGRDCLWSLEVQAKDRGSPSFSTTALLKIDITDAE----TLSRSPMAAFLIQTKDN
..:. : : : :.: : :.: ...:. . :.. : . :.:. : :..... .:
CCDS81 EQISNG---LIYLTVMAMDAGNPPLNSTVPVTIEVFDENDNPPTFSK-P--AYFVSVVEN
630 640 650 660 670 680
700 710 720 730 740 750
pF1KA1 PMKAVGVLAGTMATVVAITVLISTATFWRNKKSNKVLPMRRVLRKRPSPAPRTIRIEWLK
: .. ::
CCDS81 IMAGATVLFLNATDLDRSREYGQESIIYSLEGSTQFRINARSGEITTTSLLDRETKSEYI
690 700 710 720 730 740
>>CCDS81472.1 CDH23 gene_id:64072|Hs108|chr10 (1381 aa)
initn: 732 init1: 261 opt: 732 Z-score: 519.9 bits: 108.0 E(32554): 1.2e-22
Smith-Waterman score: 1062; 33.1% identity (61.1% similar) in 720 aa overlap (4-705:9-691)
10 20 30 40 50
pF1KA1 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVGSHVY
:. : : : :. : .:.: : :: : .: . . ::::::: :
CCDS81 MGRHVATSCHVAWL-LVLISGCWGQVNRLP-FFTNHFFDT-----YLLISEDTPVGSSVT
10 20 30 40 50
60 70 80 90 100 110
pF1KA1 TLNGTDPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLN
: . : ..::. . .: . ..: :.:.: : . : . :::: ..:. . .:.:: .
CCDS81 QLLAQDMDNDPLVFGVSGEEASR-FFAVEPDTGVVWLRQPLDRETKSEFTVEFSVSDHQG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KA1 LVAEKVVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQ
....:: : : :.::.:: : ..:: . .::. :.:. :: :.:.: : :.:::: : .:
CCDS81 VITRKVNIQVGDVNDNAPTFHNQPYSVRIPENTPVGTPIFIVNATDPDLGAGGSVLYSFQ
120 130 140 150 160 170
180 190 200 210 220 230
pF1KA1 NLHSPFAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVN
. ::.: :.. . :::: .... .:: : : . .:. .....
CCDS81 PPSQFFAIDSARGIVTVIR--ELDYETTQAYQLTVNATD-----QDKTRPLSTLANLAII
180 190 200 210 220
240 250 260 270 280 290
pF1KA1 VEDVQDMAPVFVGTPYYGYVYEDTLPGSEVLKVVAMDGDRGKPNRILYSLVNGN-DGAFE
. ::::: :.:.. :: .:: . ::. : ..:.: :.:.: : :..:.:: .. :
CCDS81 ITDVQDMDPIFINLPYSTNIYEHSPPGTTVRIITAIDQDKGRPRGIGYTIVSGNTNSIFA
230 240 250 260 270 280
300 310 320 330 340 350
pF1KA1 INETSGAISIT---QSPAQLQREVYELHVQVTEMSPAGSPA-AQATVPVTIRIVDLNNHP
.. ::..... . : . . : :. ::.. .:. : .:. .: ..:.:..
CCDS81 LDYISGVLTLNGLLDRENPLYSHGFILTVKGTELNDDRTPSDATVTTTFNILVIDINDNA
290 300 310 320 330 340
360 370 380 390 400
pF1KA1 PTFYGESGPQNRFELSMNEHPPQGEILRGLKITVNDSDQ--GANAKFNLQLVGPRGI-FR
: : .... ....: : : : : : :.:. : :. :.. ::: . :
CCDS81 PEFN-----SSEYSVAITELAQVGFAL-PLFIQVVDKDENLGLNSMFEVYLVGNNSHHFI
350 360 370 380 390
410 420 430 440 450 460
pF1KA1 VVPQTVLNEAQVTIIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDTND
. : .: ..:.. : : . .:.: : :.: : ..:.. . : : : :.. ::
CCDS81 ISPTSVQGKADIRIRV--AIPLDYETVDRYDFDLFANE-SVPDHVGY-AKVKITLINEND
400 410 420 430 440 450
470 480 490 500 510 520
pF1KA1 NVPKFDSLYYVARIPENAPGGSSVVAVTAVDPDTGPWGEVKYSTYGTGADLFLIHPSTGL
: : :.. : . ::. :.::..: :.: :.: .:::.: .. : : . .:::
CCDS81 NRPIFSQPLYNISLYENVTVGTSVLTVLATDNDAGTFGEVSY-FFSDDPDRFSLDKDTGL
460 470 480 490 500 510
530 540 550 560 570 580
pF1KA1 IYTQPWASLDAEATARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGKSVQKKTMVL
:. : :: : :... . :.: :. ....: :..:::::. : : :.. ..
CCDS81 IMLI--ARLDYELIQRFTLTIIARDGGGEETTGRVRINVLDVNDNVPTFQKDAYVGALRE
520 530 540 550 560 570
590 600 610 620 630 640
pF1KA1 GTP-----VKIEAIDEDAEEPNNLVDYSITHAEP-ANVFDINSHTGEIWLKNSIRSLDAL
. : :...: :::. ::: . :::. : .. :::. . : .. : : ::
CCDS81 NEPSVTQLVRLRATDEDSP-PNNQITYSIVSASAFGSYFDISLYEGYGVISVS-RPLD-Y
580 590 600 610 620
650 660 670 680 690
pF1KA1 HNITPGRDCLWSLEVQAKDRGSPSFSTTALLKIDITDAE----TLSRSPMAAFLIQTKDN
..:. : : : :.: : :.: ...:. . :.. : . :.:. : :..... .:
CCDS81 EQISNG---LIYLTVMAMDAGNPPLNSTVPVTIEVFDENDNPPTFSK-P--AYFVSVVEN
630 640 650 660 670 680
700 710 720 730 740 750
pF1KA1 PMKAVGVLAGTMATVVAITVLISTATFWRNKKSNKVLPMRRVLRKRPSPAPRTIRIEWLK
: .. ::
CCDS81 IMAGATVLFLNATDLDRSREYGQESIIYSLEGSTQFRINARSGEITTTSLLDRETKSEYI
690 700 710 720 730 740
>--
initn: 291 init1: 153 opt: 659 Z-score: 469.0 bits: 98.5 E(32554): 8.4e-20
Smith-Waterman score: 662; 27.6% identity (55.6% similar) in 691 aa overlap (72-733:712-1364)
50 60 70 80 90 100
pF1KA1 FSLPEDTPVGSHVYTLNGTDPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDRERE
:.. ::. : .. :.:: . :::: .
CCDS81 ENIMAGATVLFLNATDLDRSREYGQESIIYSLEGSTQ--FRINARSGEITTTSLLDRETK
690 700 710 720 730
110 120 130 140 150
pF1KA1 DEIEAIISISDGLNLVAEK-----VVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFK
.: :. :: .: : : . : ::. : . . :: . : : : .
CCDS81 SEYILIVRAVDGGVGHNQKTGIATVNITLLDINDNHPTWKDAPYYINLVEMTPPDSDVTT
740 750 760 770 780 790
160 170 180 190 200 210
pF1KA1 VHAVDRDTGSGGSVTYFLQNLHSPFAVDRHSGVLRLQAGATLDYERSRTHYIT-----VV
: ::: : : .:...: .: .. .... .: .: . : :: : : ::
CCDS81 VVAVDPDLGENGTLVYSIQPPNKFYSLNSTTGKIRT-THAMLDRENPDPHEAELMRKIVV
800 810 820 830 840 850
220 230 240 250 260 270
pF1KA1 AKDGGGRLHGADVVFSATTTVTVNVEDVQDMAPVFVGTPYYGYVYEDTLPGSEVLKVVAM
. :: . ....:: ::. :..: :.: . :. . : : : . .:::.
CCDS81 SVTDCGR---PPLKATSSATVFVNLLDLNDNDPTFQNLPFVAEVLEGIPAGVSIYQVVAI
860 870 880 890 900 910
280 290 300 310 320
pF1KA1 DGDRGKPNRILYSLVNGNDGA-FEINETSGAISITQSPAQLQRE-VYELHVQVTEMSPAG
: :.: . . : . : : :: .::.. : ..:.:: . : ...:. : ::
CCDS81 DLDEGLNGLVSYRMPVGMPRMDFLINSSSGVVVTT---TELDRERIAEYQLRVVA-SDAG
920 930 940 950 960 970
330 340 350 360 370 380
pF1KA1 SPAAQATVPVTIRIVDLNNHPPTFYGESGPQNRFELSMNEHPPQGEILRGLKITVNDSDQ
.:. ..: .::...:.:.. :::. : ...:..: :. .: . .. .:.:
CCDS81 TPTKSSTSTLTIHVLDVNDETPTFF----PAV-YNVSVSEDVPRE--FRVVWLNCTDNDV
980 990 1000 1010 1020
390 400 410 420 430 440
pF1KA1 GANAKFNLQLVGPR--GIFRVVPQTVLNEAQVTIIVENSAAIDFEKSKVLTFKLLAVEVN
: ::... ..: : : : . .:.. ...: : . . . : :.. :
CCDS81 GLNAELSYFITGGNVDGKFSV--------GYRDAVVRTVVGLDRETTAAYMLILEAID-N
1030 1040 1050 1060 1070
450 460 470 480 490 500
pF1KA1 TP--EKFSSTADVVIQLLDTNDNVPKFDSLYYVARIPENAPGGSSVVAVTAVDPDTGPWG
: .. ..:: : . .::.::: : : . : : .::. : : :.. . :.: : : .:
CCDS81 GPVGKRHTGTATVFVTVLDVNDNRPIFLQSSYEASVPEDIPEGHSILQLKATDADEGEFG
1080 1090 1100 1110 1120 1130
510 520 530 540 550 560
pF1KA1 EVKYST-YGTGADLFLIHPSTGLIYTQPWASLDAEATARYNFYVKA--EDMEGKYSVAEV
.: : .:. .. : :: :.::.. : :: : .. . . :.: .:. : ..:
CCDS81 RVWYRILHGNHGNNFRIHVSNGLLMRGP-RPLDRERNSSHVLIVEAYNHDLGPMRSSVRV
1140 1150 1160 1170 1180 1190
570 580 590 600 610
pF1KA1 FITLLDVNDHPP-----QFGKSVQKKTMVLGTPVKI-EAIDEDAEEPNNLVDYSITHAEP
.. . :.::. : :... ..: .:: : . .: :.:. . ..::.: : .
CCDS81 IVYVEDINDEAPVFTQQQYSRLGLRETAGIGTSVIVVQATDRDSGD-GGLVNYRILSGAE
1200 1210 1220 1230 1240 1250
620 630 640 650 660 670
pF1KA1 ANVFDINSHTGEIWLKNSIRSLDALHNITPGRDCLWSLEVQAKDRGSP---SFSTTAL-L
.. :.:. :: : .. :: . . . ..:.: :.. : .: .. . :
CCDS81 GK-FEIDESTGLII---TVNYLDYETKTS------YMMNVSATDQAPPFNQGFCSVYITL
1260 1270 1280 1290 1300
680 690 700 710 720 730
pF1KA1 KIDITDAETLSRSPMAAFLIQTKDNPMKAVGVLAGTMATVVAITVLISTATFWRNKKSNK
.. .: .: . . : .... . : : : .. .. :: ... : . : :
CCDS81 LNELDEAVQFSNASYEAAILENLALGTEIVRVQAYSIDNLNQITYRFNAYTSTQAKALFK
1310 1320 1330 1340 1350 1360
740 750 760 770 780 790
pF1KA1 VLPMRRVLRKRPSPAPRTIRIEWLKSKSTKAATKFMLKEKPPNENCNNNSPESSLLPRAP
.
CCDS81 IDAITVRGWGQGAPFLPI
1370 1380
>>CCDS44429.1 CDH23 gene_id:64072|Hs108|chr10 (530 aa)
initn: 516 init1: 261 opt: 720 Z-score: 517.8 bits: 106.2 E(32554): 1.6e-22
Smith-Waterman score: 789; 33.1% identity (61.0% similar) in 510 aa overlap (4-503:9-492)
10 20 30 40 50
pF1KA1 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVGSHVY
:. : : : :. : .:.: : :: : .: . . ::::::: :
CCDS44 MGRHVATSCHVAWL-LVLISGCWGQVNRLP-FFTNHFFDT-----YLLISEDTPVGSSVT
10 20 30 40 50
60 70 80 90 100 110
pF1KA1 TLNGTDPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLN
: . : ..::. . .: . ..: :.:.: : . : . :::: ..:. . .:.:: .
CCDS44 QLLAQDMDNDPLVFGVSGEEASR-FFAVEPDTGVVWLRQPLDRETKSEFTVEFSVSDHQG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KA1 LVAEKVVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQ
....:: : : :.::.:: : ..:: . .::. :.:. :: :.:.: : :.:::: : .:
CCDS44 VITRKVNIQVGDVNDNAPTFHNQPYSVRIPENTPVGTPIFIVNATDPDLGAGGSVLYSFQ
120 130 140 150 160 170
180 190 200 210 220 230
pF1KA1 NLHSPFAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVN
. ::.: :.. . :::: .... .:: : : . .:. .....
CCDS44 PPSQFFAIDSARGIVTVI--RELDYETTQAYQLTVNATD-----QDKTRPLSTLANLAII
180 190 200 210 220
240 250 260 270 280 290
pF1KA1 VEDVQDMAPVFVGTPYYGYVYEDTLPGSEVLKVVAMDGDRGKPNRILYSLVNGN-DGAFE
. ::::: :.:.. :: .:: . ::. : ..:.: :.:.: : :..:.:: .. :
CCDS44 ITDVQDMDPIFINLPYSTNIYEHSPPGTTVRIITAIDQDKGRPRGIGYTIVSGNTNSIFA
230 240 250 260 270 280
300 310 320 330 340 350
pF1KA1 INETSGAISIT---QSPAQLQREVYELHVQVTEMSPAGSPA-AQATVPVTIRIVDLNNHP
.. ::..... . : . . : :. ::.. .:. : .:. .: ..:.:..
CCDS44 LDYISGVLTLNGLLDRENPLYSHGFILTVKGTELNDDRTPSDATVTTTFNILVIDINDNA
290 300 310 320 330 340
360 370 380 390 400
pF1KA1 PTFYGESGPQNRFELSMNEHPPQGEILRGLKITVNDSDQ--GANAKFNLQLVGPRGI-FR
: : . ... ....: : : : : : :.:. : :. :.. ::: . :
CCDS44 PEFNS-----SEYSVAITELAQVGFAL-PLFIQVVDKDENLGLNSMFEVYLVGNNSHHFI
350 360 370 380 390
410 420 430 440 450 460
pF1KA1 VVPQTVLNEAQVTIIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDTND
. : .: ..:.. : : . .:.: : :.: : ..:.. . : : : :.. ::
CCDS44 ISPTSVQGKADIRIRV--AIPLDYETVDRYDFDLFANE-SVPDHVGY-AKVKITLINEND
400 410 420 430 440 450
470 480 490 500 510 520
pF1KA1 NVPKFDSLYYVARIPENAPGGSSVVAVTAVDP--DTGPWGEVKYSTYGTGADLFLIHPST
: : :.. : . ::. :.::..: :.: .::
CCDS44 NRPIFSQPLYNISLYENVTVGTSVLTVL-VSPRFTAGPLSSPGPTVVRHPEGFCPRDLSN
460 470 480 490 500 510
530 540 550 560 570 580
pF1KA1 GLIYTQPWASLDAEATARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGKSVQKKTM
CCDS44 QGRRHPQIPELCLLVY
520 530
>>CCDS7771.1 DCHS1 gene_id:8642|Hs108|chr11 (3298 aa)
initn: 441 init1: 276 opt: 705 Z-score: 495.5 bits: 104.7 E(32554): 2.8e-21
Smith-Waterman score: 715; 27.8% identity (57.1% similar) in 753 aa overlap (46-748:2287-2998)
20 30 40 50 60 70
pF1KA1 LCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVGSHVYTLNGTDPEGDPISYHISFDP
::. .::.. ..:.: .. :. ... ..:
CCDS77 LVGSATLTVMVIDTNDNRPTIPQPWELRVSEDALLGSEIAQVTGNDVDSGPVLWYV-LSP
2260 2270 2280 2290 2300 2310
80 90 100 110 120 130
pF1KA1 S-TRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLNLVAEKVVILVTDANDEAPR
: .. ::: : ..:. :: :. :. . . :: . ....:: :.::.::
CCDS77 SGPQDPFSVGRYGGRVSLTGPLDFEQCDRYQLQLLAHDGPHEGRANLTVLVEDVNDNAPA
2320 2330 2340 2350 2360 2370
140 150 160 170 180 190
pF1KA1 FIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQNLHSPFAVDRHSGVLRLQA
: : : ... : : :: :..: :.:::.:..: ..: : . . :.:: ..:.: .
CCDS77 FSQSLYQVMLLEHTPPGSAILSVSATDRDSGANGHISYHLASPADGFSVDPNNGTLFTIV
2380 2390 2400 2410 2420 2430
200 210 220 230 240 250
pF1KA1 GAT-LDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVNVEDVQDMAPVFVGTPYYG
:.. : .. : . ... :.: ::: .: .:: :...: .: :: :. . :
CCDS77 GTVALGHDGSGAVDVVLEARD-----HGAPGR-AARATVHVQLQDQNDHAPSFTLSHYRV
2440 2450 2460 2470 2480
260 270 280 290 300
pF1KA1 YVYEDTLPGSEVLKVVAMDGDRGKPNRIL-YSLVNGNDG-AF-------EINETSG----
: :: ::: .: . : :.: .. . . ::...:: : .: : .:..:
CCDS77 AVTEDLPPGSTLLTLEATDADGSRSHAAVDYSIISGNWGRVFQLEPRLAEAGESAGPGPR
2490 2500 2510 2520 2530 2540
310 320 330 340 350 360
pF1KA1 AISITQSPAQLQREVYELHVQVTEMSPAGSPAAQATVPVTIRIVDLNNHPPTFYGESGPQ
:.. :. : . .. . :.: ...::::. ..:.:..::.: :
CCDS77 ALGCLVLLEPLDFESLTQYNLTVAAADRGQPPQSSVVPVTVTVLDVNDNPPVFTRAS---
2550 2560 2570 2580 2590 2600
370 380 390 400 410
pF1KA1 NRFELSMNEHPPQGEILRGLKITVNDSDQGANA--KFNLQLVGPRGIFRVVPQTVLNEAQ
..... : : : : :.. ..:.: : .. .:... : :.:. :.:..
CCDS77 --YRVTVPEDTPVGAEL--LHVEASDADPGPHGLVRFTVSSGDPSGLFE------LDESS
2610 2620 2630 2640 2650
420 430 440 450 460 470
pF1KA1 VTIIVENSAAIDFEKSKVLTFKLLAVEVNTPE-KFSSTADVVIQLLDTNDNVPKFDSLYY
:. . . :.: : . . . :.:.. : . : :.:.. :.::. : :
CCDS77 GTLRLAH--ALDCETQ---ARHQLVVQAADPAGAHFALAPVTIEVQDVNDHGPAFPLNLL
2660 2670 2680 2690 2700 2710
480 490 500 510 520 530
pF1KA1 VARIPENAPGGSSVVAVTAVDPDTGPWGEVKYSTY--GTGAD---LFLIHPSTGLIYTQP
. . :: : :. :... :.: :.: .:...:: : : . : .. ::: . ..
CCDS77 STSVAENQPPGTLVTTLHAIDGDAGAFGRLRYSLLEAGPGPEGREAFALNSSTGELRAR-
2720 2730 2740 2750 2760 2770
540 550 560 570 580
pF1KA1 WASLDAEATARYNFYVKAEDMEGKYSVA---EVFITLLDVNDH---PPQFGKSVQKKTMV
. .: : : . . : : : :. :.. :..: : : : : .: . .
CCDS77 -VPFDYEHTESFRLLVGAADA-GNLSASVTVSVLVTGEDEYDPVFLAPAFHFQVPEGARR
2780 2790 2800 2810 2820
590 600 610 620 630 640
pF1KA1 LGTPVKIEAIDEDAEEPNNLVDYSITHAEPANVFDINSHTGEIWLKNSIRSLDALHNITP
. ...: :::. ..:: ::.. . : : ::. :: ..:. . :. . .
CCDS77 GHSLGHVQATDEDGGA-DGLVLYSLATSSP--YFGINQTTGALYLRVDSRAPGSGTATSG
2830 2840 2850 2860 2870 2880
650 660 670 680 690
pF1KA1 G-----RDCLWSLEVQAKDRGS-P-SFSTTALLKIDITDAETLSRSPMAAFLIQTKDNPM
: :. :.... :: : : :.:. . .::: . .:. .: .:.
CCDS77 GGGRTRREAPRELRLEVIARGPLPGSRSATVPVTVDITHT-ALGLAPDLNLLL-------
2890 2900 2910 2920 2930
700 710 720 730 740
pF1KA1 KAVGVLAGTMATVV--AITVLISTATFWRNKKS-------NKVLPM-----RRVLRKRPS
::..:.....:: :...:. . :..:. ... :. ... :. ::
CCDS77 --VGAVAASLGVVVVLALAALVLGLVRARSRKAEAAPGPMSQAAPLASDSLQKLGREPPS
2940 2950 2960 2970 2980 2990
750 760 770 780 790 800
pF1KA1 PAPRTIRIEWLKSKSTKAATKFMLKEKPPNENCNNNSPESSLLPRAPALPPPPSVAPSTG
: :
CCDS77 PPPSEHLYHQTLPSYGGPGAGGPYPRGGSLDPSHSSGRGSAEAAEDDEIRMINEFPRVAS
3000 3010 3020 3030 3040 3050
>--
initn: 423 init1: 173 opt: 620 Z-score: 436.1 bits: 93.7 E(32554): 5.7e-18
Smith-Waterman score: 688; 29.7% identity (56.5% similar) in 644 aa overlap (66-678:75-677)
40 50 60 70 80 90
pF1KA1 NGNMALFSLPEDTPVGSHVYTLNGTDPEGDPISYHISFDPSTR--SVFSVDPTFGNITLV
:. : :: . .. . ...: : . .
CCDS77 GSLDLQIDEEQPAGTLIGDISAGLPAGTAAPLMYFISAQEGSGVGTDLAIDEHSGVVRTA
50 60 70 80 90 100
100 110 120 130 140 150
pF1KA1 EELDREREDEIEAIISISDGLNLVAEKVVILVTDANDEAPRFIQEPYVALVPEDIPAGSI
. ::::..:. . :: .. .:.. :.: ::.:: : : . ::: :.
CCDS77 RVLDREQRDRYRFTAVTPDGATV---EVTVRVADINDHAPAFPQARAALQVPEHTAFGTR
110 120 130 140 150 160
160 170 180 190 200
pF1KA1 IFKVHAVDRDTGSGGSVTYFLQNLHS--PFAVDRHSG-----VLRLQAGATLDYERSRTH
: : :.: :. : :.. . : .. . : : .: . . :: : .:.:
CCDS77 YPLEPARDADAGRLGTQGYALSGDGAGETFRLETRPGPDGTPVPELVVTGELDRE-NRSH
170 180 190 200 210 220
210 220 230 240 250 260
pF1KA1 YITVV-AKDGGGRLHGADVVFSATTTVTVNVEDVQDMAPVFVGTPYYGYVYEDTLPGSEV
:. . : :::. . :......: :..: ::.: . :.. : :. ::: :
CCDS77 YMLQLEAYDGGSPPRRAQALLDVTLL------DINDHAPAFNQSRYHAVVSESLAPGSPV
230 240 250 260 270
270 280 290 300 310 320
pF1KA1 LKVVAMDGDRGKPNRILYSLV---NGNDGAFEINETSGAISITQSPAQL-QREVYELHVQ
:.: : :.: : . . : . . .:: : :. .: ... . : .. ::.:.:: ::
CCDS77 LQVFASDADAGVNGAVTYEINRRQSEGDGPFSIDAHTGLLQL-ERPLDFEQRRVHELVVQ
280 290 300 310 320 330
330 340 350 360 370
pF1KA1 VTEMSPAGSPAAQATVPVTIRIVDLNNHPPT----FYGESG-PQNRFELSMNEHPPQGEI
. . .:. ... ::... : :.. :. : . .: :: ..: : :..
CCDS77 ARD---GGAHPELGSAFVTVHVRDANDNQPSMTVIFLSADGSPQ------VSEAAPPGQL
340 350 360 370 380
380 390 400 410 420 430
pF1KA1 LRGLKITVNDSDQGANAKFNLQLVGPRGIFRVVPQTVLNEAQVTIIVENSAAIDFEKSKV
. .:.:.: :.: :. :..: : .: : . : .: .: . .: :. .
CCDS77 VA--RISVSDPDDGDFAHVNVSLEGGEGHFALSTQD-----SVIYLVCVARRLDREERDA
390 400 410 420 430
440 450 460 470 480 490
pF1KA1 LTFKLLAVEVNTPEKFSSTADVVIQLLDTNDNVPKFD-SLYYVARIPENAPGGSSVVAVT
.... :.. ..: . . : :... :.:::.: :: .:: .:: : :: :: ::
CCDS77 YNLRVTATDSGSPP-LRAEAAFVLHVTDVNDNAPAFDRQLYRPEPLPEVALPGSFVVRVT
440 450 460 470 480 490
500 510 520 530 540 550
pF1KA1 AVDPDTGPWGEVKYSTY-GTGADLFLIHPSTGLIYTQPWASLDAEATARYNFYVKAED--
: ::: : :.: :: :. . : : :..:.: : :::: : . .. : : :
CCDS77 ARDPDQGTNGQVTYSLAPGAHTHWFSIDPTSGIITTA--ASLDYELEPQPQLIVVATDGG
500 510 520 530 540 550
560 570 580 590 600
pF1KA1 MEGKYSVAEVFITLLDVNDHPPQFGKSVQKKTMVLGT-P----VKIEAIDEDAEEPNNLV
. : : : ..: ::::. ::: .. . .. :: : ... : : :. : .:.
CCDS77 LPPLASSATVSVALQDVNDNEPQFQRTFYNASLPEGTQPGTCFLQVTATDADSG-PFGLL
560 570 580 590 600 610
610 620 630 640 650 660
pF1KA1 DYSI---THAEPANVFDINSHTGEIWLKNSIRSLDALHNITPGRDCLWSLEVQAKDRGSP
.::. . . : :..:.:.. . :.:: .. :. ... : : : :.
CCDS77 SYSLGAGLGSSGSPPFRIDAHSGDV---CTTRTLD--RDQGPSS---FDFTVTAVDGGG-
620 630 640 650 660
670 680 690 700 710 720
pF1KA1 SFSTTALLKIDITDAETLSRSPMAAFLIQTKDNPMKAVGVLAGTMATVVAITVLISTATF
... . .:. ..:
CCDS77 -LKSMVYVKVFLSDENDNPPQFYPREYAASISAQSPPGTAVLRLRAHDPDQGSHGRLSYH
670 680 690 700 710 720
>>CCDS33971.1 PCDH7 gene_id:5099|Hs108|chr4 (1069 aa)
initn: 294 init1: 191 opt: 529 Z-score: 379.9 bits: 81.7 E(32554): 7.7e-15
Smith-Waterman score: 573; 26.2% identity (55.5% similar) in 762 aa overlap (21-731:201-910)
10 20 30 40 50
pF1KA1 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPV
:. ::. .: :...:. . . :.
CCDS33 DFGRNGIERYELLQEPGGGGSGGESRRAGAADSAPYPGGGGNGASGGGSGGSKRRLDASE
180 190 200 210 220 230
60 70 80 90 100 110
pF1KA1 GSHVYTLNGTDPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISI
:. .::.: : .... . . .: .. . ::::..: : . .
CCDS33 GG-----GGTNPGGRSSVFELQVADTPDG--EKQP---QLIVKGALDREQRDSYELTLRV
240 250 260 270 280
120 130 140 150 160
pF1KA1 SDGLN--LVAEKVV-ILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSG
:: . .. .. .:.::.::..::: . : : . :. :. :....:.: :.: .
CCDS33 RDGGDPPRSSQAILRVLITDVNDNSPRFEKSVYEADLAENSAPGTPILQLRAADLDVGVN
290 300 310 320 330 340
170 180 190 200 210 220
pF1KA1 GSVTYFL----QNLHSPFAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGAD
:.. : . .... . .:. :: : . .: :. .::.:.: : . .:
CCDS33 GQIEYVFGAATESVRRLLRLDETSGWLSVLH--RIDREEVNQLRFTVMARDRG-QPPKTD
350 360 370 380 390
230 240 250 260 270
pF1KA1 VVFSATTTVTVNVEDVQDMAPVF----VGT-PY---YGYVYEDTLPGSEVLKVVAMDGDR
.::..:..: .: .: . .: : . : ::.: . . : . : :.
CCDS33 -----KATVVLNIKDENDNVPSIEIRKIGRIPLKDGVANVAEDVLVDTPIALVQVSDRDQ
400 410 420 430 440 450
280 290 300 310 320
pF1KA1 GKPNRILYSLVNGNDGAFEI---NETSGAIS----ITQSPAQLQREV-YELHVQVTEMSP
:. : .. : : : :.. ..: : . . .. . :. :. :..: .. ..
CCDS33 GE-NGVVTCTVVG-DVPFQLKPASDTEGDQNKKKYFLHTSTPLDYEATREFNVVIVAVD-
460 470 480 490 500
330 340 350 360 370 380
pF1KA1 AGSPAAQATVPVTIRIVDLNNHPPTFYGESGPQNRFELSMNEHPPQGEILRGLKITVNDS
.:::. ... . ... : :..:: : : :. :. . :. :: : . ..:.
CCDS33 SGSPSLSSNNSLIVKVGDTNDNPPMF----G-QSVVEVYFPENNIPGE--RVATVLATDA
510 520 530 540 550 560
390 400 410 420 430 440
pF1KA1 DQGANAKFNLQLVGP-RGIFRVVPQTVLNEAQVTIIVENSAAIDFEKSKVLTFKLLAVEV
:.: ::.. .: . ::: . :.. :.: ....: :.. ::. : .
CCDS33 DSGKNAEIAYSLDSSVMGIFAIDPDSG------DILV--NTVLDREQTDRYEFKVNAKDK
570 580 590 600 610
450 460 470 480 490 500
pF1KA1 NTPEKFSSTADVVIQLLDTNDNVPKFDSLYYVARIPENAPGGSSVVAVTAVDPDTGPWGE
. : .::. :..:. : ::: ::: . .. . :: .: : ::..: : : .:
CCDS33 GIPVLQGSTT-VIVQVADKNDNDPKFMQDVFTFYVKENLQPNSPVGMVTVMDADKGRNAE
620 630 640 650 660 670
510 520 530 540 550 560
pF1KA1 VKYSTY-GTGADLFLIHPSTGLIYTQPWASLDAEATARYNFYVKAEDM--EGKYSVAEVF
. : : . ..: :. .:: ::. :.: : . :.: ::: : . ..: :
CCDS33 M--SLYIEENNNIFSIENDTGTIYST--MSFDREHQTTYTFRVKAVDGGDPPRSATATVS
680 690 700 710 720
570 580 590 600 610
pF1KA1 ITLLDVNDHPPQ--FGKSVQKKTMVLGTPVK-----IEAIDEDAEEPNNLVDYSITHAEP
. ..: ::. : . :... . .. :. . : : : . : ..:::. ..:
CCDS33 LFVMDENDNAPTVTLPKNISYTLLPPSSNVRTVVATVLATDSD-DGINADLNYSIVGGNP
730 740 750 760 770 780
620 630 640 650 660 670
pF1KA1 ANVFDINSHTGEIWLKNSIRSLDALHNITPGRDCLWSLEVQAKDRGSPSFSTTALLKI--
..:.:. .: . : . ..: . : : ::..: :.:: :::.:...
CCDS33 FKLFEIDPTSGVVSL---------VGKLTQKHYGLHRLVVQVNDSGQPSQSTTTLVHVFV
790 800 810 820 830
680 690 700 710
pF1KA1 --DITDAETLSRSPMAAFLIQ-TKD---NPMK---------AVGVLAGTMATVVAITVLI
....: ... . .. : :.: .: ..::.:: : ::. : ...
CCDS33 NESVSNATAIDSQIARSLHIPLTQDIAGDPSYEISKQRLSIVIGVVAGIM-TVILIILIV
840 850 860 870 880 890
720 730 740 750 760 770
pF1KA1 STATFWRNKKSNKVLPMRRVLRKRPSPAPRTIRIEWLKSKSTKAATKFMLKEKPPNENCN
: . :.:..:
CCDS33 VMARYCRSKNKNGYEAGKKDHEDFFTPQQHDKSKKPKKDKKNKKSKQPLYSSIVTVEASK
900 910 920 930 940 950
>>CCDS75116.1 PCDH7 gene_id:5099|Hs108|chr4 (1072 aa)
initn: 294 init1: 191 opt: 529 Z-score: 379.9 bits: 81.7 E(32554): 7.7e-15
Smith-Waterman score: 573; 26.2% identity (55.5% similar) in 762 aa overlap (21-731:201-910)
10 20 30 40 50
pF1KA1 MRRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPV
:. ::. .: :...:. . . :.
CCDS75 DFGRNGIERYELLQEPGGGGSGGESRRAGAADSAPYPGGGGNGASGGGSGGSKRRLDASE
180 190 200 210 220 230
60 70 80 90 100 110
pF1KA1 GSHVYTLNGTDPEGDPISYHISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISI
:. .::.: : .... . . .: .. . ::::..: : . .
CCDS75 GG-----GGTNPGGRSSVFELQVADTPDG--EKQP---QLIVKGALDREQRDSYELTLRV
240 250 260 270 280
120 130 140 150 160
pF1KA1 SDGLN--LVAEKVV-ILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSG
:: . .. .. .:.::.::..::: . : : . :. :. :....:.: :.: .
CCDS75 RDGGDPPRSSQAILRVLITDVNDNSPRFEKSVYEADLAENSAPGTPILQLRAADLDVGVN
290 300 310 320 330 340
170 180 190 200 210 220
pF1KA1 GSVTYFL----QNLHSPFAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGAD
:.. : . .... . .:. :: : . .: :. .::.:.: : . .:
CCDS75 GQIEYVFGAATESVRRLLRLDETSGWLSVLH--RIDREEVNQLRFTVMARDRG-QPPKTD
350 360 370 380 390
230 240 250 260 270
pF1KA1 VVFSATTTVTVNVEDVQDMAPVF----VGT-PY---YGYVYEDTLPGSEVLKVVAMDGDR
.::..:..: .: .: . .: : . : ::.: . . : . : :.
CCDS75 -----KATVVLNIKDENDNVPSIEIRKIGRIPLKDGVANVAEDVLVDTPIALVQVSDRDQ
400 410 420 430 440 450
280 290 300 310 320
pF1KA1 GKPNRILYSLVNGNDGAFEI---NETSGAIS----ITQSPAQLQREV-YELHVQVTEMSP
:. : .. : : : :.. ..: : . . .. . :. :. :..: .. ..
CCDS75 GE-NGVVTCTVVG-DVPFQLKPASDTEGDQNKKKYFLHTSTPLDYEATREFNVVIVAVD-
460 470 480 490 500
330 340 350 360 370 380
pF1KA1 AGSPAAQATVPVTIRIVDLNNHPPTFYGESGPQNRFELSMNEHPPQGEILRGLKITVNDS
.:::. ... . ... : :..:: : : :. :. . :. :: : . ..:.
CCDS75 SGSPSLSSNNSLIVKVGDTNDNPPMF----G-QSVVEVYFPENNIPGE--RVATVLATDA
510 520 530 540 550 560
390 400 410 420 430 440
pF1KA1 DQGANAKFNLQLVGP-RGIFRVVPQTVLNEAQVTIIVENSAAIDFEKSKVLTFKLLAVEV
:.: ::.. .: . ::: . :.. :.: ....: :.. ::. : .
CCDS75 DSGKNAEIAYSLDSSVMGIFAIDPDSG------DILV--NTVLDREQTDRYEFKVNAKDK
570 580 590 600 610
450 460 470 480 490 500
pF1KA1 NTPEKFSSTADVVIQLLDTNDNVPKFDSLYYVARIPENAPGGSSVVAVTAVDPDTGPWGE
. : .::. :..:. : ::: ::: . .. . :: .: : ::..: : : .:
CCDS75 GIPVLQGSTT-VIVQVADKNDNDPKFMQDVFTFYVKENLQPNSPVGMVTVMDADKGRNAE
620 630 640 650 660 670
510 520 530 540 550 560
pF1KA1 VKYSTY-GTGADLFLIHPSTGLIYTQPWASLDAEATARYNFYVKAEDM--EGKYSVAEVF
. : : . ..: :. .:: ::. :.: : . :.: ::: : . ..: :
CCDS75 M--SLYIEENNNIFSIENDTGTIYST--MSFDREHQTTYTFRVKAVDGGDPPRSATATVS
680 690 700 710 720
570 580 590 600 610
pF1KA1 ITLLDVNDHPPQ--FGKSVQKKTMVLGTPVK-----IEAIDEDAEEPNNLVDYSITHAEP
. ..: ::. : . :... . .. :. . : : : . : ..:::. ..:
CCDS75 LFVMDENDNAPTVTLPKNISYTLLPPSSNVRTVVATVLATDSD-DGINADLNYSIVGGNP
730 740 750 760 770 780
620 630 640 650 660 670
pF1KA1 ANVFDINSHTGEIWLKNSIRSLDALHNITPGRDCLWSLEVQAKDRGSPSFSTTALLKI--
..:.:. .: . : . ..: . : : ::..: :.:: :::.:...
CCDS75 FKLFEIDPTSGVVSL---------VGKLTQKHYGLHRLVVQVNDSGQPSQSTTTLVHVFV
790 800 810 820 830
680 690 700 710
pF1KA1 --DITDAETLSRSPMAAFLIQ-TKD---NPMK---------AVGVLAGTMATVVAITVLI
....: ... . .. : :.: .: ..::.:: : ::. : ...
CCDS75 NESVSNATAIDSQIARSLHIPLTQDIAGDPSYEISKQRLSIVIGVVAGIM-TVILIILIV
840 850 860 870 880 890
720 730 740 750 760 770
pF1KA1 STATFWRNKKSNKVLPMRRVLRKRPSPAPRTIRIEWLKSKSTKAATKFMLKEKPPNENCN
: . :.:..:
CCDS75 VMARYCRSKNKNGYEAGKKDHEDFFTPQQHDKSKKPKKDKKNKKSKQPLYSSIVTVEASK
900 910 920 930 940 950
>>CCDS3785.1 DCHS2 gene_id:54798|Hs108|chr4 (2916 aa)
initn: 343 init1: 206 opt: 517 Z-score: 365.0 bits: 80.4 E(32554): 5.2e-14
Smith-Waterman score: 698; 25.7% identity (56.6% similar) in 770 aa overlap (44-780:1900-2605)
20 30 40 50 60
pF1KA1 LRLCLAQANFAPHFFDNGVGSTNGNMALFSLPEDTPVG---SHVYTLNGTDPEGDPI-SY
. ::. : .:: ... .: .. : :.
CCDS37 PRLSNTTVIKVQVTDINDNAPAFLPSEAVEITEDSLPGVIVTHV-SVHDVDLNSAFIFSF
1870 1880 1890 1900 1910 1920
70 80 90 100 110 120
pF1KA1 HISFDPSTRSVFSVDPTFGNITLVEELDREREDEIEAIISISDGLNLVAEKVVILVTDAN
.:.:. :..: . : ..::. :: :. : : .:.:::... . .:. : :.:
CCDS37 AKESNPGTK--FAIDQNTGVVVLVKTLDFEEMTEYELLIQISDSVHYTEGALVVRVLDVN
1930 1940 1950 1960 1970 1980
130 140 150 160 170 180
pF1KA1 DEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVTYFLQNLHSPFAVDRHSGV
:. : : :. : . :::.::.: .. . :.: . :. ...: . . . :..: ..:.
CCDS37 DNPPVFSQDFYQVTVPESIPVGYSVLTLSATDLE--SNENISYRILSSSKEFSIDPKNGT
1990 2000 2010 2020 2030 2040
190 200 210 220 230 240
pF1KA1 LRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTTVTVNVEDVQDMAPVFVGT
. . . : : :... : :.:::. :. : : : ...::....:: :.
CCDS37 IFTISPVLLLDTISTTQFL-VEASDGGN----PDL--RALTLVEIGIEDMNNYAPEFTVK
2050 2060 2070 2080 2090
250 260 270 280 290
pF1KA1 PYYGYVYEDTLPGSEVLKVVAMDGDRGKPNR-ILYSLVNGND-GAFEIN----------E
: . ::.: :: .. .: : . : . ::...::. . :... .
CCDS37 SYNLSLSEDALVGSTLVTFSNIDHDWTRENTYVEYSIISGNSQNNFHVETKFFHSEYPYK
2100 2110 2120 2130 2140 2150
300 310 320 330 340 350
pF1KA1 TSGAISITQSPAQLQREVYELHVQVTEMSPAGSPAAQATVPVTIRIVDLNNHPPTFYGES
: . . .: :.::. : : : .: : ..:. ..:...:.:..::.: . :
CCDS37 QVGYLVLLHS---LDREASASHELVILASDSGCPPLSSTAVISIQVLDVNDNPPNFSSLS
2160 2170 2180 2190 2200 2210
360 370 380 390 400 410
pF1KA1 GPQNRFELSMNEHPPQGEILRGLKITVNDSDQGANAK--FNLQLVGPRGIFRVVPQTVLN
.. ..: : : . ...:: : :..:. .:. . .: : . .:
CCDS37 -----YHTHVKESTPLGSHI--TVVSANDRDTGSHAEIIYNIISGNEKGHFYLEENT---
2220 2230 2240 2250 2260
420 430 440 450 460 470
pF1KA1 EAQVTIIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDTNDNVPKFDSL
: ... .:.: :. : : . .. .: : : : ...:: ::..:.:
CCDS37 --GVLYLIK---PLDYE--KMTKFTLTVQASDAEKKHFSFAVVFVSVLDDNDHAPQFMFS
2270 2280 2290 2300 2310
480 490 500 510 520
pF1KA1 YYVARIPENAPGGSSVVAVTAVDPDTGPWGEVKYS-------TYGTGAD--LFLIHPSTG
. .::: : .:.. ...:.: :.::.::. :: :.: . : :::: : ::
CCDS37 SFSCIVPENLPISSTICSINALDFDAGPYGELTYSIVSPCFLTHGMSYDHDLFLIDPLTG
2320 2330 2340 2350 2360 2370
530 540 550 560 570 580
pF1KA1 LIYTQPWASLDAEATARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGK-----SVQ
:... :: : .: . :.:.: . :.. . ... : : . ..
CCDS37 DIHAKQ--ILDYENGNKYCLTVQAKDKGDATASLVVWVDIEGIDEFEPIFTQDQYFFTLP
2380 2390 2400 2410 2420 2430
590 600 610 620 630 640
pF1KA1 KKTMVLGTPVKIEAIDEDAEEPNNLVDYSITHAEPANVFDINSHTGEIWLKNSIRSLDAL
.:. ..:: : :: .... ::. . : :..:. .:.:.: ::.: .
CCDS37 EKNKDRQLIGRVEASDADAG-IDGVILYSLGTSSP--FFSVNKTNGNIYL---IRALPLI
2440 2450 2460 2470 2480
650 660 670 680 690 700
pF1KA1 HNITPGRDCLWSLEVQAKDRGSPSF-STTALLKIDITDAETLSRSPMAAFLIQTKDNPMK
.. .: : . . ... .: : :......... : :.:.: .
CCDS37 KSQLNKEDTLEMKIIAHSPKSDSKFASCTVFVNVSFSSEGT----PLAVFASSF------
2490 2500 2510 2520 2530
710 720 730 740 750 760
pF1KA1 AVGVLAGTMATVVAITVLISTATFWRNKKSNKVLPMRRVLRKRPSPAPRTIRIEWLKSKS
....... .. .. : .:: . . :.:... . ... :. : .:.
CCDS37 SISLVVSFLVFLILICILI--VMILRHKQKDTINNYEE---KKTSSLDADLRV-------
2540 2550 2560 2570 2580
770 780 790 800 810 820
pF1KA1 TKAATKFMLKEKPPNENCNNNSPESSLLPRAPALPPPPSVAPSTGAAQWTVPTVSGSLTP
:. :. .:: ...:.:
CCDS37 TRDAS--VLKAFQKTDDCSNEVVPVDATPEWLSLISIMEKDIVNLYRHSNSSGHCSVEGE
2590 2600 2610 2620 2630 2640
>>CCDS14076.1 CELSR1 gene_id:9620|Hs108|chr22 (3014 aa)
initn: 406 init1: 198 opt: 501 Z-score: 353.6 bits: 78.3 E(32554): 2.2e-13
Smith-Waterman score: 662; 32.1% identity (60.0% similar) in 517 aa overlap (32-526:677-1158)
10 20 30 40 50
pF1KA1 RRCRWAALALGLLRLCLAQANFAPHFFDNGVGSTNGNMALFSLP-------EDTPVGSHV
: ..: : .:. : ::. ::: :
CCDS14 REEVEHYSFGVEAVDHGSPPMSSSTSVSITVLDVNDNDPVFTQPTYELRLNEDAAVGSSV
650 660 670 680 690 700
60 70 80 90 100 110
pF1KA1 YTLNGTDPEGDP-ISYHISFDPSTRSVFSVDPTFGN--ITLVEELDREREDEIEAIISIS
::.. : ... :.:... .::. :... :. :::. :: ..:.. .. :
CCDS14 LTLQARDRDANSVITYQLT-GGNTRNRFALSSQRGGGLITLALPLDYKQEQQYVLAVTAS
710 720 730 740 750 760
120 130 140 150 160 170
pF1KA1 DGLNLVAEKVVILVTDANDEAPRFIQEPYVALVPEDIPAGSIIFKVHAVDRDTGSGGSVT
:: . .:.: ::::: . : : . :.. : :: :.:. : . : :.::: .. .:
CCDS14 DGTRSHTAHVLINVTDANTHRPVFQSSHYTVSVSEDRPVGTSIATLSANDEDTGENARIT
770 780 790 800 810 820
180 190 200 210 220 230
pF1KA1 YFLQNLHSPFAVDRHSGVLRLQAGATLDYERSRTHYITVVAKDGGGRLHGADVVFSATTT
: .:. : .: ::.. . :::: . .. .:..:.:.: . : :::
CCDS14 YVIQDPVPQFRIDPDSGTMYTMM--ELDYENQVAYTLTIMAQDNGIPQK------SDTTT
830 840 850 860 870
240 250 260 270 280 290
pF1KA1 VTVNVEDVQDMAPVFVGTPYYGYVYEDTLPGSEVLKVVAMDGDRGKPNRILYSLVNGNDG
. . . :..: :: :. : : ..::. :.. .:.: : : : : .:.::.. .:.::
CCDS14 LEILILDANDNAPQFLWDFYQGSIFEDAPPSTSILQVSATDRDSGPNGRLLYTFQGGDDG
880 890 900 910 920 930
300 310 320 330 340
pF1KA1 A--FEINETSGAISITQSPAQLQRE---VYELHVQVTEMSPAGSPAA-QATVPVTIRIVD
: :. :::.: .. .:.:: ::.: . ... :::. .:.: . . :.:
CCDS14 DGDFYIEPTSGVI---RTQRRLDRENVAVYNLWALAVDR---GSPTPLSASVEIQVTILD
940 950 960 970 980 990
350 360 370 380 390 400
pF1KA1 LNNHPPTFYGESGPQNRFELSMNEHPPQGEILRGLKITVNDSDQGANAKFNLQLVGPRGI
.:.. : : ....:: ..:. : : .. :: .:: :.: ::.. :.: .:
CCDS14 INDNAPMF-----EKDELELFVEENNPVGSVVA--KIRANDPDEGPNAQIMYQIV--EGD
1000 1010 1020 1030 1040
410 420 430 440 450 460
pF1KA1 FRVVPQTVLNEAQVTIIVENSAAIDFEKSKVLTFKLLAVEVNTPEKFSSTADVVIQLLDT
.: : : .... .:: .::: . . :.. ...: . : : : : :.:
CCDS14 MRHFFQLDLLNGDLRAMVE----LDFEVRR--EYVLVVQATSAP--LVSRATVHILLVDQ
1050 1060 1070 1080 1090
470 480 490 500 510
pF1KA1 NDN---VPKFDSLY--YVARIPENAPGGSSVVAVTAVDPDTGPWGEVKYS-TYGTGADLF
::: .: :. :. ::. .. : : . . : :::.. ..:. . :. :.
CCDS14 NDNPPVLPDFQILFNNYVTNKSNSFPTGV-IGCIPAHDPDVS--DSLNYTFVQGNELRLL
1100 1110 1120 1130 1140 1150
520 530 540 550 560 570
pF1KA1 LIHPSTGLIYTQPWASLDAEATARYNFYVKAEDMEGKYSVAEVFITLLDVNDHPPQFGKS
:. :.::
CCDS14 LLDPATGELQLSRDLDNNRPLEALMEVSVSDGIHSVTAFCTLRVTIITDDMLTNSITVRL
1160 1170 1180 1190 1200 1210
859 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 01:48:55 2016 done: Fri Nov 4 01:48:56 2016
Total Scan time: 3.790 Total Display time: 0.270
Function used was FASTA [36.3.4 Apr, 2011]