FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4879, 810 aa
1>>>pF1KB4879 810 - 810 aa - 810 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.6344+/-0.000996; mu= 10.5514+/- 0.060
mean_var=143.1389+/-27.988, 0's: 0 Z-trim(108.8): 72 B-trim: 11 in 1/54
Lambda= 0.107200
statistics sampled from 10356 (10427) to 10356 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.669), E-opt: 0.2 (0.32), width: 16
Scan time: 4.480
The best scores are: opt bits E(32554)
CCDS53288.1 EPB41 gene_id:2035|Hs108|chr1 ( 864) 4061 640.3 3.9e-183
CCDS53289.1 EPB41 gene_id:2035|Hs108|chr1 ( 720) 4043 637.5 2.3e-182
CCDS330.1 EPB41 gene_id:2035|Hs108|chr1 ( 775) 3565 563.6 4.5e-160
CCDS331.1 EPB41 gene_id:2035|Hs108|chr1 ( 588) 2727 433.9 3.7e-121
CCDS332.1 EPB41 gene_id:2035|Hs108|chr1 ( 641) 2693 428.7 1.5e-119
CCDS56450.1 EPB41L2 gene_id:2037|Hs108|chr6 ( 852) 1934 311.4 4.1e-84
CCDS59037.1 EPB41L2 gene_id:2037|Hs108|chr6 ( 747) 1885 303.8 7.1e-82
CCDS47474.1 EPB41L2 gene_id:2037|Hs108|chr6 ( 673) 1884 303.6 7.3e-82
CCDS5141.1 EPB41L2 gene_id:2037|Hs108|chr6 (1005) 1884 303.7 1e-81
CCDS58771.1 EPB41L1 gene_id:2036|Hs108|chr20 ( 880) 1873 302.0 2.9e-81
CCDS13271.1 EPB41L1 gene_id:2036|Hs108|chr20 ( 881) 1873 302.0 2.9e-81
CCDS62381.1 EPB41L3 gene_id:23136|Hs108|chr18 ( 865) 1869 301.3 4.5e-81
CCDS62382.1 EPB41L3 gene_id:23136|Hs108|chr18 ( 883) 1869 301.3 4.5e-81
CCDS82237.1 EPB41L3 gene_id:23136|Hs108|chr18 ( 918) 1869 301.3 4.7e-81
CCDS11838.1 EPB41L3 gene_id:23136|Hs108|chr18 (1087) 1816 293.2 1.6e-78
CCDS58770.1 EPB41L1 gene_id:2036|Hs108|chr20 ( 701) 1809 292.0 2.3e-78
CCDS82236.1 EPB41L3 gene_id:23136|Hs108|chr18 ( 756) 1795 289.9 1.1e-77
CCDS13272.1 EPB41L1 gene_id:2036|Hs108|chr20 ( 779) 1766 285.4 2.5e-76
CCDS2129.1 PTPN4 gene_id:5775|Hs108|chr2 ( 926) 1034 172.2 3.5e-42
CCDS54392.1 EPB41L5 gene_id:57669|Hs108|chr2 ( 505) 925 155.2 2.5e-37
CCDS54393.1 EPB41L5 gene_id:57669|Hs108|chr2 ( 687) 924 155.1 3.7e-37
CCDS82506.1 EPB41L5 gene_id:57669|Hs108|chr2 ( 732) 924 155.1 3.8e-37
CCDS2130.1 EPB41L5 gene_id:57669|Hs108|chr2 ( 733) 924 155.1 3.8e-37
CCDS9487.1 FARP1 gene_id:10160|Hs108|chr13 (1045) 919 154.5 8.8e-37
CCDS66572.1 FARP1 gene_id:10160|Hs108|chr13 (1076) 919 154.5 9e-37
CCDS43860.1 EPB41L4B gene_id:54566|Hs108|chr9 ( 518) 890 149.8 1.1e-35
CCDS43859.1 EPB41L4B gene_id:54566|Hs108|chr9 ( 900) 890 149.9 1.7e-35
CCDS59133.1 FRMD3 gene_id:257019|Hs108|chr9 ( 556) 884 148.9 2.2e-35
CCDS43840.1 FRMD3 gene_id:257019|Hs108|chr9 ( 597) 884 148.9 2.4e-35
CCDS43350.1 EPB41L4A gene_id:64097|Hs108|chr5 ( 686) 847 143.2 1.4e-33
CCDS63198.1 FARP2 gene_id:9855|Hs108|chr2 ( 638) 844 142.7 1.8e-33
CCDS63197.1 FARP2 gene_id:9855|Hs108|chr2 ( 647) 844 142.7 1.8e-33
CCDS10107.2 FRMD5 gene_id:84978|Hs108|chr15 ( 570) 840 142.1 2.6e-33
CCDS33424.1 FARP2 gene_id:9855|Hs108|chr2 (1054) 844 142.9 2.7e-33
CCDS75852.1 FRMD3 gene_id:257019|Hs108|chr9 ( 553) 824 139.6 1.4e-32
CCDS35397.1 FRMD7 gene_id:90167|Hs108|chrX ( 714) 794 135.0 4.3e-31
CCDS6776.1 PTPN3 gene_id:5774|Hs108|chr9 ( 913) 785 133.7 1.4e-30
CCDS73716.1 FRMD5 gene_id:84978|Hs108|chr15 ( 414) 592 103.6 6.9e-22
CCDS78504.1 FRMD7 gene_id:90167|Hs108|chrX ( 699) 594 104.1 8.6e-22
CCDS48001.1 PTPN3 gene_id:5774|Hs108|chr9 ( 782) 534 94.8 5.8e-19
CCDS9884.1 PTPN21 gene_id:11099|Hs108|chr14 (1174) 530 94.3 1.2e-18
CCDS48000.1 PTPN3 gene_id:5774|Hs108|chr9 ( 737) 520 92.7 2.5e-18
CCDS5258.1 EZR gene_id:7430|Hs108|chr6 ( 586) 468 84.6 5.4e-16
CCDS4536.1 MYLIP gene_id:29116|Hs108|chr6 ( 445) 445 80.9 5.1e-15
CCDS14382.1 MSN gene_id:4478|Hs108|chrX ( 577) 446 81.1 5.7e-15
CCDS8343.1 RDX gene_id:5962|Hs108|chr11 ( 583) 439 80.1 1.2e-14
CCDS58174.1 RDX gene_id:5962|Hs108|chr11 ( 604) 439 80.1 1.2e-14
CCDS1514.1 PTPN14 gene_id:5784|Hs108|chr1 (1187) 420 77.3 1.7e-13
CCDS13862.1 NF2 gene_id:4771|Hs108|chr22 ( 590) 410 75.6 2.7e-13
CCDS13861.1 NF2 gene_id:4771|Hs108|chr22 ( 595) 410 75.6 2.8e-13
>>CCDS53288.1 EPB41 gene_id:2035|Hs108|chr1 (864 aa)
initn: 4037 init1: 4037 opt: 4061 Z-score: 3401.2 bits: 640.3 E(32554): 3.9e-183
Smith-Waterman score: 5015; 93.5% identity (93.5% similar) in 842 aa overlap (1-788:1-842)
10 20 30 40 50 60
pF1KB4 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQVSEEEGKEVESDKEKGEGGQKEIEFGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQVSEEEGKEVESDKEKGEGGQKEIEFGT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 SLDEEIILKAPIAAPEPELKTDPSLDLHSLSSAETQPAQEELREDPDFEIKEGEGLEECS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SLDEEIILKAPIAAPEPELKTDPSLDLHSLSSAETQPAQEELREDPDFEIKEGEGLEECS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 KIEVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVEKHAKGQDLLKRVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KIEVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVEKHAKGQDLLKRVC
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 EHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTEDI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 EHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTEDI
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 TRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 KELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSGL
::::::::::::: ::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KELEEKVMELHKSYRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSGL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 LVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKVC
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 VEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 VEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRAS
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 RSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 RSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKED
550 560 570 580 590 600
610
pF1KB4 EPPEQAEPEPTEAWK---------------------------------------------
:::::::::::::::
CCDS53 EPPEQAEPEPTEAWKVEKTHIEVTVPTSNGDQTQKLAEKTEDLIRMRKKKRERLDGENIY
610 620 630 640 650 660
620 630 640 650 660
pF1KB4 ---------DLDKSQEEIKKHHASISELKKNFMESVPEPRPSEWDKRLSTHSPFRTLNIN
:::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 IRHSNLMLEDLDKSQEEIKKHHASISELKKNFMESVPEPRPSEWDKRLSTHSPFRTLNIN
670 680 690 700 710 720
670 680 690 700 710 720
pF1KB4 GQIPTGEGPPLVKTQTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQTDDNSGDLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GQIPTGEGPPLVKTQTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQTDDNSGDLD
730 740 750 760 770 780
730 740 750 760 770 780
pF1KB4 PGVLLTAQTITSETPSSTTTTQITKTVKGGISETRIEKRIVITGDADIDHDQVLVQAIKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PGVLLTAQTITSETPSSTTTTQITKTVKGGISETRIEKRIVITGDADIDHDQVLVQAIKE
790 800 810 820 830 840
790 800 810
pF1KB4 AKEQHPDMSVTKVVVHQETEIADE
::
CCDS53 AKEQHPDMSVTKVVVHQETEIADE
850 860
>>CCDS53289.1 EPB41 gene_id:2035|Hs108|chr1 (720 aa)
initn: 4037 init1: 4037 opt: 4043 Z-score: 3387.4 bits: 637.5 E(32554): 2.3e-182
Smith-Waterman score: 4348; 93.6% identity (93.9% similar) in 720 aa overlap (1-680:1-720)
10 20 30 40 50 60
pF1KB4 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQVSEEEGKEVESDKEKGEGGQKEIEFGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQVSEEEGKEVESDKEKGEGGQKEIEFGT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 SLDEEIILKAPIAAPEPELKTDPSLDLHSLSSAETQPAQEELREDPDFEIKEGEGLEECS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SLDEEIILKAPIAAPEPELKTDPSLDLHSLSSAETQPAQEELREDPDFEIKEGEGLEECS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 KIEVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVEKHAKGQDLLKRVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KIEVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVEKHAKGQDLLKRVC
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 EHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTEDI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 EHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTEDI
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 TRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 KELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSGL
::::::::::::: ::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KELEEKVMELHKSYRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSGL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 LVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKVC
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 VEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 VEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRAS
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 RSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 RSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKED
550 560 570 580 590 600
610 620
pF1KB4 EPPEQAEPEPTEAWK----------------------------------------DLDKS
::::::::::::::: :::::
CCDS53 EPPEQAEPEPTEAWKVEKTHIEVTVPTSNGDQTQKKRERLDGENIYIRHSNLMLEDLDKS
610 620 630 640 650 660
630 640 650 660 670 680
pF1KB4 QEEIKKHHASISELKKNFMESVPEPRPSEWDKRLSTHSPFRTLNINGQIPTGEGPPLVKT
:::::::::::::::::::::::::::::::::::::::::::::::::::::: ..:
CCDS53 QEEIKKHHASISELKKNFMESVPEPRPSEWDKRLSTHSPFRTLNINGQIPTGEGVSTLST
670 680 690 700 710 720
690 700 710 720 730 740
pF1KB4 QTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQTDDNSGDLDPGVLLTAQTITSET
>>CCDS330.1 EPB41 gene_id:2035|Hs108|chr1 (775 aa)
initn: 3562 init1: 3562 opt: 3565 Z-score: 2987.4 bits: 563.6 E(32554): 4.5e-160
Smith-Waterman score: 4956; 95.6% identity (95.6% similar) in 810 aa overlap (1-810:1-775)
10 20 30 40 50 60
pF1KB4 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQVSEEEGKEVESDKEKGEGGQKEIEFGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQVSEEEGKEVESDKEKGEGGQKEIEFGT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 SLDEEIILKAPIAAPEPELKTDPSLDLHSLSSAETQPAQEELREDPDFEIKEGEGLEECS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SLDEEIILKAPIAAPEPELKTDPSLDLHSLSSAETQPAQEELREDPDFEIKEGEGLEECS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 KIEVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVEKHAKGQDLLKRVC
:::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KIEVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVE-------------
190 200 210 220
250 260 270 280 290 300
pF1KB4 EHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTEDI
::::::::::::::::::::::::::::::::::::::
CCDS33 ----------------------TWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTEDI
230 240 250 260
310 320 330 340 350 360
pF1KB4 TRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQT
270 280 290 300 310 320
370 380 390 400 410 420
pF1KB4 KELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSGL
::::::::::::: ::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KELEEKVMELHKSYRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSGL
330 340 350 360 370 380
430 440 450 460 470 480
pF1KB4 LVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKVC
390 400 410 420 430 440
490 500 510 520 530 540
pF1KB4 VEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRAS
450 460 470 480 490 500
550 560 570 580 590 600
pF1KB4 RSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKED
510 520 530 540 550 560
610 620 630 640 650 660
pF1KB4 EPPEQAEPEPTEAWKDLDKSQEEIKKHHASISELKKNFMESVPEPRPSEWDKRLSTHSPF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EPPEQAEPEPTEAWKDLDKSQEEIKKHHASISELKKNFMESVPEPRPSEWDKRLSTHSPF
570 580 590 600 610 620
670 680 690 700 710 720
pF1KB4 RTLNINGQIPTGEGPPLVKTQTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQTDD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RTLNINGQIPTGEGPPLVKTQTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQTDD
630 640 650 660 670 680
730 740 750 760 770 780
pF1KB4 NSGDLDPGVLLTAQTITSETPSSTTTTQITKTVKGGISETRIEKRIVITGDADIDHDQVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NSGDLDPGVLLTAQTITSETPSSTTTTQITKTVKGGISETRIEKRIVITGDADIDHDQVL
690 700 710 720 730 740
790 800 810
pF1KB4 VQAIKEAKEQHPDMSVTKVVVHQETEIADE
::::::::::::::::::::::::::::::
CCDS33 VQAIKEAKEQHPDMSVTKVVVHQETEIADE
750 760 770
>>CCDS331.1 EPB41 gene_id:2035|Hs108|chr1 (588 aa)
initn: 3057 init1: 2687 opt: 2727 Z-score: 2288.7 bits: 433.9 E(32554): 3.7e-121
Smith-Waterman score: 3589; 91.0% identity (91.0% similar) in 622 aa overlap (210-810:1-588)
180 190 200 210 220 230
pF1KB4 SKIEVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVEKHAKGQDLLKRV
::::::::::::::::::::::::::::::
CCDS33 MHCKVSLLDDTVYECVVEKHAKGQDLLKRV
10 20 30
240 250 260 270 280 290
pF1KB4 CEHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 CEHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTED
40 50 60 70 80 90
300 310 320 330 340 350
pF1KB4 ITRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ITRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQ
100 110 120 130 140 150
360 370 380 390 400 410
pF1KB4 TKELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSG
:::::::::::::: :::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TKELEEKVMELHKSYRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSG
160 170 180 190 200 210
420 430 440 450 460 470
pF1KB4 LLVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LLVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKV
220 230 240 250 260 270
480 490 500 510 520 530
pF1KB4 CVEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 CVEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRA
280 290 300 310 320 330
540 550 560 570 580 590
pF1KB4 SRSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SRSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKE
340 350 360 370 380 390
600 610 620 630
pF1KB4 DEPPEQAEPEPTEAWK---------------------DLDKSQEEIKKHHASISELKKNF
:::::::::::::::: :::::::::::::::::::::::
CCDS33 DEPPEQAEPEPTEAWKKKRERLDGENIYIRHSNLMLEDLDKSQEEIKKHHASISELKKNF
400 410 420 430 440 450
640 650 660 670 680 690
pF1KB4 MESVPEPRPSEWDKRLSTHSPFRTLNINGQIPTGEGPPLVKTQTVTISDNANAVKSEIPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MESVPEPRPSEWDKRLSTHSPFRTLNINGQIPTGEGPPLVKTQTVTISDNANAVKSEIPT
460 470 480 490 500 510
700 710 720 730 740 750
pF1KB4 KDVPIVHTETKTITYEAAQTDDNSGDLDPGVLLTAQTITSETPSSTTTTQITKTVKGGIS
:::::::::::::::::::: ::::::
CCDS33 KDVPIVHTETKTITYEAAQT----------------------------------VKGGIS
520 530
760 770 780 790 800 810
pF1KB4 ETRIEKRIVITGDADIDHDQVLVQAIKEAKEQHPDMSVTKVVVHQETEIADE
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ETRIEKRIVITGDADIDHDQVLVQAIKEAKEQHPDMSVTKVVVHQETEIADE
540 550 560 570 580
>>CCDS332.1 EPB41 gene_id:2035|Hs108|chr1 (641 aa)
initn: 2687 init1: 2687 opt: 2693 Z-score: 2259.7 bits: 428.7 E(32554): 1.5e-119
Smith-Waterman score: 3787; 93.5% identity (93.5% similar) in 633 aa overlap (210-802:1-633)
180 190 200 210 220 230
pF1KB4 SKIEVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVEKHAKGQDLLKRV
::::::::::::::::::::::::::::::
CCDS33 MHCKVSLLDDTVYECVVEKHAKGQDLLKRV
10 20 30
240 250 260 270 280 290
pF1KB4 CEHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 CEHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTED
40 50 60 70 80 90
300 310 320 330 340 350
pF1KB4 ITRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ITRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQ
100 110 120 130 140 150
360 370 380 390 400 410
pF1KB4 TKELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSG
:::::::::::::: :::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TKELEEKVMELHKSYRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSG
160 170 180 190 200 210
420 430 440 450 460 470
pF1KB4 LLVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LLVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKV
220 230 240 250 260 270
480 490 500 510 520 530
pF1KB4 CVEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 CVEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRA
280 290 300 310 320 330
540 550 560 570 580 590
pF1KB4 SRSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SRSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKE
340 350 360 370 380 390
600 610
pF1KB4 DEPPEQAEPEPTEAWK----------------------------------------DLDK
:::::::::::::::: ::::
CCDS33 DEPPEQAEPEPTEAWKVEKTHIEVTVPTSNGDQTQKKRERLDGENIYIRHSNLMLEDLDK
400 410 420 430 440 450
620 630 640 650 660 670
pF1KB4 SQEEIKKHHASISELKKNFMESVPEPRPSEWDKRLSTHSPFRTLNINGQIPTGEGPPLVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SQEEIKKHHASISELKKNFMESVPEPRPSEWDKRLSTHSPFRTLNINGQIPTGEGPPLVK
460 470 480 490 500 510
680 690 700 710 720 730
pF1KB4 TQTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQTDDNSGDLDPGVLLTAQTITSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TQTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQTDDNSGDLDPGVLLTAQTITSE
520 530 540 550 560 570
740 750 760 770 780 790
pF1KB4 TPSSTTTTQITKTVKGGISETRIEKRIVITGDADIDHDQVLVQAIKEAKEQHPDMSVTKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TPSSTTTTQITKTVKGGISETRIEKRIVITGDADIDHDQVLVQAIKEAKEQHPDMSVTKV
580 590 600 610 620 630
800 810
pF1KB4 VVHQETEIADE
:::
CCDS33 VVHQETEIADE
640
>>CCDS56450.1 EPB41L2 gene_id:2037|Hs108|chr6 (852 aa)
initn: 2461 init1: 1807 opt: 1934 Z-score: 1623.5 bits: 311.4 E(32554): 4.1e-84
Smith-Waterman score: 2495; 51.8% identity (73.9% similar) in 865 aa overlap (1-810:1-849)
10 20 30 40 50 60
pF1KB4 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT
:::: . :.:..... : : .: . .: .... :.. .. : :.....
CCDS56 MTTEVGSVSEVKKDSSQL---GTDATKEKPKEVAENQQNQSSDPEEEKGSQPPPAAESQS
10 20 30 40 50
70 80 90 100
pF1KB4 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQ---VSEEEGKEVES----------DKE
... : ...::::::.::.. .::. :: :... : . : :::
CCDS56 SLRRQ--KREKETSESRGISRFIPPWLKKQKSYTLVVAKDGGDKKEPTQAVVEEQVLDKE
60 70 80 90 100 110
110 120 130 140 150 160
pF1KB4 KGEGGQKEIEFGTSLDEEIILKAPIAAPEPELKTDPSLDLH-SLSSAETQPAQ--EELRE
. ... : . .: : : . : : . : . . :.:..: ::.. . ::
CCDS56 EPLPEEQRQAKGDA-EEMAQKKQEIKVEVKEEKPSVSKEEKPSVSKVEMQPTELVSKERE
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB4 DPDFEIKEGEGLEECSKIEVKE-ESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYE
. : .: . .: :.:: .. . ::: ::::: .: ....:::.::: : :
CCDS56 EKVKETQEDKLEGGAAKRETKEVQTNELKAE---KASQKVTKKTKTVQCKVTLLDGTEYS
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB4 CVVEKHAKGQDLLKRVCEHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFT
: .::::::: :. .:::::::::.::::: . .. .:.::: :::::.:.:..:: ::
CCDS56 CDLEKHAKGQVLFDKVCEHLNLLEKDYFGLLFQESPEQKNWLDPAKEIKRQLRNLPWLFT
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB4 FNVKFYPPDPAQLTEDITRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPE
::::::::::.:::::::::.:::::::::..:::::::.: :::::::.:.::::::::
CCDS56 FNVKFYPPDPSQLTEDITRYFLCLQLRQDIASGRLPCSFVTHALLGSYTLQAELGDYDPE
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB4 LHGVDYVSDFKLAPNQTKELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKA
:: .:.:..::.::::::::: ::::. :...::::: .::::::.:::::::::.:
CCDS56 EHGSIDLSEFQFAPTQTKELEEKVAELHKTHRGLSPAQADSQFLENAKRLSMYGVDLHHA
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB4 KDLEGVDIILGVCSSGLLVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTI
:: ::::: ::::..:::.:::.:::::: :::.::::::::.:.::.::.: ::.::::
CCDS56 KDSEGVDIKLGVCANGLLIYKDRLRINRFAWPKILKISYKRSNFYIKVRPAELEQFESTI
420 430 440 450 460 470
470 480 490 500 510 520
pF1KB4 GFKLPSYRAAKKLWKVCVEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASAL
:::::..::::.:::::::::::.::.: . ::.:::.:::::::::::::::::::.:
CCDS56 GFKLPNHRAAKRLWKVCVEHHTFYRLVSPEQPPKAKFLTLGSKFRYSGRTQAQTRQASTL
480 490 500 510 520 530
530 540 550 560 570
pF1KB4 IDRPAPHFERTASKRASRSLDGA--AAVDSADRSPRPTSAPAITQ---GQVAEGGVLDAS
:::::::::::.:::.::::::: ...:.. . : .: :. : :. . : :..
CCDS56 IDRPAPHFERTSSKRVSRSLDGAPIGVMDQSLMKDFPGAAGEISAYGPGLVSIAVVQDGD
540 550 560 570 580 590
580 590 600 610
pF1KB4 AKKTV-----VP-------KAQKETV-------KAEVKKED----EPPEQAEPEPTEAWK
... : .: :...::. .::: :.. : . : : .
CCDS56 GRREVRSPTKAPHLQLIEGKSSHETLNIVEEKKRAEVGKDERVITEEMNGKEISPGSGPG
600 610 620 630 640 650
620 630 640 650 660
pF1KB4 DLDKSQEEIKKHHASIS-ELKKNFMES----VPEPRPSEWDKRLSTHSPFRTLNINGQI-
.. : . .: .:.: : ... :: : : :: .:.. . . . . ..
CCDS56 EIRKVEPVTQKDSTSLSSESSSSSSESEEEDVGEYRP---HHRVTEGTIREEQEYEEEVE
660 670 680 690 700
670 680 690 700 710 720
pF1KB4 ----PTGEGPPLVKTQTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQTDDNSGDL
:... ::.:::. ::::: .. ..:: ::.::::.:::::::::. : : ..:
CCDS56 EEPRPAAK-PPVVKTEMVTISDASQ--RTEISTKEVPIVQTETKTITYESPQIDGGAGG-
710 720 730 740 750 760
730 740 750 760 770 780
pF1KB4 DPGVLLTAQTITSETPSSTTTTQITKTVKGGISETRIEKRIVITGDADIDHDQVLVQAIK
: :.::::::::::. :.::::.:::::::::::::::::::::::.::::::.:.:::.
CCDS56 DSGTLLTAQTITSESVSTTTTTHITKTVKGGISETRIEKRIVITGDGDIDHDQALAQAIR
770 780 790 800 810 820
790 800 810
pF1KB4 EAKEQHPDMSVTKVVVHQETEIADE
::.:::::::::.::::.:::.:.:
CCDS56 EAREQHPDMSVTRVVVHKETELAEEGED
830 840 850
>>CCDS59037.1 EPB41L2 gene_id:2037|Hs108|chr6 (747 aa)
initn: 2461 init1: 1807 opt: 1885 Z-score: 1583.4 bits: 303.8 E(32554): 7.1e-82
Smith-Waterman score: 2406; 52.1% identity (71.9% similar) in 827 aa overlap (1-810:1-744)
10 20 30 40 50 60
pF1KB4 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT
:::: . :.:..... : : .: . .: .... :.. .. : :.....
CCDS59 MTTEVGSVSEVKKDSSQL---GTDATKEKPKEVAENQQNQSSDPEEEKGSQPPPAAESQS
10 20 30 40 50
70 80 90 100
pF1KB4 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQ---VSEEEGKEVES----------DKE
... : ...::::::.::.. .::. :: :... : . : :::
CCDS59 SLRRQ--KREKETSESRGISRFIPPWLKKQKSYTLVVAKDGGDKKEPTQAVVEEQVLDKE
60 70 80 90 100 110
110 120 130 140 150 160
pF1KB4 KGEGGQKEIEFGTSLDEEIILKAPIAAPEPELKTDPSLDLH-SLSSAETQPAQ--EELRE
. ... : . .: : : . : : . : . . :.:..: ::.. . ::
CCDS59 EPLPEEQRQAKGDA-EEMAQKKQEIKVEVKEEKPSVSKEEKPSVSKVEMQPTELVSKERE
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB4 DPDFEIKEGEGLEECSKIEVKE-ESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYE
. : .: . .: :.:: .. . ::: ::::: .: ....:::.::: : :
CCDS59 EKVKETQEDKLEGGAAKRETKEVQTNELKAE---KASQKVTKKTKTVQCKVTLLDGTEYS
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB4 CVVEKHAKGQDLLKRVCEHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFT
: .::::::: :. .:::::::::.::::: . .. .:.::: :::::.:.:..:: ::
CCDS59 CDLEKHAKGQVLFDKVCEHLNLLEKDYFGLLFQESPEQKNWLDPAKEIKRQLRNLPWLFT
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB4 FNVKFYPPDPAQLTEDITRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPE
::::::::::.:::::::::.:::::::::..:::::::.: :::::::.:.::::::::
CCDS59 FNVKFYPPDPSQLTEDITRYFLCLQLRQDIASGRLPCSFVTHALLGSYTLQAELGDYDPE
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB4 LHGVDYVSDFKLAPNQTKELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKA
:: .:.:..::.::::::::: ::::. :...::::: .::::::.:::::::::.:
CCDS59 EHGSIDLSEFQFAPTQTKELEEKVAELHKTHRGLSPAQADSQFLENAKRLSMYGVDLHHA
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB4 KDLEGVDIILGVCSSGLLVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTI
:: ::::: ::::..:::.:::.:::::: :::.::::::::.:.::.::.: ::.::::
CCDS59 KDSEGVDIKLGVCANGLLIYKDRLRINRFAWPKILKISYKRSNFYIKVRPAELEQFESTI
420 430 440 450 460 470
470 480 490 500 510 520
pF1KB4 GFKLPSYRAAKKLWKVCVEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASAL
:::::..::::.:::::::::::.::.: . ::.:::.:::::::::::::::::::.:
CCDS59 GFKLPNHRAAKRLWKVCVEHHTFYRLVSPEQPPKAKFLTLGSKFRYSGRTQAQTRQASTL
480 490 500 510 520 530
530 540 550 560 570 580
pF1KB4 IDRPAPHFERTASKRASRSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTV
:::::::::::.:::.::::::: : ::.: :
CCDS59 IDRPAPHFERTSSKRVSRSLDGA---------------PI---------GVMDQSL----
540 550 560
590 600 610 620 630 640
pF1KB4 VPKAQKETVKAEVKKEDEPPEQAEPEPTEAWKDLDKSQEEIKKHHASISELKKNFMESVP
::. . ::. . .. . .:
CCDS59 ------------------------------MKDFPGAAGEISAYGPGLVSI------AVV
570 580
650 660 670 680 690 700
pF1KB4 EPRPSEWDKRLSTHSPFRTLNINGQIPTGEGPPLVKTQTVTISDNANAVKSEIPTKDVPI
. . : : ..:: .. .. :. :. ::.:::. ::::: .. ..:: ::.:::
CCDS59 Q----DGDGRREVRSPTKAPHL--QLIEGK-PPVVKTEMVTISDASQ--RTEISTKEVPI
590 600 610 620 630
710 720 730 740 750 760
pF1KB4 VHTETKTITYEAAQTDDNSGDLDPGVLLTAQTITSETPSSTTTTQITKTVKGGISETRIE
:.:::::::::. : : ..: : :.::::::::::. :.::::.:::::::::::::::
CCDS59 VQTETKTITYESPQIDGGAGG-DSGTLLTAQTITSESVSTTTTTHITKTVKGGISETRIE
640 650 660 670 680 690
770 780 790 800 810
pF1KB4 KRIVITGDADIDHDQVLVQAIKEAKEQHPDMSVTKVVVHQETEIADE
::::::::.::::::.:.:::.::.:::::::::.::::.:::.:.:
CCDS59 KRIVITGDGDIDHDQALAQAIREAREQHPDMSVTRVVVHKETELAEEGED
700 710 720 730 740
>>CCDS47474.1 EPB41L2 gene_id:2037|Hs108|chr6 (673 aa)
initn: 2196 init1: 1807 opt: 1884 Z-score: 1583.2 bits: 303.6 E(32554): 7.3e-82
Smith-Waterman score: 2016; 47.4% identity (64.7% similar) in 827 aa overlap (1-810:1-670)
10 20 30 40 50 60
pF1KB4 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT
:::: . :.:..... : : .: . .: .... :.. .. : :.....
CCDS47 MTTEVGSVSEVKKDSSQL---GTDATKEKPKEVAENQQNQSSDPEEEKGSQPPPAAESQS
10 20 30 40 50
70 80 90 100
pF1KB4 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQ---VSEEEGKEVES----------DKE
... : ...::::::.::.. .::. :: :... : . : :::
CCDS47 SLRRQ--KREKETSESRGISRFIPPWLKKQKSYTLVVAKDGGDKKEPTQAVVEEQVLDKE
60 70 80 90 100 110
110 120 130 140 150 160
pF1KB4 KGEGGQKEIEFGTSLDEEIILKAPIAAPEPELKTDPSLDLH-SLSSAETQPAQ--EELRE
. ... : . .: : : . : : . : . . :.:..: ::.. . ::
CCDS47 EPLPEEQRQAKGDA-EEMAQKKQEIKVEVKEEKPSVSKEEKPSVSKVEMQPTELVSKERE
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB4 DPDFEIKEGEGLEECSKIEVKE-ESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYE
. : .: . .: :.:: .. . ::: ::::: .: ....:::.::: : :
CCDS47 EKVKETQEDKLEGGAAKRETKEVQTNELKAE---KASQKVTKKTKTVQCKVTLLDGTEYS
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB4 CVVEKHAKGQDLLKRVCEHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFT
: .::::::: :. .:::::::::.::::: . .. .:.::: :::::.:.:..:: ::
CCDS47 CDLEKHAKGQVLFDKVCEHLNLLEKDYFGLLFQESPEQKNWLDPAKEIKRQLRNLPWLFT
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB4 FNVKFYPPDPAQLTEDITRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPE
::::::::::.:::::::::.:::::::::..:::::::.: :::::::.:.::::::::
CCDS47 FNVKFYPPDPSQLTEDITRYFLCLQLRQDIASGRLPCSFVTHALLGSYTLQAELGDYDPE
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB4 LHGVDYVSDFKLAPNQTKELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKA
:: .:.:..::.::::::::: ::::. :...::::: .::::::.:::::::::.:
CCDS47 EHGSIDLSEFQFAPTQTKELEEKVAELHKTHRGLSPAQADSQFLENAKRLSMYGVDLHHA
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB4 KDLEGVDIILGVCSSGLLVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTI
:: ::::: ::::..:::.:::.:::::: :::.::::::::.:.::.::.: ::.::::
CCDS47 KDSEGVDIKLGVCANGLLIYKDRLRINRFAWPKILKISYKRSNFYIKVRPAELEQFESTI
420 430 440 450 460 470
470 480 490 500 510 520
pF1KB4 GFKLPSYRAAKKLWKVCVEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASAL
:::::..::::.:::::::::::.::.: . ::.:::.:::::::::::::::::::.:
CCDS47 GFKLPNHRAAKRLWKVCVEHHTFYRLVSPEQPPKAKFLTLGSKFRYSGRTQAQTRQASTL
480 490 500 510 520 530
530 540 550 560 570 580
pF1KB4 IDRPAPHFERTASKRASRSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTV
:::::::::::.:::.::::::: : ::.: :
CCDS47 IDRPAPHFERTSSKRVSRSLDGA---------------PI---------GVMDQS-----
540 550 560
590 600 610 620 630 640
pF1KB4 VPKAQKETVKAEVKKEDEPPEQAEPEPTEAWKDLDKSQEEIKKHHASISELKKNFMESVP
: :.:
CCDS47 --------------------------------------------------LMKDF-----
650 660 670 680 690 700
pF1KB4 EPRPSEWDKRLSTHSPFRTLNINGQIPTGEGPPLVKTQTVTISDNANAVKSEIPTKDVPI
: . :.: .. :: ::. .: .:. :.: ::: .:
CCDS47 ---------------P----GAAGEI-SAYGPGLVSIAVVQDGDGRREVRS--PTK-AP-
570 580 590 600
710 720 730 740 750 760
pF1KB4 VHTETKTITYEAAQTDDNSGDLDPGVLLTAQTITSETPSSTTTTQITKTVKGGISETRIE
: . : : :::::::::::::
CCDS47 -HLQ-----------------LIEG----------------------KTVKGGISETRIE
610 620
770 780 790 800 810
pF1KB4 KRIVITGDADIDHDQVLVQAIKEAKEQHPDMSVTKVVVHQETEIADE
::::::::.::::::.:.:::.::.:::::::::.::::.:::.:.:
CCDS47 KRIVITGDGDIDHDQALAQAIREAREQHPDMSVTRVVVHKETELAEEGED
630 640 650 660 670
>>CCDS5141.1 EPB41L2 gene_id:2037|Hs108|chr6 (1005 aa)
initn: 2658 init1: 1807 opt: 1884 Z-score: 1580.7 bits: 303.7 E(32554): 1e-81
Smith-Waterman score: 2135; 46.3% identity (69.2% similar) in 860 aa overlap (1-792:1-846)
10 20 30 40 50 60
pF1KB4 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT
:::: . :.:..... : : .: . .: .... :.. .. : :.....
CCDS51 MTTEVGSVSEVKKDSSQL---GTDATKEKPKEVAENQQNQSSDPEEEKGSQPPPAAESQS
10 20 30 40 50
70 80 90 100
pF1KB4 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQ---VSEEEGKEVES----------DKE
... : ...::::::.::.. .::. :: :... : . : :::
CCDS51 SLRRQ--KREKETSESRGISRFIPPWLKKQKSYTLVVAKDGGDKKEPTQAVVEEQVLDKE
60 70 80 90 100 110
110 120 130 140 150 160
pF1KB4 KGEGGQKEIEFGTSLDEEIILKAPIAAPEPELKTDPSLDLH-SLSSAETQPAQ--EELRE
. ... : . .: : : . : : . : . . :.:..: ::.. . ::
CCDS51 EPLPEEQRQAKGDA-EEMAQKKQEIKVEVKEEKPSVSKEEKPSVSKVEMQPTELVSKERE
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB4 DPDFEIKEGEGLEECSKIEVKE-ESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYE
. : .: . .: :.:: .. . ::: ::::: .: ....:::.::: : :
CCDS51 EKVKETQEDKLEGGAAKRETKEVQTNELKAE---KASQKVTKKTKTVQCKVTLLDGTEYS
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB4 CVVEKHAKGQDLLKRVCEHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFT
: .::::::: :. .:::::::::.::::: . .. .:.::: :::::.:.:..:: ::
CCDS51 CDLEKHAKGQVLFDKVCEHLNLLEKDYFGLLFQESPEQKNWLDPAKEIKRQLRNLPWLFT
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB4 FNVKFYPPDPAQLTEDITRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPE
::::::::::.:::::::::.:::::::::..:::::::.: :::::::.:.::::::::
CCDS51 FNVKFYPPDPSQLTEDITRYFLCLQLRQDIASGRLPCSFVTHALLGSYTLQAELGDYDPE
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB4 LHGVDYVSDFKLAPNQTKELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKA
:: .:.:..::.::::::::: ::::. :...::::: .::::::.:::::::::.:
CCDS51 EHGSIDLSEFQFAPTQTKELEEKVAELHKTHRGLSPAQADSQFLENAKRLSMYGVDLHHA
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB4 KDLEGVDIILGVCSSGLLVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTI
:: ::::: ::::..:::.:::.:::::: :::.::::::::.:.::.::.: ::.::::
CCDS51 KDSEGVDIKLGVCANGLLIYKDRLRINRFAWPKILKISYKRSNFYIKVRPAELEQFESTI
420 430 440 450 460 470
470 480 490 500 510 520
pF1KB4 GFKLPSYRAAKKLWKVCVEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASAL
:::::..::::.:::::::::::.::.: . ::.:::.:::::::::::::::::::.:
CCDS51 GFKLPNHRAAKRLWKVCVEHHTFYRLVSPEQPPKAKFLTLGSKFRYSGRTQAQTRQASTL
480 490 500 510 520 530
530 540 550 560 570
pF1KB4 IDRPAPHFERTASKRASRSLDGA--AAVDSADRSPRPTSAPAITQ---GQVAEGGVLDAS
:::::::::::.:::.::::::: ...:.. . : .: :. : :. . : :..
CCDS51 IDRPAPHFERTSSKRVSRSLDGAPIGVMDQSLMKDFPGAAGEISAYGPGLVSIAVVQDGD
540 550 560 570 580 590
580 590 600 610 620 630
pF1KB4 AKKTV-VPKAQKETVKAEVKKED---EPPEQAEPEPTEAWKDLDKSQEEIKKHHASISEL
... : : . : ::.. : . . . ..:::.::.: ::.::::::
CCDS51 GRREVRSPTKAPHLQLIEGKKNSLRVEGDNIYVRHSNLMLEELDKAQEDILKHQASISEL
600 610 620 630 640 650
640 650 660
pF1KB4 KKNFMESVPEPRPSEWDKR------LSTH-SPFRTLNI--------------------NG
:.:::::.:::::.::.:: :.:. : .:::: ::
CCDS51 KRNFMESTPEPRPNEWEKRRITPLSLQTQGSSHETLNIVEEKKRAEVGKDERVITEEMNG
660 670 680 690 700 710
670 680 690 700 710
pF1KB4 Q-IPTGEGP-------PLVKTQTVTISDNANAVKSEIPTKDVPIV--HTETKTITYEAAQ
. : : :: :... .....:..... .:: .:: : .. : . :
CCDS51 KEISPGSGPGEIRKVEPVTQKDSTSLSSESSSSSSESEEEDVGEYRPHHRVTEGTIREEQ
720 730 740 750 760 770
720 730 740 750 760 770
pF1KB4 TDDNSGDLDPGVLLTAQTITSE--TPSSTTTTQITKTVKGGISETRIEKRI---VITGDA
.. . .: .:... : .: .. .:: .: :: :.. . : :.
CCDS51 EYEEEVEEEPRP--AAKVVEREEAVPEASPVTQAGASVI--TVETVIQENVGAQKIPGEK
780 790 800 810 820
780 790 800 810
pF1KB4 DIDHDQVLVQAIKEAKEQHPDMSVTKVVVHQETEIADE
.. :. .: : . : :..:
CCDS51 SV-HEGALKQDMGEEAEEEPQKVNGEVSHVDIDVLPQIICCSEPPVVKTEMVTISDASQR
830 840 850 860 870 880
>--
initn: 612 init1: 426 opt: 610 Z-score: 515.8 bits: 106.7 E(32554): 2.1e-22
Smith-Waterman score: 610; 68.9% identity (87.2% similar) in 148 aa overlap (663-810:858-1002)
640 650 660 670 680 690
pF1KB4 ELKKNFMESVPEPRPSEWDKRLSTHSPFRTLNINGQIPTGEGPPLVKTQTVTISDNANAV
... :: ::.:::. ::::: ..
CCDS51 SVHEGALKQDMGEEAEEEPQKVNGEVSHVDIDVLPQIICCSEPPVVKTEMVTISDASQ--
830 840 850 860 870 880
700 710 720 730 740 750
pF1KB4 KSEIPTKDVPIVHTETKTITYEAAQTDDNSGDLDPGVLLTAQTITSETPSSTTTTQITKT
..:: ::.::::.:::::::::. : : ..: : :.::::::::::. :.::::.::::
CCDS51 RTEISTKEVPIVQTETKTITYESPQIDGGAGG-DSGTLLTAQTITSESVSTTTTTHITKT
890 900 910 920 930 940
760 770 780 790 800 810
pF1KB4 VKGGISETRIEKRIVITGDADIDHDQVLVQAIKEAKEQHPDMSVTKVVVHQETEIADE
:::::::::::::::::::.::::::.:.:::.::.:::::::::.::::.:::.:.:
CCDS51 VKGGISETRIEKRIVITGDGDIDHDQALAQAIREAREQHPDMSVTRVVVHKETELAEEGE
950 960 970 980 990 1000
CCDS51 D
>>CCDS58771.1 EPB41L1 gene_id:2036|Hs108|chr20 (880 aa)
initn: 1914 init1: 1511 opt: 1873 Z-score: 1572.3 bits: 302.0 E(32554): 2.9e-81
Smith-Waterman score: 1892; 47.8% identity (72.0% similar) in 674 aa overlap (94-762:1-625)
70 80 90 100 110 120
pF1KB4 EDLTKNKERTSESRGLSRLFSSFLKRPKSQVSEEEGKEVESDKEKGEGGQKEIEFGTSLD
.. : : . : : . :. :. : ....
CCDS58 MTTETGPDSEVKKAQEEAPQQP-EAAAAVT
10 20
130 140 150 160 170 180
pF1KB4 EEIILKAPIAAPEPELKTDPSLDLHSLSSAETQPAQEELR-EDPDFEIKEGEGLEECSKI
. .: . .:: ... . : :. .:.::.. : :. :. .:..::
CCDS58 TPV---TPAGHGHPEANSNEK---HP-SQQDTRPAEQSLDMEEKDY--SEADGL------
30 40 50 60 70
190 200 210 220 230 240
pF1KB4 EVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVEKHAKGQDLLKRVCEH
.:.. :::. :. :: .:... :.:.::: . ::: ::::..:: :. ::::
CCDS58 --SERTTPSKAQ---KSPQKIAKKYKSAICRVTLLDASEYECEVEKHGRGQVLFDLVCEH
80 90 100 110 120
250 260 270 280 290 300
pF1KB4 LNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTEDITR
:::::.:::::.. : ..:.::: .::::::.:. ::::.:.:::::::::::::::::
CCDS58 LNLLEKDYFGLTFCDADSQKNWLDPSKEIKKQIRSSPWNFAFTVKFYPPDPAQLTEDITR
130 140 150 160 170 180
310 320 330 340 350 360
pF1KB4 YYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQTKE
:::::::: ::..:::::::.: ::::::..:.:::::: : : .:::....:::::.:
CCDS58 YYLCLQLRADIITGRLPCSFVTHALLGSYAVQAELGDYDAEEHVGNYVSELRFAPNQTRE
190 200 210 220 230 240
370 380 390 400 410 420
pF1KB4 LEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSGLLV
:::..:::::. :.:::..:...::::::::::::::::.::: ::.::.::::..:::.
CCDS58 LEERIMELHKTYRGMTPGEAEIHFLENAKKLSMYGVDLHHAKDSEGIDIMLGVCANGLLI
250 260 270 280 290 300
430 440 450 460 470 480
pF1KB4 YKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKVCVE
:.:.:::::: :::.::::::::.:.::::::: ::.:::::::::..:.::.:::::.:
CCDS58 YRDRLRINRFAWPKILKISYKRSNFYIKIRPGEYEQFESTIGFKLPNHRSAKRLWKVCIE
310 320 330 340 350 360
490 500 510 520 530 540
pF1KB4 HHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKR--AS
:::::::.: . ::. ::..:::::::::::::::::::::::::: :::..::: :
CCDS58 HHTFFRLVSPEPPPKG-FLVMGSKFRYSGRTQAQTRQASALIDRPAPFFERSSSKRYTMS
370 380 390 400 410 420
550 560 570 580 590 600
pF1KB4 RSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKED
:::::: :. : ..: . : : ....... .:.. :.. .: ..
CCDS58 RSLDGAEFSRPASVSENHDAGP--DGDKRDEDG--ESGGQRS---EAEEGEVRTPTKIKE
430 440 450 460 470 480
610 620 630 640 650
pF1KB4 EPPEQAEPEPTEAWKDLDKSQEEIKKHHASISELKKNFMESVPE--PRPSEWDKRLSTHS
::: : : . . ::: .. . ::.:::.:::... : . : .:...
CCDS58 LKPEQ-ETTPRHKQEFLDKPEDVLLKHQASINELKRTLKEPNSKLIHRDRDWERE-----
490 500 510 520 530
660 670 680 690 700 710
pF1KB4 PFRTLNINGQIPTGEGPPLVKTQTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQT
: : . :. .: : .. . . .... : . : .: :. : . :
CCDS58 --RRLPSSPASPSPKGTPEKANERAGLREGSEE-KVKPPRPRAP----ESDTGDEDQDQE
540 550 560 570 580
720 730 740 750 760 770
pF1KB4 DDNSGDLDPGVLLTAQTITSETPSSTTTTQITKTVKGGISETRIEKRIVITGDADIDHDQ
:. :.: . .. : :. :.. :..... .. : :
CCDS58 RDT-------VFLKDNHLAIERKCSSITVSSTSSLEAEVDFTVIGDYHGSAFEDFSRSLP
590 600 610 620 630 640
780 790 800 810
pF1KB4 VLVQAIKEAKEQHPDMSVTKVVVHQETEIADE
CCDS58 ELDRDKSDSDTEGLLFSRDLNKGAPSQDDESGGIEDSPDRGACSTPDMPQFEPVKTETMT
650 660 670 680 690 700
810 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 22:46:11 2016 done: Fri Nov 4 22:46:11 2016
Total Scan time: 4.480 Total Display time: 0.290
Function used was FASTA [36.3.4 Apr, 2011]