FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4879, 810 aa 1>>>pF1KB4879 810 - 810 aa - 810 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.6344+/-0.000996; mu= 10.5514+/- 0.060 mean_var=143.1389+/-27.988, 0's: 0 Z-trim(108.8): 72 B-trim: 11 in 1/54 Lambda= 0.107200 statistics sampled from 10356 (10427) to 10356 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.669), E-opt: 0.2 (0.32), width: 16 Scan time: 4.480 The best scores are: opt bits E(32554) CCDS53288.1 EPB41 gene_id:2035|Hs108|chr1 ( 864) 4061 640.3 3.9e-183 CCDS53289.1 EPB41 gene_id:2035|Hs108|chr1 ( 720) 4043 637.5 2.3e-182 CCDS330.1 EPB41 gene_id:2035|Hs108|chr1 ( 775) 3565 563.6 4.5e-160 CCDS331.1 EPB41 gene_id:2035|Hs108|chr1 ( 588) 2727 433.9 3.7e-121 CCDS332.1 EPB41 gene_id:2035|Hs108|chr1 ( 641) 2693 428.7 1.5e-119 CCDS56450.1 EPB41L2 gene_id:2037|Hs108|chr6 ( 852) 1934 311.4 4.1e-84 CCDS59037.1 EPB41L2 gene_id:2037|Hs108|chr6 ( 747) 1885 303.8 7.1e-82 CCDS47474.1 EPB41L2 gene_id:2037|Hs108|chr6 ( 673) 1884 303.6 7.3e-82 CCDS5141.1 EPB41L2 gene_id:2037|Hs108|chr6 (1005) 1884 303.7 1e-81 CCDS58771.1 EPB41L1 gene_id:2036|Hs108|chr20 ( 880) 1873 302.0 2.9e-81 CCDS13271.1 EPB41L1 gene_id:2036|Hs108|chr20 ( 881) 1873 302.0 2.9e-81 CCDS62381.1 EPB41L3 gene_id:23136|Hs108|chr18 ( 865) 1869 301.3 4.5e-81 CCDS62382.1 EPB41L3 gene_id:23136|Hs108|chr18 ( 883) 1869 301.3 4.5e-81 CCDS82237.1 EPB41L3 gene_id:23136|Hs108|chr18 ( 918) 1869 301.3 4.7e-81 CCDS11838.1 EPB41L3 gene_id:23136|Hs108|chr18 (1087) 1816 293.2 1.6e-78 CCDS58770.1 EPB41L1 gene_id:2036|Hs108|chr20 ( 701) 1809 292.0 2.3e-78 CCDS82236.1 EPB41L3 gene_id:23136|Hs108|chr18 ( 756) 1795 289.9 1.1e-77 CCDS13272.1 EPB41L1 gene_id:2036|Hs108|chr20 ( 779) 1766 285.4 2.5e-76 CCDS2129.1 PTPN4 gene_id:5775|Hs108|chr2 ( 926) 1034 172.2 3.5e-42 CCDS54392.1 EPB41L5 gene_id:57669|Hs108|chr2 ( 505) 925 155.2 2.5e-37 CCDS54393.1 EPB41L5 gene_id:57669|Hs108|chr2 ( 687) 924 155.1 3.7e-37 CCDS82506.1 EPB41L5 gene_id:57669|Hs108|chr2 ( 732) 924 155.1 3.8e-37 CCDS2130.1 EPB41L5 gene_id:57669|Hs108|chr2 ( 733) 924 155.1 3.8e-37 CCDS9487.1 FARP1 gene_id:10160|Hs108|chr13 (1045) 919 154.5 8.8e-37 CCDS66572.1 FARP1 gene_id:10160|Hs108|chr13 (1076) 919 154.5 9e-37 CCDS43860.1 EPB41L4B gene_id:54566|Hs108|chr9 ( 518) 890 149.8 1.1e-35 CCDS43859.1 EPB41L4B gene_id:54566|Hs108|chr9 ( 900) 890 149.9 1.7e-35 CCDS59133.1 FRMD3 gene_id:257019|Hs108|chr9 ( 556) 884 148.9 2.2e-35 CCDS43840.1 FRMD3 gene_id:257019|Hs108|chr9 ( 597) 884 148.9 2.4e-35 CCDS43350.1 EPB41L4A gene_id:64097|Hs108|chr5 ( 686) 847 143.2 1.4e-33 CCDS63198.1 FARP2 gene_id:9855|Hs108|chr2 ( 638) 844 142.7 1.8e-33 CCDS63197.1 FARP2 gene_id:9855|Hs108|chr2 ( 647) 844 142.7 1.8e-33 CCDS10107.2 FRMD5 gene_id:84978|Hs108|chr15 ( 570) 840 142.1 2.6e-33 CCDS33424.1 FARP2 gene_id:9855|Hs108|chr2 (1054) 844 142.9 2.7e-33 CCDS75852.1 FRMD3 gene_id:257019|Hs108|chr9 ( 553) 824 139.6 1.4e-32 CCDS35397.1 FRMD7 gene_id:90167|Hs108|chrX ( 714) 794 135.0 4.3e-31 CCDS6776.1 PTPN3 gene_id:5774|Hs108|chr9 ( 913) 785 133.7 1.4e-30 CCDS73716.1 FRMD5 gene_id:84978|Hs108|chr15 ( 414) 592 103.6 6.9e-22 CCDS78504.1 FRMD7 gene_id:90167|Hs108|chrX ( 699) 594 104.1 8.6e-22 CCDS48001.1 PTPN3 gene_id:5774|Hs108|chr9 ( 782) 534 94.8 5.8e-19 CCDS9884.1 PTPN21 gene_id:11099|Hs108|chr14 (1174) 530 94.3 1.2e-18 CCDS48000.1 PTPN3 gene_id:5774|Hs108|chr9 ( 737) 520 92.7 2.5e-18 CCDS5258.1 EZR gene_id:7430|Hs108|chr6 ( 586) 468 84.6 5.4e-16 CCDS4536.1 MYLIP gene_id:29116|Hs108|chr6 ( 445) 445 80.9 5.1e-15 CCDS14382.1 MSN gene_id:4478|Hs108|chrX ( 577) 446 81.1 5.7e-15 CCDS8343.1 RDX gene_id:5962|Hs108|chr11 ( 583) 439 80.1 1.2e-14 CCDS58174.1 RDX gene_id:5962|Hs108|chr11 ( 604) 439 80.1 1.2e-14 CCDS1514.1 PTPN14 gene_id:5784|Hs108|chr1 (1187) 420 77.3 1.7e-13 CCDS13862.1 NF2 gene_id:4771|Hs108|chr22 ( 590) 410 75.6 2.7e-13 CCDS13861.1 NF2 gene_id:4771|Hs108|chr22 ( 595) 410 75.6 2.8e-13 >>CCDS53288.1 EPB41 gene_id:2035|Hs108|chr1 (864 aa) initn: 4037 init1: 4037 opt: 4061 Z-score: 3401.2 bits: 640.3 E(32554): 3.9e-183 Smith-Waterman score: 5015; 93.5% identity (93.5% similar) in 842 aa overlap (1-788:1-842) 10 20 30 40 50 60 pF1KB4 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQVSEEEGKEVESDKEKGEGGQKEIEFGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQVSEEEGKEVESDKEKGEGGQKEIEFGT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 SLDEEIILKAPIAAPEPELKTDPSLDLHSLSSAETQPAQEELREDPDFEIKEGEGLEECS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SLDEEIILKAPIAAPEPELKTDPSLDLHSLSSAETQPAQEELREDPDFEIKEGEGLEECS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 KIEVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVEKHAKGQDLLKRVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KIEVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVEKHAKGQDLLKRVC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 EHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTEDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 EHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTEDI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 TRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 TRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 KELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSGL ::::::::::::: :::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KELEEKVMELHKSYRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSGL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB4 LVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 LVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKVC 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB4 VEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 VEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRAS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB4 RSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 RSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKED 550 560 570 580 590 600 610 pF1KB4 EPPEQAEPEPTEAWK--------------------------------------------- ::::::::::::::: CCDS53 EPPEQAEPEPTEAWKVEKTHIEVTVPTSNGDQTQKLAEKTEDLIRMRKKKRERLDGENIY 610 620 630 640 650 660 620 630 640 650 660 pF1KB4 ---------DLDKSQEEIKKHHASISELKKNFMESVPEPRPSEWDKRLSTHSPFRTLNIN ::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 IRHSNLMLEDLDKSQEEIKKHHASISELKKNFMESVPEPRPSEWDKRLSTHSPFRTLNIN 670 680 690 700 710 720 670 680 690 700 710 720 pF1KB4 GQIPTGEGPPLVKTQTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQTDDNSGDLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GQIPTGEGPPLVKTQTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQTDDNSGDLD 730 740 750 760 770 780 730 740 750 760 770 780 pF1KB4 PGVLLTAQTITSETPSSTTTTQITKTVKGGISETRIEKRIVITGDADIDHDQVLVQAIKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 PGVLLTAQTITSETPSSTTTTQITKTVKGGISETRIEKRIVITGDADIDHDQVLVQAIKE 790 800 810 820 830 840 790 800 810 pF1KB4 AKEQHPDMSVTKVVVHQETEIADE :: CCDS53 AKEQHPDMSVTKVVVHQETEIADE 850 860 >>CCDS53289.1 EPB41 gene_id:2035|Hs108|chr1 (720 aa) initn: 4037 init1: 4037 opt: 4043 Z-score: 3387.4 bits: 637.5 E(32554): 2.3e-182 Smith-Waterman score: 4348; 93.6% identity (93.9% similar) in 720 aa overlap (1-680:1-720) 10 20 30 40 50 60 pF1KB4 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQVSEEEGKEVESDKEKGEGGQKEIEFGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQVSEEEGKEVESDKEKGEGGQKEIEFGT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 SLDEEIILKAPIAAPEPELKTDPSLDLHSLSSAETQPAQEELREDPDFEIKEGEGLEECS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SLDEEIILKAPIAAPEPELKTDPSLDLHSLSSAETQPAQEELREDPDFEIKEGEGLEECS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 KIEVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVEKHAKGQDLLKRVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KIEVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVEKHAKGQDLLKRVC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 EHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTEDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 EHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTEDI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 TRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 TRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 KELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSGL ::::::::::::: :::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KELEEKVMELHKSYRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSGL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB4 LVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 LVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKVC 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB4 VEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 VEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRAS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB4 RSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 RSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKED 550 560 570 580 590 600 610 620 pF1KB4 EPPEQAEPEPTEAWK----------------------------------------DLDKS ::::::::::::::: ::::: CCDS53 EPPEQAEPEPTEAWKVEKTHIEVTVPTSNGDQTQKKRERLDGENIYIRHSNLMLEDLDKS 610 620 630 640 650 660 630 640 650 660 670 680 pF1KB4 QEEIKKHHASISELKKNFMESVPEPRPSEWDKRLSTHSPFRTLNINGQIPTGEGPPLVKT :::::::::::::::::::::::::::::::::::::::::::::::::::::: ..: CCDS53 QEEIKKHHASISELKKNFMESVPEPRPSEWDKRLSTHSPFRTLNINGQIPTGEGVSTLST 670 680 690 700 710 720 690 700 710 720 730 740 pF1KB4 QTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQTDDNSGDLDPGVLLTAQTITSET >>CCDS330.1 EPB41 gene_id:2035|Hs108|chr1 (775 aa) initn: 3562 init1: 3562 opt: 3565 Z-score: 2987.4 bits: 563.6 E(32554): 4.5e-160 Smith-Waterman score: 4956; 95.6% identity (95.6% similar) in 810 aa overlap (1-810:1-775) 10 20 30 40 50 60 pF1KB4 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQVSEEEGKEVESDKEKGEGGQKEIEFGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQVSEEEGKEVESDKEKGEGGQKEIEFGT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 SLDEEIILKAPIAAPEPELKTDPSLDLHSLSSAETQPAQEELREDPDFEIKEGEGLEECS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SLDEEIILKAPIAAPEPELKTDPSLDLHSLSSAETQPAQEELREDPDFEIKEGEGLEECS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 KIEVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVEKHAKGQDLLKRVC ::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KIEVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVE------------- 190 200 210 220 250 260 270 280 290 300 pF1KB4 EHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTEDI :::::::::::::::::::::::::::::::::::::: CCDS33 ----------------------TWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTEDI 230 240 250 260 310 320 330 340 350 360 pF1KB4 TRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQT 270 280 290 300 310 320 370 380 390 400 410 420 pF1KB4 KELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSGL ::::::::::::: :::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KELEEKVMELHKSYRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSGL 330 340 350 360 370 380 430 440 450 460 470 480 pF1KB4 LVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKVC 390 400 410 420 430 440 490 500 510 520 530 540 pF1KB4 VEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRAS 450 460 470 480 490 500 550 560 570 580 590 600 pF1KB4 RSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKED 510 520 530 540 550 560 610 620 630 640 650 660 pF1KB4 EPPEQAEPEPTEAWKDLDKSQEEIKKHHASISELKKNFMESVPEPRPSEWDKRLSTHSPF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 EPPEQAEPEPTEAWKDLDKSQEEIKKHHASISELKKNFMESVPEPRPSEWDKRLSTHSPF 570 580 590 600 610 620 670 680 690 700 710 720 pF1KB4 RTLNINGQIPTGEGPPLVKTQTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQTDD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RTLNINGQIPTGEGPPLVKTQTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQTDD 630 640 650 660 670 680 730 740 750 760 770 780 pF1KB4 NSGDLDPGVLLTAQTITSETPSSTTTTQITKTVKGGISETRIEKRIVITGDADIDHDQVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 NSGDLDPGVLLTAQTITSETPSSTTTTQITKTVKGGISETRIEKRIVITGDADIDHDQVL 690 700 710 720 730 740 790 800 810 pF1KB4 VQAIKEAKEQHPDMSVTKVVVHQETEIADE :::::::::::::::::::::::::::::: CCDS33 VQAIKEAKEQHPDMSVTKVVVHQETEIADE 750 760 770 >>CCDS331.1 EPB41 gene_id:2035|Hs108|chr1 (588 aa) initn: 3057 init1: 2687 opt: 2727 Z-score: 2288.7 bits: 433.9 E(32554): 3.7e-121 Smith-Waterman score: 3589; 91.0% identity (91.0% similar) in 622 aa overlap (210-810:1-588) 180 190 200 210 220 230 pF1KB4 SKIEVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVEKHAKGQDLLKRV :::::::::::::::::::::::::::::: CCDS33 MHCKVSLLDDTVYECVVEKHAKGQDLLKRV 10 20 30 240 250 260 270 280 290 pF1KB4 CEHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 CEHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTED 40 50 60 70 80 90 300 310 320 330 340 350 pF1KB4 ITRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ITRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQ 100 110 120 130 140 150 360 370 380 390 400 410 pF1KB4 TKELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSG :::::::::::::: ::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TKELEEKVMELHKSYRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSG 160 170 180 190 200 210 420 430 440 450 460 470 pF1KB4 LLVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LLVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKV 220 230 240 250 260 270 480 490 500 510 520 530 pF1KB4 CVEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 CVEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRA 280 290 300 310 320 330 540 550 560 570 580 590 pF1KB4 SRSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SRSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKE 340 350 360 370 380 390 600 610 620 630 pF1KB4 DEPPEQAEPEPTEAWK---------------------DLDKSQEEIKKHHASISELKKNF :::::::::::::::: ::::::::::::::::::::::: CCDS33 DEPPEQAEPEPTEAWKKKRERLDGENIYIRHSNLMLEDLDKSQEEIKKHHASISELKKNF 400 410 420 430 440 450 640 650 660 670 680 690 pF1KB4 MESVPEPRPSEWDKRLSTHSPFRTLNINGQIPTGEGPPLVKTQTVTISDNANAVKSEIPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MESVPEPRPSEWDKRLSTHSPFRTLNINGQIPTGEGPPLVKTQTVTISDNANAVKSEIPT 460 470 480 490 500 510 700 710 720 730 740 750 pF1KB4 KDVPIVHTETKTITYEAAQTDDNSGDLDPGVLLTAQTITSETPSSTTTTQITKTVKGGIS :::::::::::::::::::: :::::: CCDS33 KDVPIVHTETKTITYEAAQT----------------------------------VKGGIS 520 530 760 770 780 790 800 810 pF1KB4 ETRIEKRIVITGDADIDHDQVLVQAIKEAKEQHPDMSVTKVVVHQETEIADE :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ETRIEKRIVITGDADIDHDQVLVQAIKEAKEQHPDMSVTKVVVHQETEIADE 540 550 560 570 580 >>CCDS332.1 EPB41 gene_id:2035|Hs108|chr1 (641 aa) initn: 2687 init1: 2687 opt: 2693 Z-score: 2259.7 bits: 428.7 E(32554): 1.5e-119 Smith-Waterman score: 3787; 93.5% identity (93.5% similar) in 633 aa overlap (210-802:1-633) 180 190 200 210 220 230 pF1KB4 SKIEVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVEKHAKGQDLLKRV :::::::::::::::::::::::::::::: CCDS33 MHCKVSLLDDTVYECVVEKHAKGQDLLKRV 10 20 30 240 250 260 270 280 290 pF1KB4 CEHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 CEHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTED 40 50 60 70 80 90 300 310 320 330 340 350 pF1KB4 ITRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ITRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQ 100 110 120 130 140 150 360 370 380 390 400 410 pF1KB4 TKELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSG :::::::::::::: ::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TKELEEKVMELHKSYRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSG 160 170 180 190 200 210 420 430 440 450 460 470 pF1KB4 LLVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LLVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKV 220 230 240 250 260 270 480 490 500 510 520 530 pF1KB4 CVEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 CVEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKRA 280 290 300 310 320 330 540 550 560 570 580 590 pF1KB4 SRSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SRSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKE 340 350 360 370 380 390 600 610 pF1KB4 DEPPEQAEPEPTEAWK----------------------------------------DLDK :::::::::::::::: :::: CCDS33 DEPPEQAEPEPTEAWKVEKTHIEVTVPTSNGDQTQKKRERLDGENIYIRHSNLMLEDLDK 400 410 420 430 440 450 620 630 640 650 660 670 pF1KB4 SQEEIKKHHASISELKKNFMESVPEPRPSEWDKRLSTHSPFRTLNINGQIPTGEGPPLVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SQEEIKKHHASISELKKNFMESVPEPRPSEWDKRLSTHSPFRTLNINGQIPTGEGPPLVK 460 470 480 490 500 510 680 690 700 710 720 730 pF1KB4 TQTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQTDDNSGDLDPGVLLTAQTITSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TQTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQTDDNSGDLDPGVLLTAQTITSE 520 530 540 550 560 570 740 750 760 770 780 790 pF1KB4 TPSSTTTTQITKTVKGGISETRIEKRIVITGDADIDHDQVLVQAIKEAKEQHPDMSVTKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TPSSTTTTQITKTVKGGISETRIEKRIVITGDADIDHDQVLVQAIKEAKEQHPDMSVTKV 580 590 600 610 620 630 800 810 pF1KB4 VVHQETEIADE ::: CCDS33 VVHQETEIADE 640 >>CCDS56450.1 EPB41L2 gene_id:2037|Hs108|chr6 (852 aa) initn: 2461 init1: 1807 opt: 1934 Z-score: 1623.5 bits: 311.4 E(32554): 4.1e-84 Smith-Waterman score: 2495; 51.8% identity (73.9% similar) in 865 aa overlap (1-810:1-849) 10 20 30 40 50 60 pF1KB4 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT :::: . :.:..... : : .: . .: .... :.. .. : :..... CCDS56 MTTEVGSVSEVKKDSSQL---GTDATKEKPKEVAENQQNQSSDPEEEKGSQPPPAAESQS 10 20 30 40 50 70 80 90 100 pF1KB4 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQ---VSEEEGKEVES----------DKE ... : ...::::::.::.. .::. :: :... : . : ::: CCDS56 SLRRQ--KREKETSESRGISRFIPPWLKKQKSYTLVVAKDGGDKKEPTQAVVEEQVLDKE 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB4 KGEGGQKEIEFGTSLDEEIILKAPIAAPEPELKTDPSLDLH-SLSSAETQPAQ--EELRE . ... : . .: : : . : : . : . . :.:..: ::.. . :: CCDS56 EPLPEEQRQAKGDA-EEMAQKKQEIKVEVKEEKPSVSKEEKPSVSKVEMQPTELVSKERE 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB4 DPDFEIKEGEGLEECSKIEVKE-ESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYE . : .: . .: :.:: .. . ::: ::::: .: ....:::.::: : : CCDS56 EKVKETQEDKLEGGAAKRETKEVQTNELKAE---KASQKVTKKTKTVQCKVTLLDGTEYS 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB4 CVVEKHAKGQDLLKRVCEHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFT : .::::::: :. .:::::::::.::::: . .. .:.::: :::::.:.:..:: :: CCDS56 CDLEKHAKGQVLFDKVCEHLNLLEKDYFGLLFQESPEQKNWLDPAKEIKRQLRNLPWLFT 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB4 FNVKFYPPDPAQLTEDITRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPE ::::::::::.:::::::::.:::::::::..:::::::.: :::::::.:.:::::::: CCDS56 FNVKFYPPDPSQLTEDITRYFLCLQLRQDIASGRLPCSFVTHALLGSYTLQAELGDYDPE 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB4 LHGVDYVSDFKLAPNQTKELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKA :: .:.:..::.::::::::: ::::. :...::::: .::::::.:::::::::.: CCDS56 EHGSIDLSEFQFAPTQTKELEEKVAELHKTHRGLSPAQADSQFLENAKRLSMYGVDLHHA 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB4 KDLEGVDIILGVCSSGLLVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTI :: ::::: ::::..:::.:::.:::::: :::.::::::::.:.::.::.: ::.:::: CCDS56 KDSEGVDIKLGVCANGLLIYKDRLRINRFAWPKILKISYKRSNFYIKVRPAELEQFESTI 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB4 GFKLPSYRAAKKLWKVCVEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASAL :::::..::::.:::::::::::.::.: . ::.:::.:::::::::::::::::::.: CCDS56 GFKLPNHRAAKRLWKVCVEHHTFYRLVSPEQPPKAKFLTLGSKFRYSGRTQAQTRQASTL 480 490 500 510 520 530 530 540 550 560 570 pF1KB4 IDRPAPHFERTASKRASRSLDGA--AAVDSADRSPRPTSAPAITQ---GQVAEGGVLDAS :::::::::::.:::.::::::: ...:.. . : .: :. : :. . : :.. CCDS56 IDRPAPHFERTSSKRVSRSLDGAPIGVMDQSLMKDFPGAAGEISAYGPGLVSIAVVQDGD 540 550 560 570 580 590 580 590 600 610 pF1KB4 AKKTV-----VP-------KAQKETV-------KAEVKKED----EPPEQAEPEPTEAWK ... : .: :...::. .::: :.. : . : : . CCDS56 GRREVRSPTKAPHLQLIEGKSSHETLNIVEEKKRAEVGKDERVITEEMNGKEISPGSGPG 600 610 620 630 640 650 620 630 640 650 660 pF1KB4 DLDKSQEEIKKHHASIS-ELKKNFMES----VPEPRPSEWDKRLSTHSPFRTLNINGQI- .. : . .: .:.: : ... :: : : :: .:.. . . . . .. CCDS56 EIRKVEPVTQKDSTSLSSESSSSSSESEEEDVGEYRP---HHRVTEGTIREEQEYEEEVE 660 670 680 690 700 670 680 690 700 710 720 pF1KB4 ----PTGEGPPLVKTQTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQTDDNSGDL :... ::.:::. ::::: .. ..:: ::.::::.:::::::::. : : ..: CCDS56 EEPRPAAK-PPVVKTEMVTISDASQ--RTEISTKEVPIVQTETKTITYESPQIDGGAGG- 710 720 730 740 750 760 730 740 750 760 770 780 pF1KB4 DPGVLLTAQTITSETPSSTTTTQITKTVKGGISETRIEKRIVITGDADIDHDQVLVQAIK : :.::::::::::. :.::::.:::::::::::::::::::::::.::::::.:.:::. CCDS56 DSGTLLTAQTITSESVSTTTTTHITKTVKGGISETRIEKRIVITGDGDIDHDQALAQAIR 770 780 790 800 810 820 790 800 810 pF1KB4 EAKEQHPDMSVTKVVVHQETEIADE ::.:::::::::.::::.:::.:.: CCDS56 EAREQHPDMSVTRVVVHKETELAEEGED 830 840 850 >>CCDS59037.1 EPB41L2 gene_id:2037|Hs108|chr6 (747 aa) initn: 2461 init1: 1807 opt: 1885 Z-score: 1583.4 bits: 303.8 E(32554): 7.1e-82 Smith-Waterman score: 2406; 52.1% identity (71.9% similar) in 827 aa overlap (1-810:1-744) 10 20 30 40 50 60 pF1KB4 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT :::: . :.:..... : : .: . .: .... :.. .. : :..... CCDS59 MTTEVGSVSEVKKDSSQL---GTDATKEKPKEVAENQQNQSSDPEEEKGSQPPPAAESQS 10 20 30 40 50 70 80 90 100 pF1KB4 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQ---VSEEEGKEVES----------DKE ... : ...::::::.::.. .::. :: :... : . : ::: CCDS59 SLRRQ--KREKETSESRGISRFIPPWLKKQKSYTLVVAKDGGDKKEPTQAVVEEQVLDKE 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB4 KGEGGQKEIEFGTSLDEEIILKAPIAAPEPELKTDPSLDLH-SLSSAETQPAQ--EELRE . ... : . .: : : . : : . : . . :.:..: ::.. . :: CCDS59 EPLPEEQRQAKGDA-EEMAQKKQEIKVEVKEEKPSVSKEEKPSVSKVEMQPTELVSKERE 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB4 DPDFEIKEGEGLEECSKIEVKE-ESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYE . : .: . .: :.:: .. . ::: ::::: .: ....:::.::: : : CCDS59 EKVKETQEDKLEGGAAKRETKEVQTNELKAE---KASQKVTKKTKTVQCKVTLLDGTEYS 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB4 CVVEKHAKGQDLLKRVCEHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFT : .::::::: :. .:::::::::.::::: . .. .:.::: :::::.:.:..:: :: CCDS59 CDLEKHAKGQVLFDKVCEHLNLLEKDYFGLLFQESPEQKNWLDPAKEIKRQLRNLPWLFT 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB4 FNVKFYPPDPAQLTEDITRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPE ::::::::::.:::::::::.:::::::::..:::::::.: :::::::.:.:::::::: CCDS59 FNVKFYPPDPSQLTEDITRYFLCLQLRQDIASGRLPCSFVTHALLGSYTLQAELGDYDPE 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB4 LHGVDYVSDFKLAPNQTKELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKA :: .:.:..::.::::::::: ::::. :...::::: .::::::.:::::::::.: CCDS59 EHGSIDLSEFQFAPTQTKELEEKVAELHKTHRGLSPAQADSQFLENAKRLSMYGVDLHHA 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB4 KDLEGVDIILGVCSSGLLVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTI :: ::::: ::::..:::.:::.:::::: :::.::::::::.:.::.::.: ::.:::: CCDS59 KDSEGVDIKLGVCANGLLIYKDRLRINRFAWPKILKISYKRSNFYIKVRPAELEQFESTI 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB4 GFKLPSYRAAKKLWKVCVEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASAL :::::..::::.:::::::::::.::.: . ::.:::.:::::::::::::::::::.: CCDS59 GFKLPNHRAAKRLWKVCVEHHTFYRLVSPEQPPKAKFLTLGSKFRYSGRTQAQTRQASTL 480 490 500 510 520 530 530 540 550 560 570 580 pF1KB4 IDRPAPHFERTASKRASRSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTV :::::::::::.:::.::::::: : ::.: : CCDS59 IDRPAPHFERTSSKRVSRSLDGA---------------PI---------GVMDQSL---- 540 550 560 590 600 610 620 630 640 pF1KB4 VPKAQKETVKAEVKKEDEPPEQAEPEPTEAWKDLDKSQEEIKKHHASISELKKNFMESVP ::. . ::. . .. . .: CCDS59 ------------------------------MKDFPGAAGEISAYGPGLVSI------AVV 570 580 650 660 670 680 690 700 pF1KB4 EPRPSEWDKRLSTHSPFRTLNINGQIPTGEGPPLVKTQTVTISDNANAVKSEIPTKDVPI . . : : ..:: .. .. :. :. ::.:::. ::::: .. ..:: ::.::: CCDS59 Q----DGDGRREVRSPTKAPHL--QLIEGK-PPVVKTEMVTISDASQ--RTEISTKEVPI 590 600 610 620 630 710 720 730 740 750 760 pF1KB4 VHTETKTITYEAAQTDDNSGDLDPGVLLTAQTITSETPSSTTTTQITKTVKGGISETRIE :.:::::::::. : : ..: : :.::::::::::. :.::::.::::::::::::::: CCDS59 VQTETKTITYESPQIDGGAGG-DSGTLLTAQTITSESVSTTTTTHITKTVKGGISETRIE 640 650 660 670 680 690 770 780 790 800 810 pF1KB4 KRIVITGDADIDHDQVLVQAIKEAKEQHPDMSVTKVVVHQETEIADE ::::::::.::::::.:.:::.::.:::::::::.::::.:::.:.: CCDS59 KRIVITGDGDIDHDQALAQAIREAREQHPDMSVTRVVVHKETELAEEGED 700 710 720 730 740 >>CCDS47474.1 EPB41L2 gene_id:2037|Hs108|chr6 (673 aa) initn: 2196 init1: 1807 opt: 1884 Z-score: 1583.2 bits: 303.6 E(32554): 7.3e-82 Smith-Waterman score: 2016; 47.4% identity (64.7% similar) in 827 aa overlap (1-810:1-670) 10 20 30 40 50 60 pF1KB4 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT :::: . :.:..... : : .: . .: .... :.. .. : :..... CCDS47 MTTEVGSVSEVKKDSSQL---GTDATKEKPKEVAENQQNQSSDPEEEKGSQPPPAAESQS 10 20 30 40 50 70 80 90 100 pF1KB4 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQ---VSEEEGKEVES----------DKE ... : ...::::::.::.. .::. :: :... : . : ::: CCDS47 SLRRQ--KREKETSESRGISRFIPPWLKKQKSYTLVVAKDGGDKKEPTQAVVEEQVLDKE 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB4 KGEGGQKEIEFGTSLDEEIILKAPIAAPEPELKTDPSLDLH-SLSSAETQPAQ--EELRE . ... : . .: : : . : : . : . . :.:..: ::.. . :: CCDS47 EPLPEEQRQAKGDA-EEMAQKKQEIKVEVKEEKPSVSKEEKPSVSKVEMQPTELVSKERE 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB4 DPDFEIKEGEGLEECSKIEVKE-ESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYE . : .: . .: :.:: .. . ::: ::::: .: ....:::.::: : : CCDS47 EKVKETQEDKLEGGAAKRETKEVQTNELKAE---KASQKVTKKTKTVQCKVTLLDGTEYS 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB4 CVVEKHAKGQDLLKRVCEHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFT : .::::::: :. .:::::::::.::::: . .. .:.::: :::::.:.:..:: :: CCDS47 CDLEKHAKGQVLFDKVCEHLNLLEKDYFGLLFQESPEQKNWLDPAKEIKRQLRNLPWLFT 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB4 FNVKFYPPDPAQLTEDITRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPE ::::::::::.:::::::::.:::::::::..:::::::.: :::::::.:.:::::::: CCDS47 FNVKFYPPDPSQLTEDITRYFLCLQLRQDIASGRLPCSFVTHALLGSYTLQAELGDYDPE 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB4 LHGVDYVSDFKLAPNQTKELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKA :: .:.:..::.::::::::: ::::. :...::::: .::::::.:::::::::.: CCDS47 EHGSIDLSEFQFAPTQTKELEEKVAELHKTHRGLSPAQADSQFLENAKRLSMYGVDLHHA 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB4 KDLEGVDIILGVCSSGLLVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTI :: ::::: ::::..:::.:::.:::::: :::.::::::::.:.::.::.: ::.:::: CCDS47 KDSEGVDIKLGVCANGLLIYKDRLRINRFAWPKILKISYKRSNFYIKVRPAELEQFESTI 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB4 GFKLPSYRAAKKLWKVCVEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASAL :::::..::::.:::::::::::.::.: . ::.:::.:::::::::::::::::::.: CCDS47 GFKLPNHRAAKRLWKVCVEHHTFYRLVSPEQPPKAKFLTLGSKFRYSGRTQAQTRQASTL 480 490 500 510 520 530 530 540 550 560 570 580 pF1KB4 IDRPAPHFERTASKRASRSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTV :::::::::::.:::.::::::: : ::.: : CCDS47 IDRPAPHFERTSSKRVSRSLDGA---------------PI---------GVMDQS----- 540 550 560 590 600 610 620 630 640 pF1KB4 VPKAQKETVKAEVKKEDEPPEQAEPEPTEAWKDLDKSQEEIKKHHASISELKKNFMESVP : :.: CCDS47 --------------------------------------------------LMKDF----- 650 660 670 680 690 700 pF1KB4 EPRPSEWDKRLSTHSPFRTLNINGQIPTGEGPPLVKTQTVTISDNANAVKSEIPTKDVPI : . :.: .. :: ::. .: .:. :.: ::: .: CCDS47 ---------------P----GAAGEI-SAYGPGLVSIAVVQDGDGRREVRS--PTK-AP- 570 580 590 600 710 720 730 740 750 760 pF1KB4 VHTETKTITYEAAQTDDNSGDLDPGVLLTAQTITSETPSSTTTTQITKTVKGGISETRIE : . : : ::::::::::::: CCDS47 -HLQ-----------------LIEG----------------------KTVKGGISETRIE 610 620 770 780 790 800 810 pF1KB4 KRIVITGDADIDHDQVLVQAIKEAKEQHPDMSVTKVVVHQETEIADE ::::::::.::::::.:.:::.::.:::::::::.::::.:::.:.: CCDS47 KRIVITGDGDIDHDQALAQAIREAREQHPDMSVTRVVVHKETELAEEGED 630 640 650 660 670 >>CCDS5141.1 EPB41L2 gene_id:2037|Hs108|chr6 (1005 aa) initn: 2658 init1: 1807 opt: 1884 Z-score: 1580.7 bits: 303.7 E(32554): 1e-81 Smith-Waterman score: 2135; 46.3% identity (69.2% similar) in 860 aa overlap (1-792:1-846) 10 20 30 40 50 60 pF1KB4 MTTEKSLVTEAENSQHQQKEEGEEAINSGQQEPQQEESCQTAAEGDNWCEQKLKASNGDT :::: . :.:..... : : .: . .: .... :.. .. : :..... CCDS51 MTTEVGSVSEVKKDSSQL---GTDATKEKPKEVAENQQNQSSDPEEEKGSQPPPAAESQS 10 20 30 40 50 70 80 90 100 pF1KB4 PTHEDLTKNKERTSESRGLSRLFSSFLKRPKSQ---VSEEEGKEVES----------DKE ... : ...::::::.::.. .::. :: :... : . : ::: CCDS51 SLRRQ--KREKETSESRGISRFIPPWLKKQKSYTLVVAKDGGDKKEPTQAVVEEQVLDKE 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB4 KGEGGQKEIEFGTSLDEEIILKAPIAAPEPELKTDPSLDLH-SLSSAETQPAQ--EELRE . ... : . .: : : . : : . : . . :.:..: ::.. . :: CCDS51 EPLPEEQRQAKGDA-EEMAQKKQEIKVEVKEEKPSVSKEEKPSVSKVEMQPTELVSKERE 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB4 DPDFEIKEGEGLEECSKIEVKE-ESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYE . : .: . .: :.:: .. . ::: ::::: .: ....:::.::: : : CCDS51 EKVKETQEDKLEGGAAKRETKEVQTNELKAE---KASQKVTKKTKTVQCKVTLLDGTEYS 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB4 CVVEKHAKGQDLLKRVCEHLNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFT : .::::::: :. .:::::::::.::::: . .. .:.::: :::::.:.:..:: :: CCDS51 CDLEKHAKGQVLFDKVCEHLNLLEKDYFGLLFQESPEQKNWLDPAKEIKRQLRNLPWLFT 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB4 FNVKFYPPDPAQLTEDITRYYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPE ::::::::::.:::::::::.:::::::::..:::::::.: :::::::.:.:::::::: CCDS51 FNVKFYPPDPSQLTEDITRYFLCLQLRQDIASGRLPCSFVTHALLGSYTLQAELGDYDPE 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB4 LHGVDYVSDFKLAPNQTKELEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKA :: .:.:..::.::::::::: ::::. :...::::: .::::::.:::::::::.: CCDS51 EHGSIDLSEFQFAPTQTKELEEKVAELHKTHRGLSPAQADSQFLENAKRLSMYGVDLHHA 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB4 KDLEGVDIILGVCSSGLLVYKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTI :: ::::: ::::..:::.:::.:::::: :::.::::::::.:.::.::.: ::.:::: CCDS51 KDSEGVDIKLGVCANGLLIYKDRLRINRFAWPKILKISYKRSNFYIKVRPAELEQFESTI 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB4 GFKLPSYRAAKKLWKVCVEHHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASAL :::::..::::.:::::::::::.::.: . ::.:::.:::::::::::::::::::.: CCDS51 GFKLPNHRAAKRLWKVCVEHHTFYRLVSPEQPPKAKFLTLGSKFRYSGRTQAQTRQASTL 480 490 500 510 520 530 530 540 550 560 570 pF1KB4 IDRPAPHFERTASKRASRSLDGA--AAVDSADRSPRPTSAPAITQ---GQVAEGGVLDAS :::::::::::.:::.::::::: ...:.. . : .: :. : :. . : :.. CCDS51 IDRPAPHFERTSSKRVSRSLDGAPIGVMDQSLMKDFPGAAGEISAYGPGLVSIAVVQDGD 540 550 560 570 580 590 580 590 600 610 620 630 pF1KB4 AKKTV-VPKAQKETVKAEVKKED---EPPEQAEPEPTEAWKDLDKSQEEIKKHHASISEL ... : : . : ::.. : . . . ..:::.::.: ::.:::::: CCDS51 GRREVRSPTKAPHLQLIEGKKNSLRVEGDNIYVRHSNLMLEELDKAQEDILKHQASISEL 600 610 620 630 640 650 640 650 660 pF1KB4 KKNFMESVPEPRPSEWDKR------LSTH-SPFRTLNI--------------------NG :.:::::.:::::.::.:: :.:. : .:::: :: CCDS51 KRNFMESTPEPRPNEWEKRRITPLSLQTQGSSHETLNIVEEKKRAEVGKDERVITEEMNG 660 670 680 690 700 710 670 680 690 700 710 pF1KB4 Q-IPTGEGP-------PLVKTQTVTISDNANAVKSEIPTKDVPIV--HTETKTITYEAAQ . : : :: :... .....:..... .:: .:: : .. : . : CCDS51 KEISPGSGPGEIRKVEPVTQKDSTSLSSESSSSSSESEEEDVGEYRPHHRVTEGTIREEQ 720 730 740 750 760 770 720 730 740 750 760 770 pF1KB4 TDDNSGDLDPGVLLTAQTITSE--TPSSTTTTQITKTVKGGISETRIEKRI---VITGDA .. . .: .:... : .: .. .:: .: :: :.. . : :. CCDS51 EYEEEVEEEPRP--AAKVVEREEAVPEASPVTQAGASVI--TVETVIQENVGAQKIPGEK 780 790 800 810 820 780 790 800 810 pF1KB4 DIDHDQVLVQAIKEAKEQHPDMSVTKVVVHQETEIADE .. :. .: : . : :..: CCDS51 SV-HEGALKQDMGEEAEEEPQKVNGEVSHVDIDVLPQIICCSEPPVVKTEMVTISDASQR 830 840 850 860 870 880 >-- initn: 612 init1: 426 opt: 610 Z-score: 515.8 bits: 106.7 E(32554): 2.1e-22 Smith-Waterman score: 610; 68.9% identity (87.2% similar) in 148 aa overlap (663-810:858-1002) 640 650 660 670 680 690 pF1KB4 ELKKNFMESVPEPRPSEWDKRLSTHSPFRTLNINGQIPTGEGPPLVKTQTVTISDNANAV ... :: ::.:::. ::::: .. CCDS51 SVHEGALKQDMGEEAEEEPQKVNGEVSHVDIDVLPQIICCSEPPVVKTEMVTISDASQ-- 830 840 850 860 870 880 700 710 720 730 740 750 pF1KB4 KSEIPTKDVPIVHTETKTITYEAAQTDDNSGDLDPGVLLTAQTITSETPSSTTTTQITKT ..:: ::.::::.:::::::::. : : ..: : :.::::::::::. :.::::.:::: CCDS51 RTEISTKEVPIVQTETKTITYESPQIDGGAGG-DSGTLLTAQTITSESVSTTTTTHITKT 890 900 910 920 930 940 760 770 780 790 800 810 pF1KB4 VKGGISETRIEKRIVITGDADIDHDQVLVQAIKEAKEQHPDMSVTKVVVHQETEIADE :::::::::::::::::::.::::::.:.:::.::.:::::::::.::::.:::.:.: CCDS51 VKGGISETRIEKRIVITGDGDIDHDQALAQAIREAREQHPDMSVTRVVVHKETELAEEGE 950 960 970 980 990 1000 CCDS51 D >>CCDS58771.1 EPB41L1 gene_id:2036|Hs108|chr20 (880 aa) initn: 1914 init1: 1511 opt: 1873 Z-score: 1572.3 bits: 302.0 E(32554): 2.9e-81 Smith-Waterman score: 1892; 47.8% identity (72.0% similar) in 674 aa overlap (94-762:1-625) 70 80 90 100 110 120 pF1KB4 EDLTKNKERTSESRGLSRLFSSFLKRPKSQVSEEEGKEVESDKEKGEGGQKEIEFGTSLD .. : : . : : . :. :. : .... CCDS58 MTTETGPDSEVKKAQEEAPQQP-EAAAAVT 10 20 130 140 150 160 170 180 pF1KB4 EEIILKAPIAAPEPELKTDPSLDLHSLSSAETQPAQEELR-EDPDFEIKEGEGLEECSKI . .: . .:: ... . : :. .:.::.. : :. :. .:..:: CCDS58 TPV---TPAGHGHPEANSNEK---HP-SQQDTRPAEQSLDMEEKDY--SEADGL------ 30 40 50 60 70 190 200 210 220 230 240 pF1KB4 EVKEESPQSKAETELKASQKPIRKHRNMHCKVSLLDDTVYECVVEKHAKGQDLLKRVCEH .:.. :::. :. :: .:... :.:.::: . ::: ::::..:: :. :::: CCDS58 --SERTTPSKAQ---KSPQKIAKKYKSAICRVTLLDASEYECEVEKHGRGQVLFDLVCEH 80 90 100 110 120 250 260 270 280 290 300 pF1KB4 LNLLEEDYFGLAIWDNATSKTWLDSAKEIKKQVRGVPWNFTFNVKFYPPDPAQLTEDITR :::::.:::::.. : ..:.::: .::::::.:. ::::.:.::::::::::::::::: CCDS58 LNLLEKDYFGLTFCDADSQKNWLDPSKEIKKQIRSSPWNFAFTVKFYPPDPAQLTEDITR 130 140 150 160 170 180 310 320 330 340 350 360 pF1KB4 YYLCLQLRQDIVAGRLPCSFATLALLGSYTIQSELGDYDPELHGVDYVSDFKLAPNQTKE :::::::: ::..:::::::.: ::::::..:.:::::: : : .:::....:::::.: CCDS58 YYLCLQLRADIITGRLPCSFVTHALLGSYAVQAELGDYDAEEHVGNYVSELRFAPNQTRE 190 200 210 220 230 240 370 380 390 400 410 420 pF1KB4 LEEKVMELHKSCRSMTPAQADLEFLENAKKLSMYGVDLHKAKDLEGVDIILGVCSSGLLV :::..:::::. :.:::..:...::::::::::::::::.::: ::.::.::::..:::. CCDS58 LEERIMELHKTYRGMTPGEAEIHFLENAKKLSMYGVDLHHAKDSEGIDIMLGVCANGLLI 250 260 270 280 290 300 430 440 450 460 470 480 pF1KB4 YKDKLRINRFPWPKVLKISYKRSSFFIKIRPGEQEQYESTIGFKLPSYRAAKKLWKVCVE :.:.:::::: :::.::::::::.:.::::::: ::.:::::::::..:.::.:::::.: CCDS58 YRDRLRINRFAWPKILKISYKRSNFYIKIRPGEYEQFESTIGFKLPNHRSAKRLWKVCIE 310 320 330 340 350 360 490 500 510 520 530 540 pF1KB4 HHTFFRLTSTDTIPKSKFLALGSKFRYSGRTQAQTRQASALIDRPAPHFERTASKR--AS :::::::.: . ::. ::..:::::::::::::::::::::::::: :::..::: : CCDS58 HHTFFRLVSPEPPPKG-FLVMGSKFRYSGRTQAQTRQASALIDRPAPFFERSSSKRYTMS 370 380 390 400 410 420 550 560 570 580 590 600 pF1KB4 RSLDGAAAVDSADRSPRPTSAPAITQGQVAEGGVLDASAKKTVVPKAQKETVKAEVKKED :::::: :. : ..: . : : ....... .:.. :.. .: .. CCDS58 RSLDGAEFSRPASVSENHDAGP--DGDKRDEDG--ESGGQRS---EAEEGEVRTPTKIKE 430 440 450 460 470 480 610 620 630 640 650 pF1KB4 EPPEQAEPEPTEAWKDLDKSQEEIKKHHASISELKKNFMESVPE--PRPSEWDKRLSTHS ::: : : . . ::: .. . ::.:::.:::... : . : .:... CCDS58 LKPEQ-ETTPRHKQEFLDKPEDVLLKHQASINELKRTLKEPNSKLIHRDRDWERE----- 490 500 510 520 530 660 670 680 690 700 710 pF1KB4 PFRTLNINGQIPTGEGPPLVKTQTVTISDNANAVKSEIPTKDVPIVHTETKTITYEAAQT : : . :. .: : .. . . .... : . : .: :. : . : CCDS58 --RRLPSSPASPSPKGTPEKANERAGLREGSEE-KVKPPRPRAP----ESDTGDEDQDQE 540 550 560 570 580 720 730 740 750 760 770 pF1KB4 DDNSGDLDPGVLLTAQTITSETPSSTTTTQITKTVKGGISETRIEKRIVITGDADIDHDQ :. :.: . .. : :. :.. :..... .. : : CCDS58 RDT-------VFLKDNHLAIERKCSSITVSSTSSLEAEVDFTVIGDYHGSAFEDFSRSLP 590 600 610 620 630 640 780 790 800 810 pF1KB4 VLVQAIKEAKEQHPDMSVTKVVVHQETEIADE CCDS58 ELDRDKSDSDTEGLLFSRDLNKGAPSQDDESGGIEDSPDRGACSTPDMPQFEPVKTETMT 650 660 670 680 690 700 810 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 22:46:11 2016 done: Fri Nov 4 22:46:11 2016 Total Scan time: 4.480 Total Display time: 0.290 Function used was FASTA [36.3.4 Apr, 2011]