FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDB0185, 1646 aa
1>>>pF1KSDB0185 1646 - 1646 aa - 1646 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.5272+/-0.00111; mu= 22.3916+/- 0.066
mean_var=69.0354+/-13.879, 0's: 0 Z-trim(102.9): 79 B-trim: 3 in 1/50
Lambda= 0.154361
statistics sampled from 7086 (7166) to 7086 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.561), E-opt: 0.2 (0.22), width: 16
Scan time: 4.940
The best scores are: opt bits E(32554)
CCDS10466.1 ABCA3 gene_id:21|Hs108|chr16 (1704) 8468 1896.1 0
CCDS6762.1 ABCA1 gene_id:19|Hs108|chr9 (2261) 1167 270.2 5.4e-71
CCDS43909.1 ABCA2 gene_id:20|Hs108|chr9 (2436) 1139 264.0 4.4e-69
CCDS747.1 ABCA4 gene_id:24|Hs108|chr1 (2273) 1130 262.0 1.6e-68
CCDS12055.1 ABCA7 gene_id:10347|Hs108|chr19 (2146) 1093 253.7 4.7e-66
CCDS11685.1 ABCA5 gene_id:23461|Hs108|chr17 (1642) 1063 247.0 3.9e-64
CCDS74138.1 ABCA8 gene_id:10351|Hs108|chr17 (1616) 1033 240.3 3.9e-62
CCDS74139.1 ABCA8 gene_id:10351|Hs108|chr17 (1621) 1033 240.3 3.9e-62
CCDS11681.1 ABCA9 gene_id:10350|Hs108|chr17 (1624) 1011 235.4 1.2e-60
CCDS47584.1 ABCA13 gene_id:154664|Hs108|chr7 (5058) 1017 237.0 1.2e-60
CCDS33373.1 ABCA12 gene_id:26154|Hs108|chr2 (2277) 976 227.7 3.5e-58
CCDS33372.1 ABCA12 gene_id:26154|Hs108|chr2 (2595) 976 227.7 3.9e-58
CCDS11684.1 ABCA10 gene_id:10349|Hs108|chr17 (1543) 967 225.6 1e-57
CCDS11683.1 ABCA6 gene_id:23460|Hs108|chr17 (1617) 949 221.6 1.7e-56
CCDS11680.1 ABCA8 gene_id:10351|Hs108|chr17 (1581) 547 132.1 1.5e-29
CCDS1814.1 ABCG5 gene_id:64240|Hs108|chr2 ( 651) 320 81.3 1.1e-14
CCDS5371.1 ABCB5 gene_id:340273|Hs108|chr7 ( 812) 315 80.3 3e-14
CCDS64798.1 ABCB8 gene_id:11194|Hs108|chr7 ( 630) 312 79.6 3.8e-14
CCDS5913.1 ABCB8 gene_id:11194|Hs108|chr7 ( 718) 312 79.6 4.2e-14
CCDS55090.1 ABCB5 gene_id:340273|Hs108|chr7 (1257) 315 80.4 4.3e-14
CCDS64799.1 ABCB8 gene_id:11194|Hs108|chr7 ( 735) 312 79.6 4.3e-14
CCDS1580.1 ABCB10 gene_id:23456|Hs108|chr1 ( 738) 312 79.6 4.3e-14
CCDS13681.1 ABCG1 gene_id:9619|Hs108|chr21 ( 663) 305 78.0 1.2e-13
CCDS42938.1 ABCG1 gene_id:9619|Hs108|chr21 ( 666) 305 78.0 1.2e-13
CCDS42937.1 ABCG1 gene_id:9619|Hs108|chr21 ( 668) 305 78.0 1.2e-13
CCDS13683.1 ABCG1 gene_id:9619|Hs108|chr21 ( 677) 305 78.0 1.2e-13
CCDS13682.1 ABCG1 gene_id:9619|Hs108|chr21 ( 678) 305 78.0 1.2e-13
CCDS5608.1 ABCB1 gene_id:5243|Hs108|chr7 (1280) 305 78.2 2e-13
CCDS5607.1 ABCB4 gene_id:5244|Hs108|chr7 (1232) 304 77.9 2.3e-13
CCDS5605.1 ABCB4 gene_id:5244|Hs108|chr7 (1279) 304 77.9 2.4e-13
CCDS8415.1 ABCG4 gene_id:64137|Hs108|chr11 ( 646) 293 75.3 7.3e-13
CCDS64800.1 ABCB8 gene_id:11194|Hs108|chr7 ( 693) 293 75.3 7.7e-13
CCDS2436.1 ABCB6 gene_id:10058|Hs108|chr2 ( 842) 286 73.8 2.7e-12
CCDS78129.1 TAP2 gene_id:6891|Hs108|chr6 ( 686) 278 72.0 7.7e-12
CCDS46444.1 ABCB11 gene_id:8647|Hs108|chr2 (1321) 274 71.3 2.5e-11
CCDS4758.1 TAP1 gene_id:6890|Hs108|chr6 ( 808) 270 70.3 3.1e-11
CCDS1815.1 ABCG8 gene_id:64241|Hs108|chr2 ( 673) 265 69.1 5.7e-11
>>CCDS10466.1 ABCA3 gene_id:21|Hs108|chr16 (1704 aa)
initn: 8449 init1: 8449 opt: 8468 Z-score: 10177.0 bits: 1896.1 E(32554): 0
Smith-Waterman score: 10612; 96.5% identity (96.5% similar) in 1678 aa overlap (27-1646:27-1704)
10 20 30 40 50 60
pF1KSD MAVLRQLALLLWKNYTLQKRKVLVTVLELFLPLLFSGILIWLRLKIQSENVPNATIYPGQ
::::::::::::::::::::::::::::::::::
CCDS10 MAVLRQLALLLWKNYTLQKRKVLVTVLELFLPLLFSGILIWLRLKIQSENVPNATIYPGQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD SIQELPLFFTFPPPGDTWELAYIPSHSDAAKTVTETVRRALVINMRVRGFPSEKDFEDYI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SIQELPLFFTFPPPGDTWELAYIPSHSDAAKTVTETVRRALVINMRVRGFPSEKDFEDYI
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD RYDNCSSSVLAAVVFEHPFNHSKEPLPLAVKYHLRFSYTRRNYMWTQTGSFFLKETEGWH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RYDNCSSSVLAAVVFEHPFNHSKEPLPLAVKYHLRFSYTRRNYMWTQTGSFFLKETEGWH
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD TTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVDRAIMEYHADAATRQLFQRLTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 TTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVDRAIMEYHADAATRQLFQRLTV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD TIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIARAVVQEKERRLKEYMRMMGLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 TIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIARAVVQEKERRLKEYMRMMGLS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD SWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLSRSDPSLVLAFLLCFAISTISF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLSRSDPSLVLAFLLCFAISTISF
310 320 330 340 350 360
370
pF1KSD SFMVSTFFSK--------------------------------------------------
::::::::::
CCDS10 SFMVSTFFSKANMAAAFGGFLYFFTYIPYFFVAPRYNWMTLSQKLCSCLLSNVAMAMGAQ
370 380 390 400 410 420
380 390 400 410 420
pF1KSD --------GMGIQWRDLLSPVNVDDDFCFGQVLGMLLLDSVLYGLVTWYMEAVFPGQFGV
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LIGKFEAKGMGIQWRDLLSPVNVDDDFCFGQVLGMLLLDSVLYGLVTWYMEAVFPGQFGV
430 440 450 460 470 480
430 440 450 460 470 480
pF1KSD PQPWYFFIMPSYWCGKPRAVAGKEEEDSDPEKALRNEYFEAEPEDLVAGIKIKHLSKVFR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PQPWYFFIMPSYWCGKPRAVAGKEEEDSDPEKALRNEYFEAEPEDLVAGIKIKHLSKVFR
490 500 510 520 530 540
490 500 510 520 530 540
pF1KSD VGNKDRAAVRDLNLNLYEGQITVLLGHNGAGKTTTLSMLTGLFPPTSGRAYISGYEISQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VGNKDRAAVRDLNLNLYEGQITVLLGHNGAGKTTTLSMLTGLFPPTSGRAYISGYEISQD
550 560 570 580 590 600
550 560 570 580 590 600
pF1KSD MVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKGLSRQKCPEEVKQMLHIIGLEDKWNS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKGLSRQKCPEEVKQMLHIIGLEDKWNS
610 620 630 640 650 660
610 620 630 640 650 660
pF1KSD RSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSGMDAISRRAIWDLLQRQKSDRTIVLTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSGMDAISRRAIWDLLQRQKSDRTIVLTT
670 680 690 700 710 720
670 680 690 700 710 720
pF1KSD HFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKYGAGYHMTLVKEPHCNPEDISQLVHHH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 HFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKYGAGYHMTLVKEPHCNPEDISQLVHHH
730 740 750 760 770 780
730 740 750 760 770 780
pF1KSD VPNATLESSAGAELSFILPRESTHRFEGLFAKLEKKQKELGIASFGASITTMEEVFLRVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VPNATLESSAGAELSFILPRESTHRFEGLFAKLEKKQKELGIASFGASITTMEEVFLRVG
790 800 810 820 830 840
790 800 810 820 830 840
pF1KSD KLVDSSMDIQAIQLPALQYQHERRASDWAVDSNLCGAMDPSDGIGALIEEERTAVKLNTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 KLVDSSMDIQAIQLPALQYQHERRASDWAVDSNLCGAMDPSDGIGALIEEERTAVKLNTG
850 860 870 880 890 900
850 860 870 880 890 900
pF1KSD LALHCQQFWAMFLKKAAYSWREWKMVAAQVLVPLTCVTLALLAINYSSELFDDPMLRLTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LALHCQQFWAMFLKKAAYSWREWKMVAAQVLVPLTCVTLALLAINYSSELFDDPMLRLTL
910 920 930 940 950 960
910 920 930 940 950 960
pF1KSD GEYGRTVVPFSVPGTSQLGQQLSEHLKDALQAEGQEPREVLGDLEEFLIFRASVEGGGFN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GEYGRTVVPFSVPGTSQLGQQLSEHLKDALQAEGQEPREVLGDLEEFLIFRASVEGGGFN
970 980 990 1000 1010 1020
970 980 990 1000 1010 1020
pF1KSD ERCLVAASFRDVGERTVVNALFNNQAYHSPATALAVVDNLLFKLLCGPHASIVVSNFPQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ERCLVAASFRDVGERTVVNALFNNQAYHSPATALAVVDNLLFKLLCGPHASIVVSNFPQP
1030 1040 1050 1060 1070 1080
1030 1040 1050 1060 1070 1080
pF1KSD RSALQAAKDQFNEGRKGFDIALNLLFAMAFLASTFSILAVSERAVQAKHVQFVSGVHVAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RSALQAAKDQFNEGRKGFDIALNLLFAMAFLASTFSILAVSERAVQAKHVQFVSGVHVAS
1090 1100 1110 1120 1130 1140
1090 1100 1110 1120 1130 1140
pF1KSD FWLSALLWDLISFLIPSLLLLVVFKAFDVRAFTRDGHMADTLLLLLLYGWAIIPLMYLMN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 FWLSALLWDLISFLIPSLLLLVVFKAFDVRAFTRDGHMADTLLLLLLYGWAIIPLMYLMN
1150 1160 1170 1180 1190 1200
1150 1160 1170 1180 1190 1200
pF1KSD FFFLGAATAYTRLTIFNILSGIATFLMVTIMRIPAVKLEELSKTLDHVFLVLPNHCLGMA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 FFFLGAATAYTRLTIFNILSGIATFLMVTIMRIPAVKLEELSKTLDHVFLVLPNHCLGMA
1210 1220 1230 1240 1250 1260
1210 1220 1230 1240 1250 1260
pF1KSD VSSFYENYETRRYCTSSEVAAHYCKKYNIQYQENFYAWSAPGVGRFVASMAASGCAYLIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VSSFYENYETRRYCTSSEVAAHYCKKYNIQYQENFYAWSAPGVGRFVASMAASGCAYLIL
1270 1280 1290 1300 1310 1320
1270 1280 1290 1300 1310 1320
pF1KSD LFLIETNLLQRLRGILCALRRRRTLTELYTRMPVLPEDQDVADERTRILAPSPDSLLHTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LFLIETNLLQRLRGILCALRRRRTLTELYTRMPVLPEDQDVADERTRILAPSPDSLLHTP
1330 1340 1350 1360 1370 1380
1330 1340 1350 1360 1370 1380
pF1KSD LIIKELSKVYEQRVPLLAVDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LIIKELSKVYEQRVPLLAVDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDA
1390 1400 1410 1420 1430 1440
1390 1400 1410 1420 1430 1440
pF1KSD FVGGHRISSDVGKVRQRIGYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 FVGGHRISSDVGKVRQRIGYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLR
1450 1460 1470 1480 1490 1500
1450 1460 1470 1480 1490 1500
pF1KSD GLLLEPHANKLVRTYSGGNKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTVARA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GLLLEPHANKLVRTYSGGNKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTVARA
1510 1520 1530 1540 1550 1560
1510 1520 1530 1540 1550 1560
pF1KSD RESGKAIIITSHSMEECEALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RESGKAIIITSHSMEECEALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQ
1570 1580 1590 1600 1610 1620
1570 1580 1590 1600 1610 1620
pF1KSD QEALEEFKAFVDLTFPGSVLEDEHQGMVHYHLPGRDLSWAKVFGILEKAKEKYGVDDYSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 QEALEEFKAFVDLTFPGSVLEDEHQGMVHYHLPGRDLSWAKVFGILEKAKEKYGVDDYSV
1630 1640 1650 1660 1670 1680
1630 1640
pF1KSD SQISLEQVFLSFAHLQPPTAEEGR
::::::::::::::::::::::::
CCDS10 SQISLEQVFLSFAHLQPPTAEEGR
1690 1700
>>CCDS6762.1 ABCA1 gene_id:19|Hs108|chr9 (2261 aa)
initn: 2839 init1: 879 opt: 1167 Z-score: 1388.0 bits: 270.2 E(32554): 5.4e-71
Smith-Waterman score: 2991; 35.3% identity (60.3% similar) in 1714 aa overlap (190-1638:575-2224)
160 170 180 190 200 210
pF1KSD RRNYMWTQTGSFFLKETEGWHTTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVD
.:::: : :. :: .: .:.
CCDS67 SIELPHHVKYKIRMDIDNVERTNKIKDGYWDPGPRADPFEDMR---YVWGGFAYLQDVVE
550 560 570 580 590 600
220 230 240 250 260 270
pF1KSD RAIMEYHADAATRQLFQRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIA
.::.. . . .. : ....::: .. : :: ... ..::.. :.. :.. .:
CCDS67 QAIIRVLTGTE-----KKTGVYMQQMPYPCYVDDIFLRVMSRSMPLFMTLAWIYSVAVII
610 620 630 640 650
280 290 300 310 320 330
pF1KSD RAVVQEKERRLKEYMRMMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLS
...: ::: :::: ::.:::.. . : .::. .. ::..:....... . .:
CCDS67 KGIVYEKEARLKETMRIMGLDNSILWFSWFISSLIPLLVSAGLLVVILKLG-----NLLP
660 670 680 690 700 710
340 350 360 370
pF1KSD RSDPSLVLAFLLCFAISTISFSFMVSTFFSK-----------------------------
::::.:..:: ::. :: :..::.::.
CCDS67 YSDPSVVFVFLSVFAVVTILQCFLISTLFSRANLAAACGGIIYFTLYLPYVLCVAWQDYV
720 730 740 750 760 770
380 390 400
pF1KSD -----------------------------GMGIQWRDLL-SPVNVDDDFCFGQVLGMLLL
:.:.:: .:. :::. .: : . ..:.:.
CCDS67 GFTLKIFASLLSPVAFGFGCEYFALFEEQGIGVQWDNLFESPVE-EDGFNLTTSVSMMLF
780 790 800 810 820 830
410 420 430 440 450
pF1KSD DSVLYGLVTWYMEAVFPGQFGVPQPWYFFIMPSYWCGKPRAVAGKEEEDSDP---EKALR
:. :::..:::.:::::::.:.:.:::: ::: :. . .: : : .: .
CCDS67 DTFLYGVMTWYIEAVFPGQYGIPRPWYFPCTKSYWFGE------ESDEKSHPGSNQKRIS
840 850 860 870 880
460 470 480 490 500 510
pF1KSD NEYFEAEPEDLVAGIKIKHLSKVFRVGNKDRAAVRDLNLNLYEGQITVLLGHNGAGKTTT
. .: :: : :..:..: ::.: : : .:: : ::.:::::: .:::::::::::
CCDS67 EICMEEEPTHLKLGVSIQNLVKVYRDGMK--VAVDGLALNFYEGQITSFLGHNGAGKTTT
890 900 910 920 930 940
520 530 540 550 560 570
pF1KSD LSMLTGLFPPTSGRAYISGYEISQDMVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKG
.:.:::::::::: ::: : .: ..: ::..::.::::..::: ::: ::..:::.:::
CCDS67 MSILTGLFPPTSGTAYILGKDIRSEMSTIRQNLGVCPQHNVLFDMLTVEEHIWFYARLKG
950 960 970 980 990 1000
580 590 600 610 620 630
pF1KSD LSRQKCPEEVKQMLHIIGLED-KWNSRSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSG
::... :..:: .:: . : .:.. :::::.::::...:...::::.::::::.:
CCDS67 LSEKHVKAEMEQMALDVGLPSSKLKSKTSQLSGGMQRKLSVALAFVGGSKVVILDEPTAG
1010 1020 1030 1040 1050 1060
640 650 660 670 680 690
pF1KSD MDAISRRAIWDLLQRQKSDRTIVLTTHFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKY
.: :::.::.:: . .. :::.:.:: :::::.:::::::...:.: : :::::::..
CCDS67 VDPYSRRGIWELLLKYRQGRTIILSTHHMDEADVLGDRIAIISHGKLCCVGSSLFLKNQL
1070 1080 1090 1100 1110 1120
700 710
pF1KSD GAGYHMTLVKEP------HC----------NPED--------------------------
:.::..::::. : . ::
CCDS67 GTGYYLTLVKKDVESSLSSCRNSSSTVSYLKKEDSVSQSSSDAGLGSDHESDTLTIDVSA
1130 1140 1150 1160 1170 1180
720 730 740 750 760 770
pF1KSD ISQLVHHHVPNATLESSAGAELSFILPRESTHR--FEGLFAKLEKKQKELGIASFGASIT
::.:...:: .: : . : ::...:: :.... : :: ... . ..:::.:.: : :
CCDS67 ISNLIRKHVSEARLVEDIGHELTYVLPYEAAKEGAFVELFHEIDDRLSDLGISSYGISET
1190 1200 1210 1220 1230 1240
780 790 800 810 820
pF1KSD TMEEVFLRVGKLVDSSMDIQAIQ--LPALQYQHERRASDWAVDSNLC-------GAMDPS
:.::.::.:.. .:..: .. . ::: ...::: :.. : : ::.
CCDS67 TLEEIFLKVAE--ESGVDAETSDGTLPA---RRNRRAFG---DKQSCLRPFTEDDAADPN
1250 1260 1270 1280 1290
830 840 850 860 870
pF1KSD DGIGALIEEERTAVKLNTGL-----------ALHCQQFWAMFLKKAAYSWREWKMVAAQV
: . :. : . : .:. : ::: :.. :. . : : ::.
CCDS67 D---SDIDPESRETDLLSGMDGKGSYQVKGWKLTQQQFVALLWKRLLIARRSRKGFFAQI
1300 1310 1320 1330 1340 1350
880 890
pF1KSD LVP--LTCVTLALLAI-----NYSS--------------------------ELFD----D
..: ..:..:.. : .: : ::.. :
CCDS67 VLPAVFVCIALVFSLIVPPFGKYPSLELQPWMYNEQYTFVSNDAPEDTGTLELLNALTKD
1360 1370 1380 1390 1400 1410
900 910 920
pF1KSD PML--RLTLG-------------EYGRTVVPFSVPGTSQLG-----------QQLSEHLK
: . : : :. . :: .. : : : :...:
CCDS67 PGFGTRCMEGNPIPDTPCQAGEEEWTTAPVPQTIMDLFQNGNWTMQNPSPACQCSSDKIK
1420 1430 1440 1450 1460 1470
930 940 950
pF1KSD DALQ-----AEGQEP-------REVLGDLE-----EFL------IFRASVEG--------
: : : : ..: :: ..: :. :...
CCDS67 KMLPVCPPGAGGLPPPQRKQNTADILQDLTGRNISDYLVKTYVQIIAKSLKNKIWVNEFR
1480 1490 1500 1510 1520 1530
960 970 980
pF1KSD -GGF-----NERCLVAASF---------------RDVGERTVVNAL--------------
::: : . : .. .: . .:.:
CCDS67 YGGFSLGVSNTQALPPSQEVNDAIKQMKKHLKLAKDSSADRFLNSLGRFMTGLDTKNNVK
1540 1550 1560 1570 1580 1590
990 1000 1010 1020 1030
pF1KSD --FNNQAYHSPATALAVVDNLLFK--LLCG--P-HASIVVSNFPQPRSALQAAKDQFNEG
:::...:. .. : :..: ... : : : : .:.. : : . : .. .
CCDS67 VWFNNKGWHAISSFLNVINNAILRANLQKGENPSHYGITAFNHPLNLTKQQLSEVALMTT
1600 1610 1620 1630 1640 1650
1040 1050 1060 1070 1080 1090
pF1KSD RKGFDIALNLLFAMAFLASTFSILAVSERAVQAKHVQFVSGVHVASFWLSALLWDLISFL
... ..:::.:. ..: .. ..::. .:::.::.:::. . .::: ..::. ...
CCDS67 SVDVLVSICVIFAMSFVPASFVVFLIQERVSKAKHLQFISGVKPVIYWLSNFVWDMCNYV
1660 1670 1680 1690 1700 1710
1100 1110 1120 1130 1140 1150
pF1KSD IPSLLLLVVFKAFDVRAFTRDGHMADTLLLLLLYGWAIIPLMYLMNFFFLGAATAYTRLT
.:. :....: :. .... . .. ::::::::.: :::: .: : .:::. ::
CCDS67 VPATLVIIIFICFQQKSYVSSTNLPVLALLLLLYGWSITPLMYPASFVFKIPSTAYVVLT
1720 1730 1740 1750 1760 1770
1160 1170 1180 1190 1200 1210
pF1KSD IFNILSGIATFLMVTIMRI-PAVKLEELSKTLDHVFLVLPNHCLGMAVSSFYENYETRRY
:.. :: . . .... ::.... : :::..:. ::: .. .. .:
CCDS67 SVNLFIGINGSVATFVLELFTDNKLNNINDILKSVFLIFPHFCLGRGLIDMVKN------
1780 1790 1800 1810 1820
1220 1230 1240 1250 1260 1270
pF1KSD CTSSEVAAHYCKKYNIQYQENFYAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQRLR
.. : .... . . .:. ::: . .::. : ..... ::. .. : :
CCDS67 ----QAMADALERFGENRFVSPLSWDL--VGRNLFAMAVEGVVFFLITVLIQYRFFIRPR
1830 1840 1850 1860 1870
1280 1290 1300 1310 1320 1330
pF1KSD GILCALRRRRTLTELYTRMPVLPEDQDVADERTRILAPSPDSLLHTPLIIKELSKVYE-Q
. : :. ::.:: :: ::: . .. . : ::::.:.:. .
CCDS67 PVNAKLS------------PLNDEDEDVRRERQRILDGGGQNDI---LEIKELTKIYRRK
1880 1890 1900 1910 1920
1340 1350 1360 1370 1380 1390
pF1KSD RVPLLAVDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGHRISSDVG
: : ::::. ... :::::::: :::::..:::::::. ..: ::::.. . : :..
CCDS67 RKP--AVDRICVGIPPGECFGLLGVNGAGKSSTFKMLTGDTTVTRGDAFLNKNSILSNIH
1930 1940 1950 1960 1970 1980
1400 1410 1420 1430 1440 1450
pF1KSD KVRQRIGYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLV
.:.: .::::::::. . .:::: . ..: :::.::...: : ..: : : ...: .
CCDS67 EVHQNMGYCPQFDAITELLTGREHVEFFALLRGVPEKEVGKVGEWAIRKLGLVKYGEKYA
1990 2000 2010 2020 2030 2040
1460 1470 1480 1490 1500 1510
pF1KSD RTYSGGNKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTVARARESGKAIIITSH
.:::::::::::..:::: : :.:::::.::::: :::.::. . . . :.....:::
CCDS67 GNYSGGNKRKLSTAMALIGGPPVVFLDEPTTGMDPKARRFLWNCALSVVKEGRSVVLTSH
2050 2060 2070 2080 2090 2100
1520 1530 1540 1550 1560 1570
pF1KSD SMEECEALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQEALEEFKAFVD
:::::::::::.::::.:.:.:::: ::::..::.::.. ... :.. :. . :
CCDS67 SMEECEALCTRMAIMVNGRFRCLGSVQHLKNRFGDGYTIVVRIA--GSNPDLKPVQDFFG
2110 2120 2130 2140 2150 2160
1580 1590 1600 1610 1620 1630
pF1KSD LTFPGSVLEDEHQGMVHYHLPGRDLSWAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSF
:.::::::...:..:..:.::. : :..:.:: ..:.. ..:::::: .:.:::..:
CCDS67 LAFPGSVLKEKHRNMLQYQLPSSLSSLARIFSILSQSKKRLHIEDYSVSQTTLDQVFVNF
2170 2180 2190 2200 2210 2220
1640
pF1KSD AHLQPPTAEEGR
:. :
CCDS67 AKDQSDDDHLKDLSLHKNQTVVDVAVLTSFLQDEKVKESYV
2230 2240 2250 2260
>>CCDS43909.1 ABCA2 gene_id:20|Hs108|chr9 (2436 aa)
initn: 2943 init1: 905 opt: 1139 Z-score: 1353.8 bits: 264.0 E(32554): 4.4e-69
Smith-Waterman score: 2723; 34.0% identity (58.5% similar) in 1719 aa overlap (255-1644:700-2371)
230 240 250 260 270 280
pF1KSD YHADAATRQLFQRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIARAVVQ
:: .:....:: ...:..:.. . .:
CCDS43 AIIDTFVGHDVVEPGSYVQMFPYPCYTRDDFLFVIEHMMPLCMVISWVYSVAMTIQHIVA
670 680 690 700 710 720
290 300 310 320 330 340
pF1KSD EKERRLKEYMRMMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLSRSDPS
:::.:::: :. :::.. .:: :::. :. : :... .: .. :: .:
CCDS43 EKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVTALTAILKYG-----QVLMHSHVV
730 740 750 760 770 780
350 360 370
pF1KSD LVLAFLLCFAISTISFSFMVSTFFSK----------------------------------
.. :: .:..:: : :.::...::
CCDS43 IIWLFLAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREEVAHDKIT
790 800 810 820 830 840
380 390 400
pF1KSD ----------------------------GMGIQWRDL-LSPVNVDDDFCFGQVLGMLLLD
:.::::. . :::. ::: . .. ::..:
CCDS43 AFEKCIASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQSPVE-GDDFNLLLAVTMLMVD
850 860 870 880 890 900
410 420 430 440 450
pF1KSD SVLYGLVTWYMEAVFPGQFGVPQPWYFFIMPSYWCGKPRAVAGKEE-----------EDS
.:.::..:::.::: ::..:.:.:::: .. ::: :. :. : . .
CCDS43 AVVYGILTWYIEAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTPRLSVMEE
910 920 930 940 950 960
460 470 480 490 500
pF1KSD DPEKALRNEYFEA------EPEDLVAGIKIKHLSKVFRVGNKDRAAVRDLNLNLYEGQIT
: :.... :: :: : . . .:.::.. . . :. :.:::::.:..
CCDS43 DQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKVYK--DDKKLALNKLSLNLYENQVV
970 980 990 1000 1010 1020
510 520 530 540 550 560
pF1KSD VLLGHNGAGKTTTLSMLTGLFPPTSGRAYISGYEISQDMVQIRKSLGLCPQHDILFDNLT
.:::::::::::.:.:::::::::: : : :..: .: .:::.::.::::..::: ::
CCDS43 SFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRTEMDEIRKNLGMCPQHNVLFDRLT
1030 1040 1050 1060 1070 1080
570 580 590 600 610 620
pF1KSD VAEHLYFYAQLKGLSRQKCPEEVKQMLHIIGLEDKWNSRSRFLSGGMRRKLSIGIALIAG
: :::.::..::...... .:. .:.. . : .: .: . :::::.::::..::...:
CCDS43 VEEHLWFYSRLKSMAQEEIRREMDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAIAFVGG
1090 1100 1110 1120 1130 1140
630 640 650 660 670 680
pF1KSD SKVLILDEPTSGMDAISRRAIWDLLQRQKSDRTIVLTTHFMDEADLLGDRIAIMAKGELQ
:...::::::.:.: .:::::::. . : :::.:.:: :::::::::::::...:.:.
CCDS43 SRAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIISHGKLK
1150 1160 1170 1180 1190 1200
690 700 710 720
pF1KSD CCGSSLFLKQKYGAGYHMTLVKEP----------------------HCNPEDISQLVHHH
:::: :::: :: ::..::::.: :. ..::....:
CCDS43 CCGSPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPPGRAPLSSCSELQVSQFIRKH
1210 1220 1230 1240 1250 1260
730 740 750 760 770 780
pF1KSD VPNATLESSAGAELSFILPRESTHR--FEGLFAKLEKKQKELGIASFGASITTMEEVFLR
: . : :....:::.::: :.... :: :: .::.. : ..::: ::.:::::.
CCDS43 VASCLLVSDTSTELSYILPSEAAKKGAFERLFQHLERSLDALHLSSFGLMDTTLEEVFLK
1270 1280 1290 1300 1310 1320
790 800 810
pF1KSD VGK----LVDSSMDIQAIQ---LPALQ--YQHERRASDWAVDSNLC------------GA
:.. : .: :.. . ::. . . : .:.. : :.: :.
CCDS43 VSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCSELTQSQASLQSASSVGS
1330 1340 1350 1360 1370 1380
820 830 840 850
pF1KSD MDPSDGIG---------------------ALIEEERTAV--------KLNTGLALHCQQF
..: : .: : : :. ::. : :. .::
CCDS43 ARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGW-LKVRQF
1390 1400 1410 1420 1430 1440
860 870 880 890 900 910
pF1KSD WAMFLKKAAYSWREWKMVAAQVLVPLTCVTLALLAINYSSELFDDPMLRLTLGEYGRTVV
....:. . :. : . .:.:.: : .:. . :. : : : :. ..: .
CCDS43 HGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQYHNYTQ
1450 1460 1470 1480 1490 1500
pF1KSD P-------------------------------FSVP------------------------
: : .:
CCDS43 PRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSLGPTLNLS
1510 1520 1530 1540 1550 1560
920 930
pF1KSD -GTSQL----------------GQQLSEHLK---------------DALQAE--------
: :.: : ::. . . :::
CCDS43 SGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWNVSLPPTA
1570 1580 1590 1600 1610 1620
940
pF1KSD -------------------------------------GQEP--REVLGDL---------E
:. : : : ::.
CCDS43 GPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGHPPQMRVVTGDILTDITGHNVS
1630 1640 1650 1660 1670 1680
950 960 970 980 990
pF1KSD EFLIF---RASVEGGG---F-NERCLVAASF--------RDVGERTVVNALFNNQAYHSP
:.:.: : .. : : : . ::: : .. : ......::..:::
CCDS43 EYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMVRKIAVRRAAQVFYNNKGYHSM
1690 1700 1710 1720 1730 1740
1000 1010 1020 1030 1040
pF1KSD ATALAVVDNLLF-----KLLCGPHA-SIVVSNFPQPRSALQAAKDQFNEGRKGFDIALNL
: : ..: .. : .: : .:.:.: :. ... . . : . .: ::. .
CCDS43 PTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMNKTSASLSLDYLLQGTDVV-IAIFI
1750 1760 1770 1780 1790
1050 1060 1070 1080 1090 1100
pF1KSD LFAMAFLASTFSILAVSERAVQAKHVQFVSGVHVASFWLSALLWDLISFLIPSLLLLVVF
. ::.:. ..: .. :.:....:::.::::: . .::. .::....:.:. ....
CCDS43 IVAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPIIYWLANYVWDMLNYLVPATCCVIIL
1800 1810 1820 1830 1840 1850
1110 1120 1130 1140 1150 1160
pF1KSD KAFDVRAFTRDGHMADTLLLLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSGI--
.::. :.: .. .: :.:::::.: :.:: .:.: ..::. : ..:.. ::
CCDS43 FVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFWFEVPSSAYVFLIVINLFIGITA
1860 1870 1880 1890 1900 1910
1170 1180 1190 1200 1210 1220
pF1KSD --ATFLMVTIMRIPAVKLEELSKTLDHVFLVLPNHCLGMAVSSF-YENYETRRYCTSSEV
::::. . . .:. ... : ::..::. :: .. . :..: .
CCDS43 TVATFLLQLFEHDKDLKV--VNSYLKSCFLIFPNYNLGHGLMEMAYNEY----------I
1920 1930 1940 1950 1960
1230 1240 1250 1260 1270 1280
pF1KSD AAHYCKKYNIQYQENFYAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQRLRGILCAL
.: : ... ... . :. : : ...::. : . ..: .. . :.:.: .
CCDS43 NEYYAKIGQFDKMKSPFEWDI--VTRGLVAMAVEGVVGFLLTIMCQYNFLRRPQ------
1970 1980 1990 2000 2010
1290 1300 1310 1320 1330
pF1KSD RRRRTLTELYTRMPV----LPEDQDVADERTRILAPSPDSLLHTPLIIKELSKVYEQRVP
:::: . .: :::.:: :.: . :. . . :..:.:::..:
CCDS43 -----------RMPVSTKPVEDDVDVASERQRVLRGDADNDM---VKIENLTKVYKSRKI
2020 2030 2040 2050 2060
1340 1350 1360 1370 1380 1390
pF1KSD --LLAVDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGHRISSDVGK
.:::::: :.:. :::::::: ::::::.:::::::.:: :.:.:::.:: . ... .
CCDS43 GRILAVDRLCLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQ
2070 2080 2090 2100 2110 2120
1400 1410 1420 1430 1440 1450
pF1KSD VRQRIGYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLVR
:.: .::::: :::.:..:.:: : .:.::::: . . :. .:. : : .:.: .
CCDS43 VQQSLGYCPQCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPAG
2130 2140 2150 2160 2170 2180
1460 1470 1480 1490 1500 1510
pF1KSD TYSGGNKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTVARARESGKAIIITSHS
::::::::::::.::::: :: ::::::.::::: :::.::. . ..:.....::::
CCDS43 TYSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSVVLTSHS
2190 2200 2210 2220 2230 2240
1520 1530 1540 1550 1560 1570
pF1KSD MEECEALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQEALEEFKAFVDL
:::::::::::::::.:...:::: ::::..::.:: . ....: ...... : .
CCDS43 MEECEALCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKS---SQSVKDVVRFFNR
2250 2260 2270 2280 2290 2300
1580 1590 1600 1610 1620 1630
pF1KSD TFPGSVLEDEHQGMVHYHLPGRDLSWAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFA
.:: ..:...:. :.:.: .. .: :.::. .:... :..:::::: .:..::..::
CCDS43 NFPEAMLKERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFA
2310 2320 2330 2340 2350 2360
1640
pF1KSD HLQPPTAEEGR
. : . :.
CCDS43 KKQSDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFE
2370 2380 2390 2400 2410 2420
>>CCDS747.1 ABCA4 gene_id:24|Hs108|chr1 (2273 aa)
initn: 2806 init1: 963 opt: 1130 Z-score: 1343.4 bits: 262.0 E(32554): 1.6e-68
Smith-Waterman score: 2862; 33.9% identity (59.9% similar) in 1710 aa overlap (190-1638:590-2252)
160 170 180 190 200 210
pF1KSD RRNYMWTQTGSFFLKETEGWHTTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVD
. ::: : :: :: .: :.
CCDS74 TSSLPPHVKYKIRMDIDVVEKTNKIKDRYWDSGPRADPVEDFR---YIWGGFAYLQDMVE
560 570 580 590 600 610
220 230 240 250 260 270
pF1KSD RAIMEYHADAATRQLFQRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIA
..: . ...: . . . ....::: :. : :.. .. .:....:.. :.. .
CCDS74 QGITRSQVQAEAP-----VGIYLQQMPYPCFVDDSFMIILNRCFPIFMVLAWIYSVSMTV
620 630 640 650 660 670
280 290 300 310 320 330
pF1KSD RAVVQEKERRLKEYMRMMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLS
...: ::: :::: .. .:.:. . : .::: : .. .. :. .: .. . .:
CCDS74 KSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSMSI-FLLTIFIMHGR----ILH
680 690 700 710 720
340 350 360 370
pF1KSD RSDPSLVLAFLLCFAISTISFSFMVSTFFSK-----------------------------
::: ... ::: :. .:: . :..::::::
CCDS74 YSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYFTLYLPHILCFAWQDRM
730 740 750 760 770 780
380 390 400
pF1KSD -----------------------------GMGIQWRDLLSPVNVDDDFCFGQVLGMLLLD
:.:.:: .. . . :.: : . :.:::
CCDS74 TAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLLSMQMMLLD
790 800 810 820 830 840
410 420 430 440 450
pF1KSD SVLYGLVTWYMEAVFPGQFGVPQPWYFFIMPSYWCG-------KPRAVAGKE---EEDSD
...:::..::.. ::::..:.: ::::... ::: : . ::. : :: :
CCDS74 AAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCSTREERALEKTEPLTEETED
850 860 870 880 890 900
460 470 480 490 500
pF1KSD PE--KALRNEYFEAEPEDLVAGIKIKHLSKVFRVGNKDRAAVRDLNLNLYEGQITVLLGH
:: ..... .:: : : :. .:.: :.:. : :: ::...::.:::..:::
CCDS74 PEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFE--PCGRPAVDRLNITFYENQITAFLGH
910 920 930 940 950 960
510 520 530 540 550 560
pF1KSD NGAGKTTTLSMLTGLFPPTSGRAYISGYEISQDMVQIRKSLGLCPQHDILFDNLTVAEHL
::::::::::.::::.::::: . ..: .: .. .:.:::.::::.::: .::::::.
CCDS74 NGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQHNILFHHLTVAEHM
970 980 990 1000 1010 1020
570 580 590 600 610 620
pF1KSD YFYAQLKGLSRQKCPEEVKQMLHIIGLEDKWNSRSRFLSGGMRRKLSIGIALIAGSKVLI
::::::: :... :.. ::. ::. : : ... :::::.::::..::... .::.:
CCDS74 LFYAQLKGKSQEEAQLEMEAMLEDTGLHHKRNEEAQDLSGGMQRKLSVAIAFVGDAKVVI
1030 1040 1050 1060 1070 1080
630 640 650 660 670 680
pF1KSD LDEPTSGMDAISRRAIWDLLQRQKSDRTIVLTTHFMDEADLLGDRIAIMAKGELQCCGSS
:::::::.: :::.::::: . .: :::...:: :::::::::::::.:.:.: : :.
CCDS74 LDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAIIAQGRLYCSGTP
1090 1100 1110 1120 1130 1140
690 700 710
pF1KSD LFLKQKYGAGYHMTLVK------------EPHCN------------------PE-----D
::::. .:.: ..:::. : :. :: :
CCDS74 LFLKNCFGTGLYLTLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAHVDDLTPEQVLDGD
1150 1160 1170 1180 1190 1200
720 730 740 750 760
pF1KSD ISQL---VHHHVPNATLESSAGAELSFILPRES-THR-FEGLFAKLEKKQKELGIASFGA
...: : ::::.: : : :: :.:: .. :: . .:: .::. .::..:::
CCDS74 VNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFKHRAYASLFRELEETLADLGLSSFGI
1210 1220 1230 1240 1250 1260
770 780 790 800 810 820
pF1KSD SITTMEEVFLRVGKLVDSS-MDIQAIQLP--ALQYQH-----ERRASDWAVDSNLCGAMD
: : .::.::.: . ::. . . : .. .: ...:.. :::.:.
CCDS74 SDTPLEEIFLKVTEDSDSGPLFAGGAQQKRENVNPRHPCLGPREKAGQTPQDSNVCSPGA
1270 1280 1290 1300 1310 1320
830 840 850 860 870
pF1KSD PS---DGIGALIEEERTAVKLNTGLALHCQQFWAMFLKKAAYSWREWKMVAAQVLVPLTC
:. .: : : . .:::: : :. :...:. .. : : ::...: :
CCDS74 PAAHPEGQPP-PEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHKDFLAQIVLPATF
1330 1340 1350 1360 1370 1380
880 890 900 910 920
pF1KSD VTLALLAINYSSELFDDPMLRLTLGEYGRTVVPFSV--PGTSQL-------------GQQ
: :::. . . : : : ::. . ::. ::. :. :..
CCDS74 VFLALMLSIVIPPFGEYPALTLHPWIYGQQYTFFSMDEPGSEQFTVLADVLLNKPGFGNR
1390 1400 1410 1420 1430 1440
930 940 950
pF1KSD ----------------------LSEHLKDALQAE-----GQEPREVLGDLEEFLIFRASV
.: .. . .: . . : . :.. ..
CCDS74 CLKEGWLPEYPCGNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSCRCSTREKLTMLPECP
1450 1460 1470 1480 1490 1500
960 970 980 990
pF1KSD EG-GGFN--ERCLVAAS-FRDVGERTVVNALF-----------------NNQAYHS----
:: ::. .: .. ..:. .:.. . : :.: : .
CCDS74 EGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSKFWVNEQRYGGISIG
1510 1520 1530 1540 1550 1560
1000
pF1KSD ------PATALAVV-----------------------------------DNL--------
: :. :.: ::.
CCDS74 GKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHLETEDNIKVWFNNKG
1570 1580 1590 1600 1610 1620
1010 1020 1030 1040
pF1KSD ---LFKLLCGPHASIVVSNFPQPRSA-----------LQAAKDQFNEGR---KGFD--IA
: ..: : .:. ...:. :: :. .:.:..: . : .:
CCDS74 WHALVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLSEITVLTTSVDAVVA
1630 1640 1650 1660 1670 1680
1050 1060 1070 1080 1090 1100
pF1KSD LNLLFAMAFLASTFSILAVSERAVQAKHVQFVSGVHVASFWLSALLWDLISFLIPSLLLL
. ..:.:.:. ..: . ..::. ..::.::.::: ...:.. .:::.... . . :..
CCDS74 ICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFLWDIMNYSVSAGLVV
1690 1700 1710 1720 1730 1740
1110 1120 1130 1140 1150 1160
pF1KSD VVFKAFDVRAFTRDGHMADTLLLLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSG
.: .:. .:.: .. . ::::::::.::.:: .:.: .:::. :. :.. :
CCDS74 GIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPSTAYVALSCANLFIG
1750 1760 1770 1780 1790 1800
1170 1180 1190 1200 1210 1220
pF1KSD IATFLMVTIMRI--PAVKLEELSKTLDHVFLVLPNHCLGMAVSSFYENYETRRYCTSSEV
: . .. :... : ... .: ....:.:. ::: .. .. . :..
CCDS74 INSSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGLIDL----------ALSQA
1810 1820 1830 1840 1850
1230 1240 1250 1260 1270 1280
pF1KSD AAHYCKKYNIQYQENFYAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQRLRGILCAL
.. ... ... : . :. .:. . .:.. : .:..: .:.. ...
CCDS74 VTDVYARFGEEHSANPFHWDL--IGKNLFAMVVEGVVYFLLTLLVQRHFFLS--------
1860 1870 1880 1890 1900
1290 1300 1310 1320 1330 1340
pF1KSD RRRRTLTELYTRMPVLPEDQDVADERTRILAPSPDSLLHTPLIIKELSKVYE-QRVPLLA
. ..: :. :.. ::.:::.:: ::.. . . . : ..::.:.: : :
CCDS74 ---QWIAE-PTKEPIVDEDDDVAEERQRIITGGNKTDI---LRLHELTKIYPGTSSP--A
1910 1920 1930 1940 1950
1350 1360 1370 1380 1390 1400
pF1KSD VDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGHRISSDVGKVRQRI
:::: ..:. :::::::: ::::::::::::::. ..::::: :.:. : .....:.: .
CCDS74 VDRLCVGVRPGECFGLLGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNM
1960 1970 1980 1990 2000 2010
1410 1420 1430 1440 1450 1460
pF1KSD GYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLVRTYSGG
::::::::. . .:::: : .::::::.: ..: .. ....: : .:. :. :::::
CCDS74 GYCPQFDAIDELLTGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGG
2020 2030 2040 2050 2060 2070
1470 1480 1490 1500 1510 1520
pF1KSD NKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTVARARESGKAIIITSHSMEECE
:::::::.::::: : ...::::.::::: :::.::.... . :.:...:::::::::
CCDS74 NKRKLSTAIALIGCPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECE
2080 2090 2100 2110 2120 2130
1530 1540 1550 1560 1570
pF1KSD ALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQ--EALEEFKAFVDLTFP
::::::::::.: :.:.:. ::::::::.:: . :..: .. :. . : . .::
CCDS74 ALCTRLAIMVKGAFRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFP
2140 2150 2160 2170 2180 2190
1580 1590 1600 1610 1620 1630
pF1KSD GSVLEDEHQGMVHYHLPGRDLSWAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFAHLQ
::: ...: .:..... . .: :..: .: . :.. ...:::.: .:.:::..::. :
CCDS74 GSVQRERHYNMLQFQVSSSSL--ARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQ
2200 2210 2220 2230 2240 2250
1640
pF1KSD PPTAEEGR
CCDS74 TESHDLPLHPRAAGASRQAQD
2260 2270
>>CCDS12055.1 ABCA7 gene_id:10347|Hs108|chr19 (2146 aa)
initn: 2793 init1: 854 opt: 1093 Z-score: 1299.3 bits: 253.7 E(32554): 4.7e-66
Smith-Waterman score: 2894; 35.5% identity (59.7% similar) in 1687 aa overlap (188-1638:483-2104)
160 170 180 190 200 210
pF1KSD YTRRNYMWTQTGSFFLKETEGWHTTSLFPLFPNPGPR-EPTSPDGGEPGYIREGFLAVQH
: .::: .: . . :. ::. .:
CCDS12 PTPDLGPGHVRIKIRMDIDVVTRTNKIRDRFWDPGPAADPLT----DLRYVWGGFVYLQD
460 470 480 490 500
220 230 240 250 260 270
pF1KSD AVDRAIMEYHADAATRQLFQRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTAL
:.:: .. . : : . ....::: .. : :: ... .:::.: :.. :..
CCDS12 LVERAAVRVLSGANPRA-----GLYLQQMPYPCYVDDVFLRVLSRSLPLFLTLAWIYSVT
510 520 530 540 550 560
280 290 300 310 320 330
pF1KSD TIARAVVQEKERRLKEYMRMMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVA
..:::.::: ::.. :: :::: . : .::: . .:..:....:.. :.
CCDS12 LTVKAVVREKETRLRDTMRAMGLSRAVLWLGWFLSCLGPFLLSAALLVLVL--KLGD---
570 580 590 600 610
340 350 360 370
pF1KSD VLSRSDPSLVLAFLLCFAISTISFSFMVSTFFSK--------GMG-----------IQWR
.: : :..:. :: ::..:.. ::..:.:::. :.. . ::
CCDS12 ILPYSHPGVVFLFLAAFAVATVTQSFLLSAFFSRANLAAACGGLAYFSLYLPYVLCVAWR
620 630 640 650 660 670
380 390
pF1KSD D-----------LLSPV----------------------NVD-----DDFCFGQVLGMLL
: ::::: :: : : ..:: :.::
CCDS12 DRLPAGGRVAASLLSPVAFGFGCESLALLEEQGEGAQWHNVGTRPTADVFSLAQVSGLLL
680 690 700 710 720 730
400 410 420 430 440 450
pF1KSD LDSVLYGLVTWYMEAVFPGQFGVPQPWYFFIMPSYWCG-KPRAVAGKEEEDSDPEKALRN
::..::::.:::.::: :::.:.:.:: : . ::::: .: . :: :.:
CCDS12 LDAALYGLATWYLEAVCPGQYGIPEPWNFPFRRSYWCGPRPPKSPAPCPTPLDP-KVL--
740 750 760 770 780 790
460 470 480 490 500 510
pF1KSD EYFEAEPEDLVAGIKIKHLSKVFRVGNKDRAAVRDLNLNLYEGQITVLLGHNGAGKTTTL
: : : :.... : : : .. . :.: :.:..:.:.::..::::::::::::
CCDS12 --VEEAPPGLSPGVSVRSLEK--RFPGSPQPALRGLSLDFYQGHITAFLGHNGAGKTTTL
800 810 820 830 840 850
520 530 540 550 560 570
pF1KSD SMLTGLFPPTSGRAYISGYEISQDMVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKGL
:.:.:::::..: :.: :... ..:. :: ::.:::...::: ::: ::..::..::::
CCDS12 SILSGLFPPSGGSAFILGHDVRSSMAAIRPHLGVCPQYNVLFDMLTVDEHVWFYGRLKGL
860 870 880 890 900 910
580 590 600 610 620 630
pF1KSD SRQKCPEEVKQMLHIIGLEDKWNSRSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSGMD
: : ..:. .:: .: . ..: :::::.::::..::...::.:.::::::.:.:
CCDS12 SAAVVGPEQDRLLQDVGLVSKQSVQTRHLSGGMQRKLSVAIAFVGGSQVVILDEPTAGVD
920 930 940 950 960 970
640 650 660 670 680 690
pF1KSD AISRRAIWDLLQRQKSDRTIVLTTHFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKYGA
:::.::.:: . . ::..:.:: .:::.:::::.:..: :.: :::: :::... :.
CCDS12 PASRRGIWELLLKYREGRTLILSTHHLDEAELLGDRVAVVAGGRLCCCGSPLFLRRHLGS
980 990 1000 1010 1020 1030
700 710 720
pF1KSD GYHMTLVKE--PHCNPE----------DISQ------------------LVHHHVPNATL
::..:::: : . : : : ::.: ::.: :
CCDS12 GYYLTLVKARLPLTTNEKADTDMEGSVDTRQEKKNGSQGSRVGTPQLLALVQHWVPGARL
1040 1050 1060 1070 1080 1090
730 740 750 760 770 780
pF1KSD ESSAGAELSFILPRESTH--RFEGLFAKLEKKQKELGIASFGASITTMEEVFLRVGKLVD
:: ..:: ..: : :: .:. . :: ....: : :..::.::.: .
CCDS12 VEELPHELVLVLPYTGAHDGSFATLFRELDTRLAELRLTGYGISDTSLEEIFLKVVEECA
1100 1110 1120 1130 1140 1150
790 800 810 820 830
pF1KSD SSMDIQAIQLPALQYQHERRASDWAVDSNLCGAMDPSDGI-------GALIEEER----T
.. :.. . :: . ..: .: : :.. :. : ..
CCDS12 ADTDME----DGSCGQHLCTGIA-GLDVTLRLKMPPQETALENGEPAGSAPETDQGSGPD
1160 1170 1180 1190 1200
840 850 860 870 880 890
pF1KSD AVKLNTGLALHCQQFWAMFLKKAAYSWREWKMVAAQVLVPLTCVTLALLAINYSSELFDD
:: : :: ::. :..::. . : . . ::...: : :::. .
CCDS12 AVGRVQGWALTRQQLQALLLKRFLLARRSRRGLFAQIVLPALFVGLALVFSLIVPPFGHY
1210 1220 1230 1240 1250 1260
900 910 920
pF1KSD PMLRLTLGEYGRTVVPFSV-----PGTSQLGQQL-------------SEH----------
: :::. :: : :: :: ..: . : : :
CCDS12 PALRLSPTMYGAQVSFFSEDAPGDPGRARLLEALLQEAGLEEPPVQHSSHRFSAPEVPAE
1270 1280 1290 1300 1310 1320
930 940
pF1KSD -----------------------------LKDALQAEG--QEPREVLG-----------D
: : : : :. : : .
CCDS12 VAKVLASGNWTPESPSPACQCSRPGARRLLPDCPAAAGGPPPPQAVTGSGEVVQNLTGRN
1330 1340 1350 1360 1370 1380
950 960
pF1KSD LEEFLI---------------FRASVEGGGFN----------------------------
: .::. . :. :::.
CCDS12 LSDFLVKTYPRLVRQGLKTKKWVNEVRYGGFSLGGRDPGLPSGQELGRSVEELWALLSPL
1390 1400 1410 1420 1430 1440
970 980 990 1000 1010
pF1KSD -----ERCL--VAASFRDVGERTVVNALFNNQAYHSPATALAVVDNLLFK--LLCGP--H
.: : ..: ... . .. :::...:: .. . ..: ... : :: :
CCDS12 PGGALDRVLKNLTAWAHSLDAQDSLKIWFNNKGWHSMVAFVNRASNAILRAHLPPGPARH
1450 1460 1470 1480 1490 1500
1020 1030 1040 1050 1060
pF1KSD A-SIVVSNFPQPRSALQAAKDQFNEGR---KGFDIALNL--LFAMAFLASTFSILAVSER
: ::.. : : :. .:.:..:: .. :. ... .:::.:. ..:... . ::
CCDS12 AHSITTLNHP-----LNLTKEQLSEGALMASSVDVLVSICVVFAMSFVPASFTLVLIEER
1510 1520 1530 1540 1550 1560
1070 1080 1090 1100 1110 1120
pF1KSD AVQAKHVQFVSGVHVASFWLSALLWDLISFLIPSLLLLVVFKAFDVRAFTRDGHMADTLL
...:::.:...:. . .::. .:::. ..:.:. .....: ::. ::.. ... ::
CCDS12 VTRAKHLQLMGGLSPTLYWLGNFLWDMCNYLVPACIVVLIFLAFQQRAYVAPANLPALLL
1570 1580 1590 1600 1610 1620
1130 1140 1150 1160 1170 1180
pF1KSD LLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSGIATFLMVTIMRIPA-VKLEELS
:::::::.: :::: .::: .:::. :: .:.. :: . . .... . ::.:.:
CCDS12 LLLLYGWSITPLMYPASFFFSVPSTAYVVLTCINLFIGINGSMATFVLELFSDQKLQEVS
1630 1640 1650 1660 1670 1680
1190 1200 1210 1220 1230 1240
pF1KSD KTLDHVFLVLPNHCLGMAVSSFYENYETRRYCTSSEVAAHYCKKYNIQYQENFYAWSAPG
. : .:::..:. ::: .. .. .: . .: . . . :.: . : .
CCDS12 RILKQVFLIFPHFCLGRGLIDMVRN---------QAMADAFERLGDRQFQSPLR-WEV--
1690 1700 1710 1720
1250 1260 1270 1280 1290 1300
pF1KSD VGRFVASMAASGCAYLILLFLIETNLLQRLRGILCALRRRRTLTELYTRMPVL-PEDQDV
::. . .:. .: :::. : :::. :. : : :.: :.: ::.::
CCDS12 VGKNLLAMVIQGP-----LFLLFTLLLQH-RSQLLPQPRVRSL-------PLLGEEDEDV
1730 1740 1750 1760 1770
1310 1320 1330 1340 1350 1360
pF1KSD ADERTRILAPSPDSLLHTPLIIKELSKVYE-QRVPLLAVDRLSLAVQKGECFGLLGFNGA
: :: :.. . .. . :....:.:::. ::.: ::::: :.. :::::::: :::
CCDS12 ARERERVVQGATQGDV---LVLRNLTKVYRGQRMP--AVDRLCLGIPPGECFGLLGVNGA
1780 1790 1800 1810 1820 1830
1370 1380 1390 1400 1410 1420
pF1KSD GKTTTFKMLTGEESLTSGDAFVGGHRISSDVGKVRQRIGYCPQFDALLDHMTGREMLVMY
:::.::.:.::. . :.: ..:: .. . . .. .::::: ::... .:::: : .
CCDS12 GKTSTFRMVTGDTLASRGEAVLAGHSVAREPSAAHLSMGYCPQSDAIFELLTGREHLELL
1840 1850 1860 1870 1880 1890
1430 1440 1450 1460 1470 1480
pF1KSD ARLRGIPERHIGACVENTLRGLLLEPHANKLVRTYSGGNKRKLSTGIALIGEPAVIFLDE
:::::.:: ... . . : : : .:.. . ::::::::::.:..::.:.:::.::::
CCDS12 ARLRGVPEAQVAQTAGSGLARLGLSWYADRPAGTYSGGNKRKLATALALVGDPAVVFLDE
1900 1910 1920 1930 1940 1950
1490 1500 1510 1520 1530 1540
pF1KSD PSTGMDPVARRLLWDTVARARESGKAIIITSHSMEECEALCTRLAIMVQGQFKCLGSPQH
:.::::: :::.::... . . :.....::::::::::::.::::::.:.:.:::::::
CCDS12 PTTGMDPSARRFLWNSLLAVVREGRSVMLTSHSMEECEALCSRLAIMVNGRFRCLGSPQH
1960 1970 1980 1990 2000 2010
1550 1560 1570 1580 1590 1600
pF1KSD LKSKFGSGYSLRAKVQSEGQQEALEEFKAFVDLTFPGSVLEDEHQGMVHYHLP-GRDLSW
::..:..:..: .: . .: : ::: :::. :.. : : ....:: : .
CCDS12 LKGRFAAGHTLTLRVPAARSQPA----AAFVAAEFPGAELREAHGGRLRFQLPPGGRCAL
2020 2030 2040 2050 2060
1610 1620 1630 1640
pF1KSD AKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFAHLQPPTAEEGR
:.::: : ..::.:.:::: ::.::: :.. :
CCDS12 ARVFGELAVHGAEHGVEDFSVSQTMLEEVFLYFSKDQGKDEDTEEQKEAGVGVDPAPGLQ
2070 2080 2090 2100 2110 2120
CCDS12 HPKRVSQFLDDPSTAETVL
2130 2140
>>CCDS11685.1 ABCA5 gene_id:23461|Hs108|chr17 (1642 aa)
initn: 1363 init1: 668 opt: 1063 Z-score: 1265.0 bits: 247.0 E(32554): 3.9e-64
Smith-Waterman score: 1916; 26.9% identity (57.5% similar) in 1730 aa overlap (1-1638:8-1616)
10 20 30 40 50
pF1KSD MAVLRQLALLLWKNYTLQKRKVLVTVLELFLPLLFSGILIWLRLKIQSENVPN
..: :: :: ::: .. : .: :...::.: :.:: :
CCDS11 MSTAIREVGVWRQTRTLLLKNYLIKCRTKKSSVQEILFPLFF---LFWLILI--------
10 20 30 40
60 70 80 90 100 110
pF1KSD ATIYPGQSIQELPLFFTFPPPGDTWELAYIPSHSDAAKTVTETVRRALVINMRVRGFPSE
. ..:... .:.: . : : . :. . . ..: .. . . . .:.
CCDS11 SMMHPNKKYEEVPNIEL--NPMDKFTLSNLILGYTPVTNITSSIMQKVSTDH----LPDV
50 60 70 80 90 100
120 130 140 150 160 170
pF1KSD KDFEDYIRYDNCSSSVLAAVVFEHPFNHSKEPLPLAVKYHLRFSYTRRNYMWTQTGSFFL
:.: . .: :. .: : . ...:.::: ..:...
CCDS11 IITEEYTNEKEMLTSSLS-----KPSNFVGVVFKDSMSYELRFFPD-----MIPVSSIYM
110 120 130 140 150
180 190 200 210 220 230
pF1KSD KETEGWHTTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVDRAIMEYHADAAT-R
: : . : :: ..: ..: ::.. ..... .
CCDS11 DSRAG------------------CSKSCEAAQYWSSGFTVLQASIDAAIIQLKTNVSLWK
160 170 180 190
240 250 260 270 280 290
pF1KSD QLFQRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIARAVVQEKERRLKE
.: . .: . . . . : : . : :...:. . .: .: :::...::
CCDS11 ELESTKAVIMGETAVVEIDTFPRGVILIY-----LVIAFSPFGYFLAIHIVAEKEKKIKE
200 210 220 230 240 250
300 310 320 330 340 350
pF1KSD YMRMMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLSRSDPSLVLAFLLC
....::: . : .: ::. .... :.::. : . .. . :. . : :.:
CCDS11 FLKIMGLHDTAFWLSWVLLYTSLIFL----MSLLMAVIATASLLFPQSSSIVIFLLFFL-
260 270 280 290 300
360 370 380
pF1KSD FAISTISFSFMVSTFF--SKGMGIQ--------------------------WRDLLSP--
...:.. :..:.. .: :: .:: : :.::
CCDS11 YGLSSVFFALMLTPLFKKSKHVGIVEFFVTVAFGFIGLMIILIESFPKSLVW--LFSPFC
310 320 330 340 350 360
390 400 410
pF1KSD -----VNVD-----DDFCFGQVLG--------------MLLLDSVLYGLVTWYMEAVFPG
... .:: : .. :: :.:..: :.. :.. :.::
CCDS11 HCTFVIGIAQVMHLEDFNEGASFSNLTAGPYPLIITIIMLTLNSIFYVLLAVYLDQVIPG
370 380 390 400 410 420
420 430 440 450 460 470
pF1KSD QFGVPQPWYFFIMPSYWCGKPRAVAGKEEEDSDPEKALRNEYFEAEPEDLVA--GIKIKH
.::. . .:. :::: . : : . . . .. .: .: ..:. .:.:.
CCDS11 EFGLRRSSLYFLKPSYWSKSKRNYEELSEGNVNGNISF-SEIIEPVSSEFVGKEAIRISG
430 440 450 460 470 480
480 490 500 510 520 530
pF1KSD LSKVFRVGNKDRAAVRDLNLNLYEGQITVLLGHNGAGKTTTLSMLTGLFPPTSGRAYISG
..:..: ... :.:.:....::::::.::::.:.::.: ...: :: ::..: : : :
CCDS11 IQKTYRKKGENVEALRNLSFDIYEGQITALLGHSGTGKSTLMNILCGLCPPSDGFASIYG
490 500 510 520 530 540
540 550 560 570 580 590
pF1KSD YEISQ--DMVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKGLSRQKCPEEVKQMLHII
...:. .: . :: .:.::: :: :: ::: :.: . :..::. .. .::...: .
CCDS11 HRVSEIDEMFEARKMIGICPQLDIHFDVLTVEENLSILASIKGIPANNIIQEVQKVLLDL
550 560 570 580 590 600
600 610 620 630 640 650
pF1KSD GLEDKWNSRSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSGMDAISRRAIWDLLQRQKS
.. ..... ::::..::::.:::.... :.:.:::::.::: ::. .:.::. .:.
CCDS11 DMQTIKDNQAKKLSGGQKRKLSLGIAVLGNPKILLLDEPTAGMDPCSRHIVWNLLKYRKA
610 620 630 640 650 660
660 670 680 690 700 710
pF1KSD DRTIVLTTHFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKYGAGYHMTLVKEPHCNPED
.:. :..::::::::.:.:: :....: :.: :::.:::.:.: ::.... . .: :.
CCDS11 NRVTVFSTHFMDEADILADRKAVISQGMLKCVGSSMFLKSKWGIGYRLSMYIDKYCATES
670 680 690 700 710 720
720 730 740 750 760 770
pF1KSD ISQLVHHHVPNATLESSAGAELSFILPRESTHRFEGLFAKLEKKQKELGIASFGASITTM
.:.::..:.:.::: .. .: . :: .. .: :::. :.. ...::. :.:.:.::.
CCDS11 LSSLVKQHIPGATLLQQNDQQLVYSLPFKDMDKFSGLFSALDS-HSNLGVISYGVSMTTL
730 740 750 760 770 780
780 790 800 810 820 830
pF1KSD EEVFLRVGKLVDSSMDIQAIQLPALQYQHERRASDWAVDSNLCGAMDPSDGIGALIEEER
:.:::.. :.. .: .. . : .:. .::. :. : :: :
CCDS11 EDVFLKL--EVEAEIDQADYSVFTQQPLEEE------MDSKSFDEMEQS----LLILSET
790 800 810 820
840 850 860 870 880 890
pF1KSD TAVKLNTGLALHCQQFWAMFLKKAAYSWREWKMVAAQVLVPLTCVTLALLAINYSSELFD
:. ..: ..: ::.... : . . : . .: .: :: : .. ..:
CCDS11 KAALVST-MSLWKQQMYTI----AKFHFFTLKRESKSVRS-----VLLLLLIFFTVQIF-
830 840 850 860 870
900 910 920 930 940 950
pF1KSD DPMLRLTLGEYGRTVVPFS-VPGTSQLGQQLSEH-LKDALQAEGQEPREVLGDLEEFL--
. :. . .:::.. :: : . : : .: ... .. .:: :.
CCDS11 ---MFLVHHSFKNAVVPIKLVPDLYFLKPGDKPHKYKTSLLLQNSADSDI-SDLISFFTS
880 890 900 910 920 930
960 970 980 990 1000
pF1KSD --IFRASVEGGGFNERCLVAASFRDV-GERTVV-NALFNNQAYHSPATALAVVDNL-LFK
:. . .. . . .:.. . .:. : :.::. .: . ...: :..
CCDS11 QNIMVTMINDSDYVSVAPHSAALNVMHSEKDYVFAAVFNSTMVYSLPILVNIISNYYLYH
940 950 960 970 980 990
1010 1020 1030 1040 1050 1060
pF1KSD LLCGPHASIVVSNFPQPRSALQAAKDQFNEGRKGFDIALNLLFAMAFLASTFSILAVSER
: .: . : .: : . . :. :: : . .. . :.. . ..
CCDS11 LNVTETIQIWSTPF------FQEITDIVFKIELYFQAAL-LGIIVTAMPPYFAMENAENH
1000 1010 1020 1030 1040
1070 1080 1090 1100 1110 1120
pF1KSD AVQAKHVQFVSGVHVASFWLSALLWDLISFLIPSLLLLVVFKAFDVRAFTRDGHMADTLL
..: .::. ...:.. . :. :.: .:.: . :: . .. ...
CCDS11 KIKAYTQLKLSGLLPSAYWIGQAVVDIPLFFIILILMLGSLLAFHYGLYFYTVKFLAVVF
1050 1060 1070 1080 1090 1100
1130 1140 1150 1160 1170 1180
pF1KSD LLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSGIATFLMVTIMRIPAVKLEELSK
:. : ..: . :. .: : . ..... ..:.. ..: .: ..
CCDS11 CLIGYVPSVILFTYIASFTF---KKILNTKEFWSFIYSVAALACIAITEITFFMGYTIAT
1110 1120 1130 1140 1150 1160
1190 1200 1210 1220 1230 1240
pF1KSD TLDHVF-LVLPNHCLGMAVSSFYENYETRRYCTSSEVAAHYCKKYNIQYQENFYAWSAPG
: ..: ...: . : . :: . .. . .: :. ... :.
CCDS11 ILHYAFCIIIPIYPLLGCLISFIK------------ISWKNVRK-NV---DTYNPWD---
1170 1180 1190 1200
1250 1260 1270 1280 1290
pF1KSD VGRFVASMAASGCAYLILLFLIETNLLQRLRGILCALRRRRTLTELYTR-----MPVLP-
:. ... . .. .::.. .. : ..:. . .: :. .: :
CCDS11 --RLSVAVISPYLQCVLWIFLLQ--YYEKKYGGR-SIRKDPFFRNLSTKSKNRKLPEPPD
1210 1220 1230 1240 1250 1260
1300 1310 1320 1330 1340
pF1KSD ---EDQDVADERTRI--LAPSPDSLLHTPLIIKELSKVYE--------QRVPLLAVDRLS
::.:: :: .. : . .....: : :. ..: .:. .:
CCDS11 NEDEDEDVKAERLKVKELMGCQCCEEKPSIMVSNLHKEYDDKKDFLLSRKVKKVATKYIS
1270 1280 1290 1300 1310 1320
1350 1360 1370 1380 1390 1400
pF1KSD LAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGH--RISSDVGKVRQRIGYC
. :.::: .:::: :::::.: ...:.:. :::..:.: . . : : ... .:::
CCDS11 FCVKKGEILGLLGPNGAGKSTIINILVGDIEPTSGQVFLGDYSSETSEDDDSLKC-MGYC
1330 1340 1350 1360 1370
1410 1420 1430 1440 1450 1460
pF1KSD PQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLVRTYSGGNKR
::.. : : .: . .:. ..:. . . ..: :. : .: :. .: ::
CCDS11 PQINPLWPDTTLQEHFEIYGAVKGMSASDMKEVISRITHALDLKEHLQKTVKKLPAGIKR
1380 1390 1400 1410 1420 1430
1470 1480 1490 1500 1510 1520
pF1KSD KLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTVARA-RESGKAIIITSHSMEECEAL
:: .....:.: . .:::::::::: :.. .: .. : .. .: :.:.: ::: ::.
CCDS11 KLCFALSMLGNPQITLLDEPSTGMDPKAKQHMWRAIRTAFKNRKRAAILTTHYMEEAEAV
1440 1450 1460 1470 1480 1490
1530 1540 1550 1560 1570 1580
pF1KSD CTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQEALEEFKAFVDLTFPGSVL
: :.::::.::..:.:. ::::::::.:: :. :... .. ..... .. ::..
CCDS11 CDRVAIMVSGQLRCIGTVQHLKSKFGKGYFLEIKLKDWIENLEVDRLQREIQYIFPNASR
1500 1510 1520 1530 1540 1550
1590 1600 1610 1620 1630 1640
pF1KSD EDEHQGMVHYHLPGRDL-SWAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFAHLQPPT
.. .... :..: .:. : .. : ::.::. .....:: :: .:::::. ... :
CCDS11 QESFSSILAYKIPKEDVQSLSQSFFKLEEAKHAFAIEEYSFSQATLEQVFVELTKEQEEE
1560 1570 1580 1590 1600 1610
pF1KSD AEEGR
CCDS11 DNSCGTLNSTLWWERTQEDRVVF
1620 1630 1640
>>CCDS74138.1 ABCA8 gene_id:10351|Hs108|chr17 (1616 aa)
initn: 1424 init1: 639 opt: 1033 Z-score: 1229.0 bits: 240.3 E(32554): 3.9e-62
Smith-Waterman score: 1825; 29.0% identity (59.9% similar) in 1530 aa overlap (206-1638:172-1593)
180 190 200 210 220 230
pF1KSD TEGWHTTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVDRAIMEYHADAATRQLF
. .:::.:.: :.. ::.: .. .. .
CCDS74 GHGMPAKKEHKDHTAHCYETNEDVYCEVSVFWKEGFVALQAAINAAIIEITTNHSVME--
150 160 170 180 190
240 250 260 270 280 290
pF1KSD QRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIARAVVQEKERRLKEYMR
. ..:: : . . ::.. ... : . . .::. . . : . : ....:.: :
CCDS74 ELMSVTGKNMKMHSFIGQSGVITDLYLFSCI--ISFS-SFIYYASVNVTRERKRMKALMT
200 210 220 230 240 250
300 310 320 330 340 350
pF1KSD MMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLSRSDPSLVLAFLLCFAI
:::: . : .: ::. :..: : :..: : . . .:: .:....: ...
CCDS74 MMGLRDSAFWLSWGLLYAGFIFIMALFLAL---VIRSTQFIILS--GFMVVFSLFLLYGL
260 270 280 290 300 310
360 370 380
pF1KSD STISFSFMVSTFFSK----GM-----------------------GIQW-RDLLSP-----
: ....:..: . .: :. ...: .::::
CCDS74 SLVALAFLMSILVKKSFLTGLVVFLLTVFWGCLGFTSLYRHLPASLEWILSLLSPFAFML
320 330 340 350 360 370
390 400 410 420
pF1KSD -----VNVDDDF---CF-----GQVLG-----MLLLDSVLYGLVTWYMEAVFPGQFGVPQ
...: :. : :. : :: .:. :: .. :.: ..:...: .
CCDS74 GMAQLLHLDYDLNSNAFPHPSDGSNLIVATNFMLAFDTCLYLALAIYFEKILPNEYGHRR
380 390 400 410 420 430
430 440 450 460 470 480
pF1KSD PWYFFIMPSYWCGKPRA--VAGKEEEDSDPEKALRNEYFEAEPE-DLVAGIKIKHLSKVF
: ::. :.: .. :: ..: :.:: .... . .: :: . .:.:....: .
CCDS74 PPLFFLKSSFWSQTQKTDHVALEDEMDADP--SFHDSFEQAPPEFQGKEAIRIRNVTKEY
440 450 460 470 480
490 500 510 520 530 540
pF1KSD RVGNKDRA-AVRDLNLNLYEGQITVLLGHNGAGKTTTLSMLTGLFPPTSGRAYISGYEIS
. :. :. :..:: ...::::::..:::.::::.: :..:.:: ::.: . : . ..:
CCDS74 K-GKPDKIEALKDLVFDIYEGQITAILGHSGAGKSTLLNILSGLSVPTKGSVTIYNNKLS
490 500 510 520 530 540
550 560 570 580 590
pF1KSD Q--DMVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKGLSRQKCPEEVKQMLHIIGLED
. :. .. : :.::: .. :: ::: :.: ..:..::. :. .:....: . ...
CCDS74 EMADLENLSKLTGVCPQSNVQFDFLTVRENLRLFAKIKGILPQEVDKEIQRVLLELEMKN
550 560 570 580 590 600
600 610 620 630 640 650
pF1KSD KWNSRSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSGMDAISRRAIWDLLQRQKSDRTI
. .. ::::..:::..:::... ....:::::.:.: .::. .:.::...:.::.:
CCDS74 IQDVLAQNLSGGQKRKLTFGIAILGDPQIFLLDEPTAGLDPFSRHQVWNLLKERKTDRVI
610 620 630 640 650 660
660 670 680 690 700 710
pF1KSD VLTTHFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKYGAGYHMTLVKEPHCNPEDISQL
...:.::::::.:.:: .....:.:.: :::::::.:.: :::..: . : :.:..:
CCDS74 LFSTQFMDEADILADRKVFLSQGKLKCAGSSLFLKKKWGIGYHLSLQLNEICVEENITSL
670 680 690 700 710 720
720 730 740 750 760 770
pF1KSD VHHHVPNATLESSAGAELSFILPRESTHRFEGLFAKLEKKQKELGIASFGASITTMEEVF
:..:.:.: : ... ..: . :: : :..: :. :.. .::: ..:.:.::..:::
CCDS74 VKQHIPDAKLSAKSEGKLIYTLPLERTNKFPELYKDLDS-YPDLGIENYGVSMTTLNEVF
730 740 750 760 770 780
780 790 800 810 820 830
pF1KSD LRV-GKLVDSSMDIQAIQLPALQYQHERRASDWAVDSNLCGAMDPSDGIGALIEEERTAV
:.. :: . . :: . . : :. : :.. :. . . ... : ..
CCDS74 LKLEGKSTINESDIAILG----EVQAEK-----ADDTERLVEMEQ---VLSSLNKMRKTI
790 800 810 820 830
840 850 860 870 880 890
pF1KSD KLNTGLALHCQQFWAMFLKKAAYSWREWKMVAAQVLVPLTCVTLALLAINYSSELFDDPM
:.:: ::. :. . .: : . : .:. :.: .. : . :
CCDS74 G---GVALWRQQICAIARVRLLKLKHERKALLALLLI--------LMA-GFCPLLVEYTM
840 850 860 870 880
900 910 920 930 940 950
pF1KSD LRLTLGEYGRTVVPFSVPGTSQLGQQLSEHLKDALQAEGQEPREVLGDLEEFLIFRASVE
... . : .:: :: . : ::.:.. : .: ..: ....
CCDS74 VKIYQNSYT---------------WELSPHLY--FLAPGQQPHDPLTQL--LIINKTGAS
890 900 910 920
960 970 980 990 1000
pF1KSD GGGFN---ERCLVAASFRDVGERTVVNALFNNQAYHSPATALAVVDNLLFKLLCG-----
: :. .: : :. .. . .:.. :. : :.: :.
CCDS74 IDDFIQSVEHQNIALEVDAFGTRNGTD----DPSYNGAITVCCNEKNYSFSLACNAKRLN
930 940 950 960 970 980
1010 1020 1030 1040 1050 1060
pF1KSD --PHASIVVSN----FPQPRSALQAAKDQFNEGRKGFDIAL--NLLFAMAFLASTFSILA
: .::: . .: ... .. : :. . :.. ..: ... .: .:
CCDS74 CFPVLMDIVSNGLLGMVKPSVHIRTERSTFLENGQDNPIGFLAYIMFWLVLTSSCPPYIA
990 1000 1010 1020 1030 1040
1070 1080 1090 1100 1110
pF1KSD VS---ERAVQAKHVQFVSGVHVASFWLSALLWDL-ISFLIPSLLLLVVF-KAFDVRAFTR
.: . .:. .::. ...:.. : :. . ::. .. :. . . :. .:
CCDS74 MSSIDDYKNRARSQLRISGLSPSAYWFGQALVDVSLYFLVFVFIYLMSYISNFEDMLLTI
1050 1060 1070 1080 1090 1100
1120 1130 1140 1150 1160 1170
pF1KSD DGHMADTLLLLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSGIATF--LMVTIMR
:. . . . :....: . :...:.: : : ::: .: .::..
CCDS74 I-HIIQ-IPCAVGYSFSLIFMTYVISFIF--------RKGRKN--SGIWSFCFYVVTVFS
1110 1120 1130 1140
1180 1190 1200 1210 1220 1230
pF1KSD IP--AVKLEELSKTLDHVFLVLPNHCLGMAVSSFYENYETRRYCTSSEVAAHYCKKYNIQ
. : .. : . . .::. : .: : . . . :: .....:
CCDS74 VAGFAFSIFESDIPFIFTFLIPPATMIGCLFLSSHLLFSS----LFSE------ERMDVQ
1150 1160 1170 1180 1190
1240 1250 1260 1270 1280 1290
pF1KSD YQENFYAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQRLRGILCALRRRRTLTELYT
: .. : . .:. .:. : .: .. .. ..:. ..
CCDS74 ---PFLVFLIPFL-HFI--------IFLFTLRCLEWKFGKK------SMRKDPFFSSDVC
1200 1210 1220 1230 1240
1300 1310 1320 1330 1340
pF1KSD RMPVLPE--DQDVADERTRIL-APSPDSLLHTPLIIKE-LSKVYE--------QRVPLLA
. : :: :.:: ::.: : . .. . :.:: : : : .: .:
CCDS74 QNPEEPEGEDEDVQMERVRTANALNSTNFDEKPVIIASCLRKEYAGKRKGCFSKRKNKIA
1250 1260 1270 1280 1290 1300
1350 1360 1370 1380 1390 1400
pF1KSD VDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGHRISSDVGKVRQRI
. .:. :.::: .:::: :::::.:..:..::. . :.:.... : : : . . .
CCDS74 TRNVSFCVRKGEVLGLLGHNGAGKSTSIKVITGDTKPTAGQVLLKG----SGGGDALEFL
1310 1320 1330 1340 1350
1410 1420 1430 1440 1450 1460
pF1KSD GYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLVRTYSGG
::::: .:: ..: :. : .:: ..:. . . . . .: :. . .. :.: : :
CCDS74 GYCPQENALWPNLTVRQHLEVYAAVKGLRKGDAEVAITRLVDALKLQDQLKSPVKTLSEG
1360 1370 1380 1390 1400 1410
1470 1480 1490 1500 1510
pF1KSD NKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTV-ARARESGKAIIITSHSMEEC
:::: ....:.:.:..:::::::::: ... .:... : :.. .. ..:.: : :
CCDS74 IKRKLCFVLSILGNPSVVLLDEPSTGMDPEGQQQMWQAIRATFRNTERGALLTTHYMAEA
1420 1430 1440 1450 1460 1470
1520 1530 1540 1550 1560 1570
pF1KSD EALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQEALEEFKAFVDLTFPG
::.: :.::::.:...:.:: ::::::::. : :. ::.. .: : :. : . ::
CCDS74 EAVCDRVAIMVSGRLRCIGSIQHLKSKFGKDYLLEMKVKNLAQVEPLH---AEILRLFPQ
1480 1490 1500 1510 1520 1530
1580 1590 1600 1610 1620 1630
pF1KSD SVLEDEHQGMVHYHLPGRDLS-WAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFAHLQ
.. ........ :.:: .:.. :..: :::.:... ...::.:: .:::::: ... :
CCDS74 AARQERYSSLMVYKLPVEDVQPLAQAFFKLEKVKQSFDLEEYSLSQSTLEQVFLELSKEQ
1540 1550 1560 1570 1580 1590
1640
pF1KSD PPTAEEGR
CCDS74 ELGDFEEDFDPSVKWKLLPQEEP
1600 1610
>>CCDS74139.1 ABCA8 gene_id:10351|Hs108|chr17 (1621 aa)
initn: 1424 init1: 639 opt: 1033 Z-score: 1229.0 bits: 240.3 E(32554): 3.9e-62
Smith-Waterman score: 1812; 29.1% identity (59.8% similar) in 1531 aa overlap (206-1638:172-1598)
180 190 200 210 220 230
pF1KSD TEGWHTTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVDRAIMEYHADAATRQLF
. .:::.:.: :.. ::.: .. .. .
CCDS74 GHGMPAKKEHKDHTAHCYETNEDVYCEVSVFWKEGFVALQAAINAAIIEITTNHSVME--
150 160 170 180 190
240 250 260 270 280 290
pF1KSD QRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIARAVVQEKERRLKEYMR
. ..:: : . . ::.. ... : . . .::. . . : . : ....:.: :
CCDS74 ELMSVTGKNMKMHSFIGQSGVITDLYLFSCI--ISFS-SFIYYASVNVTRERKRMKALMT
200 210 220 230 240 250
300 310 320 330 340 350
pF1KSD MMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLSRSDPSLVLAFLLCFAI
:::: . : .: ::. :..: : :..: : . . .:: .:....: ...
CCDS74 MMGLRDSAFWLSWGLLYAGFIFIMALFLAL---VIRSTQFIILS--GFMVVFSLFLLYGL
260 270 280 290 300 310
360 370 380
pF1KSD STISFSFMVSTFFSK----GM-----------------------GIQW-RDLLSP-----
: ....:..: . .: :. ...: .::::
CCDS74 SLVALAFLMSILVKKSFLTGLVVFLLTVFWGCLGFTSLYRHLPASLEWILSLLSPFAFML
320 330 340 350 360 370
390 400 410 420
pF1KSD -----VNVDDDF---CF-----GQVLG-----MLLLDSVLYGLVTWYMEAVFPGQFGVPQ
...: :. : :. : :: .:. :: .. :.: ..:...: .
CCDS74 GMAQLLHLDYDLNSNAFPHPSDGSNLIVATNFMLAFDTCLYLALAIYFEKILPNEYGHRR
380 390 400 410 420 430
430 440 450 460 470 480
pF1KSD PWYFFIMPSYWCGKPRA--VAGKEEEDSDPEKALRNEYFEAEPE-DLVAGIKIKHLSKVF
: ::. :.: .. :: ..: :.:: .... . .: :: . .:.:....: .
CCDS74 PPLFFLKSSFWSQTQKTDHVALEDEMDADP--SFHDSFEQAPPEFQGKEAIRIRNVTKEY
440 450 460 470 480
490 500 510 520 530 540
pF1KSD RVGNKDRA-AVRDLNLNLYEGQITVLLGHNGAGKTTTLSMLTGLFPPTSGRAYISGYEIS
. :. :. :..:: ...::::::..:::.::::.: :..:.:: ::.: . : . ..:
CCDS74 K-GKPDKIEALKDLVFDIYEGQITAILGHSGAGKSTLLNILSGLSVPTKGSVTIYNNKLS
490 500 510 520 530 540
550 560 570 580 590
pF1KSD Q--DMVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKGLSRQKCPEEVKQMLHIIGLED
. :. .. : :.::: .. :: ::: :.: ..:..::. :. .:....: . ...
CCDS74 EMADLENLSKLTGVCPQSNVQFDFLTVRENLRLFAKIKGILPQEVDKEIQRVLLELEMKN
550 560 570 580 590 600
600 610 620 630 640 650
pF1KSD KWNSRSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSGMDAISRRAIWDLLQRQKSDRTI
. .. ::::..:::..:::... ....:::::.:.: .::. .:.::...:.::.:
CCDS74 IQDVLAQNLSGGQKRKLTFGIAILGDPQIFLLDEPTAGLDPFSRHQVWNLLKERKTDRVI
610 620 630 640 650 660
660 670 680 690 700 710
pF1KSD VLTTHFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKYGAGYHMTLVKEPHCNPEDISQL
...:.::::::.:.:: .....:.:.: :::::::.:.: :::..: . : :.:..:
CCDS74 LFSTQFMDEADILADRKVFLSQGKLKCAGSSLFLKKKWGIGYHLSLQLNEICVEENITSL
670 680 690 700 710 720
720 730 740 750 760 770
pF1KSD VHHHVPNATLESSAGAELSFILPRESTHRFEGLFAKLEKKQKELGIASFGASITTMEEVF
:..:.:.: : ... ..: . :: : :..: :. :.. .::: ..:.:.::..:::
CCDS74 VKQHIPDAKLSAKSEGKLIYTLPLERTNKFPELYKDLDS-YPDLGIENYGVSMTTLNEVF
730 740 750 760 770 780
780 790 800 810 820 830
pF1KSD LRV-GKLVDSSMDIQAIQLPALQYQHERRASDWAVDSNLCGAMDPSDGIGALIEEERTAV
:.. :: . . :: . . : :. : :.. :. . . ... : ..
CCDS74 LKLEGKSTINESDIAILG----EVQAEK-----ADDTERLVEMEQ---VLSSLNKMRKTI
790 800 810 820 830
840 850 860 870 880 890
pF1KSD KLNTGLALHCQQFWAMFLKKAAYSWREWKMVAAQVLVPLTCVTLALLAINYSSELFDDPM
:.:: ::. :. . .: : . : .:. :.: .. : . :
CCDS74 G---GVALWRQQICAIARVRLLKLKHERKALLALLLI--------LMA-GFCPLLVEYTM
840 850 860 870 880
900 910 920 930 940 950
pF1KSD LRLTLGEYGRTVVPFSVPGTSQLGQQLSEHLKDALQAEGQEPREVLGDLEEFLIFRASVE
... . : .:: :: . : ::.:.. : .: ..: ....
CCDS74 VKIYQNSYT---------------WELSPHLY--FLAPGQQPHDPLTQL--LIINKTGAS
890 900 910 920
960 970 980 990 1000
pF1KSD GGGFN---ERCLVAASFRDVGERTVVNALFNNQAYHSPATALAVVDNLLFKLLCG-----
: :. .: : :. .. . .:.. :. : :.: :.
CCDS74 IDDFIQSVEHQNIALEVDAFGTRNGTD----DPSYNGAITVCCNEKNYSFSLACNAKRLN
930 940 950 960 970 980
1010 1020 1030 1040 1050 1060
pF1KSD --PHASIVVSN----FPQPRSALQAAKDQFNEGRKGFDIAL--NLLFAMAFLASTFSILA
: .::: . .: ... .. : :. . :.. ..: ... .: .:
CCDS74 CFPVLMDIVSNGLLGMVKPSVHIRTERSTFLENGQDNPIGFLAYIMFWLVLTSSCPPYIA
990 1000 1010 1020 1030 1040
1070 1080 1090 1100 1110
pF1KSD VS---ERAVQAKHVQFVSGVHVASFWLSALLWDL-ISFLIPSLLLLVVF-KAFDVRAFTR
.: . .:. .::. ...:.. : :. . ::. .. :. . . :. .:
CCDS74 MSSIDDYKNRARSQLRISGLSPSAYWFGQALVDVSLYFLVFVFIYLMSYISNFEDMLLTI
1050 1060 1070 1080 1090 1100
1120 1130 1140 1150 1160 1170
pF1KSD DGHMADTLLLLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSGIATF--LMVTIMR
:. . . . :....: . :...:.: : : ::: .: .::..
CCDS74 I-HIIQ-IPCAVGYSFSLIFMTYVISFIF--------RKGRKN--SGIWSFCFYVVTVFS
1110 1120 1130 1140
1180 1190 1200 1210 1220 1230
pF1KSD IP--AVKLEELSKTLDHVFLVLPNHCLGMAVSSFYENYETRRYCTSSEVAAHYCKKYNIQ
. : .. : . . .::. : .: : . . . :: .....:
CCDS74 VAGFAFSIFESDIPFIFTFLIPPATMIGCLFLSSHLLFSS----LFSE------ERMDVQ
1150 1160 1170 1180 1190
1240 1250 1260 1270 1280 1290
pF1KSD YQENFYAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQR-LRGILCALRRRRTLTELY
: .. : . .:. .:. : .: .. .. .: . : .
CCDS74 ---PFLVFLIPFL-HFI--------IFLFTLRCLEWKFGKKSMRKD--PFFRISPRSSDV
1200 1210 1220 1230 1240
1300 1310 1320 1330
pF1KSD TRMPVLPE--DQDVADERTRIL-APSPDSLLHTPLIIKE-LSKVYE--------QRVPLL
. : :: :.:: ::.: : . .. . :.:: : : : .: .
CCDS74 CQNPEEPEGEDEDVQMERVRTANALNSTNFDEKPVIIASCLRKEYAGKRKGCFSKRKNKI
1250 1260 1270 1280 1290 1300
1340 1350 1360 1370 1380 1390
pF1KSD AVDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGHRISSDVGKVRQR
:. .:. :.::: .:::: :::::.:..:..::. . :.:.... : : : . .
CCDS74 ATRNVSFCVRKGEVLGLLGHNGAGKSTSIKVITGDTKPTAGQVLLKG----SGGGDALEF
1310 1320 1330 1340 1350 1360
1400 1410 1420 1430 1440 1450
pF1KSD IGYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLVRTYSG
.::::: .:: ..: :. : .:: ..:. . . . . .: :. . .. :.: :
CCDS74 LGYCPQENALWPNLTVRQHLEVYAAVKGLRKGDAEVAITRLVDALKLQDQLKSPVKTLSE
1370 1380 1390 1400 1410 1420
1460 1470 1480 1490 1500 1510
pF1KSD GNKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTV-ARARESGKAIIITSHSMEE
: :::: ....:.:.:..:::::::::: ... .:... : :.. .. ..:.: : :
CCDS74 GIKRKLCFVLSILGNPSVVLLDEPSTGMDPEGQQQMWQAIRATFRNTERGALLTTHYMAE
1430 1440 1450 1460 1470 1480
1520 1530 1540 1550 1560 1570
pF1KSD CEALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQEALEEFKAFVDLTFP
::.: :.::::.:...:.:: ::::::::. : :. ::.. .: : :. : . ::
CCDS74 AEAVCDRVAIMVSGRLRCIGSIQHLKSKFGKDYLLEMKVKNLAQVEPLH---AEILRLFP
1490 1500 1510 1520 1530
1580 1590 1600 1610 1620 1630
pF1KSD GSVLEDEHQGMVHYHLPGRDLS-WAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFAHL
.. ........ :.:: .:.. :..: :::.:... ...::.:: .:::::: ...
CCDS74 QAARQERYSSLMVYKLPVEDVQPLAQAFFKLEKVKQSFDLEEYSLSQSTLEQVFLELSKE
1540 1550 1560 1570 1580 1590
1640
pF1KSD QPPTAEEGR
:
CCDS74 QELGDFEEDFDPSVKWKLLPQEEP
1600 1610 1620
>>CCDS11681.1 ABCA9 gene_id:10350|Hs108|chr17 (1624 aa)
initn: 1455 init1: 641 opt: 1011 Z-score: 1202.5 bits: 235.4 E(32554): 1.2e-60
Smith-Waterman score: 1875; 29.2% identity (58.7% similar) in 1736 aa overlap (1-1638:6-1601)
10 20 30 40 50
pF1KSD MAVLRQLALLLWKNYTLQKRKVLVTVLELFLPLLFSGILIWLRLKIQSENVPNAT
:.: .: :: :: :.: .. .: : ::: .:. : : . :. ..
CCDS11 MSKRRMSVGQQTWALLCKN-CLKKWRMKRQTL---LEWLFSFLLV-LFLYLFFSNLHQVH
10 20 30 40 50
60 70 80 90 100 110
pF1KSD IYPGQSIQELPLFFTFPPPGDT-WELAYIPSHSDAAKTVTETVRRALVINMR-VRGFPSE
: .: ..: .: .:: . .:. : .: ... . . : : .. : . :.:.:
CCDS11 DTPQMSSMDLGRVDSF---NDTNYVIAFAP-ESKTTQEIMNKVASAPFLKGRTIMGWPDE
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD KDFEDYIRYDNCSSSVLAA-VVFEHPFNHSKEPLPLAVKYHLRFSYTRRNYMWTQTGSFF
:.... . . :. :. :.: :. :::.::. .: :
CCDS11 KSMDEL----DLNYSIDAVRVIFTDTFS-----------YHLKFSWGHRIPM--------
120 130 140
180 190 200 210 220 230
pF1KSD LKETEGWHTTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVDRAIMEYHADAATR
.:: . :.. . : . .:.: . ..::.: : :.. ::.: .. ..
CCDS11 MKEHRD-HSAHC------QAVNEKMKCEGSE--FWEKGFVAFQAAINAAIIEIATNHSVM
150 160 170 180 190
240 250 260 270 280 290
pF1KSD QLFQRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIARAVVQEKERRLKE
. : ..:: .. ::.:. :: .. . .. ..::. .. :.::.. .
CCDS11 E--QLMSVTGVHMKILPFVAQGG-VATDF-FIFFCIISFSTFIYYVSVNVTQERQY-ITS
200 210 220 230 240 250
300 310 320 330 340 350
pF1KSD YMRMMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLSRSDPSLVLAFLLC
: :::: : .: :.. :.:: :..:.:. :: . ...::. .:....:
CCDS11 LMTMMGLRESAFWLSWGLMYAGFILIMATLMALI--VK-SAQIVVLT--GFVMVFTLFLL
260 270 280 290 300
360 370 380
pF1KSD FAISTISFSFMVSTFFSK----GM---------GI--------------QWRD-LLSP--
...: :...:..:....: :. :: .: ::::
CCDS11 YGLSLITLAFLMSVLIKKPFLTGLVVFLLIVFWGILGFPALYTRLPAFLEWTLCLLSPFA
310 320 330 340 350 360
390 400 410 420
pF1KSD --------VNVDDD-------------FCFGQVLGMLLLDSVLYGLVTWYMEAVFPGQFG
...: : . . .: ::..:..:: ..: :.. ..:...:
CCDS11 FTVGMAQLIHLDYDVNSNAHLDSSQNPYLIIATLFMLVFDTLLYLVLTLYFDKILPAEYG
370 380 390 400 410 420
430 440 450 460 470
pF1KSD VPQPWYFFIMPSYWCGKPRA--VAGKEEEDSDPEKALRNEYFEAEPEDLVA--GIKIKHL
::. .: . :: :. ..: :::: :. :: .. . .:.::.:
CCDS11 HRCSPLFFLKSCFWFQHGRANHVVLENETDSDPTP---NDCFEPVSPEFCGKEAIRIKNL
430 440 450 460 470 480
480 490 500 510 520 530
pF1KSD SKVFRVGNKDRA-AVRDLNLNLYEGQITVLLGHNGAGKTTTLSMLTGLFPPTSGRAYISG
.: . .:. .:. :.. . ...::::::.::::.:::::: :..:.:: :::: . . .
CCDS11 KKEY-AGKCERVEALKGVVFDIYEGQITALLGHSGAGKTTLLNILSGLSVPTSGSVTVYN
490 500 510 520 530 540
540 550 560 570 580 590
pF1KSD YEISQ--DMVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKGLSRQKCPEEVKQMLHII
. .:. :. .: : :.::: .. : ::: :.: ..:..::. .. .::..... .
CCDS11 HTLSRMADIENISKFTGFCPQSNVQFGFLTVKENLRLFAKIKGILPHEVEKEVQRVVQEL
550 560 570 580 590 600
600 610 620 630 640 650
pF1KSD GLEDKWNSRSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSGMDAISRRAIWDLLQRQKS
.:. . .. ::::. :::..:::... .::.:::::.:.: .::. ::.::.. ::
CCDS11 EMENIQDILAQNLSGGQNRKLTFGIAILGDPQVLLLDEPTAGLDPLSRHRIWNLLKEGKS
610 620 630 640 650 660
660 670 680 690 700 710
pF1KSD DRTIVLTTHFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKYGAGYHMTLVKEPHCNPED
::.:...:.:.::::.:.:: .....:.:.: :::::::.:.: :::..: . .:.::.
CCDS11 DRVILFSTQFIDEADILADRKVFISNGKLKCAGSSLFLKKKWGIGYHLSLHLNERCDPES
670 680 690 700 710 720
720 730 740 750 760 770
pF1KSD ISQLVHHHVPNATLESSAGAELSFILPRESTHRFEGLFAKLEKKQKELGIASFGASITTM
:..::..:. .: : ... .: .::: : :..: :. :.. ... :: ..:.::::.
CCDS11 ITSLVKQHISDAKLTAQSEEKLVYILPLERTNKFPELYRDLDRCSNQ-GIEDYGVSITTL
730 740 750 760 770 780
780 790 800 810 820 830
pF1KSD EEVFLRV-GKLVDSSMDIQAIQLPALQYQHERRASDWAVDSNLCGAMDPSDGIGALIEEE
.::::.. :: :..: . : . . : : .: : : :.. . . . ..:
CCDS11 NEVFLKLEGK---STIDESDIGIWG-QLQ-----TDGAKD---IGSLVELEQVLSSFHET
790 800 810 820 830
840 850 860 870 880
pF1KSD RTAVKLNTGLALHCQQFWAM----FLKKAAYSWREWKMVAAQVLVPLTCVTLALLAINYS
: .. .:.:: :: :. ::: : .. .: .. . : . :
CCDS11 RKTI---SGVALWRQQVCAIAKVRFLKLKKERKSLWTIL---LLFGISFIPQLLEHLFYE
840 850 860 870 880
890 900 910 920 930 940
pF1KSD SELFDDPMLRLTLGEYGRTVVPFSVPGTSQLGQQLSEHLKDALQAEGQEPREVLGDLE--
: . : .:. . : : :: : :. :: ... :. . : .:.
CCDS11 SYQKSYPW-ELSPNTY------FLSPG--QQPQDPLTHLL-VINKTGSTIDNFLHSLRRQ
890 900 910 920 930
950 960 970 980 990 1000
pF1KSD ----EFLIF--RASVEGGGFNERCLVAASFRDVGERTVVNALFNNQAYHSPATALAVVDN
: : : ... ..: .:... .: .: . :.. . . : :..:
CCDS11 NIAIEVDAFGTRNGTDDPSYNGAIIVSGDEKD--HRFSIAC--NTKRLNCFPVLLDVISN
940 950 960 970 980 990
1010 1020 1030 1040 1050 1060
pF1KSD LLFKLLCGPHASIVVSNFPQPRSALQAAKDQFNEGRKGFDIALNLLFAMAFLASTFSILA
:. .. . . .. ::.. . ... : .. : .: . . :: .:
CCDS11 GLLGIFNSSE------HIQTDRSTFFEEHMDYEYGYRS-----NTFFWIPMAASFTPYIA
1000 1010 1020 1030 1040
1070 1080 1090 1100 1110
pF1KSD VSERAVQAK--HVQF-VSGVHVASFWLSALLWDLISFLIPSLLLLVVFKAFDVRAFTRDG
.: . : : :. .::.. ...:.. : :. ... ::. .. :. . .
CCDS11 MSSIGDYKKKAHSQLRISGLYPSAYWFGQALVDVSLYFLILLLMQIMDYIFSPEEII---
1050 1060 1070 1080 1090
1120 1130 1140 1150 1160 1170
pF1KSD HMADTLLLLLL----YGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSGIATFLMVTIMR
. ..::. .: : ... : :...:.: .. ..: ::.:.:.
CCDS11 FIIQNLLIQILCSIGYVSSLVFLTYVISFIFRNGRKNSGIWSFF--------FLIVVIFS
1100 1110 1120 1130 1140 1150
1180 1190 1200 1210 1220 1230
pF1KSD IPAVKLEELSKTLDHVF--LVLPNHCLGMAVSSFYE-NYETRRYCTSSEVAAHYCKKYNI
: :. :.: . : : ...: : .. : : . .. : .:: :
CCDS11 IVATDLNEYG-FLGLFFGTMLIPPFTLIGSLFIFSEISPDSMDYLGASESEIVY------
1160 1170 1180 1190 1200
1240 1250 1260 1270 1280 1290
pF1KSD QYQENFYAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQRLRGILCALRRRRTLTELY
: : . .. .:..: .: : ..: ..: . ..
CCDS11 ------LALLIPYLHFLI---------FLFILRCLEMNCRKKLMRKDPVFRISPRSNAIF
1210 1220 1230 1240
1300 1310 1320 1330
pF1KSD TRMPVLPE--DQDVADERTRIL-APSPDSLLHTPLII-----KELS----KVYEQRVPLL
: :: ..:. :: : . : . .. .::.:: :: . . . .: .
CCDS11 PN-PEEPEGEEEDIQMERMRTVNAMAVRDFDETPVIIASCLRKEYAGKKKNCFSKRKKKI
1250 1260 1270 1280 1290 1300
1340 1350 1360 1370 1380 1390
pF1KSD AVDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGHRISSDVGKVRQR
:. .:. :.::: .:::: :::::.::.::.::. . :.:.... : : :.
CCDS11 ATRNVSFCVKKGEVIGLLGHNGAGKSTTIKMITGDTKPTAGQVILKG----SGGGEPLGF
1310 1320 1330 1340 1350 1360
1400 1410 1420 1430 1440 1450
pF1KSD IGYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLVRTYSG
.::::: .:: ..: :. : .:: ..:. . . . .: :. . . :.: :
CCDS11 LGYCPQENALWPNLTVRQHLEVYAAVKGLRKGDAMIAITRLVDALKLQDQLKAPVKTLSE
1370 1380 1390 1400 1410 1420
1460 1470 1480 1490 1500 1510
pF1KSD GNKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTV-ARARESGKAIIITSHSMEE
: :::: ....:.:.:..:::::::::: ... .:... : :.. .. ..:.: : :
CCDS11 GIKRKLCFVLSILGNPSVVLLDEPSTGMDPEGQQQMWQVIRATFRNTERGALLTTHYMAE
1430 1440 1450 1460 1470 1480
1520 1530 1540 1550 1560 1570
pF1KSD CEALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQEALEEFKAFVDLTFP
::.: :.::::.:...:.:: ::::::::. : :. :... .:.: : .: . ::
CCDS11 AEAVCDRVAIMVSGRLRCIGSIQHLKSKFGKDYLLEMKLKNLAQMEPL---HAEILRLFP
1490 1500 1510 1520 1530 1540
1580 1590 1600 1610 1620 1630
pF1KSD GSVLEDEHQGMVHYHLPGRDLS-WAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFAHL
.. ... .... :.:: .:. ...: :: .:... ...::.:: .:::::: ...
CCDS11 QAAQQERFSSLMVYKLPVEDVRPLSQAFFKLEIVKQSFDLEEYSLSQSTLEQVFLELSKE
1550 1560 1570 1580 1590 1600
1640
pF1KSD QPPTAEEGR
:
CCDS11 QELGDLEEDFDPSVKWKLLLQEEP
1610 1620
>>CCDS47584.1 ABCA13 gene_id:154664|Hs108|chr7 (5058 aa)
initn: 1919 init1: 642 opt: 1017 Z-score: 1202.1 bits: 237.0 E(32554): 1.2e-60
Smith-Waterman score: 2519; 32.0% identity (60.8% similar) in 1659 aa overlap (127-1641:3456-5039)
100 110 120 130 140 150
pF1KSD VRRALVINMRVRGFPSEKDFEDYIRYDNCSSSVLAAVVFEHPFNHSKEPLPLAVKYHLRF
.: ::...: . . .:. .:: .
CCDS47 NLSSCVALNRFQALQSVDILETKAHELLQQNSFLASIIFSNSL-FDKNFRSESVKLPPHV
3430 3440 3450 3460 3470 3480
160 170 180 190 200 210
pF1KSD SYT-RRNYMWTQTGSFFLKETEGWHTTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQ
::: : : ... . . .. .:. . :. : :: . .:. : .:
CCDS47 SYTIRTNVLYSVRTD--VVKNPSWK------FHPQNLP-----ADGFKYNYV---FAPLQ
3490 3500 3510 3520
220 230 240 250 260 270
pF1KSD HAVDRAIMEYHADAATRQLFQRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTA
..:::. . : : . .. . ::: .: :: . . .::...:.. ..
CCDS47 DMIERAIILVQ----TGQEALEPAAQTQAAPYPCHTSDLFLNNVGFFFPLIMMLTWMVSV
3530 3540 3550 3560 3570 3580
280 290 300 310
pF1KSD LTIARAVVQEKERRLKEYMRMMGLSSWLHWSAWFL-------------------------
...: .: :.: ...:::::::. .:. ::::
CCDS47 ASMVRKLVYEQEIQIEEYMRMMGVHPVIHFLAWFLENMAVLTISSATLAIVLKTSGIFAH
3590 3600 3610 3620 3630 3640
320 330 340
pF1KSD ----LFFLFLL------IAASFM---------------TLLFCVKVKPNVAVLSRSDP-S
. ::::: . :.. .:.. .. : ...: . :
CCDS47 SNTFIVFLFLLDFGMSVVMLSYLLSAFFSQANTAALCTSLVYMISFLPYIVLLVLHNQLS
3650 3660 3670 3680 3690 3700
350 360 370 380 390 400
pF1KSD LVLAFLLCFAISTISFS---FMVSTFFSKGMGIQWRDLLSPVNVDDDFCFGQVLGMLLLD
.: .::. .:: .:. :... . .. :::: .. . .. . . :: : :.:.:
CCDS47 FVNQTFLCL-LSTTAFGQGVFFITFLEGQETGIQWNNMYQALE-QGGMTFGWVCWMILFD
3710 3720 3730 3740 3750 3760
410 420 430 440 450
pF1KSD SVLYGLVTWYMEAVFPGQFGVPQPWYFFIMPSYWCGKPRAVAGKE----------EEDSD
: :: : ::. ..:: ::. .:::: . ::: . : .. .:. :
CCDS47 SSLYFLCGWYLSNLIPGTFGLRKPWYFPFTASYWKSVGFLVEKRQYFLSSSLFFFNENFD
3770 3780 3790 3800 3810 3820
460 470 480 490 500 510
pF1KSD PE-KALRNEYFEAEPEDLVAGIKIKHLSKVFRVGNKDRAAVRDLNLNLYEGQITVLLGHN
. ..:.:. :.: : . :. . ..: .. :.: :.:.::.:..:. :::.::: :
CCDS47 NKGSSLQNR--EGELEGSAPGVTLVSVTKEYE-GHK--AVVQDLSLTFYRDQITALLGTN
3830 3840 3850 3860 3870
520 530 540 550 560 570
pF1KSD GAGKTTTLSMLTGLFPPTSGRAYISGYEISQDMVQIRKSLGLCPQHDILFDNLTVAEHLY
:::::: .:::::: ::::: :.: ... :. ..: ::.:::.:::.::::: :::
CCDS47 GAGKTTIISMLTGLHPPTSGTIIINGKNLQTDLSRVRMELGVCPQQDILLDNLTVREHLL
3880 3890 3900 3910 3920 3930
580 590 600 610 620
pF1KSD FYAQLKG--LSRQKCPEEVKQMLHIIGLEDKWNSRSRFLSGGMRRKLSIGIALIAGSKVL
..:..:. .... ..:.: :. . : .. ....: ::::..::::.:::... :...
CCDS47 LFASIKAPQWTKKELHQQVNQTLQDVDLTQHQHKQTRALSGGLKRKLSLGIAFMGMSRTV
3940 3950 3960 3970 3980 3990
630 640 650 660 670 680
pF1KSD ILDEPTSGMDAISRRAIWDLLQRQKSDRTIVLTTHFMDEADLLGDRIAIMAKGELQCCGS
.:::::::.: ::...::.: . . :::..::: .:::. :.::.:.. .:.:.:::
CCDS47 VLDEPTSGVDPCSRHSLWDILLKYREGRTIIFTTHHLDEAEALSDRVAVLQHGRLRCCGP
4000 4010 4020 4030 4040 4050
690 700 710 720 730 740
pF1KSD SLFLKQKYGAGYHMTLVKEPHC-NPED------ISQLVHHHVPNATLESSAGAELSFILP
. ::. :: : ..::...: . .: ...:.. ..:.: :..:.:.::.. .:
CCDS47 PFCLKEAYGQGLRLTLTRQPSVLEAHDLKDMACVTSLIKIYIPQAFLKDSSGSELTYTIP
4060 4070 4080 4090 4100 4110
750 760 770 780 790 800
pF1KSD RESTHR-FEGLFAKLEKKQKELGIASFGASITTMEEVFLRVGKLVDSSMDIQAIQLPALQ
... . ..::: :... ..: ....: : ::.::::: . : ::. . .
CCDS47 KDTDKACLKGLFQALDENLHQLHLTGYGISDTTLEEVFLML--LQDSNKKSHIALGTESE
4120 4130 4140 4150 4160 4170
810 820 830 840 850 860
pF1KSD YQHERRASDWAVDSNLCGAMDPSDGIGALIEEERTAVKLNTGLALHCQQFWAMFLKKAAY
:..: .. :. ::.. : :. :. : : :.. ..
CCDS47 LQNHRPTGHL---SGYCGSL------------ARPATV--QGVQLLRAQVAAILARRLRR
4180 4190 4200 4210
870 880 890 900 910 920
pF1KSD SWREWKMVAAQVLVPLTCVTLALLAINYSSELFDDPMLRLTLGEYGRTVVPFSVPGTSQL
. : : . :..:.:. :.::. . . : :::: :.: :. . : : ..:
CCDS47 TLRAGKSTLADLLLPVLFVALAMGLFMVRPLATEYPPLRLTPGHYQRAETYFFSSGGDNL
4220 4230 4240 4250 4260 4270
930 940 950
pF1KSD G--QQLSEHLKDA-LQAEGQEPRE------------------VLGDLE--------EFL-
. : ....: : .::. : :. .:
CCDS47 DLTRVLLRKFRDQDLPCADLNPRQKNSSCWRTDPFSHPEFQDSCGCLKCPNRSASAPYLT
4280 4290 4300 4310 4320 4330
960 970 980
pF1KSD --IFRASVEGGGFN-ERCLVAASFR------DVGER----------------TVVNALFN
. .. .. .::: :. :.: : . . : . :.... .:
CCDS47 NHLGHTLLNLSGFNMEEYLLAPSEKPRLGGWSFGLKIPSEAGGANGNISKPPTLAKVWYN
4340 4350 4360 4370 4380 4390
990 1000 1010 1020 1030 1040
pF1KSD NQAYHSPATALAVVDNLLFKLLCGPHAS---IVVSNFPQPRSALQAAKDQFNEGRKGFDI
....:: . : ..::.. : .. .. . .: .. .:.. :. . .
CCDS47 QKGFHSLPSYLNHLNNLILWQHLPPTVDWRQYGITLYSHPYGGALLNEDKILESIRQCGV
4400 4410 4420 4430 4440 4450
1050 1060 1070 1080 1090 1100
pF1KSD ALNLLFAMAFLASTFSILAVSERAVQAKHVQFVSGVHVASFWLSALLWDLISFLIPSLLL
:: .......:..... .: .:.. ::..: .::. .:.. .:.:.. .:. :
CCDS47 ALCIVLGFSILSASIGSSVVRDRVIGAKRLQHISGLGYRMYWFTNFLYDMLFYLVSVCLC
4460 4470 4480 4490 4500 4510
1110 1120 1130 1140 1150 1160
pF1KSD LVVFKAFDVRAFTRDGHMADTLLLLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILS
..:. ::.. ::: ..: : ::: :.:.: .: ::::. .: .. .:. . .:..
CCDS47 VAVIVAFQLTAFTFRKNLAATALLLSLFGYATLPWMYLMSRIFSSSDVAFISYVSLNFIF
4520 4530 4540 4550 4560 4570
1170 1180 1190 1200 1210
pF1KSD GIATFLMVTIMRIPAV-----KLEELSKTLDHVFLVLPNHCLGMAVSSFYENYETRRYCT
:. :.:.. . :. :. .:... .: :: ..:. :::... . :. .:
CCDS47 GLCTMLITIMPRLLAIISKAKNLQNIYDVLKWVFTIFPQFCLGQGLVEL--CYNQIKYDL
4580 4590 4600 4610 4620 4630
1220 1230 1240 1250 1260 1270
pF1KSD SSEVAAHYCKKYNIQYQENFYAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQRLRGI
. . . .: .. :: .: :: ..:..: . :.: :.. .::. ::
CCDS47 THNFGI---DSYVSPFEMNFLGWI------FV-QLASQGTVLLLLRVLLHWDLLRWPRG-
4640 4650 4660 4670 4680
1280 1290 1300 1310 1320 1330
pF1KSD LCALRRRRTLTELYTRMPVLPEDQDVADERTRILAPSPDSLLHTPLIIKELSKVYEQRVP
. :: .: :: :. :.. .. . :.. .::: :..
CCDS47 ------HSTLQGTVKS----SKDTDVEKEEKRVFEGRTNGDI---LVLYNLSKHYRRFFQ
4690 4700 4710 4720 4730
1340 1350 1360 1370 1380 1390
pF1KSD -LLAVDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVG---GHRIS-SD
..::. .::.. ::::::::: :::::.::::::.:: ::::: :.. : .. :.
CCDS47 NIIAVQDISLGIPKGECFGLLGVNGAGKSTTFKMLNGEVSLTSGHAIIRTPMGDAVDLSS
4740 4750 4760 4770 4780 4790
1400 1410 1420 1430 1440 1450
pF1KSD VGKVRQRIGYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANK
.: . :::::: ::: . .:: : : .: :::::.. : . . .: : :: ::.:
CCDS47 AGTAGVLIGYCPQQDALDELLTGWEHLYYYCSLRGIPRQCIPEVAGDLIRRLHLEAHADK
4800 4810 4820 4830 4840 4850
1460 1470 1480 1490 1500 1510
pF1KSD LVRTYSGGNKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTVARARESGKAIIIT
: :::::.::::::..::.:.: ...:::::.:::: ..: ::.:. . . : : ..:
CCDS47 PVATYSGGTKRKLSTALALVGKPDILLLDEPSSGMDPCSKRYLWQTIMKEVREGCAAVLT
4860 4870 4880 4890 4900 4910
1520 1530 1540 1550 1560 1570
pF1KSD SHSMEECEALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQEALEEFKAF
::::::::::::::::::.:.:::::::::.:..::.::.... . .:..:. .
CCDS47 SHSMEECEALCTRLAIMVNGSFKCLGSPQHIKNRFGDGYTVKVWLCKEANQHCT--VSDH
4920 4930 4940 4950 4960 4970
1580 1590 1600 1610 1620 1630
pF1KSD VDLTFPGSVLEDEHQGMVHYHLPGRDLSWAKVFGILEKAKEKYGVDDYSVSQISLEQVFL
. : ::: .. .: ....::.: : : .: ..:. : .. ::..: .:::::.
CCDS47 LKLYFPGIQFKGQHLNLLEYHVPKRWGCLADLFKVIENNKTFLNIKHYSINQTTLEQVFI
4980 4990 5000 5010 5020 5030
1640
pF1KSD SFAHLQPPTAEEGR
.:: : :
CCDS47 NFASEQQQTLQSTLDPSTDSHHTHHLPI
5040 5050
1646 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 08:30:44 2016 done: Thu Nov 3 08:30:45 2016
Total Scan time: 4.940 Total Display time: 1.300
Function used was FASTA [36.3.4 Apr, 2011]