FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDB0185, 1646 aa 1>>>pF1KSDB0185 1646 - 1646 aa - 1646 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5272+/-0.00111; mu= 22.3916+/- 0.066 mean_var=69.0354+/-13.879, 0's: 0 Z-trim(102.9): 79 B-trim: 3 in 1/50 Lambda= 0.154361 statistics sampled from 7086 (7166) to 7086 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.561), E-opt: 0.2 (0.22), width: 16 Scan time: 4.940 The best scores are: opt bits E(32554) CCDS10466.1 ABCA3 gene_id:21|Hs108|chr16 (1704) 8468 1896.1 0 CCDS6762.1 ABCA1 gene_id:19|Hs108|chr9 (2261) 1167 270.2 5.4e-71 CCDS43909.1 ABCA2 gene_id:20|Hs108|chr9 (2436) 1139 264.0 4.4e-69 CCDS747.1 ABCA4 gene_id:24|Hs108|chr1 (2273) 1130 262.0 1.6e-68 CCDS12055.1 ABCA7 gene_id:10347|Hs108|chr19 (2146) 1093 253.7 4.7e-66 CCDS11685.1 ABCA5 gene_id:23461|Hs108|chr17 (1642) 1063 247.0 3.9e-64 CCDS74138.1 ABCA8 gene_id:10351|Hs108|chr17 (1616) 1033 240.3 3.9e-62 CCDS74139.1 ABCA8 gene_id:10351|Hs108|chr17 (1621) 1033 240.3 3.9e-62 CCDS11681.1 ABCA9 gene_id:10350|Hs108|chr17 (1624) 1011 235.4 1.2e-60 CCDS47584.1 ABCA13 gene_id:154664|Hs108|chr7 (5058) 1017 237.0 1.2e-60 CCDS33373.1 ABCA12 gene_id:26154|Hs108|chr2 (2277) 976 227.7 3.5e-58 CCDS33372.1 ABCA12 gene_id:26154|Hs108|chr2 (2595) 976 227.7 3.9e-58 CCDS11684.1 ABCA10 gene_id:10349|Hs108|chr17 (1543) 967 225.6 1e-57 CCDS11683.1 ABCA6 gene_id:23460|Hs108|chr17 (1617) 949 221.6 1.7e-56 CCDS11680.1 ABCA8 gene_id:10351|Hs108|chr17 (1581) 547 132.1 1.5e-29 CCDS1814.1 ABCG5 gene_id:64240|Hs108|chr2 ( 651) 320 81.3 1.1e-14 CCDS5371.1 ABCB5 gene_id:340273|Hs108|chr7 ( 812) 315 80.3 3e-14 CCDS64798.1 ABCB8 gene_id:11194|Hs108|chr7 ( 630) 312 79.6 3.8e-14 CCDS5913.1 ABCB8 gene_id:11194|Hs108|chr7 ( 718) 312 79.6 4.2e-14 CCDS55090.1 ABCB5 gene_id:340273|Hs108|chr7 (1257) 315 80.4 4.3e-14 CCDS64799.1 ABCB8 gene_id:11194|Hs108|chr7 ( 735) 312 79.6 4.3e-14 CCDS1580.1 ABCB10 gene_id:23456|Hs108|chr1 ( 738) 312 79.6 4.3e-14 CCDS13681.1 ABCG1 gene_id:9619|Hs108|chr21 ( 663) 305 78.0 1.2e-13 CCDS42938.1 ABCG1 gene_id:9619|Hs108|chr21 ( 666) 305 78.0 1.2e-13 CCDS42937.1 ABCG1 gene_id:9619|Hs108|chr21 ( 668) 305 78.0 1.2e-13 CCDS13683.1 ABCG1 gene_id:9619|Hs108|chr21 ( 677) 305 78.0 1.2e-13 CCDS13682.1 ABCG1 gene_id:9619|Hs108|chr21 ( 678) 305 78.0 1.2e-13 CCDS5608.1 ABCB1 gene_id:5243|Hs108|chr7 (1280) 305 78.2 2e-13 CCDS5607.1 ABCB4 gene_id:5244|Hs108|chr7 (1232) 304 77.9 2.3e-13 CCDS5605.1 ABCB4 gene_id:5244|Hs108|chr7 (1279) 304 77.9 2.4e-13 CCDS8415.1 ABCG4 gene_id:64137|Hs108|chr11 ( 646) 293 75.3 7.3e-13 CCDS64800.1 ABCB8 gene_id:11194|Hs108|chr7 ( 693) 293 75.3 7.7e-13 CCDS2436.1 ABCB6 gene_id:10058|Hs108|chr2 ( 842) 286 73.8 2.7e-12 CCDS78129.1 TAP2 gene_id:6891|Hs108|chr6 ( 686) 278 72.0 7.7e-12 CCDS46444.1 ABCB11 gene_id:8647|Hs108|chr2 (1321) 274 71.3 2.5e-11 CCDS4758.1 TAP1 gene_id:6890|Hs108|chr6 ( 808) 270 70.3 3.1e-11 CCDS1815.1 ABCG8 gene_id:64241|Hs108|chr2 ( 673) 265 69.1 5.7e-11 >>CCDS10466.1 ABCA3 gene_id:21|Hs108|chr16 (1704 aa) initn: 8449 init1: 8449 opt: 8468 Z-score: 10177.0 bits: 1896.1 E(32554): 0 Smith-Waterman score: 10612; 96.5% identity (96.5% similar) in 1678 aa overlap (27-1646:27-1704) 10 20 30 40 50 60 pF1KSD MAVLRQLALLLWKNYTLQKRKVLVTVLELFLPLLFSGILIWLRLKIQSENVPNATIYPGQ :::::::::::::::::::::::::::::::::: CCDS10 MAVLRQLALLLWKNYTLQKRKVLVTVLELFLPLLFSGILIWLRLKIQSENVPNATIYPGQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD SIQELPLFFTFPPPGDTWELAYIPSHSDAAKTVTETVRRALVINMRVRGFPSEKDFEDYI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SIQELPLFFTFPPPGDTWELAYIPSHSDAAKTVTETVRRALVINMRVRGFPSEKDFEDYI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD RYDNCSSSVLAAVVFEHPFNHSKEPLPLAVKYHLRFSYTRRNYMWTQTGSFFLKETEGWH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 RYDNCSSSVLAAVVFEHPFNHSKEPLPLAVKYHLRFSYTRRNYMWTQTGSFFLKETEGWH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD TTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVDRAIMEYHADAATRQLFQRLTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVDRAIMEYHADAATRQLFQRLTV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD TIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIARAVVQEKERRLKEYMRMMGLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIARAVVQEKERRLKEYMRMMGLS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD SWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLSRSDPSLVLAFLLCFAISTISF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLSRSDPSLVLAFLLCFAISTISF 310 320 330 340 350 360 370 pF1KSD SFMVSTFFSK-------------------------------------------------- :::::::::: CCDS10 SFMVSTFFSKANMAAAFGGFLYFFTYIPYFFVAPRYNWMTLSQKLCSCLLSNVAMAMGAQ 370 380 390 400 410 420 380 390 400 410 420 pF1KSD --------GMGIQWRDLLSPVNVDDDFCFGQVLGMLLLDSVLYGLVTWYMEAVFPGQFGV :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LIGKFEAKGMGIQWRDLLSPVNVDDDFCFGQVLGMLLLDSVLYGLVTWYMEAVFPGQFGV 430 440 450 460 470 480 430 440 450 460 470 480 pF1KSD PQPWYFFIMPSYWCGKPRAVAGKEEEDSDPEKALRNEYFEAEPEDLVAGIKIKHLSKVFR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 PQPWYFFIMPSYWCGKPRAVAGKEEEDSDPEKALRNEYFEAEPEDLVAGIKIKHLSKVFR 490 500 510 520 530 540 490 500 510 520 530 540 pF1KSD VGNKDRAAVRDLNLNLYEGQITVLLGHNGAGKTTTLSMLTGLFPPTSGRAYISGYEISQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 VGNKDRAAVRDLNLNLYEGQITVLLGHNGAGKTTTLSMLTGLFPPTSGRAYISGYEISQD 550 560 570 580 590 600 550 560 570 580 590 600 pF1KSD MVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKGLSRQKCPEEVKQMLHIIGLEDKWNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKGLSRQKCPEEVKQMLHIIGLEDKWNS 610 620 630 640 650 660 610 620 630 640 650 660 pF1KSD RSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSGMDAISRRAIWDLLQRQKSDRTIVLTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 RSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSGMDAISRRAIWDLLQRQKSDRTIVLTT 670 680 690 700 710 720 670 680 690 700 710 720 pF1KSD HFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKYGAGYHMTLVKEPHCNPEDISQLVHHH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 HFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKYGAGYHMTLVKEPHCNPEDISQLVHHH 730 740 750 760 770 780 730 740 750 760 770 780 pF1KSD VPNATLESSAGAELSFILPRESTHRFEGLFAKLEKKQKELGIASFGASITTMEEVFLRVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 VPNATLESSAGAELSFILPRESTHRFEGLFAKLEKKQKELGIASFGASITTMEEVFLRVG 790 800 810 820 830 840 790 800 810 820 830 840 pF1KSD KLVDSSMDIQAIQLPALQYQHERRASDWAVDSNLCGAMDPSDGIGALIEEERTAVKLNTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 KLVDSSMDIQAIQLPALQYQHERRASDWAVDSNLCGAMDPSDGIGALIEEERTAVKLNTG 850 860 870 880 890 900 850 860 870 880 890 900 pF1KSD LALHCQQFWAMFLKKAAYSWREWKMVAAQVLVPLTCVTLALLAINYSSELFDDPMLRLTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LALHCQQFWAMFLKKAAYSWREWKMVAAQVLVPLTCVTLALLAINYSSELFDDPMLRLTL 910 920 930 940 950 960 910 920 930 940 950 960 pF1KSD GEYGRTVVPFSVPGTSQLGQQLSEHLKDALQAEGQEPREVLGDLEEFLIFRASVEGGGFN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GEYGRTVVPFSVPGTSQLGQQLSEHLKDALQAEGQEPREVLGDLEEFLIFRASVEGGGFN 970 980 990 1000 1010 1020 970 980 990 1000 1010 1020 pF1KSD ERCLVAASFRDVGERTVVNALFNNQAYHSPATALAVVDNLLFKLLCGPHASIVVSNFPQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ERCLVAASFRDVGERTVVNALFNNQAYHSPATALAVVDNLLFKLLCGPHASIVVSNFPQP 1030 1040 1050 1060 1070 1080 1030 1040 1050 1060 1070 1080 pF1KSD RSALQAAKDQFNEGRKGFDIALNLLFAMAFLASTFSILAVSERAVQAKHVQFVSGVHVAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 RSALQAAKDQFNEGRKGFDIALNLLFAMAFLASTFSILAVSERAVQAKHVQFVSGVHVAS 1090 1100 1110 1120 1130 1140 1090 1100 1110 1120 1130 1140 pF1KSD FWLSALLWDLISFLIPSLLLLVVFKAFDVRAFTRDGHMADTLLLLLLYGWAIIPLMYLMN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 FWLSALLWDLISFLIPSLLLLVVFKAFDVRAFTRDGHMADTLLLLLLYGWAIIPLMYLMN 1150 1160 1170 1180 1190 1200 1150 1160 1170 1180 1190 1200 pF1KSD FFFLGAATAYTRLTIFNILSGIATFLMVTIMRIPAVKLEELSKTLDHVFLVLPNHCLGMA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 FFFLGAATAYTRLTIFNILSGIATFLMVTIMRIPAVKLEELSKTLDHVFLVLPNHCLGMA 1210 1220 1230 1240 1250 1260 1210 1220 1230 1240 1250 1260 pF1KSD VSSFYENYETRRYCTSSEVAAHYCKKYNIQYQENFYAWSAPGVGRFVASMAASGCAYLIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 VSSFYENYETRRYCTSSEVAAHYCKKYNIQYQENFYAWSAPGVGRFVASMAASGCAYLIL 1270 1280 1290 1300 1310 1320 1270 1280 1290 1300 1310 1320 pF1KSD LFLIETNLLQRLRGILCALRRRRTLTELYTRMPVLPEDQDVADERTRILAPSPDSLLHTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LFLIETNLLQRLRGILCALRRRRTLTELYTRMPVLPEDQDVADERTRILAPSPDSLLHTP 1330 1340 1350 1360 1370 1380 1330 1340 1350 1360 1370 1380 pF1KSD LIIKELSKVYEQRVPLLAVDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LIIKELSKVYEQRVPLLAVDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDA 1390 1400 1410 1420 1430 1440 1390 1400 1410 1420 1430 1440 pF1KSD FVGGHRISSDVGKVRQRIGYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 FVGGHRISSDVGKVRQRIGYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLR 1450 1460 1470 1480 1490 1500 1450 1460 1470 1480 1490 1500 pF1KSD GLLLEPHANKLVRTYSGGNKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTVARA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GLLLEPHANKLVRTYSGGNKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTVARA 1510 1520 1530 1540 1550 1560 1510 1520 1530 1540 1550 1560 pF1KSD RESGKAIIITSHSMEECEALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 RESGKAIIITSHSMEECEALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQ 1570 1580 1590 1600 1610 1620 1570 1580 1590 1600 1610 1620 pF1KSD QEALEEFKAFVDLTFPGSVLEDEHQGMVHYHLPGRDLSWAKVFGILEKAKEKYGVDDYSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 QEALEEFKAFVDLTFPGSVLEDEHQGMVHYHLPGRDLSWAKVFGILEKAKEKYGVDDYSV 1630 1640 1650 1660 1670 1680 1630 1640 pF1KSD SQISLEQVFLSFAHLQPPTAEEGR :::::::::::::::::::::::: CCDS10 SQISLEQVFLSFAHLQPPTAEEGR 1690 1700 >>CCDS6762.1 ABCA1 gene_id:19|Hs108|chr9 (2261 aa) initn: 2839 init1: 879 opt: 1167 Z-score: 1388.0 bits: 270.2 E(32554): 5.4e-71 Smith-Waterman score: 2991; 35.3% identity (60.3% similar) in 1714 aa overlap (190-1638:575-2224) 160 170 180 190 200 210 pF1KSD RRNYMWTQTGSFFLKETEGWHTTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVD .:::: : :. :: .: .:. CCDS67 SIELPHHVKYKIRMDIDNVERTNKIKDGYWDPGPRADPFEDMR---YVWGGFAYLQDVVE 550 560 570 580 590 600 220 230 240 250 260 270 pF1KSD RAIMEYHADAATRQLFQRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIA .::.. . . .. : ....::: .. : :: ... ..::.. :.. :.. .: CCDS67 QAIIRVLTGTE-----KKTGVYMQQMPYPCYVDDIFLRVMSRSMPLFMTLAWIYSVAVII 610 620 630 640 650 280 290 300 310 320 330 pF1KSD RAVVQEKERRLKEYMRMMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLS ...: ::: :::: ::.:::.. . : .::. .. ::..:....... . .: CCDS67 KGIVYEKEARLKETMRIMGLDNSILWFSWFISSLIPLLVSAGLLVVILKLG-----NLLP 660 670 680 690 700 710 340 350 360 370 pF1KSD RSDPSLVLAFLLCFAISTISFSFMVSTFFSK----------------------------- ::::.:..:: ::. :: :..::.::. CCDS67 YSDPSVVFVFLSVFAVVTILQCFLISTLFSRANLAAACGGIIYFTLYLPYVLCVAWQDYV 720 730 740 750 760 770 380 390 400 pF1KSD -----------------------------GMGIQWRDLL-SPVNVDDDFCFGQVLGMLLL :.:.:: .:. :::. .: : . ..:.:. CCDS67 GFTLKIFASLLSPVAFGFGCEYFALFEEQGIGVQWDNLFESPVE-EDGFNLTTSVSMMLF 780 790 800 810 820 830 410 420 430 440 450 pF1KSD DSVLYGLVTWYMEAVFPGQFGVPQPWYFFIMPSYWCGKPRAVAGKEEEDSDP---EKALR :. :::..:::.:::::::.:.:.:::: ::: :. . .: : : .: . CCDS67 DTFLYGVMTWYIEAVFPGQYGIPRPWYFPCTKSYWFGE------ESDEKSHPGSNQKRIS 840 850 860 870 880 460 470 480 490 500 510 pF1KSD NEYFEAEPEDLVAGIKIKHLSKVFRVGNKDRAAVRDLNLNLYEGQITVLLGHNGAGKTTT . .: :: : :..:..: ::.: : : .:: : ::.:::::: .::::::::::: CCDS67 EICMEEEPTHLKLGVSIQNLVKVYRDGMK--VAVDGLALNFYEGQITSFLGHNGAGKTTT 890 900 910 920 930 940 520 530 540 550 560 570 pF1KSD LSMLTGLFPPTSGRAYISGYEISQDMVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKG .:.:::::::::: ::: : .: ..: ::..::.::::..::: ::: ::..:::.::: CCDS67 MSILTGLFPPTSGTAYILGKDIRSEMSTIRQNLGVCPQHNVLFDMLTVEEHIWFYARLKG 950 960 970 980 990 1000 580 590 600 610 620 630 pF1KSD LSRQKCPEEVKQMLHIIGLED-KWNSRSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSG ::... :..:: .:: . : .:.. :::::.::::...:...::::.::::::.: CCDS67 LSEKHVKAEMEQMALDVGLPSSKLKSKTSQLSGGMQRKLSVALAFVGGSKVVILDEPTAG 1010 1020 1030 1040 1050 1060 640 650 660 670 680 690 pF1KSD MDAISRRAIWDLLQRQKSDRTIVLTTHFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKY .: :::.::.:: . .. :::.:.:: :::::.:::::::...:.: : :::::::.. CCDS67 VDPYSRRGIWELLLKYRQGRTIILSTHHMDEADVLGDRIAIISHGKLCCVGSSLFLKNQL 1070 1080 1090 1100 1110 1120 700 710 pF1KSD GAGYHMTLVKEP------HC----------NPED-------------------------- :.::..::::. : . :: CCDS67 GTGYYLTLVKKDVESSLSSCRNSSSTVSYLKKEDSVSQSSSDAGLGSDHESDTLTIDVSA 1130 1140 1150 1160 1170 1180 720 730 740 750 760 770 pF1KSD ISQLVHHHVPNATLESSAGAELSFILPRESTHR--FEGLFAKLEKKQKELGIASFGASIT ::.:...:: .: : . : ::...:: :.... : :: ... . ..:::.:.: : : CCDS67 ISNLIRKHVSEARLVEDIGHELTYVLPYEAAKEGAFVELFHEIDDRLSDLGISSYGISET 1190 1200 1210 1220 1230 1240 780 790 800 810 820 pF1KSD TMEEVFLRVGKLVDSSMDIQAIQ--LPALQYQHERRASDWAVDSNLC-------GAMDPS :.::.::.:.. .:..: .. . ::: ...::: :.. : : ::. CCDS67 TLEEIFLKVAE--ESGVDAETSDGTLPA---RRNRRAFG---DKQSCLRPFTEDDAADPN 1250 1260 1270 1280 1290 830 840 850 860 870 pF1KSD DGIGALIEEERTAVKLNTGL-----------ALHCQQFWAMFLKKAAYSWREWKMVAAQV : . :. : . : .:. : ::: :.. :. . : : ::. CCDS67 D---SDIDPESRETDLLSGMDGKGSYQVKGWKLTQQQFVALLWKRLLIARRSRKGFFAQI 1300 1310 1320 1330 1340 1350 880 890 pF1KSD LVP--LTCVTLALLAI-----NYSS--------------------------ELFD----D ..: ..:..:.. : .: : ::.. : CCDS67 VLPAVFVCIALVFSLIVPPFGKYPSLELQPWMYNEQYTFVSNDAPEDTGTLELLNALTKD 1360 1370 1380 1390 1400 1410 900 910 920 pF1KSD PML--RLTLG-------------EYGRTVVPFSVPGTSQLG-----------QQLSEHLK : . : : :. . :: .. : : : :...: CCDS67 PGFGTRCMEGNPIPDTPCQAGEEEWTTAPVPQTIMDLFQNGNWTMQNPSPACQCSSDKIK 1420 1430 1440 1450 1460 1470 930 940 950 pF1KSD DALQ-----AEGQEP-------REVLGDLE-----EFL------IFRASVEG-------- : : : : ..: :: ..: :. :... CCDS67 KMLPVCPPGAGGLPPPQRKQNTADILQDLTGRNISDYLVKTYVQIIAKSLKNKIWVNEFR 1480 1490 1500 1510 1520 1530 960 970 980 pF1KSD -GGF-----NERCLVAASF---------------RDVGERTVVNAL-------------- ::: : . : .. .: . .:.: CCDS67 YGGFSLGVSNTQALPPSQEVNDAIKQMKKHLKLAKDSSADRFLNSLGRFMTGLDTKNNVK 1540 1550 1560 1570 1580 1590 990 1000 1010 1020 1030 pF1KSD --FNNQAYHSPATALAVVDNLLFK--LLCG--P-HASIVVSNFPQPRSALQAAKDQFNEG :::...:. .. : :..: ... : : : : .:.. : : . : .. . CCDS67 VWFNNKGWHAISSFLNVINNAILRANLQKGENPSHYGITAFNHPLNLTKQQLSEVALMTT 1600 1610 1620 1630 1640 1650 1040 1050 1060 1070 1080 1090 pF1KSD RKGFDIALNLLFAMAFLASTFSILAVSERAVQAKHVQFVSGVHVASFWLSALLWDLISFL ... ..:::.:. ..: .. ..::. .:::.::.:::. . .::: ..::. ... CCDS67 SVDVLVSICVIFAMSFVPASFVVFLIQERVSKAKHLQFISGVKPVIYWLSNFVWDMCNYV 1660 1670 1680 1690 1700 1710 1100 1110 1120 1130 1140 1150 pF1KSD IPSLLLLVVFKAFDVRAFTRDGHMADTLLLLLLYGWAIIPLMYLMNFFFLGAATAYTRLT .:. :....: :. .... . .. ::::::::.: :::: .: : .:::. :: CCDS67 VPATLVIIIFICFQQKSYVSSTNLPVLALLLLLYGWSITPLMYPASFVFKIPSTAYVVLT 1720 1730 1740 1750 1760 1770 1160 1170 1180 1190 1200 1210 pF1KSD IFNILSGIATFLMVTIMRI-PAVKLEELSKTLDHVFLVLPNHCLGMAVSSFYENYETRRY :.. :: . . .... ::.... : :::..:. ::: .. .. .: CCDS67 SVNLFIGINGSVATFVLELFTDNKLNNINDILKSVFLIFPHFCLGRGLIDMVKN------ 1780 1790 1800 1810 1820 1220 1230 1240 1250 1260 1270 pF1KSD CTSSEVAAHYCKKYNIQYQENFYAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQRLR .. : .... . . .:. ::: . .::. : ..... ::. .. : : CCDS67 ----QAMADALERFGENRFVSPLSWDL--VGRNLFAMAVEGVVFFLITVLIQYRFFIRPR 1830 1840 1850 1860 1870 1280 1290 1300 1310 1320 1330 pF1KSD GILCALRRRRTLTELYTRMPVLPEDQDVADERTRILAPSPDSLLHTPLIIKELSKVYE-Q . : :. ::.:: :: ::: . .. . : ::::.:.:. . CCDS67 PVNAKLS------------PLNDEDEDVRRERQRILDGGGQNDI---LEIKELTKIYRRK 1880 1890 1900 1910 1920 1340 1350 1360 1370 1380 1390 pF1KSD RVPLLAVDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGHRISSDVG : : ::::. ... :::::::: :::::..:::::::. ..: ::::.. . : :.. CCDS67 RKP--AVDRICVGIPPGECFGLLGVNGAGKSSTFKMLTGDTTVTRGDAFLNKNSILSNIH 1930 1940 1950 1960 1970 1980 1400 1410 1420 1430 1440 1450 pF1KSD KVRQRIGYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLV .:.: .::::::::. . .:::: . ..: :::.::...: : ..: : : ...: . CCDS67 EVHQNMGYCPQFDAITELLTGREHVEFFALLRGVPEKEVGKVGEWAIRKLGLVKYGEKYA 1990 2000 2010 2020 2030 2040 1460 1470 1480 1490 1500 1510 pF1KSD RTYSGGNKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTVARARESGKAIIITSH .:::::::::::..:::: : :.:::::.::::: :::.::. . . . :.....::: CCDS67 GNYSGGNKRKLSTAMALIGGPPVVFLDEPTTGMDPKARRFLWNCALSVVKEGRSVVLTSH 2050 2060 2070 2080 2090 2100 1520 1530 1540 1550 1560 1570 pF1KSD SMEECEALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQEALEEFKAFVD :::::::::::.::::.:.:.:::: ::::..::.::.. ... :.. :. . : CCDS67 SMEECEALCTRMAIMVNGRFRCLGSVQHLKNRFGDGYTIVVRIA--GSNPDLKPVQDFFG 2110 2120 2130 2140 2150 2160 1580 1590 1600 1610 1620 1630 pF1KSD LTFPGSVLEDEHQGMVHYHLPGRDLSWAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSF :.::::::...:..:..:.::. : :..:.:: ..:.. ..:::::: .:.:::..: CCDS67 LAFPGSVLKEKHRNMLQYQLPSSLSSLARIFSILSQSKKRLHIEDYSVSQTTLDQVFVNF 2170 2180 2190 2200 2210 2220 1640 pF1KSD AHLQPPTAEEGR :. : CCDS67 AKDQSDDDHLKDLSLHKNQTVVDVAVLTSFLQDEKVKESYV 2230 2240 2250 2260 >>CCDS43909.1 ABCA2 gene_id:20|Hs108|chr9 (2436 aa) initn: 2943 init1: 905 opt: 1139 Z-score: 1353.8 bits: 264.0 E(32554): 4.4e-69 Smith-Waterman score: 2723; 34.0% identity (58.5% similar) in 1719 aa overlap (255-1644:700-2371) 230 240 250 260 270 280 pF1KSD YHADAATRQLFQRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIARAVVQ :: .:....:: ...:..:.. . .: CCDS43 AIIDTFVGHDVVEPGSYVQMFPYPCYTRDDFLFVIEHMMPLCMVISWVYSVAMTIQHIVA 670 680 690 700 710 720 290 300 310 320 330 340 pF1KSD EKERRLKEYMRMMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLSRSDPS :::.:::: :. :::.. .:: :::. :. : :... .: .. :: .: CCDS43 EKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVTALTAILKYG-----QVLMHSHVV 730 740 750 760 770 780 350 360 370 pF1KSD LVLAFLLCFAISTISFSFMVSTFFSK---------------------------------- .. :: .:..:: : :.::...:: CCDS43 IIWLFLAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREEVAHDKIT 790 800 810 820 830 840 380 390 400 pF1KSD ----------------------------GMGIQWRDL-LSPVNVDDDFCFGQVLGMLLLD :.::::. . :::. ::: . .. ::..: CCDS43 AFEKCIASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQSPVE-GDDFNLLLAVTMLMVD 850 860 870 880 890 900 410 420 430 440 450 pF1KSD SVLYGLVTWYMEAVFPGQFGVPQPWYFFIMPSYWCGKPRAVAGKEE-----------EDS .:.::..:::.::: ::..:.:.:::: .. ::: :. :. : . . CCDS43 AVVYGILTWYIEAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTPRLSVMEE 910 920 930 940 950 960 460 470 480 490 500 pF1KSD DPEKALRNEYFEA------EPEDLVAGIKIKHLSKVFRVGNKDRAAVRDLNLNLYEGQIT : :.... :: :: : . . .:.::.. . . :. :.:::::.:.. CCDS43 DQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKVYK--DDKKLALNKLSLNLYENQVV 970 980 990 1000 1010 1020 510 520 530 540 550 560 pF1KSD VLLGHNGAGKTTTLSMLTGLFPPTSGRAYISGYEISQDMVQIRKSLGLCPQHDILFDNLT .:::::::::::.:.:::::::::: : : :..: .: .:::.::.::::..::: :: CCDS43 SFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRTEMDEIRKNLGMCPQHNVLFDRLT 1030 1040 1050 1060 1070 1080 570 580 590 600 610 620 pF1KSD VAEHLYFYAQLKGLSRQKCPEEVKQMLHIIGLEDKWNSRSRFLSGGMRRKLSIGIALIAG : :::.::..::...... .:. .:.. . : .: .: . :::::.::::..::...: CCDS43 VEEHLWFYSRLKSMAQEEIRREMDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAIAFVGG 1090 1100 1110 1120 1130 1140 630 640 650 660 670 680 pF1KSD SKVLILDEPTSGMDAISRRAIWDLLQRQKSDRTIVLTTHFMDEADLLGDRIAIMAKGELQ :...::::::.:.: .:::::::. . : :::.:.:: :::::::::::::...:.:. CCDS43 SRAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIISHGKLK 1150 1160 1170 1180 1190 1200 690 700 710 720 pF1KSD CCGSSLFLKQKYGAGYHMTLVKEP----------------------HCNPEDISQLVHHH :::: :::: :: ::..::::.: :. ..::....: CCDS43 CCGSPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPPGRAPLSSCSELQVSQFIRKH 1210 1220 1230 1240 1250 1260 730 740 750 760 770 780 pF1KSD VPNATLESSAGAELSFILPRESTHR--FEGLFAKLEKKQKELGIASFGASITTMEEVFLR : . : :....:::.::: :.... :: :: .::.. : ..::: ::.:::::. CCDS43 VASCLLVSDTSTELSYILPSEAAKKGAFERLFQHLERSLDALHLSSFGLMDTTLEEVFLK 1270 1280 1290 1300 1310 1320 790 800 810 pF1KSD VGK----LVDSSMDIQAIQ---LPALQ--YQHERRASDWAVDSNLC------------GA :.. : .: :.. . ::. . . : .:.. : :.: :. CCDS43 VSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCSELTQSQASLQSASSVGS 1330 1340 1350 1360 1370 1380 820 830 840 850 pF1KSD MDPSDGIG---------------------ALIEEERTAV--------KLNTGLALHCQQF ..: : .: : : :. ::. : :. .:: CCDS43 ARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGW-LKVRQF 1390 1400 1410 1420 1430 1440 860 870 880 890 900 910 pF1KSD WAMFLKKAAYSWREWKMVAAQVLVPLTCVTLALLAINYSSELFDDPMLRLTLGEYGRTVV ....:. . :. : . .:.:.: : .:. . :. : : : :. ..: . CCDS43 HGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQYHNYTQ 1450 1460 1470 1480 1490 1500 pF1KSD P-------------------------------FSVP------------------------ : : .: CCDS43 PRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSLGPTLNLS 1510 1520 1530 1540 1550 1560 920 930 pF1KSD -GTSQL----------------GQQLSEHLK---------------DALQAE-------- : :.: : ::. . . ::: CCDS43 SGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWNVSLPPTA 1570 1580 1590 1600 1610 1620 940 pF1KSD -------------------------------------GQEP--REVLGDL---------E :. : : : ::. CCDS43 GPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGHPPQMRVVTGDILTDITGHNVS 1630 1640 1650 1660 1670 1680 950 960 970 980 990 pF1KSD EFLIF---RASVEGGG---F-NERCLVAASF--------RDVGERTVVNALFNNQAYHSP :.:.: : .. : : : . ::: : .. : ......::..::: CCDS43 EYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMVRKIAVRRAAQVFYNNKGYHSM 1690 1700 1710 1720 1730 1740 1000 1010 1020 1030 1040 pF1KSD ATALAVVDNLLF-----KLLCGPHA-SIVVSNFPQPRSALQAAKDQFNEGRKGFDIALNL : : ..: .. : .: : .:.:.: :. ... . . : . .: ::. . CCDS43 PTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMNKTSASLSLDYLLQGTDVV-IAIFI 1750 1760 1770 1780 1790 1050 1060 1070 1080 1090 1100 pF1KSD LFAMAFLASTFSILAVSERAVQAKHVQFVSGVHVASFWLSALLWDLISFLIPSLLLLVVF . ::.:. ..: .. :.:....:::.::::: . .::. .::....:.:. .... CCDS43 IVAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPIIYWLANYVWDMLNYLVPATCCVIIL 1800 1810 1820 1830 1840 1850 1110 1120 1130 1140 1150 1160 pF1KSD KAFDVRAFTRDGHMADTLLLLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSGI-- .::. :.: .. .: :.:::::.: :.:: .:.: ..::. : ..:.. :: CCDS43 FVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFWFEVPSSAYVFLIVINLFIGITA 1860 1870 1880 1890 1900 1910 1170 1180 1190 1200 1210 1220 pF1KSD --ATFLMVTIMRIPAVKLEELSKTLDHVFLVLPNHCLGMAVSSF-YENYETRRYCTSSEV ::::. . . .:. ... : ::..::. :: .. . :..: . CCDS43 TVATFLLQLFEHDKDLKV--VNSYLKSCFLIFPNYNLGHGLMEMAYNEY----------I 1920 1930 1940 1950 1960 1230 1240 1250 1260 1270 1280 pF1KSD AAHYCKKYNIQYQENFYAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQRLRGILCAL .: : ... ... . :. : : ...::. : . ..: .. . :.:.: . CCDS43 NEYYAKIGQFDKMKSPFEWDI--VTRGLVAMAVEGVVGFLLTIMCQYNFLRRPQ------ 1970 1980 1990 2000 2010 1290 1300 1310 1320 1330 pF1KSD RRRRTLTELYTRMPV----LPEDQDVADERTRILAPSPDSLLHTPLIIKELSKVYEQRVP :::: . .: :::.:: :.: . :. . . :..:.:::..: CCDS43 -----------RMPVSTKPVEDDVDVASERQRVLRGDADNDM---VKIENLTKVYKSRKI 2020 2030 2040 2050 2060 1340 1350 1360 1370 1380 1390 pF1KSD --LLAVDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGHRISSDVGK .:::::: :.:. :::::::: ::::::.:::::::.:: :.:.:::.:: . ... . CCDS43 GRILAVDRLCLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQ 2070 2080 2090 2100 2110 2120 1400 1410 1420 1430 1440 1450 pF1KSD VRQRIGYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLVR :.: .::::: :::.:..:.:: : .:.::::: . . :. .:. : : .:.: . CCDS43 VQQSLGYCPQCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPAG 2130 2140 2150 2160 2170 2180 1460 1470 1480 1490 1500 1510 pF1KSD TYSGGNKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTVARARESGKAIIITSHS ::::::::::::.::::: :: ::::::.::::: :::.::. . ..:.....:::: CCDS43 TYSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSVVLTSHS 2190 2200 2210 2220 2230 2240 1520 1530 1540 1550 1560 1570 pF1KSD MEECEALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQEALEEFKAFVDL :::::::::::::::.:...:::: ::::..::.:: . ....: ...... : . CCDS43 MEECEALCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKS---SQSVKDVVRFFNR 2250 2260 2270 2280 2290 2300 1580 1590 1600 1610 1620 1630 pF1KSD TFPGSVLEDEHQGMVHYHLPGRDLSWAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFA .:: ..:...:. :.:.: .. .: :.::. .:... :..:::::: .:..::..:: CCDS43 NFPEAMLKERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFA 2310 2320 2330 2340 2350 2360 1640 pF1KSD HLQPPTAEEGR . : . :. CCDS43 KKQSDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFE 2370 2380 2390 2400 2410 2420 >>CCDS747.1 ABCA4 gene_id:24|Hs108|chr1 (2273 aa) initn: 2806 init1: 963 opt: 1130 Z-score: 1343.4 bits: 262.0 E(32554): 1.6e-68 Smith-Waterman score: 2862; 33.9% identity (59.9% similar) in 1710 aa overlap (190-1638:590-2252) 160 170 180 190 200 210 pF1KSD RRNYMWTQTGSFFLKETEGWHTTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVD . ::: : :: :: .: :. CCDS74 TSSLPPHVKYKIRMDIDVVEKTNKIKDRYWDSGPRADPVEDFR---YIWGGFAYLQDMVE 560 570 580 590 600 610 220 230 240 250 260 270 pF1KSD RAIMEYHADAATRQLFQRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIA ..: . ...: . . . ....::: :. : :.. .. .:....:.. :.. . CCDS74 QGITRSQVQAEAP-----VGIYLQQMPYPCFVDDSFMIILNRCFPIFMVLAWIYSVSMTV 620 630 640 650 660 670 280 290 300 310 320 330 pF1KSD RAVVQEKERRLKEYMRMMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLS ...: ::: :::: .. .:.:. . : .::: : .. .. :. .: .. . .: CCDS74 KSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSMSI-FLLTIFIMHGR----ILH 680 690 700 710 720 340 350 360 370 pF1KSD RSDPSLVLAFLLCFAISTISFSFMVSTFFSK----------------------------- ::: ... ::: :. .:: . :..:::::: CCDS74 YSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYFTLYLPHILCFAWQDRM 730 740 750 760 770 780 380 390 400 pF1KSD -----------------------------GMGIQWRDLLSPVNVDDDFCFGQVLGMLLLD :.:.:: .. . . :.: : . :.::: CCDS74 TAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLLSMQMMLLD 790 800 810 820 830 840 410 420 430 440 450 pF1KSD SVLYGLVTWYMEAVFPGQFGVPQPWYFFIMPSYWCG-------KPRAVAGKE---EEDSD ...:::..::.. ::::..:.: ::::... ::: : . ::. : :: : CCDS74 AAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCSTREERALEKTEPLTEETED 850 860 870 880 890 900 460 470 480 490 500 pF1KSD PE--KALRNEYFEAEPEDLVAGIKIKHLSKVFRVGNKDRAAVRDLNLNLYEGQITVLLGH :: ..... .:: : : :. .:.: :.:. : :: ::...::.:::..::: CCDS74 PEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFE--PCGRPAVDRLNITFYENQITAFLGH 910 920 930 940 950 960 510 520 530 540 550 560 pF1KSD NGAGKTTTLSMLTGLFPPTSGRAYISGYEISQDMVQIRKSLGLCPQHDILFDNLTVAEHL ::::::::::.::::.::::: . ..: .: .. .:.:::.::::.::: .::::::. CCDS74 NGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQHNILFHHLTVAEHM 970 980 990 1000 1010 1020 570 580 590 600 610 620 pF1KSD YFYAQLKGLSRQKCPEEVKQMLHIIGLEDKWNSRSRFLSGGMRRKLSIGIALIAGSKVLI ::::::: :... :.. ::. ::. : : ... :::::.::::..::... .::.: CCDS74 LFYAQLKGKSQEEAQLEMEAMLEDTGLHHKRNEEAQDLSGGMQRKLSVAIAFVGDAKVVI 1030 1040 1050 1060 1070 1080 630 640 650 660 670 680 pF1KSD LDEPTSGMDAISRRAIWDLLQRQKSDRTIVLTTHFMDEADLLGDRIAIMAKGELQCCGSS :::::::.: :::.::::: . .: :::...:: :::::::::::::.:.:.: : :. CCDS74 LDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAIIAQGRLYCSGTP 1090 1100 1110 1120 1130 1140 690 700 710 pF1KSD LFLKQKYGAGYHMTLVK------------EPHCN------------------PE-----D ::::. .:.: ..:::. : :. :: : CCDS74 LFLKNCFGTGLYLTLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAHVDDLTPEQVLDGD 1150 1160 1170 1180 1190 1200 720 730 740 750 760 pF1KSD ISQL---VHHHVPNATLESSAGAELSFILPRES-THR-FEGLFAKLEKKQKELGIASFGA ...: : ::::.: : : :: :.:: .. :: . .:: .::. .::..::: CCDS74 VNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFKHRAYASLFRELEETLADLGLSSFGI 1210 1220 1230 1240 1250 1260 770 780 790 800 810 820 pF1KSD SITTMEEVFLRVGKLVDSS-MDIQAIQLP--ALQYQH-----ERRASDWAVDSNLCGAMD : : .::.::.: . ::. . . : .. .: ...:.. :::.:. CCDS74 SDTPLEEIFLKVTEDSDSGPLFAGGAQQKRENVNPRHPCLGPREKAGQTPQDSNVCSPGA 1270 1280 1290 1300 1310 1320 830 840 850 860 870 pF1KSD PS---DGIGALIEEERTAVKLNTGLALHCQQFWAMFLKKAAYSWREWKMVAAQVLVPLTC :. .: : : . .:::: : :. :...:. .. : : ::...: : CCDS74 PAAHPEGQPP-PEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHKDFLAQIVLPATF 1330 1340 1350 1360 1370 1380 880 890 900 910 920 pF1KSD VTLALLAINYSSELFDDPMLRLTLGEYGRTVVPFSV--PGTSQL-------------GQQ : :::. . . : : : ::. . ::. ::. :. :.. CCDS74 VFLALMLSIVIPPFGEYPALTLHPWIYGQQYTFFSMDEPGSEQFTVLADVLLNKPGFGNR 1390 1400 1410 1420 1430 1440 930 940 950 pF1KSD ----------------------LSEHLKDALQAE-----GQEPREVLGDLEEFLIFRASV .: .. . .: . . : . :.. .. CCDS74 CLKEGWLPEYPCGNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSCRCSTREKLTMLPECP 1450 1460 1470 1480 1490 1500 960 970 980 990 pF1KSD EG-GGFN--ERCLVAAS-FRDVGERTVVNALF-----------------NNQAYHS---- :: ::. .: .. ..:. .:.. . : :.: : . CCDS74 EGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSKFWVNEQRYGGISIG 1510 1520 1530 1540 1550 1560 1000 pF1KSD ------PATALAVV-----------------------------------DNL-------- : :. :.: ::. CCDS74 GKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHLETEDNIKVWFNNKG 1570 1580 1590 1600 1610 1620 1010 1020 1030 1040 pF1KSD ---LFKLLCGPHASIVVSNFPQPRSA-----------LQAAKDQFNEGR---KGFD--IA : ..: : .:. ...:. :: :. .:.:..: . : .: CCDS74 WHALVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLSEITVLTTSVDAVVA 1630 1640 1650 1660 1670 1680 1050 1060 1070 1080 1090 1100 pF1KSD LNLLFAMAFLASTFSILAVSERAVQAKHVQFVSGVHVASFWLSALLWDLISFLIPSLLLL . ..:.:.:. ..: . ..::. ..::.::.::: ...:.. .:::.... . . :.. CCDS74 ICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFLWDIMNYSVSAGLVV 1690 1700 1710 1720 1730 1740 1110 1120 1130 1140 1150 1160 pF1KSD VVFKAFDVRAFTRDGHMADTLLLLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSG .: .:. .:.: .. . ::::::::.::.:: .:.: .:::. :. :.. : CCDS74 GIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPSTAYVALSCANLFIG 1750 1760 1770 1780 1790 1800 1170 1180 1190 1200 1210 1220 pF1KSD IATFLMVTIMRI--PAVKLEELSKTLDHVFLVLPNHCLGMAVSSFYENYETRRYCTSSEV : . .. :... : ... .: ....:.:. ::: .. .. . :.. CCDS74 INSSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGLIDL----------ALSQA 1810 1820 1830 1840 1850 1230 1240 1250 1260 1270 1280 pF1KSD AAHYCKKYNIQYQENFYAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQRLRGILCAL .. ... ... : . :. .:. . .:.. : .:..: .:.. ... CCDS74 VTDVYARFGEEHSANPFHWDL--IGKNLFAMVVEGVVYFLLTLLVQRHFFLS-------- 1860 1870 1880 1890 1900 1290 1300 1310 1320 1330 1340 pF1KSD RRRRTLTELYTRMPVLPEDQDVADERTRILAPSPDSLLHTPLIIKELSKVYE-QRVPLLA . ..: :. :.. ::.:::.:: ::.. . . . : ..::.:.: : : CCDS74 ---QWIAE-PTKEPIVDEDDDVAEERQRIITGGNKTDI---LRLHELTKIYPGTSSP--A 1910 1920 1930 1940 1950 1350 1360 1370 1380 1390 1400 pF1KSD VDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGHRISSDVGKVRQRI :::: ..:. :::::::: ::::::::::::::. ..::::: :.:. : .....:.: . CCDS74 VDRLCVGVRPGECFGLLGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNM 1960 1970 1980 1990 2000 2010 1410 1420 1430 1440 1450 1460 pF1KSD GYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLVRTYSGG ::::::::. . .:::: : .::::::.: ..: .. ....: : .:. :. ::::: CCDS74 GYCPQFDAIDELLTGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGG 2020 2030 2040 2050 2060 2070 1470 1480 1490 1500 1510 1520 pF1KSD NKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTVARARESGKAIIITSHSMEECE :::::::.::::: : ...::::.::::: :::.::.... . :.:...::::::::: CCDS74 NKRKLSTAIALIGCPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECE 2080 2090 2100 2110 2120 2130 1530 1540 1550 1560 1570 pF1KSD ALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQ--EALEEFKAFVDLTFP ::::::::::.: :.:.:. ::::::::.:: . :..: .. :. . : . .:: CCDS74 ALCTRLAIMVKGAFRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFP 2140 2150 2160 2170 2180 2190 1580 1590 1600 1610 1620 1630 pF1KSD GSVLEDEHQGMVHYHLPGRDLSWAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFAHLQ ::: ...: .:..... . .: :..: .: . :.. ...:::.: .:.:::..::. : CCDS74 GSVQRERHYNMLQFQVSSSSL--ARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQ 2200 2210 2220 2230 2240 2250 1640 pF1KSD PPTAEEGR CCDS74 TESHDLPLHPRAAGASRQAQD 2260 2270 >>CCDS12055.1 ABCA7 gene_id:10347|Hs108|chr19 (2146 aa) initn: 2793 init1: 854 opt: 1093 Z-score: 1299.3 bits: 253.7 E(32554): 4.7e-66 Smith-Waterman score: 2894; 35.5% identity (59.7% similar) in 1687 aa overlap (188-1638:483-2104) 160 170 180 190 200 210 pF1KSD YTRRNYMWTQTGSFFLKETEGWHTTSLFPLFPNPGPR-EPTSPDGGEPGYIREGFLAVQH : .::: .: . . :. ::. .: CCDS12 PTPDLGPGHVRIKIRMDIDVVTRTNKIRDRFWDPGPAADPLT----DLRYVWGGFVYLQD 460 470 480 490 500 220 230 240 250 260 270 pF1KSD AVDRAIMEYHADAATRQLFQRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTAL :.:: .. . : : . ....::: .. : :: ... .:::.: :.. :.. CCDS12 LVERAAVRVLSGANPRA-----GLYLQQMPYPCYVDDVFLRVLSRSLPLFLTLAWIYSVT 510 520 530 540 550 560 280 290 300 310 320 330 pF1KSD TIARAVVQEKERRLKEYMRMMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVA ..:::.::: ::.. :: :::: . : .::: . .:..:....:.. :. CCDS12 LTVKAVVREKETRLRDTMRAMGLSRAVLWLGWFLSCLGPFLLSAALLVLVL--KLGD--- 570 580 590 600 610 340 350 360 370 pF1KSD VLSRSDPSLVLAFLLCFAISTISFSFMVSTFFSK--------GMG-----------IQWR .: : :..:. :: ::..:.. ::..:.:::. :.. . :: CCDS12 ILPYSHPGVVFLFLAAFAVATVTQSFLLSAFFSRANLAAACGGLAYFSLYLPYVLCVAWR 620 630 640 650 660 670 380 390 pF1KSD D-----------LLSPV----------------------NVD-----DDFCFGQVLGMLL : ::::: :: : : ..:: :.:: CCDS12 DRLPAGGRVAASLLSPVAFGFGCESLALLEEQGEGAQWHNVGTRPTADVFSLAQVSGLLL 680 690 700 710 720 730 400 410 420 430 440 450 pF1KSD LDSVLYGLVTWYMEAVFPGQFGVPQPWYFFIMPSYWCG-KPRAVAGKEEEDSDPEKALRN ::..::::.:::.::: :::.:.:.:: : . ::::: .: . :: :.: CCDS12 LDAALYGLATWYLEAVCPGQYGIPEPWNFPFRRSYWCGPRPPKSPAPCPTPLDP-KVL-- 740 750 760 770 780 790 460 470 480 490 500 510 pF1KSD EYFEAEPEDLVAGIKIKHLSKVFRVGNKDRAAVRDLNLNLYEGQITVLLGHNGAGKTTTL : : : :.... : : : .. . :.: :.:..:.:.::..:::::::::::: CCDS12 --VEEAPPGLSPGVSVRSLEK--RFPGSPQPALRGLSLDFYQGHITAFLGHNGAGKTTTL 800 810 820 830 840 850 520 530 540 550 560 570 pF1KSD SMLTGLFPPTSGRAYISGYEISQDMVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKGL :.:.:::::..: :.: :... ..:. :: ::.:::...::: ::: ::..::..:::: CCDS12 SILSGLFPPSGGSAFILGHDVRSSMAAIRPHLGVCPQYNVLFDMLTVDEHVWFYGRLKGL 860 870 880 890 900 910 580 590 600 610 620 630 pF1KSD SRQKCPEEVKQMLHIIGLEDKWNSRSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSGMD : : ..:. .:: .: . ..: :::::.::::..::...::.:.::::::.:.: CCDS12 SAAVVGPEQDRLLQDVGLVSKQSVQTRHLSGGMQRKLSVAIAFVGGSQVVILDEPTAGVD 920 930 940 950 960 970 640 650 660 670 680 690 pF1KSD AISRRAIWDLLQRQKSDRTIVLTTHFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKYGA :::.::.:: . . ::..:.:: .:::.:::::.:..: :.: :::: :::... :. CCDS12 PASRRGIWELLLKYREGRTLILSTHHLDEAELLGDRVAVVAGGRLCCCGSPLFLRRHLGS 980 990 1000 1010 1020 1030 700 710 720 pF1KSD GYHMTLVKE--PHCNPE----------DISQ------------------LVHHHVPNATL ::..:::: : . : : : ::.: ::.: : CCDS12 GYYLTLVKARLPLTTNEKADTDMEGSVDTRQEKKNGSQGSRVGTPQLLALVQHWVPGARL 1040 1050 1060 1070 1080 1090 730 740 750 760 770 780 pF1KSD ESSAGAELSFILPRESTH--RFEGLFAKLEKKQKELGIASFGASITTMEEVFLRVGKLVD :: ..:: ..: : :: .:. . :: ....: : :..::.::.: . CCDS12 VEELPHELVLVLPYTGAHDGSFATLFRELDTRLAELRLTGYGISDTSLEEIFLKVVEECA 1100 1110 1120 1130 1140 1150 790 800 810 820 830 pF1KSD SSMDIQAIQLPALQYQHERRASDWAVDSNLCGAMDPSDGI-------GALIEEER----T .. :.. . :: . ..: .: : :.. :. : .. CCDS12 ADTDME----DGSCGQHLCTGIA-GLDVTLRLKMPPQETALENGEPAGSAPETDQGSGPD 1160 1170 1180 1190 1200 840 850 860 870 880 890 pF1KSD AVKLNTGLALHCQQFWAMFLKKAAYSWREWKMVAAQVLVPLTCVTLALLAINYSSELFDD :: : :: ::. :..::. . : . . ::...: : :::. . CCDS12 AVGRVQGWALTRQQLQALLLKRFLLARRSRRGLFAQIVLPALFVGLALVFSLIVPPFGHY 1210 1220 1230 1240 1250 1260 900 910 920 pF1KSD PMLRLTLGEYGRTVVPFSV-----PGTSQLGQQL-------------SEH---------- : :::. :: : :: :: ..: . : : : CCDS12 PALRLSPTMYGAQVSFFSEDAPGDPGRARLLEALLQEAGLEEPPVQHSSHRFSAPEVPAE 1270 1280 1290 1300 1310 1320 930 940 pF1KSD -----------------------------LKDALQAEG--QEPREVLG-----------D : : : : :. : : . CCDS12 VAKVLASGNWTPESPSPACQCSRPGARRLLPDCPAAAGGPPPPQAVTGSGEVVQNLTGRN 1330 1340 1350 1360 1370 1380 950 960 pF1KSD LEEFLI---------------FRASVEGGGFN---------------------------- : .::. . :. :::. CCDS12 LSDFLVKTYPRLVRQGLKTKKWVNEVRYGGFSLGGRDPGLPSGQELGRSVEELWALLSPL 1390 1400 1410 1420 1430 1440 970 980 990 1000 1010 pF1KSD -----ERCL--VAASFRDVGERTVVNALFNNQAYHSPATALAVVDNLLFK--LLCGP--H .: : ..: ... . .. :::...:: .. . ..: ... : :: : CCDS12 PGGALDRVLKNLTAWAHSLDAQDSLKIWFNNKGWHSMVAFVNRASNAILRAHLPPGPARH 1450 1460 1470 1480 1490 1500 1020 1030 1040 1050 1060 pF1KSD A-SIVVSNFPQPRSALQAAKDQFNEGR---KGFDIALNL--LFAMAFLASTFSILAVSER : ::.. : : :. .:.:..:: .. :. ... .:::.:. ..:... . :: CCDS12 AHSITTLNHP-----LNLTKEQLSEGALMASSVDVLVSICVVFAMSFVPASFTLVLIEER 1510 1520 1530 1540 1550 1560 1070 1080 1090 1100 1110 1120 pF1KSD AVQAKHVQFVSGVHVASFWLSALLWDLISFLIPSLLLLVVFKAFDVRAFTRDGHMADTLL ...:::.:...:. . .::. .:::. ..:.:. .....: ::. ::.. ... :: CCDS12 VTRAKHLQLMGGLSPTLYWLGNFLWDMCNYLVPACIVVLIFLAFQQRAYVAPANLPALLL 1570 1580 1590 1600 1610 1620 1130 1140 1150 1160 1170 1180 pF1KSD LLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSGIATFLMVTIMRIPA-VKLEELS :::::::.: :::: .::: .:::. :: .:.. :: . . .... . ::.:.: CCDS12 LLLLYGWSITPLMYPASFFFSVPSTAYVVLTCINLFIGINGSMATFVLELFSDQKLQEVS 1630 1640 1650 1660 1670 1680 1190 1200 1210 1220 1230 1240 pF1KSD KTLDHVFLVLPNHCLGMAVSSFYENYETRRYCTSSEVAAHYCKKYNIQYQENFYAWSAPG . : .:::..:. ::: .. .. .: . .: . . . :.: . : . CCDS12 RILKQVFLIFPHFCLGRGLIDMVRN---------QAMADAFERLGDRQFQSPLR-WEV-- 1690 1700 1710 1720 1250 1260 1270 1280 1290 1300 pF1KSD VGRFVASMAASGCAYLILLFLIETNLLQRLRGILCALRRRRTLTELYTRMPVL-PEDQDV ::. . .:. .: :::. : :::. :. : : :.: :.: ::.:: CCDS12 VGKNLLAMVIQGP-----LFLLFTLLLQH-RSQLLPQPRVRSL-------PLLGEEDEDV 1730 1740 1750 1760 1770 1310 1320 1330 1340 1350 1360 pF1KSD ADERTRILAPSPDSLLHTPLIIKELSKVYE-QRVPLLAVDRLSLAVQKGECFGLLGFNGA : :: :.. . .. . :....:.:::. ::.: ::::: :.. :::::::: ::: CCDS12 ARERERVVQGATQGDV---LVLRNLTKVYRGQRMP--AVDRLCLGIPPGECFGLLGVNGA 1780 1790 1800 1810 1820 1830 1370 1380 1390 1400 1410 1420 pF1KSD GKTTTFKMLTGEESLTSGDAFVGGHRISSDVGKVRQRIGYCPQFDALLDHMTGREMLVMY :::.::.:.::. . :.: ..:: .. . . .. .::::: ::... .:::: : . CCDS12 GKTSTFRMVTGDTLASRGEAVLAGHSVAREPSAAHLSMGYCPQSDAIFELLTGREHLELL 1840 1850 1860 1870 1880 1890 1430 1440 1450 1460 1470 1480 pF1KSD ARLRGIPERHIGACVENTLRGLLLEPHANKLVRTYSGGNKRKLSTGIALIGEPAVIFLDE :::::.:: ... . . : : : .:.. . ::::::::::.:..::.:.:::.:::: CCDS12 ARLRGVPEAQVAQTAGSGLARLGLSWYADRPAGTYSGGNKRKLATALALVGDPAVVFLDE 1900 1910 1920 1930 1940 1950 1490 1500 1510 1520 1530 1540 pF1KSD PSTGMDPVARRLLWDTVARARESGKAIIITSHSMEECEALCTRLAIMVQGQFKCLGSPQH :.::::: :::.::... . . :.....::::::::::::.::::::.:.:.::::::: CCDS12 PTTGMDPSARRFLWNSLLAVVREGRSVMLTSHSMEECEALCSRLAIMVNGRFRCLGSPQH 1960 1970 1980 1990 2000 2010 1550 1560 1570 1580 1590 1600 pF1KSD LKSKFGSGYSLRAKVQSEGQQEALEEFKAFVDLTFPGSVLEDEHQGMVHYHLP-GRDLSW ::..:..:..: .: . .: : ::: :::. :.. : : ....:: : . CCDS12 LKGRFAAGHTLTLRVPAARSQPA----AAFVAAEFPGAELREAHGGRLRFQLPPGGRCAL 2020 2030 2040 2050 2060 1610 1620 1630 1640 pF1KSD AKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFAHLQPPTAEEGR :.::: : ..::.:.:::: ::.::: :.. : CCDS12 ARVFGELAVHGAEHGVEDFSVSQTMLEEVFLYFSKDQGKDEDTEEQKEAGVGVDPAPGLQ 2070 2080 2090 2100 2110 2120 CCDS12 HPKRVSQFLDDPSTAETVL 2130 2140 >>CCDS11685.1 ABCA5 gene_id:23461|Hs108|chr17 (1642 aa) initn: 1363 init1: 668 opt: 1063 Z-score: 1265.0 bits: 247.0 E(32554): 3.9e-64 Smith-Waterman score: 1916; 26.9% identity (57.5% similar) in 1730 aa overlap (1-1638:8-1616) 10 20 30 40 50 pF1KSD MAVLRQLALLLWKNYTLQKRKVLVTVLELFLPLLFSGILIWLRLKIQSENVPN ..: :: :: ::: .. : .: :...::.: :.:: : CCDS11 MSTAIREVGVWRQTRTLLLKNYLIKCRTKKSSVQEILFPLFF---LFWLILI-------- 10 20 30 40 60 70 80 90 100 110 pF1KSD ATIYPGQSIQELPLFFTFPPPGDTWELAYIPSHSDAAKTVTETVRRALVINMRVRGFPSE . ..:... .:.: . : : . :. . . ..: .. . . . .:. CCDS11 SMMHPNKKYEEVPNIEL--NPMDKFTLSNLILGYTPVTNITSSIMQKVSTDH----LPDV 50 60 70 80 90 100 120 130 140 150 160 170 pF1KSD KDFEDYIRYDNCSSSVLAAVVFEHPFNHSKEPLPLAVKYHLRFSYTRRNYMWTQTGSFFL :.: . .: :. .: : . ...:.::: ..:... CCDS11 IITEEYTNEKEMLTSSLS-----KPSNFVGVVFKDSMSYELRFFPD-----MIPVSSIYM 110 120 130 140 150 180 190 200 210 220 230 pF1KSD KETEGWHTTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVDRAIMEYHADAAT-R : : . : :: ..: ..: ::.. ..... . CCDS11 DSRAG------------------CSKSCEAAQYWSSGFTVLQASIDAAIIQLKTNVSLWK 160 170 180 190 240 250 260 270 280 290 pF1KSD QLFQRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIARAVVQEKERRLKE .: . .: . . . . : : . : :...:. . .: .: :::...:: CCDS11 ELESTKAVIMGETAVVEIDTFPRGVILIY-----LVIAFSPFGYFLAIHIVAEKEKKIKE 200 210 220 230 240 250 300 310 320 330 340 350 pF1KSD YMRMMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLSRSDPSLVLAFLLC ....::: . : .: ::. .... :.::. : . .. . :. . : :.: CCDS11 FLKIMGLHDTAFWLSWVLLYTSLIFL----MSLLMAVIATASLLFPQSSSIVIFLLFFL- 260 270 280 290 300 360 370 380 pF1KSD FAISTISFSFMVSTFF--SKGMGIQ--------------------------WRDLLSP-- ...:.. :..:.. .: :: .:: : :.:: CCDS11 YGLSSVFFALMLTPLFKKSKHVGIVEFFVTVAFGFIGLMIILIESFPKSLVW--LFSPFC 310 320 330 340 350 360 390 400 410 pF1KSD -----VNVD-----DDFCFGQVLG--------------MLLLDSVLYGLVTWYMEAVFPG ... .:: : .. :: :.:..: :.. :.. :.:: CCDS11 HCTFVIGIAQVMHLEDFNEGASFSNLTAGPYPLIITIIMLTLNSIFYVLLAVYLDQVIPG 370 380 390 400 410 420 420 430 440 450 460 470 pF1KSD QFGVPQPWYFFIMPSYWCGKPRAVAGKEEEDSDPEKALRNEYFEAEPEDLVA--GIKIKH .::. . .:. :::: . : : . . . .. .: .: ..:. .:.:. CCDS11 EFGLRRSSLYFLKPSYWSKSKRNYEELSEGNVNGNISF-SEIIEPVSSEFVGKEAIRISG 430 440 450 460 470 480 480 490 500 510 520 530 pF1KSD LSKVFRVGNKDRAAVRDLNLNLYEGQITVLLGHNGAGKTTTLSMLTGLFPPTSGRAYISG ..:..: ... :.:.:....::::::.::::.:.::.: ...: :: ::..: : : : CCDS11 IQKTYRKKGENVEALRNLSFDIYEGQITALLGHSGTGKSTLMNILCGLCPPSDGFASIYG 490 500 510 520 530 540 540 550 560 570 580 590 pF1KSD YEISQ--DMVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKGLSRQKCPEEVKQMLHII ...:. .: . :: .:.::: :: :: ::: :.: . :..::. .. .::...: . CCDS11 HRVSEIDEMFEARKMIGICPQLDIHFDVLTVEENLSILASIKGIPANNIIQEVQKVLLDL 550 560 570 580 590 600 600 610 620 630 640 650 pF1KSD GLEDKWNSRSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSGMDAISRRAIWDLLQRQKS .. ..... ::::..::::.:::.... :.:.:::::.::: ::. .:.::. .:. CCDS11 DMQTIKDNQAKKLSGGQKRKLSLGIAVLGNPKILLLDEPTAGMDPCSRHIVWNLLKYRKA 610 620 630 640 650 660 660 670 680 690 700 710 pF1KSD DRTIVLTTHFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKYGAGYHMTLVKEPHCNPED .:. :..::::::::.:.:: :....: :.: :::.:::.:.: ::.... . .: :. CCDS11 NRVTVFSTHFMDEADILADRKAVISQGMLKCVGSSMFLKSKWGIGYRLSMYIDKYCATES 670 680 690 700 710 720 720 730 740 750 760 770 pF1KSD ISQLVHHHVPNATLESSAGAELSFILPRESTHRFEGLFAKLEKKQKELGIASFGASITTM .:.::..:.:.::: .. .: . :: .. .: :::. :.. ...::. :.:.:.::. CCDS11 LSSLVKQHIPGATLLQQNDQQLVYSLPFKDMDKFSGLFSALDS-HSNLGVISYGVSMTTL 730 740 750 760 770 780 780 790 800 810 820 830 pF1KSD EEVFLRVGKLVDSSMDIQAIQLPALQYQHERRASDWAVDSNLCGAMDPSDGIGALIEEER :.:::.. :.. .: .. . : .:. .::. :. : :: : CCDS11 EDVFLKL--EVEAEIDQADYSVFTQQPLEEE------MDSKSFDEMEQS----LLILSET 790 800 810 820 840 850 860 870 880 890 pF1KSD TAVKLNTGLALHCQQFWAMFLKKAAYSWREWKMVAAQVLVPLTCVTLALLAINYSSELFD :. ..: ..: ::.... : . . : . .: .: :: : .. ..: CCDS11 KAALVST-MSLWKQQMYTI----AKFHFFTLKRESKSVRS-----VLLLLLIFFTVQIF- 830 840 850 860 870 900 910 920 930 940 950 pF1KSD DPMLRLTLGEYGRTVVPFS-VPGTSQLGQQLSEH-LKDALQAEGQEPREVLGDLEEFL-- . :. . .:::.. :: : . : : .: ... .. .:: :. CCDS11 ---MFLVHHSFKNAVVPIKLVPDLYFLKPGDKPHKYKTSLLLQNSADSDI-SDLISFFTS 880 890 900 910 920 930 960 970 980 990 1000 pF1KSD --IFRASVEGGGFNERCLVAASFRDV-GERTVV-NALFNNQAYHSPATALAVVDNL-LFK :. . .. . . .:.. . .:. : :.::. .: . ...: :.. CCDS11 QNIMVTMINDSDYVSVAPHSAALNVMHSEKDYVFAAVFNSTMVYSLPILVNIISNYYLYH 940 950 960 970 980 990 1010 1020 1030 1040 1050 1060 pF1KSD LLCGPHASIVVSNFPQPRSALQAAKDQFNEGRKGFDIALNLLFAMAFLASTFSILAVSER : .: . : .: : . . :. :: : . .. . :.. . .. CCDS11 LNVTETIQIWSTPF------FQEITDIVFKIELYFQAAL-LGIIVTAMPPYFAMENAENH 1000 1010 1020 1030 1040 1070 1080 1090 1100 1110 1120 pF1KSD AVQAKHVQFVSGVHVASFWLSALLWDLISFLIPSLLLLVVFKAFDVRAFTRDGHMADTLL ..: .::. ...:.. . :. :.: .:.: . :: . .. ... CCDS11 KIKAYTQLKLSGLLPSAYWIGQAVVDIPLFFIILILMLGSLLAFHYGLYFYTVKFLAVVF 1050 1060 1070 1080 1090 1100 1130 1140 1150 1160 1170 1180 pF1KSD LLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSGIATFLMVTIMRIPAVKLEELSK :. : ..: . :. .: : . ..... ..:.. ..: .: .. CCDS11 CLIGYVPSVILFTYIASFTF---KKILNTKEFWSFIYSVAALACIAITEITFFMGYTIAT 1110 1120 1130 1140 1150 1160 1190 1200 1210 1220 1230 1240 pF1KSD TLDHVF-LVLPNHCLGMAVSSFYENYETRRYCTSSEVAAHYCKKYNIQYQENFYAWSAPG : ..: ...: . : . :: . .. . .: :. ... :. CCDS11 ILHYAFCIIIPIYPLLGCLISFIK------------ISWKNVRK-NV---DTYNPWD--- 1170 1180 1190 1200 1250 1260 1270 1280 1290 pF1KSD VGRFVASMAASGCAYLILLFLIETNLLQRLRGILCALRRRRTLTELYTR-----MPVLP- :. ... . .. .::.. .. : ..:. . .: :. .: : CCDS11 --RLSVAVISPYLQCVLWIFLLQ--YYEKKYGGR-SIRKDPFFRNLSTKSKNRKLPEPPD 1210 1220 1230 1240 1250 1260 1300 1310 1320 1330 1340 pF1KSD ---EDQDVADERTRI--LAPSPDSLLHTPLIIKELSKVYE--------QRVPLLAVDRLS ::.:: :: .. : . .....: : :. ..: .:. .: CCDS11 NEDEDEDVKAERLKVKELMGCQCCEEKPSIMVSNLHKEYDDKKDFLLSRKVKKVATKYIS 1270 1280 1290 1300 1310 1320 1350 1360 1370 1380 1390 1400 pF1KSD LAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGH--RISSDVGKVRQRIGYC . :.::: .:::: :::::.: ...:.:. :::..:.: . . : : ... .::: CCDS11 FCVKKGEILGLLGPNGAGKSTIINILVGDIEPTSGQVFLGDYSSETSEDDDSLKC-MGYC 1330 1340 1350 1360 1370 1410 1420 1430 1440 1450 1460 pF1KSD PQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLVRTYSGGNKR ::.. : : .: . .:. ..:. . . ..: :. : .: :. .: :: CCDS11 PQINPLWPDTTLQEHFEIYGAVKGMSASDMKEVISRITHALDLKEHLQKTVKKLPAGIKR 1380 1390 1400 1410 1420 1430 1470 1480 1490 1500 1510 1520 pF1KSD KLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTVARA-RESGKAIIITSHSMEECEAL :: .....:.: . .:::::::::: :.. .: .. : .. .: :.:.: ::: ::. CCDS11 KLCFALSMLGNPQITLLDEPSTGMDPKAKQHMWRAIRTAFKNRKRAAILTTHYMEEAEAV 1440 1450 1460 1470 1480 1490 1530 1540 1550 1560 1570 1580 pF1KSD CTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQEALEEFKAFVDLTFPGSVL : :.::::.::..:.:. ::::::::.:: :. :... .. ..... .. ::.. CCDS11 CDRVAIMVSGQLRCIGTVQHLKSKFGKGYFLEIKLKDWIENLEVDRLQREIQYIFPNASR 1500 1510 1520 1530 1540 1550 1590 1600 1610 1620 1630 1640 pF1KSD EDEHQGMVHYHLPGRDL-SWAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFAHLQPPT .. .... :..: .:. : .. : ::.::. .....:: :: .:::::. ... : CCDS11 QESFSSILAYKIPKEDVQSLSQSFFKLEEAKHAFAIEEYSFSQATLEQVFVELTKEQEEE 1560 1570 1580 1590 1600 1610 pF1KSD AEEGR CCDS11 DNSCGTLNSTLWWERTQEDRVVF 1620 1630 1640 >>CCDS74138.1 ABCA8 gene_id:10351|Hs108|chr17 (1616 aa) initn: 1424 init1: 639 opt: 1033 Z-score: 1229.0 bits: 240.3 E(32554): 3.9e-62 Smith-Waterman score: 1825; 29.0% identity (59.9% similar) in 1530 aa overlap (206-1638:172-1593) 180 190 200 210 220 230 pF1KSD TEGWHTTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVDRAIMEYHADAATRQLF . .:::.:.: :.. ::.: .. .. . CCDS74 GHGMPAKKEHKDHTAHCYETNEDVYCEVSVFWKEGFVALQAAINAAIIEITTNHSVME-- 150 160 170 180 190 240 250 260 270 280 290 pF1KSD QRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIARAVVQEKERRLKEYMR . ..:: : . . ::.. ... : . . .::. . . : . : ....:.: : CCDS74 ELMSVTGKNMKMHSFIGQSGVITDLYLFSCI--ISFS-SFIYYASVNVTRERKRMKALMT 200 210 220 230 240 250 300 310 320 330 340 350 pF1KSD MMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLSRSDPSLVLAFLLCFAI :::: . : .: ::. :..: : :..: : . . .:: .:....: ... CCDS74 MMGLRDSAFWLSWGLLYAGFIFIMALFLAL---VIRSTQFIILS--GFMVVFSLFLLYGL 260 270 280 290 300 310 360 370 380 pF1KSD STISFSFMVSTFFSK----GM-----------------------GIQW-RDLLSP----- : ....:..: . .: :. ...: .:::: CCDS74 SLVALAFLMSILVKKSFLTGLVVFLLTVFWGCLGFTSLYRHLPASLEWILSLLSPFAFML 320 330 340 350 360 370 390 400 410 420 pF1KSD -----VNVDDDF---CF-----GQVLG-----MLLLDSVLYGLVTWYMEAVFPGQFGVPQ ...: :. : :. : :: .:. :: .. :.: ..:...: . CCDS74 GMAQLLHLDYDLNSNAFPHPSDGSNLIVATNFMLAFDTCLYLALAIYFEKILPNEYGHRR 380 390 400 410 420 430 430 440 450 460 470 480 pF1KSD PWYFFIMPSYWCGKPRA--VAGKEEEDSDPEKALRNEYFEAEPE-DLVAGIKIKHLSKVF : ::. :.: .. :: ..: :.:: .... . .: :: . .:.:....: . CCDS74 PPLFFLKSSFWSQTQKTDHVALEDEMDADP--SFHDSFEQAPPEFQGKEAIRIRNVTKEY 440 450 460 470 480 490 500 510 520 530 540 pF1KSD RVGNKDRA-AVRDLNLNLYEGQITVLLGHNGAGKTTTLSMLTGLFPPTSGRAYISGYEIS . :. :. :..:: ...::::::..:::.::::.: :..:.:: ::.: . : . ..: CCDS74 K-GKPDKIEALKDLVFDIYEGQITAILGHSGAGKSTLLNILSGLSVPTKGSVTIYNNKLS 490 500 510 520 530 540 550 560 570 580 590 pF1KSD Q--DMVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKGLSRQKCPEEVKQMLHIIGLED . :. .. : :.::: .. :: ::: :.: ..:..::. :. .:....: . ... CCDS74 EMADLENLSKLTGVCPQSNVQFDFLTVRENLRLFAKIKGILPQEVDKEIQRVLLELEMKN 550 560 570 580 590 600 600 610 620 630 640 650 pF1KSD KWNSRSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSGMDAISRRAIWDLLQRQKSDRTI . .. ::::..:::..:::... ....:::::.:.: .::. .:.::...:.::.: CCDS74 IQDVLAQNLSGGQKRKLTFGIAILGDPQIFLLDEPTAGLDPFSRHQVWNLLKERKTDRVI 610 620 630 640 650 660 660 670 680 690 700 710 pF1KSD VLTTHFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKYGAGYHMTLVKEPHCNPEDISQL ...:.::::::.:.:: .....:.:.: :::::::.:.: :::..: . : :.:..: CCDS74 LFSTQFMDEADILADRKVFLSQGKLKCAGSSLFLKKKWGIGYHLSLQLNEICVEENITSL 670 680 690 700 710 720 720 730 740 750 760 770 pF1KSD VHHHVPNATLESSAGAELSFILPRESTHRFEGLFAKLEKKQKELGIASFGASITTMEEVF :..:.:.: : ... ..: . :: : :..: :. :.. .::: ..:.:.::..::: CCDS74 VKQHIPDAKLSAKSEGKLIYTLPLERTNKFPELYKDLDS-YPDLGIENYGVSMTTLNEVF 730 740 750 760 770 780 780 790 800 810 820 830 pF1KSD LRV-GKLVDSSMDIQAIQLPALQYQHERRASDWAVDSNLCGAMDPSDGIGALIEEERTAV :.. :: . . :: . . : :. : :.. :. . . ... : .. CCDS74 LKLEGKSTINESDIAILG----EVQAEK-----ADDTERLVEMEQ---VLSSLNKMRKTI 790 800 810 820 830 840 850 860 870 880 890 pF1KSD KLNTGLALHCQQFWAMFLKKAAYSWREWKMVAAQVLVPLTCVTLALLAINYSSELFDDPM :.:: ::. :. . .: : . : .:. :.: .. : . : CCDS74 G---GVALWRQQICAIARVRLLKLKHERKALLALLLI--------LMA-GFCPLLVEYTM 840 850 860 870 880 900 910 920 930 940 950 pF1KSD LRLTLGEYGRTVVPFSVPGTSQLGQQLSEHLKDALQAEGQEPREVLGDLEEFLIFRASVE ... . : .:: :: . : ::.:.. : .: ..: .... CCDS74 VKIYQNSYT---------------WELSPHLY--FLAPGQQPHDPLTQL--LIINKTGAS 890 900 910 920 960 970 980 990 1000 pF1KSD GGGFN---ERCLVAASFRDVGERTVVNALFNNQAYHSPATALAVVDNLLFKLLCG----- : :. .: : :. .. . .:.. :. : :.: :. CCDS74 IDDFIQSVEHQNIALEVDAFGTRNGTD----DPSYNGAITVCCNEKNYSFSLACNAKRLN 930 940 950 960 970 980 1010 1020 1030 1040 1050 1060 pF1KSD --PHASIVVSN----FPQPRSALQAAKDQFNEGRKGFDIAL--NLLFAMAFLASTFSILA : .::: . .: ... .. : :. . :.. ..: ... .: .: CCDS74 CFPVLMDIVSNGLLGMVKPSVHIRTERSTFLENGQDNPIGFLAYIMFWLVLTSSCPPYIA 990 1000 1010 1020 1030 1040 1070 1080 1090 1100 1110 pF1KSD VS---ERAVQAKHVQFVSGVHVASFWLSALLWDL-ISFLIPSLLLLVVF-KAFDVRAFTR .: . .:. .::. ...:.. : :. . ::. .. :. . . :. .: CCDS74 MSSIDDYKNRARSQLRISGLSPSAYWFGQALVDVSLYFLVFVFIYLMSYISNFEDMLLTI 1050 1060 1070 1080 1090 1100 1120 1130 1140 1150 1160 1170 pF1KSD DGHMADTLLLLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSGIATF--LMVTIMR :. . . . :....: . :...:.: : : ::: .: .::.. CCDS74 I-HIIQ-IPCAVGYSFSLIFMTYVISFIF--------RKGRKN--SGIWSFCFYVVTVFS 1110 1120 1130 1140 1180 1190 1200 1210 1220 1230 pF1KSD IP--AVKLEELSKTLDHVFLVLPNHCLGMAVSSFYENYETRRYCTSSEVAAHYCKKYNIQ . : .. : . . .::. : .: : . . . :: .....: CCDS74 VAGFAFSIFESDIPFIFTFLIPPATMIGCLFLSSHLLFSS----LFSE------ERMDVQ 1150 1160 1170 1180 1190 1240 1250 1260 1270 1280 1290 pF1KSD YQENFYAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQRLRGILCALRRRRTLTELYT : .. : . .:. .:. : .: .. .. ..:. .. CCDS74 ---PFLVFLIPFL-HFI--------IFLFTLRCLEWKFGKK------SMRKDPFFSSDVC 1200 1210 1220 1230 1240 1300 1310 1320 1330 1340 pF1KSD RMPVLPE--DQDVADERTRIL-APSPDSLLHTPLIIKE-LSKVYE--------QRVPLLA . : :: :.:: ::.: : . .. . :.:: : : : .: .: CCDS74 QNPEEPEGEDEDVQMERVRTANALNSTNFDEKPVIIASCLRKEYAGKRKGCFSKRKNKIA 1250 1260 1270 1280 1290 1300 1350 1360 1370 1380 1390 1400 pF1KSD VDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGHRISSDVGKVRQRI . .:. :.::: .:::: :::::.:..:..::. . :.:.... : : : . . . CCDS74 TRNVSFCVRKGEVLGLLGHNGAGKSTSIKVITGDTKPTAGQVLLKG----SGGGDALEFL 1310 1320 1330 1340 1350 1410 1420 1430 1440 1450 1460 pF1KSD GYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLVRTYSGG ::::: .:: ..: :. : .:: ..:. . . . . .: :. . .. :.: : : CCDS74 GYCPQENALWPNLTVRQHLEVYAAVKGLRKGDAEVAITRLVDALKLQDQLKSPVKTLSEG 1360 1370 1380 1390 1400 1410 1470 1480 1490 1500 1510 pF1KSD NKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTV-ARARESGKAIIITSHSMEEC :::: ....:.:.:..:::::::::: ... .:... : :.. .. ..:.: : : CCDS74 IKRKLCFVLSILGNPSVVLLDEPSTGMDPEGQQQMWQAIRATFRNTERGALLTTHYMAEA 1420 1430 1440 1450 1460 1470 1520 1530 1540 1550 1560 1570 pF1KSD EALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQEALEEFKAFVDLTFPG ::.: :.::::.:...:.:: ::::::::. : :. ::.. .: : :. : . :: CCDS74 EAVCDRVAIMVSGRLRCIGSIQHLKSKFGKDYLLEMKVKNLAQVEPLH---AEILRLFPQ 1480 1490 1500 1510 1520 1530 1580 1590 1600 1610 1620 1630 pF1KSD SVLEDEHQGMVHYHLPGRDLS-WAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFAHLQ .. ........ :.:: .:.. :..: :::.:... ...::.:: .:::::: ... : CCDS74 AARQERYSSLMVYKLPVEDVQPLAQAFFKLEKVKQSFDLEEYSLSQSTLEQVFLELSKEQ 1540 1550 1560 1570 1580 1590 1640 pF1KSD PPTAEEGR CCDS74 ELGDFEEDFDPSVKWKLLPQEEP 1600 1610 >>CCDS74139.1 ABCA8 gene_id:10351|Hs108|chr17 (1621 aa) initn: 1424 init1: 639 opt: 1033 Z-score: 1229.0 bits: 240.3 E(32554): 3.9e-62 Smith-Waterman score: 1812; 29.1% identity (59.8% similar) in 1531 aa overlap (206-1638:172-1598) 180 190 200 210 220 230 pF1KSD TEGWHTTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVDRAIMEYHADAATRQLF . .:::.:.: :.. ::.: .. .. . CCDS74 GHGMPAKKEHKDHTAHCYETNEDVYCEVSVFWKEGFVALQAAINAAIIEITTNHSVME-- 150 160 170 180 190 240 250 260 270 280 290 pF1KSD QRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIARAVVQEKERRLKEYMR . ..:: : . . ::.. ... : . . .::. . . : . : ....:.: : CCDS74 ELMSVTGKNMKMHSFIGQSGVITDLYLFSCI--ISFS-SFIYYASVNVTRERKRMKALMT 200 210 220 230 240 250 300 310 320 330 340 350 pF1KSD MMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLSRSDPSLVLAFLLCFAI :::: . : .: ::. :..: : :..: : . . .:: .:....: ... CCDS74 MMGLRDSAFWLSWGLLYAGFIFIMALFLAL---VIRSTQFIILS--GFMVVFSLFLLYGL 260 270 280 290 300 310 360 370 380 pF1KSD STISFSFMVSTFFSK----GM-----------------------GIQW-RDLLSP----- : ....:..: . .: :. ...: .:::: CCDS74 SLVALAFLMSILVKKSFLTGLVVFLLTVFWGCLGFTSLYRHLPASLEWILSLLSPFAFML 320 330 340 350 360 370 390 400 410 420 pF1KSD -----VNVDDDF---CF-----GQVLG-----MLLLDSVLYGLVTWYMEAVFPGQFGVPQ ...: :. : :. : :: .:. :: .. :.: ..:...: . CCDS74 GMAQLLHLDYDLNSNAFPHPSDGSNLIVATNFMLAFDTCLYLALAIYFEKILPNEYGHRR 380 390 400 410 420 430 430 440 450 460 470 480 pF1KSD PWYFFIMPSYWCGKPRA--VAGKEEEDSDPEKALRNEYFEAEPE-DLVAGIKIKHLSKVF : ::. :.: .. :: ..: :.:: .... . .: :: . .:.:....: . CCDS74 PPLFFLKSSFWSQTQKTDHVALEDEMDADP--SFHDSFEQAPPEFQGKEAIRIRNVTKEY 440 450 460 470 480 490 500 510 520 530 540 pF1KSD RVGNKDRA-AVRDLNLNLYEGQITVLLGHNGAGKTTTLSMLTGLFPPTSGRAYISGYEIS . :. :. :..:: ...::::::..:::.::::.: :..:.:: ::.: . : . ..: CCDS74 K-GKPDKIEALKDLVFDIYEGQITAILGHSGAGKSTLLNILSGLSVPTKGSVTIYNNKLS 490 500 510 520 530 540 550 560 570 580 590 pF1KSD Q--DMVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKGLSRQKCPEEVKQMLHIIGLED . :. .. : :.::: .. :: ::: :.: ..:..::. :. .:....: . ... CCDS74 EMADLENLSKLTGVCPQSNVQFDFLTVRENLRLFAKIKGILPQEVDKEIQRVLLELEMKN 550 560 570 580 590 600 600 610 620 630 640 650 pF1KSD KWNSRSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSGMDAISRRAIWDLLQRQKSDRTI . .. ::::..:::..:::... ....:::::.:.: .::. .:.::...:.::.: CCDS74 IQDVLAQNLSGGQKRKLTFGIAILGDPQIFLLDEPTAGLDPFSRHQVWNLLKERKTDRVI 610 620 630 640 650 660 660 670 680 690 700 710 pF1KSD VLTTHFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKYGAGYHMTLVKEPHCNPEDISQL ...:.::::::.:.:: .....:.:.: :::::::.:.: :::..: . : :.:..: CCDS74 LFSTQFMDEADILADRKVFLSQGKLKCAGSSLFLKKKWGIGYHLSLQLNEICVEENITSL 670 680 690 700 710 720 720 730 740 750 760 770 pF1KSD VHHHVPNATLESSAGAELSFILPRESTHRFEGLFAKLEKKQKELGIASFGASITTMEEVF :..:.:.: : ... ..: . :: : :..: :. :.. .::: ..:.:.::..::: CCDS74 VKQHIPDAKLSAKSEGKLIYTLPLERTNKFPELYKDLDS-YPDLGIENYGVSMTTLNEVF 730 740 750 760 770 780 780 790 800 810 820 830 pF1KSD LRV-GKLVDSSMDIQAIQLPALQYQHERRASDWAVDSNLCGAMDPSDGIGALIEEERTAV :.. :: . . :: . . : :. : :.. :. . . ... : .. CCDS74 LKLEGKSTINESDIAILG----EVQAEK-----ADDTERLVEMEQ---VLSSLNKMRKTI 790 800 810 820 830 840 850 860 870 880 890 pF1KSD KLNTGLALHCQQFWAMFLKKAAYSWREWKMVAAQVLVPLTCVTLALLAINYSSELFDDPM :.:: ::. :. . .: : . : .:. :.: .. : . : CCDS74 G---GVALWRQQICAIARVRLLKLKHERKALLALLLI--------LMA-GFCPLLVEYTM 840 850 860 870 880 900 910 920 930 940 950 pF1KSD LRLTLGEYGRTVVPFSVPGTSQLGQQLSEHLKDALQAEGQEPREVLGDLEEFLIFRASVE ... . : .:: :: . : ::.:.. : .: ..: .... CCDS74 VKIYQNSYT---------------WELSPHLY--FLAPGQQPHDPLTQL--LIINKTGAS 890 900 910 920 960 970 980 990 1000 pF1KSD GGGFN---ERCLVAASFRDVGERTVVNALFNNQAYHSPATALAVVDNLLFKLLCG----- : :. .: : :. .. . .:.. :. : :.: :. CCDS74 IDDFIQSVEHQNIALEVDAFGTRNGTD----DPSYNGAITVCCNEKNYSFSLACNAKRLN 930 940 950 960 970 980 1010 1020 1030 1040 1050 1060 pF1KSD --PHASIVVSN----FPQPRSALQAAKDQFNEGRKGFDIAL--NLLFAMAFLASTFSILA : .::: . .: ... .. : :. . :.. ..: ... .: .: CCDS74 CFPVLMDIVSNGLLGMVKPSVHIRTERSTFLENGQDNPIGFLAYIMFWLVLTSSCPPYIA 990 1000 1010 1020 1030 1040 1070 1080 1090 1100 1110 pF1KSD VS---ERAVQAKHVQFVSGVHVASFWLSALLWDL-ISFLIPSLLLLVVF-KAFDVRAFTR .: . .:. .::. ...:.. : :. . ::. .. :. . . :. .: CCDS74 MSSIDDYKNRARSQLRISGLSPSAYWFGQALVDVSLYFLVFVFIYLMSYISNFEDMLLTI 1050 1060 1070 1080 1090 1100 1120 1130 1140 1150 1160 1170 pF1KSD DGHMADTLLLLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSGIATF--LMVTIMR :. . . . :....: . :...:.: : : ::: .: .::.. CCDS74 I-HIIQ-IPCAVGYSFSLIFMTYVISFIF--------RKGRKN--SGIWSFCFYVVTVFS 1110 1120 1130 1140 1180 1190 1200 1210 1220 1230 pF1KSD IP--AVKLEELSKTLDHVFLVLPNHCLGMAVSSFYENYETRRYCTSSEVAAHYCKKYNIQ . : .. : . . .::. : .: : . . . :: .....: CCDS74 VAGFAFSIFESDIPFIFTFLIPPATMIGCLFLSSHLLFSS----LFSE------ERMDVQ 1150 1160 1170 1180 1190 1240 1250 1260 1270 1280 1290 pF1KSD YQENFYAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQR-LRGILCALRRRRTLTELY : .. : . .:. .:. : .: .. .. .: . : . CCDS74 ---PFLVFLIPFL-HFI--------IFLFTLRCLEWKFGKKSMRKD--PFFRISPRSSDV 1200 1210 1220 1230 1240 1300 1310 1320 1330 pF1KSD TRMPVLPE--DQDVADERTRIL-APSPDSLLHTPLIIKE-LSKVYE--------QRVPLL . : :: :.:: ::.: : . .. . :.:: : : : .: . CCDS74 CQNPEEPEGEDEDVQMERVRTANALNSTNFDEKPVIIASCLRKEYAGKRKGCFSKRKNKI 1250 1260 1270 1280 1290 1300 1340 1350 1360 1370 1380 1390 pF1KSD AVDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGHRISSDVGKVRQR :. .:. :.::: .:::: :::::.:..:..::. . :.:.... : : : . . CCDS74 ATRNVSFCVRKGEVLGLLGHNGAGKSTSIKVITGDTKPTAGQVLLKG----SGGGDALEF 1310 1320 1330 1340 1350 1360 1400 1410 1420 1430 1440 1450 pF1KSD IGYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLVRTYSG .::::: .:: ..: :. : .:: ..:. . . . . .: :. . .. :.: : CCDS74 LGYCPQENALWPNLTVRQHLEVYAAVKGLRKGDAEVAITRLVDALKLQDQLKSPVKTLSE 1370 1380 1390 1400 1410 1420 1460 1470 1480 1490 1500 1510 pF1KSD GNKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTV-ARARESGKAIIITSHSMEE : :::: ....:.:.:..:::::::::: ... .:... : :.. .. ..:.: : : CCDS74 GIKRKLCFVLSILGNPSVVLLDEPSTGMDPEGQQQMWQAIRATFRNTERGALLTTHYMAE 1430 1440 1450 1460 1470 1480 1520 1530 1540 1550 1560 1570 pF1KSD CEALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQEALEEFKAFVDLTFP ::.: :.::::.:...:.:: ::::::::. : :. ::.. .: : :. : . :: CCDS74 AEAVCDRVAIMVSGRLRCIGSIQHLKSKFGKDYLLEMKVKNLAQVEPLH---AEILRLFP 1490 1500 1510 1520 1530 1580 1590 1600 1610 1620 1630 pF1KSD GSVLEDEHQGMVHYHLPGRDLS-WAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFAHL .. ........ :.:: .:.. :..: :::.:... ...::.:: .:::::: ... CCDS74 QAARQERYSSLMVYKLPVEDVQPLAQAFFKLEKVKQSFDLEEYSLSQSTLEQVFLELSKE 1540 1550 1560 1570 1580 1590 1640 pF1KSD QPPTAEEGR : CCDS74 QELGDFEEDFDPSVKWKLLPQEEP 1600 1610 1620 >>CCDS11681.1 ABCA9 gene_id:10350|Hs108|chr17 (1624 aa) initn: 1455 init1: 641 opt: 1011 Z-score: 1202.5 bits: 235.4 E(32554): 1.2e-60 Smith-Waterman score: 1875; 29.2% identity (58.7% similar) in 1736 aa overlap (1-1638:6-1601) 10 20 30 40 50 pF1KSD MAVLRQLALLLWKNYTLQKRKVLVTVLELFLPLLFSGILIWLRLKIQSENVPNAT :.: .: :: :: :.: .. .: : ::: .:. : : . :. .. CCDS11 MSKRRMSVGQQTWALLCKN-CLKKWRMKRQTL---LEWLFSFLLV-LFLYLFFSNLHQVH 10 20 30 40 50 60 70 80 90 100 110 pF1KSD IYPGQSIQELPLFFTFPPPGDT-WELAYIPSHSDAAKTVTETVRRALVINMR-VRGFPSE : .: ..: .: .:: . .:. : .: ... . . : : .. : . :.:.: CCDS11 DTPQMSSMDLGRVDSF---NDTNYVIAFAP-ESKTTQEIMNKVASAPFLKGRTIMGWPDE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD KDFEDYIRYDNCSSSVLAA-VVFEHPFNHSKEPLPLAVKYHLRFSYTRRNYMWTQTGSFF :.... . . :. :. :.: :. :::.::. .: : CCDS11 KSMDEL----DLNYSIDAVRVIFTDTFS-----------YHLKFSWGHRIPM-------- 120 130 140 180 190 200 210 220 230 pF1KSD LKETEGWHTTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVDRAIMEYHADAATR .:: . :.. . : . .:.: . ..::.: : :.. ::.: .. .. CCDS11 MKEHRD-HSAHC------QAVNEKMKCEGSE--FWEKGFVAFQAAINAAIIEIATNHSVM 150 160 170 180 190 240 250 260 270 280 290 pF1KSD QLFQRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIARAVVQEKERRLKE . : ..:: .. ::.:. :: .. . .. ..::. .. :.::.. . CCDS11 E--QLMSVTGVHMKILPFVAQGG-VATDF-FIFFCIISFSTFIYYVSVNVTQERQY-ITS 200 210 220 230 240 250 300 310 320 330 340 350 pF1KSD YMRMMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLSRSDPSLVLAFLLC : :::: : .: :.. :.:: :..:.:. :: . ...::. .:....: CCDS11 LMTMMGLRESAFWLSWGLMYAGFILIMATLMALI--VK-SAQIVVLT--GFVMVFTLFLL 260 270 280 290 300 360 370 380 pF1KSD FAISTISFSFMVSTFFSK----GM---------GI--------------QWRD-LLSP-- ...: :...:..:....: :. :: .: :::: CCDS11 YGLSLITLAFLMSVLIKKPFLTGLVVFLLIVFWGILGFPALYTRLPAFLEWTLCLLSPFA 310 320 330 340 350 360 390 400 410 420 pF1KSD --------VNVDDD-------------FCFGQVLGMLLLDSVLYGLVTWYMEAVFPGQFG ...: : . . .: ::..:..:: ..: :.. ..:...: CCDS11 FTVGMAQLIHLDYDVNSNAHLDSSQNPYLIIATLFMLVFDTLLYLVLTLYFDKILPAEYG 370 380 390 400 410 420 430 440 450 460 470 pF1KSD VPQPWYFFIMPSYWCGKPRA--VAGKEEEDSDPEKALRNEYFEAEPEDLVA--GIKIKHL ::. .: . :: :. ..: :::: :. :: .. . .:.::.: CCDS11 HRCSPLFFLKSCFWFQHGRANHVVLENETDSDPTP---NDCFEPVSPEFCGKEAIRIKNL 430 440 450 460 470 480 480 490 500 510 520 530 pF1KSD SKVFRVGNKDRA-AVRDLNLNLYEGQITVLLGHNGAGKTTTLSMLTGLFPPTSGRAYISG .: . .:. .:. :.. . ...::::::.::::.:::::: :..:.:: :::: . . . CCDS11 KKEY-AGKCERVEALKGVVFDIYEGQITALLGHSGAGKTTLLNILSGLSVPTSGSVTVYN 490 500 510 520 530 540 540 550 560 570 580 590 pF1KSD YEISQ--DMVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKGLSRQKCPEEVKQMLHII . .:. :. .: : :.::: .. : ::: :.: ..:..::. .. .::..... . CCDS11 HTLSRMADIENISKFTGFCPQSNVQFGFLTVKENLRLFAKIKGILPHEVEKEVQRVVQEL 550 560 570 580 590 600 600 610 620 630 640 650 pF1KSD GLEDKWNSRSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSGMDAISRRAIWDLLQRQKS .:. . .. ::::. :::..:::... .::.:::::.:.: .::. ::.::.. :: CCDS11 EMENIQDILAQNLSGGQNRKLTFGIAILGDPQVLLLDEPTAGLDPLSRHRIWNLLKEGKS 610 620 630 640 650 660 660 670 680 690 700 710 pF1KSD DRTIVLTTHFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKYGAGYHMTLVKEPHCNPED ::.:...:.:.::::.:.:: .....:.:.: :::::::.:.: :::..: . .:.::. CCDS11 DRVILFSTQFIDEADILADRKVFISNGKLKCAGSSLFLKKKWGIGYHLSLHLNERCDPES 670 680 690 700 710 720 720 730 740 750 760 770 pF1KSD ISQLVHHHVPNATLESSAGAELSFILPRESTHRFEGLFAKLEKKQKELGIASFGASITTM :..::..:. .: : ... .: .::: : :..: :. :.. ... :: ..:.::::. CCDS11 ITSLVKQHISDAKLTAQSEEKLVYILPLERTNKFPELYRDLDRCSNQ-GIEDYGVSITTL 730 740 750 760 770 780 780 790 800 810 820 830 pF1KSD EEVFLRV-GKLVDSSMDIQAIQLPALQYQHERRASDWAVDSNLCGAMDPSDGIGALIEEE .::::.. :: :..: . : . . : : .: : : :.. . . . ..: CCDS11 NEVFLKLEGK---STIDESDIGIWG-QLQ-----TDGAKD---IGSLVELEQVLSSFHET 790 800 810 820 830 840 850 860 870 880 pF1KSD RTAVKLNTGLALHCQQFWAM----FLKKAAYSWREWKMVAAQVLVPLTCVTLALLAINYS : .. .:.:: :: :. ::: : .. .: .. . : . : CCDS11 RKTI---SGVALWRQQVCAIAKVRFLKLKKERKSLWTIL---LLFGISFIPQLLEHLFYE 840 850 860 870 880 890 900 910 920 930 940 pF1KSD SELFDDPMLRLTLGEYGRTVVPFSVPGTSQLGQQLSEHLKDALQAEGQEPREVLGDLE-- : . : .:. . : : :: : :. :: ... :. . : .:. CCDS11 SYQKSYPW-ELSPNTY------FLSPG--QQPQDPLTHLL-VINKTGSTIDNFLHSLRRQ 890 900 910 920 930 950 960 970 980 990 1000 pF1KSD ----EFLIF--RASVEGGGFNERCLVAASFRDVGERTVVNALFNNQAYHSPATALAVVDN : : : ... ..: .:... .: .: . :.. . . : :..: CCDS11 NIAIEVDAFGTRNGTDDPSYNGAIIVSGDEKD--HRFSIAC--NTKRLNCFPVLLDVISN 940 950 960 970 980 990 1010 1020 1030 1040 1050 1060 pF1KSD LLFKLLCGPHASIVVSNFPQPRSALQAAKDQFNEGRKGFDIALNLLFAMAFLASTFSILA :. .. . . .. ::.. . ... : .. : .: . . :: .: CCDS11 GLLGIFNSSE------HIQTDRSTFFEEHMDYEYGYRS-----NTFFWIPMAASFTPYIA 1000 1010 1020 1030 1040 1070 1080 1090 1100 1110 pF1KSD VSERAVQAK--HVQF-VSGVHVASFWLSALLWDLISFLIPSLLLLVVFKAFDVRAFTRDG .: . : : :. .::.. ...:.. : :. ... ::. .. :. . . CCDS11 MSSIGDYKKKAHSQLRISGLYPSAYWFGQALVDVSLYFLILLLMQIMDYIFSPEEII--- 1050 1060 1070 1080 1090 1120 1130 1140 1150 1160 1170 pF1KSD HMADTLLLLLL----YGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSGIATFLMVTIMR . ..::. .: : ... : :...:.: .. ..: ::.:.:. CCDS11 FIIQNLLIQILCSIGYVSSLVFLTYVISFIFRNGRKNSGIWSFF--------FLIVVIFS 1100 1110 1120 1130 1140 1150 1180 1190 1200 1210 1220 1230 pF1KSD IPAVKLEELSKTLDHVF--LVLPNHCLGMAVSSFYE-NYETRRYCTSSEVAAHYCKKYNI : :. :.: . : : ...: : .. : : . .. : .:: : CCDS11 IVATDLNEYG-FLGLFFGTMLIPPFTLIGSLFIFSEISPDSMDYLGASESEIVY------ 1160 1170 1180 1190 1200 1240 1250 1260 1270 1280 1290 pF1KSD QYQENFYAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQRLRGILCALRRRRTLTELY : : . .. .:..: .: : ..: ..: . .. CCDS11 ------LALLIPYLHFLI---------FLFILRCLEMNCRKKLMRKDPVFRISPRSNAIF 1210 1220 1230 1240 1300 1310 1320 1330 pF1KSD TRMPVLPE--DQDVADERTRIL-APSPDSLLHTPLII-----KELS----KVYEQRVPLL : :: ..:. :: : . : . .. .::.:: :: . . . .: . CCDS11 PN-PEEPEGEEEDIQMERMRTVNAMAVRDFDETPVIIASCLRKEYAGKKKNCFSKRKKKI 1250 1260 1270 1280 1290 1300 1340 1350 1360 1370 1380 1390 pF1KSD AVDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGHRISSDVGKVRQR :. .:. :.::: .:::: :::::.::.::.::. . :.:.... : : :. CCDS11 ATRNVSFCVKKGEVIGLLGHNGAGKSTTIKMITGDTKPTAGQVILKG----SGGGEPLGF 1310 1320 1330 1340 1350 1360 1400 1410 1420 1430 1440 1450 pF1KSD IGYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLVRTYSG .::::: .:: ..: :. : .:: ..:. . . . .: :. . . :.: : CCDS11 LGYCPQENALWPNLTVRQHLEVYAAVKGLRKGDAMIAITRLVDALKLQDQLKAPVKTLSE 1370 1380 1390 1400 1410 1420 1460 1470 1480 1490 1500 1510 pF1KSD GNKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTV-ARARESGKAIIITSHSMEE : :::: ....:.:.:..:::::::::: ... .:... : :.. .. ..:.: : : CCDS11 GIKRKLCFVLSILGNPSVVLLDEPSTGMDPEGQQQMWQVIRATFRNTERGALLTTHYMAE 1430 1440 1450 1460 1470 1480 1520 1530 1540 1550 1560 1570 pF1KSD CEALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQEALEEFKAFVDLTFP ::.: :.::::.:...:.:: ::::::::. : :. :... .:.: : .: . :: CCDS11 AEAVCDRVAIMVSGRLRCIGSIQHLKSKFGKDYLLEMKLKNLAQMEPL---HAEILRLFP 1490 1500 1510 1520 1530 1540 1580 1590 1600 1610 1620 1630 pF1KSD GSVLEDEHQGMVHYHLPGRDLS-WAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFAHL .. ... .... :.:: .:. ...: :: .:... ...::.:: .:::::: ... CCDS11 QAAQQERFSSLMVYKLPVEDVRPLSQAFFKLEIVKQSFDLEEYSLSQSTLEQVFLELSKE 1550 1560 1570 1580 1590 1600 1640 pF1KSD QPPTAEEGR : CCDS11 QELGDLEEDFDPSVKWKLLLQEEP 1610 1620 >>CCDS47584.1 ABCA13 gene_id:154664|Hs108|chr7 (5058 aa) initn: 1919 init1: 642 opt: 1017 Z-score: 1202.1 bits: 237.0 E(32554): 1.2e-60 Smith-Waterman score: 2519; 32.0% identity (60.8% similar) in 1659 aa overlap (127-1641:3456-5039) 100 110 120 130 140 150 pF1KSD VRRALVINMRVRGFPSEKDFEDYIRYDNCSSSVLAAVVFEHPFNHSKEPLPLAVKYHLRF .: ::...: . . .:. .:: . CCDS47 NLSSCVALNRFQALQSVDILETKAHELLQQNSFLASIIFSNSL-FDKNFRSESVKLPPHV 3430 3440 3450 3460 3470 3480 160 170 180 190 200 210 pF1KSD SYT-RRNYMWTQTGSFFLKETEGWHTTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQ ::: : : ... . . .. .:. . :. : :: . .:. : .: CCDS47 SYTIRTNVLYSVRTD--VVKNPSWK------FHPQNLP-----ADGFKYNYV---FAPLQ 3490 3500 3510 3520 220 230 240 250 260 270 pF1KSD HAVDRAIMEYHADAATRQLFQRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTA ..:::. . : : . .. . ::: .: :: . . .::...:.. .. CCDS47 DMIERAIILVQ----TGQEALEPAAQTQAAPYPCHTSDLFLNNVGFFFPLIMMLTWMVSV 3530 3540 3550 3560 3570 3580 280 290 300 310 pF1KSD LTIARAVVQEKERRLKEYMRMMGLSSWLHWSAWFL------------------------- ...: .: :.: ...:::::::. .:. :::: CCDS47 ASMVRKLVYEQEIQIEEYMRMMGVHPVIHFLAWFLENMAVLTISSATLAIVLKTSGIFAH 3590 3600 3610 3620 3630 3640 320 330 340 pF1KSD ----LFFLFLL------IAASFM---------------TLLFCVKVKPNVAVLSRSDP-S . ::::: . :.. .:.. .. : ...: . : CCDS47 SNTFIVFLFLLDFGMSVVMLSYLLSAFFSQANTAALCTSLVYMISFLPYIVLLVLHNQLS 3650 3660 3670 3680 3690 3700 350 360 370 380 390 400 pF1KSD LVLAFLLCFAISTISFS---FMVSTFFSKGMGIQWRDLLSPVNVDDDFCFGQVLGMLLLD .: .::. .:: .:. :... . .. :::: .. . .. . . :: : :.:.: CCDS47 FVNQTFLCL-LSTTAFGQGVFFITFLEGQETGIQWNNMYQALE-QGGMTFGWVCWMILFD 3710 3720 3730 3740 3750 3760 410 420 430 440 450 pF1KSD SVLYGLVTWYMEAVFPGQFGVPQPWYFFIMPSYWCGKPRAVAGKE----------EEDSD : :: : ::. ..:: ::. .:::: . ::: . : .. .:. : CCDS47 SSLYFLCGWYLSNLIPGTFGLRKPWYFPFTASYWKSVGFLVEKRQYFLSSSLFFFNENFD 3770 3780 3790 3800 3810 3820 460 470 480 490 500 510 pF1KSD PE-KALRNEYFEAEPEDLVAGIKIKHLSKVFRVGNKDRAAVRDLNLNLYEGQITVLLGHN . ..:.:. :.: : . :. . ..: .. :.: :.:.::.:..:. :::.::: : CCDS47 NKGSSLQNR--EGELEGSAPGVTLVSVTKEYE-GHK--AVVQDLSLTFYRDQITALLGTN 3830 3840 3850 3860 3870 520 530 540 550 560 570 pF1KSD GAGKTTTLSMLTGLFPPTSGRAYISGYEISQDMVQIRKSLGLCPQHDILFDNLTVAEHLY :::::: .:::::: ::::: :.: ... :. ..: ::.:::.:::.::::: ::: CCDS47 GAGKTTIISMLTGLHPPTSGTIIINGKNLQTDLSRVRMELGVCPQQDILLDNLTVREHLL 3880 3890 3900 3910 3920 3930 580 590 600 610 620 pF1KSD FYAQLKG--LSRQKCPEEVKQMLHIIGLEDKWNSRSRFLSGGMRRKLSIGIALIAGSKVL ..:..:. .... ..:.: :. . : .. ....: ::::..::::.:::... :... CCDS47 LFASIKAPQWTKKELHQQVNQTLQDVDLTQHQHKQTRALSGGLKRKLSLGIAFMGMSRTV 3940 3950 3960 3970 3980 3990 630 640 650 660 670 680 pF1KSD ILDEPTSGMDAISRRAIWDLLQRQKSDRTIVLTTHFMDEADLLGDRIAIMAKGELQCCGS .:::::::.: ::...::.: . . :::..::: .:::. :.::.:.. .:.:.::: CCDS47 VLDEPTSGVDPCSRHSLWDILLKYREGRTIIFTTHHLDEAEALSDRVAVLQHGRLRCCGP 4000 4010 4020 4030 4040 4050 690 700 710 720 730 740 pF1KSD SLFLKQKYGAGYHMTLVKEPHC-NPED------ISQLVHHHVPNATLESSAGAELSFILP . ::. :: : ..::...: . .: ...:.. ..:.: :..:.:.::.. .: CCDS47 PFCLKEAYGQGLRLTLTRQPSVLEAHDLKDMACVTSLIKIYIPQAFLKDSSGSELTYTIP 4060 4070 4080 4090 4100 4110 750 760 770 780 790 800 pF1KSD RESTHR-FEGLFAKLEKKQKELGIASFGASITTMEEVFLRVGKLVDSSMDIQAIQLPALQ ... . ..::: :... ..: ....: : ::.::::: . : ::. . . CCDS47 KDTDKACLKGLFQALDENLHQLHLTGYGISDTTLEEVFLML--LQDSNKKSHIALGTESE 4120 4130 4140 4150 4160 4170 810 820 830 840 850 860 pF1KSD YQHERRASDWAVDSNLCGAMDPSDGIGALIEEERTAVKLNTGLALHCQQFWAMFLKKAAY :..: .. :. ::.. : :. :. : : :.. .. CCDS47 LQNHRPTGHL---SGYCGSL------------ARPATV--QGVQLLRAQVAAILARRLRR 4180 4190 4200 4210 870 880 890 900 910 920 pF1KSD SWREWKMVAAQVLVPLTCVTLALLAINYSSELFDDPMLRLTLGEYGRTVVPFSVPGTSQL . : : . :..:.:. :.::. . . : :::: :.: :. . : : ..: CCDS47 TLRAGKSTLADLLLPVLFVALAMGLFMVRPLATEYPPLRLTPGHYQRAETYFFSSGGDNL 4220 4230 4240 4250 4260 4270 930 940 950 pF1KSD G--QQLSEHLKDA-LQAEGQEPRE------------------VLGDLE--------EFL- . : ....: : .::. : :. .: CCDS47 DLTRVLLRKFRDQDLPCADLNPRQKNSSCWRTDPFSHPEFQDSCGCLKCPNRSASAPYLT 4280 4290 4300 4310 4320 4330 960 970 980 pF1KSD --IFRASVEGGGFN-ERCLVAASFR------DVGER----------------TVVNALFN . .. .. .::: :. :.: : . . : . :.... .: CCDS47 NHLGHTLLNLSGFNMEEYLLAPSEKPRLGGWSFGLKIPSEAGGANGNISKPPTLAKVWYN 4340 4350 4360 4370 4380 4390 990 1000 1010 1020 1030 1040 pF1KSD NQAYHSPATALAVVDNLLFKLLCGPHAS---IVVSNFPQPRSALQAAKDQFNEGRKGFDI ....:: . : ..::.. : .. .. . .: .. .:.. :. . . CCDS47 QKGFHSLPSYLNHLNNLILWQHLPPTVDWRQYGITLYSHPYGGALLNEDKILESIRQCGV 4400 4410 4420 4430 4440 4450 1050 1060 1070 1080 1090 1100 pF1KSD ALNLLFAMAFLASTFSILAVSERAVQAKHVQFVSGVHVASFWLSALLWDLISFLIPSLLL :: .......:..... .: .:.. ::..: .::. .:.. .:.:.. .:. : CCDS47 ALCIVLGFSILSASIGSSVVRDRVIGAKRLQHISGLGYRMYWFTNFLYDMLFYLVSVCLC 4460 4470 4480 4490 4500 4510 1110 1120 1130 1140 1150 1160 pF1KSD LVVFKAFDVRAFTRDGHMADTLLLLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILS ..:. ::.. ::: ..: : ::: :.:.: .: ::::. .: .. .:. . .:.. CCDS47 VAVIVAFQLTAFTFRKNLAATALLLSLFGYATLPWMYLMSRIFSSSDVAFISYVSLNFIF 4520 4530 4540 4550 4560 4570 1170 1180 1190 1200 1210 pF1KSD GIATFLMVTIMRIPAV-----KLEELSKTLDHVFLVLPNHCLGMAVSSFYENYETRRYCT :. :.:.. . :. :. .:... .: :: ..:. :::... . :. .: CCDS47 GLCTMLITIMPRLLAIISKAKNLQNIYDVLKWVFTIFPQFCLGQGLVEL--CYNQIKYDL 4580 4590 4600 4610 4620 4630 1220 1230 1240 1250 1260 1270 pF1KSD SSEVAAHYCKKYNIQYQENFYAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQRLRGI . . . .: .. :: .: :: ..:..: . :.: :.. .::. :: CCDS47 THNFGI---DSYVSPFEMNFLGWI------FV-QLASQGTVLLLLRVLLHWDLLRWPRG- 4640 4650 4660 4670 4680 1280 1290 1300 1310 1320 1330 pF1KSD LCALRRRRTLTELYTRMPVLPEDQDVADERTRILAPSPDSLLHTPLIIKELSKVYEQRVP . :: .: :: :. :.. .. . :.. .::: :.. CCDS47 ------HSTLQGTVKS----SKDTDVEKEEKRVFEGRTNGDI---LVLYNLSKHYRRFFQ 4690 4700 4710 4720 4730 1340 1350 1360 1370 1380 1390 pF1KSD -LLAVDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVG---GHRIS-SD ..::. .::.. ::::::::: :::::.::::::.:: ::::: :.. : .. :. CCDS47 NIIAVQDISLGIPKGECFGLLGVNGAGKSTTFKMLNGEVSLTSGHAIIRTPMGDAVDLSS 4740 4750 4760 4770 4780 4790 1400 1410 1420 1430 1440 1450 pF1KSD VGKVRQRIGYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANK .: . :::::: ::: . .:: : : .: :::::.. : . . .: : :: ::.: CCDS47 AGTAGVLIGYCPQQDALDELLTGWEHLYYYCSLRGIPRQCIPEVAGDLIRRLHLEAHADK 4800 4810 4820 4830 4840 4850 1460 1470 1480 1490 1500 1510 pF1KSD LVRTYSGGNKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTVARARESGKAIIIT : :::::.::::::..::.:.: ...:::::.:::: ..: ::.:. . . : : ..: CCDS47 PVATYSGGTKRKLSTALALVGKPDILLLDEPSSGMDPCSKRYLWQTIMKEVREGCAAVLT 4860 4870 4880 4890 4900 4910 1520 1530 1540 1550 1560 1570 pF1KSD SHSMEECEALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQEALEEFKAF ::::::::::::::::::.:.:::::::::.:..::.::.... . .:..:. . CCDS47 SHSMEECEALCTRLAIMVNGSFKCLGSPQHIKNRFGDGYTVKVWLCKEANQHCT--VSDH 4920 4930 4940 4950 4960 4970 1580 1590 1600 1610 1620 1630 pF1KSD VDLTFPGSVLEDEHQGMVHYHLPGRDLSWAKVFGILEKAKEKYGVDDYSVSQISLEQVFL . : ::: .. .: ....::.: : : .: ..:. : .. ::..: .:::::. CCDS47 LKLYFPGIQFKGQHLNLLEYHVPKRWGCLADLFKVIENNKTFLNIKHYSINQTTLEQVFI 4980 4990 5000 5010 5020 5030 1640 pF1KSD SFAHLQPPTAEEGR .:: : : CCDS47 NFASEQQQTLQSTLDPSTDSHHTHHLPI 5040 5050 1646 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 08:30:44 2016 done: Thu Nov 3 08:30:45 2016 Total Scan time: 4.940 Total Display time: 1.300 Function used was FASTA [36.3.4 Apr, 2011]