FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1062, 2435 aa 1>>>pF1KA1062 2435 - 2435 aa - 2435 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.9765+/-0.00102; mu= 14.3879+/- 0.062 mean_var=150.5154+/-30.214, 0's: 0 Z-trim(109.5): 63 B-trim: 117 in 1/51 Lambda= 0.104540 statistics sampled from 10905 (10967) to 10905 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.662), E-opt: 0.2 (0.337), width: 16 Scan time: 7.900 The best scores are: opt bits E(32554) CCDS43909.1 ABCA2 gene_id:20|Hs108|chr9 (2436) 16186 2454.5 0 CCDS6762.1 ABCA1 gene_id:19|Hs108|chr9 (2261) 2484 388.0 2.9e-106 CCDS747.1 ABCA4 gene_id:24|Hs108|chr1 (2273) 2288 358.4 2.3e-97 CCDS12055.1 ABCA7 gene_id:10347|Hs108|chr19 (2146) 2207 346.2 1e-93 CCDS47584.1 ABCA13 gene_id:154664|Hs108|chr7 (5058) 1627 258.9 4.6e-67 CCDS33373.1 ABCA12 gene_id:26154|Hs108|chr2 (2277) 1396 223.9 7.3e-57 CCDS33372.1 ABCA12 gene_id:26154|Hs108|chr2 (2595) 1396 223.9 8.1e-57 CCDS10466.1 ABCA3 gene_id:21|Hs108|chr16 (1704) 1139 185.0 2.7e-45 CCDS11685.1 ABCA5 gene_id:23461|Hs108|chr17 (1642) 722 122.1 2.2e-26 CCDS74138.1 ABCA8 gene_id:10351|Hs108|chr17 (1616) 718 121.5 3.3e-26 CCDS74139.1 ABCA8 gene_id:10351|Hs108|chr17 (1621) 718 121.5 3.3e-26 CCDS11684.1 ABCA10 gene_id:10349|Hs108|chr17 (1543) 707 119.9 1e-25 CCDS11681.1 ABCA9 gene_id:10350|Hs108|chr17 (1624) 691 117.5 5.6e-25 CCDS11683.1 ABCA6 gene_id:23460|Hs108|chr17 (1617) 660 112.8 1.4e-23 >>CCDS43909.1 ABCA2 gene_id:20|Hs108|chr9 (2436 aa) initn: 15849 init1: 15849 opt: 16186 Z-score: 13189.2 bits: 2454.5 E(32554): 0 Smith-Waterman score: 16186; 99.8% identity (100.0% similar) in 2436 aa overlap (1-2435:1-2436) 10 20 30 40 50 pF1KA1 MGFLHQLQLLLWKNVTLKRRSPWVLAFEIFIPLVLFFILLGLRQKKPTISVKE-AFYTAA ::::::::::::::::::::::::::::::::::::::::::::::::::::: .::::: CCDS43 MGFLHQLQLLLWKNVTLKRRSPWVLAFEIFIPLVLFFILLGLRQKKPTISVKEVSFYTAA 10 20 30 40 50 60 60 70 80 90 100 110 pF1KA1 PLTSAGILPVMQSLCPDGQRDEFGFLQYANSTVTQLLERLDRVVEEGNLFDPARPSLGSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PLTSAGILPVMQSLCPDGQRDEFGFLQYANSTVTQLLERLDRVVEEGNLFDPARPSLGSE 70 80 90 100 110 120 120 130 140 150 160 170 pF1KA1 LEALRQHLEALSAGPGTSGSHLDRSTVSSFSLDSVARNPQELWRFLTQNLSLPNSTAQAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LEALRQHLEALSAGPGTSGSHLDRSTVSSFSLDSVARNPQELWRFLTQNLSLPNSTAQAL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KA1 LAARVDPPEVYHLLFGPSSALDSQSGLHKGQEPWSRLGGNPLFRMEELLLAPALLEQLTC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LAARVDPPEVYHLLFGPSSALDSQSGLHKGQEPWSRLGGNPLFRMEELLLAPALLEQLTC 190 200 210 220 230 240 240 250 260 270 280 290 pF1KA1 TPGSGELGRILTVPESQKGALQGYRDAVCSGQAAARARRFSGLSAELRNQLDVAKVSQQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 TPGSGELGRILTVPESQKGALQGYRDAVCSGQAAARARRFSGLSAELRNQLDVAKVSQQL 250 260 270 280 290 300 300 310 320 330 340 350 pF1KA1 GLDAPNGSDSSPQAPPPRRLQALLGDLLDAQKVLQDVDVLSALALLLPQGACTGRTPGPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GLDAPNGSDSSPQAPPPRRLQALLGDLLDAQKVLQDVDVLSALALLLPQGACTGRTPGPP 310 320 330 340 350 360 360 370 380 390 400 410 pF1KA1 ASGAGGAANGTGAGAVMGPNATAEEGAPSAAALATPDTLQGQCSAFVQLWAGLQPILCGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ASGAGGAANGTGAGAVMGPNATAEEGAPSAAALATPDTLQGQCSAFVQLWAGLQPILCGN 370 380 390 400 410 420 420 430 440 450 460 470 pF1KA1 NRTIEPEALRRGNMSSLGFTSKEQRNLGLLVHLMTSNPKILYAPAGSEVDRVILKANETF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 NRTIEPEALRRGNMSSLGFTSKEQRNLGLLVHLMTSNPKILYAPAGSEVDRVILKANETF 430 440 450 460 470 480 480 490 500 510 520 530 pF1KA1 AFVGNVTHYAQVWLNISAKIRSFLEQGRLQQHLRWLQQYVAELRLHPEALNLSLDELPPA ::::::::::::::::::.::::::::::::::::::::::::::::::::::::::::: CCDS43 AFVGNVTHYAQVWLNISAEIRSFLEQGRLQQHLRWLQQYVAELRLHPEALNLSLDELPPA 490 500 510 520 530 540 540 550 560 570 580 590 pF1KA1 LRQDNFSLPSGMALLQQLDTIDNAACGWIQFMSKVSVDIFKGFPDEESIVNYTLNQAYQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LRQDNFSLPSGMALLQQLDTIDNAACGWIQFMSKVSVDIFKGFPDEESIVNYTLNQAYQD 550 560 570 580 590 600 600 610 620 630 640 650 pF1KA1 NVTVFASVIFQTRKDGSLPPHVHYKIRQNSSFTEKTNEIRRAYWRPGPNTGGRFYFLYGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 NVTVFASVIFQTRKDGSLPPHVHYKIRQNSSFTEKTNEIRRAYWRPGPNTGGRFYFLYGF 610 620 630 640 650 660 660 670 680 690 700 710 pF1KA1 VWIQDMMERAIIDTFVGHDVVEPGSYVQMFPYPCYTRDDFLFVIEHMMPLCMVISWVYSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VWIQDMMERAIIDTFVGHDVVEPGSYVQMFPYPCYTRDDFLFVIEHMMPLCMVISWVYSV 670 680 690 700 710 720 720 730 740 750 760 770 pF1KA1 AMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVTALTAILKYGQVLMH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 AMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVTALTAILKYGQVLMH 730 740 750 760 770 780 780 790 800 810 820 830 pF1KA1 SHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREEVAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREEVAH 790 800 810 820 830 840 840 850 860 870 880 890 pF1KA1 DKITAFEKCIASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQSPVEGDDFNLLLAVTML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 DKITAFEKCIASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQSPVEGDDFNLLLAVTML 850 860 870 880 890 900 900 910 920 930 940 950 pF1KA1 MVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTPRLSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTPRLSV 910 920 930 940 950 960 960 970 980 990 1000 1010 pF1KA1 MEEDQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKVYKDDKKLALNKLSLNLYENQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MEEDQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKVYKDDKKLALNKLSLNLYENQV 970 980 990 1000 1010 1020 1020 1030 1040 1050 1060 1070 pF1KA1 VSFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRTEMDEIRKNLGMCPQHNVLFDRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VSFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRTEMDEIRKNLGMCPQHNVLFDRL 1030 1040 1050 1060 1070 1080 1080 1090 1100 1110 1120 1130 pF1KA1 TVEEHLWFYSRLKSMAQEEIRREMDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAIAFVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 TVEEHLWFYSRLKSMAQEEIRREMDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAIAFVG 1090 1100 1110 1120 1130 1140 1140 1150 1160 1170 1180 1190 pF1KA1 GSRAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIISHGKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GSRAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIISHGKL 1150 1160 1170 1180 1190 1200 1200 1210 1220 1230 1240 1250 pF1KA1 KCCGSPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPPGRAPLSSCSELQVSQFIRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KCCGSPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPPGRAPLSSCSELQVSQFIRK 1210 1220 1230 1240 1250 1260 1260 1270 1280 1290 1300 1310 pF1KA1 HVASCLLVSDTSTELSYILPSEAAKKGAFERLFRHLERSLDALHLSSFGLMDTTLEEVFL :::::::::::::::::::::::::::::::::.:::::::::::::::::::::::::: CCDS43 HVASCLLVSDTSTELSYILPSEAAKKGAFERLFQHLERSLDALHLSSFGLMDTTLEEVFL 1270 1280 1290 1300 1310 1320 1320 1330 1340 1350 1360 1370 pF1KA1 KVSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCSELTQSQASLQSASSVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KVSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCSELTQSQASLQSASSVG 1330 1340 1350 1360 1370 1380 1380 1390 1400 1410 1420 1430 pF1KA1 SARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGWLKVRQF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGWLKVRQF 1390 1400 1410 1420 1430 1440 1440 1450 1460 1470 1480 1490 pF1KA1 HGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQYHNYTQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 HGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQYHNYTQ 1450 1460 1470 1480 1490 1500 1500 1510 1520 1530 1540 1550 pF1KA1 PRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSLGPTLNLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSLGPTLNLS 1510 1520 1530 1540 1550 1560 1560 1570 1580 1590 1600 1610 pF1KA1 SGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWNVSLPPTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWNVSLPPTA 1570 1580 1590 1600 1610 1620 1620 1630 1640 1650 1660 1670 pF1KA1 GPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGHPPQMRVVTGDILTDITGHNVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGHPPQMRVVTGDILTDITGHNVS 1630 1640 1650 1660 1670 1680 1680 1690 1700 1710 1720 1730 pF1KA1 EYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMVRKIAVRRAAQVFYNNKGYHSM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 EYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMVRKIAVRRAAQVFYNNKGYHSM 1690 1700 1710 1720 1730 1740 1740 1750 1760 1770 1780 1790 pF1KA1 PTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMNKTSASLSLDYLLQGTDVVIAIFII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMNKTSASLSLDYLLQGTDVVIAIFII 1750 1760 1770 1780 1790 1800 1800 1810 1820 1830 1840 1850 pF1KA1 VAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPIIYWLANYVWDMLNYLVPATCCVIILF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPIIYWLANYVWDMLNYLVPATCCVIILF 1810 1820 1830 1840 1850 1860 1860 1870 1880 1890 1900 1910 pF1KA1 VFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFWFEVPSSAYVFLIVINLFIGITAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFWFEVPSSAYVFLIVINLFIGITAT 1870 1880 1890 1900 1910 1920 1920 1930 1940 1950 1960 1970 pF1KA1 VATFLLQLFEHDKDLKVVNSYLKSCFLIFPNYNLGHGLMEMAYNEYINEYYAKIGQFDKM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VATFLLQLFEHDKDLKVVNSYLKSCFLIFPNYNLGHGLMEMAYNEYINEYYAKIGQFDKM 1930 1940 1950 1960 1970 1980 1980 1990 2000 2010 2020 2030 pF1KA1 KSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYNFLRRPQRMPVSTKPVEDDVDVASERQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYNFLRRPQRMPVSTKPVEDDVDVASERQR 1990 2000 2010 2020 2030 2040 2040 2050 2060 2070 2080 2090 pF1KA1 VLRGDADNDMVKIENLTKVYKSRKIGRILAVDRLCLGVRPGECFGLLGVNGAGKTSTFKM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VLRGDADNDMVKIENLTKVYKSRKIGRILAVDRLCLGVRPGECFGLLGVNGAGKTSTFKM 2050 2060 2070 2080 2090 2100 2100 2110 2120 2130 2140 2150 pF1KA1 LTGDESTTGGEAFVNGHSVLKELLQVQQSLGYCPQCDALFDELTAREHLQLYTRLRGISW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LTGDESTTGGEAFVNGHSVLKELLQVQQSLGYCPQCDALFDELTAREHLQLYTRLRGISW 2110 2120 2130 2140 2150 2160 2160 2170 2180 2190 2200 2210 pF1KA1 KDEARVVKWALEKLELTKYADKPAGTYSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 KDEARVVKWALEKLELTKYADKPAGTYSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDPK 2170 2180 2190 2200 2210 2220 2220 2230 2240 2250 2260 2270 pF1KA1 ARRFLWNLILDLIKTGRSVVLTSHSMEECEALCTRLAIMVNGRLRCLGSIQHLKNRFGDG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 ARRFLWNLILDLIKTGRSVVLTSHSMEECEALCTRLAIMVNGRLRCLGSIQHLKNRFGDG 2230 2240 2250 2260 2270 2280 2280 2290 2300 2310 2320 2330 pF1KA1 YMITVRTKSSQSVKDVVRFFNRNFPEAMLKERHHTKVQYQLKSEHISLAQVFSKMEQVSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 YMITVRTKSSQSVKDVVRFFNRNFPEAMLKERHHTKVQYQLKSEHISLAQVFSKMEQVSG 2290 2300 2310 2320 2330 2340 2340 2350 2360 2370 2380 2390 pF1KA1 VLGIEDYSVSQTTLDNVFVNFAKKQSDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 VLGIEDYSVSQTTLDNVFVNFAKKQSDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTEL 2350 2360 2370 2380 2390 2400 2400 2410 2420 2430 pF1KA1 RALVADEPEDLDTEDEGLISFEEERAQLSFNTDTLC :::::::::::::::::::::::::::::::::::: CCDS43 RALVADEPEDLDTEDEGLISFEEERAQLSFNTDTLC 2410 2420 2430 >>CCDS6762.1 ABCA1 gene_id:19|Hs108|chr9 (2261 aa) initn: 3777 init1: 1060 opt: 2484 Z-score: 2021.2 bits: 388.0 E(32554): 2.9e-106 Smith-Waterman score: 5209; 40.3% identity (64.5% similar) in 2475 aa overlap (1-2367:1-2227) 10 20 30 40 50 60 pF1KA1 MGFLHQLQLLLWKNVTLKRRSPWVLAFEIFIPLVLFFILLGLRQKKPTISVKEAFYTAAP :. ::.::::::.:..::. : .:. :: .:.::...: . : .: . CCDS67 MACWPQLRLLLWKNLTFRRRQTCQLLLEVAWPLFIFLILISVRLSYPPYEQHECHFPNKA 10 20 30 40 50 60 70 80 90 100 110 pF1KA1 LTSAGILPVMQSLCPDGQRDEFGFLQYANSTVTQLLERLDRVVEEGNLFDPARPSL---- . ::: :: .:.. ... : . . . . .. ... . . ::. :: : CCDS67 MPSAGTLPWVQGIICNANNPCFRY--PTPGEAPGVVGNFNKSIV-ARLFSDARRLLLYSQ 70 80 90 100 110 120 130 140 150 160 170 pF1KA1 -GSELEALRQHLEALSAGPGTSGSHLDRSTVSSFSLDSVARNPQELWRFLTQNLSLPNST . .. .:. :..:. .. .:. :...:.. . . . :: .:::::.:: CCDS67 KDTSMKDMRKVLRTLQ--------QIKKSS-SNLKLQDFLVDNETFSGFLYHNLSLPKST 120 130 140 150 160 180 190 200 210 220 230 pF1KA1 AQALLAARVDPPEVYHLLFGPSSALDSQSGLHKGQEPWSRLGGNPLFRMEELLLAPALLE .. .: : : . : .: . : : : .:. . ::.. CCDS67 VDKMLRADV----ILHKVFLQGYQLHLTS-LCNGS------------KSEEMI------- 170 180 190 200 240 250 260 270 280 290 pF1KA1 QLTCTPGSGELGRILTVPESQKGALQGYRDAVCSGQAAARARRFSGLSAELRNQLDVAK- :: :. :.... .:. .: : :: :. ::...:. : CCDS67 QL----GDQEVSELCGLPR-EKLA------------AAERV---------LRSNMDILKP 210 220 230 300 310 320 330 340 pF1KA1 VSQQLGLDAPNGSDSSPQAPPP--RRLQALLGDLLDA-------QKVLQDVDVLSALALL . . :. .: : .: . : .: .:.. :.:. ..: :. . CCDS67 ILRTLNSTSPFPSKELAEATKTLLHSLGTLAQELFSMRSWSDMRQEVMFLTNVNSSSSST 240 250 260 270 280 290 350 360 370 380 390 pF1KA1 LPQGACTGRTPGPPASGAGGAAN-----GTGAGAVMGPNATAEEGAPSAAALATP---DT : . . : : .:. . .. :..: :.: :.. .:: : CCDS67 QIYQAVSRIVCGHPEGGGLKIKSLNWYEDNNYKALFGGNGTEEDAETFYDNSTTPYCNDL 300 310 320 330 340 350 400 410 420 430 440 450 pF1KA1 LQGQCSAFVQ--LWAGLQPILCGNNRTIEPEALRRGNMSSLGFTSKEQRNLGLLVHLMTS ... :. .. .: .:.:.: : CCDS67 MKNLESSPLSRIIWKALKPLLVG------------------------------------- 360 370 380 460 470 480 490 500 510 pF1KA1 NPKILYAPAGSEVDRVILKANETFAFVGNVTHYAQVWLNISAKIRSFLEQGRLQQHLR-- ::::.: . .:. ..:.:: .. .: ..: :: .:.:... .. .: CCDS67 --KILYTPDTPATRQVMAEVNKTFQELAVFHDLEGMWEELSPKIWTFMENSQEMDLVRML 390 400 410 420 430 520 530 540 550 560 pF1KA1 ---------WLQQYVAELRLHPEALNLSLDELPPALRQDNFSLPSGMALLQQLDTIDNAA : :: . : . . : . : ....: :. .. . .. ..: CCDS67 LDSRDNDHFWEQQ-LDGLDWTAQDIVAFLAKHPEDVQSSNGSV---YTWREAFNETNQAI 440 450 460 470 480 490 570 580 590 600 610 620 pF1KA1 CGWIQFMSKVSVDIFKGFPDEESIVNYTLNQAYQDNVTVFASVIFQTRKDGS--LPPHVH .:: :... .. . : ..: ... :. .:...: :: :: ::. CCDS67 RTISRFMECVNLNKLEPIATEVWLINKSME--LLDERKFWAGIVFTGITPGSIELPHHVK 500 510 520 530 540 550 630 640 650 660 670 pF1KA1 YKIRQNSSFTEKTNEIRRAYWRPGPNTG---GRFYFLYGFVWIQDMMERAIIDTFVGHDV ::::.. . .:.::.:. .:: ::: . : ::...::..:.::: ...: . CCDS67 YKIRMDIDNVERTNKIKDGYWDPGPRADPFEDMRYVWGGFAYLQDVVEQAIIRVLTGTEK 560 570 580 590 600 610 680 690 700 710 720 730 pF1KA1 VEPGSYVQMFPYPCYTRDDFLFVIEHMMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMK . : :.:..:::::. : :: :. . ::: :...:.::::. :. :: ::: ::::.:. CCDS67 -KTGVYMQQMPYPCYVDDIFLRVMSRSMPLFMTLAWIYSVAVIIKGIVYEKEARLKETMR 620 630 640 650 660 670 740 750 760 770 780 790 pF1KA1 TMGLNNAVHWVAWFITGFVQLSISVTALTAILKYGQVLMHSHVVIIWLFLAVYAVATIMF :::.:.. : .:::.... : .:. :..::: :..: .: ....::.:.::.::. CCDS67 IMGLDNSILWFSWFISSLIPLLVSAGLLVVILKLGNLLPYSDPSVVFVFLSVFAVVTILQ 680 690 700 710 720 730 800 810 820 830 840 850 pF1KA1 CFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREEVAHDKITAFE-KCIASLMSTTAF :::.:.:.:.:.::.:::::::: :.::. :: . ..: : .:::.: .:: CCDS67 CFLISTLFSRANLAAACGGIIYFTLYLPYVLC-----VAWQDYVGFTLKIFASLLSPVAF 740 750 760 770 780 860 870 880 890 900 910 pF1KA1 GLGSKYFALYEVAGVGIQWHTFSQSPVEGDDFNLLLAVTMLMVDAVVYGILTWYIEAVHP :.: .::::.: :.:.:: .. .:::: : ::: .:.:.. :. .::..::::::: : CCDS67 GFGCEYFALFEEQGIGVQWDNLFESPVEEDGFNLTTSVSMMLFDTFLYGVMTWYIEAVFP 790 800 810 820 830 840 920 930 940 950 960 970 pF1KA1 GMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTPRLSVMEEDQACAMESRRFEETRG :.::.::::::: ::::.: :. : : : . :.: . : CCDS67 GQYGIPRPWYFPCTKSYWFG---EESDEKSHPGSNQKRIS-----EIC------------ 850 860 870 880 980 990 1000 1010 1020 1030 pF1KA1 MEEEPTHLPLVVCVDKLTKVYKDDKKLALNKLSLNLYENQVVSFLGHNGAGKTTTMSILT :::::::: : : ...:.:::.: :.:.. :.::.::.:..:::::::::::::::::: CCDS67 MEEEPTHLKLGVSIQNLVKVYRDGMKVAVDGLALNFYEGQITSFLGHNGAGKTTTMSILT 890 900 910 920 930 940 1040 1050 1060 1070 1080 1090 pF1KA1 GLFPPTSGSATIYGHDIRTEMDEIRKNLGMCPQHNVLFDRLTVEEHLWFYSRLKSMAQEE ::::::::.: : :.:::.::. ::.:::.::::::::: ::::::.:::.:::...... CCDS67 GLFPPTSGTAYILGKDIRSEMSTIRQNLGVCPQHNVLFDMLTVEEHIWFYARLKGLSEKH 950 960 970 980 990 1000 1100 1110 1120 1130 1140 1150 pF1KA1 IRREMDKMIEDLEL-SNKRHSLVQTLSGGMKRKLSVAIAFVGGSRAIILDEPTAGVDPYA .. ::..: :. : :.: .: .. :::::.::::::.::::::...::::::::::::. CCDS67 VKAEMEQMALDVGLPSSKLKSKTSQLSGGMQRKLSVALAFVGGSKVVILDEPTAGVDPYS 1010 1020 1030 1040 1050 1060 1160 1170 1180 1190 1200 1210 pF1KA1 RRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGYR ::.::.:.:::. ::::.::::::::::.::::::::::::: : :: ::::. : :: CCDS67 RRGIWELLLKYRQGRTIILSTHHMDEADVLGDRIAIISHGKLCCVGSSLFLKNQLGTGYY 1070 1080 1090 1100 1110 1120 1220 1230 1240 1250 pF1KA1 LTLVKRPAEPGGP------------QEPGLASSPPGRAPLSSCSELQ--------VSQFI :::::. .: . .. .:. . : :.: : . .:..: CCDS67 LTLVKKDVESSLSSCRNSSSTVSYLKKEDSVSQSSSDAGLGSDHESDTLTIDVSAISNLI 1130 1140 1150 1160 1170 1180 1260 1270 1280 1290 1300 1310 pF1KA1 RKHVASCLLVSDTSTELSYILPSEAAKKGAFERLFRHLERSLDALHLSSFGLMDTTLEEV ::::. :: : . ::.:.:: ::::.::: .::.... :. : .::.:. .:::::. CCDS67 RKHVSEARLVEDIGHELTYVLPYEAAKEGAFVELFHEIDDRLSDLGISSYGISETTLEEI 1190 1200 1210 1220 1230 1240 1320 1330 1340 1350 1360 1370 pF1KA1 FLKVSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCSELTQSQASLQSASS ::::.:: : .:. :. .:: CCDS67 FLKVAEE------SGVDA-ETSDGTLP--------------------------------- 1250 1260 1380 1390 1400 1410 1420 1430 pF1KA1 VGSARGDEGAGYTDVYGDYRPLF-DNPQDPDNVSL--QEVEAEALSRV-GQGSRKLDGGW :: .. : . : . ::. :. ::.. .. . :.. :: . :.:: .. : CCDS67 ---ARRNRRA-FGDKQSCLRPFTEDDAADPNDSDIDPESRETDLLSGMDGKGSYQVKGWK 1270 1280 1290 1300 1310 1320 1440 1450 1460 1470 1480 1490 pF1KA1 LKVRQFHGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQ : .:: .:: ::. :::. :..:.::.::: :::.:.. .: :: .: : : :.: . CCDS67 LTQQQFVALLWKRLLIARRSRKGFFAQIVLPAVFVCIALVFSLIVPPFGKYPSLELQPWM 1330 1340 1350 1360 1370 1380 1500 1510 1520 1530 1540 1550 pF1KA1 YHN-YTQPRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSL :.. :: :. : :.. .:.... : :. :. .: CCDS67 YNEQYT-----FVSNDAPE----------DTGTLELLNALTKDPGFGTRCMEGNPI---- 1390 1400 1410 1420 1560 1570 1580 1590 1600 1610 pF1KA1 GPTLNLSSGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWN : ..:: . .: ... .. : .: :.. :::: CCDS67 -PDTPCQAGEEEWTTAPVPQTI-MDLFQNG----NWTMQNPSPA---------------- 1430 1440 1450 1460 1620 1630 1640 1650 1660 1670 pF1KA1 VSLPPTAGPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGG-HPPQMRVVTGDILT :. .. ... :: :: ..:: ::: . :.::: CCDS67 ----------CQCSSDKIKKML--PV------------CPPGAGGLPPPQRKQNTADILQ 1470 1480 1490 1680 1690 1700 1710 pF1KA1 DITGHNVSEYLLFT-------SDRFRL----HRYGAITFG--NVLKSIPASFGTRAPPMV :.::.:.:.::. : : . .. :::....: :. :.. . : .. CCDS67 DLTGRNISDYLVKTYVQIIAKSLKNKIWVNEFRYGGFSLGVSNTQALPPSQEVNDAIKQM 1500 1510 1520 1530 1540 1550 1720 1730 1740 1750 pF1KA1 RK-----------------------IAVRRAAQVFYNNKGYHSMPTYLNSLNNAILRANL .: . .. ..:..::::.:.. ..:: .::::::::: CCDS67 KKHLKLAKDSSADRFLNSLGRFMTGLDTKNNVKVWFNNKGWHAISSFLNVINNAILRANL 1560 1570 1580 1590 1600 1610 1760 1770 1780 1790 1800 1810 pF1KA1 PKSKGNPAAYGITVTNHPMNKTSASLS-LDYLLQGTDVVIAIFIIVAMSFVPASFVVFLV :.. ::. ::::. :::.: :. .:: . . ..::...: .: :::::::::::::. CCDS67 QKGE-NPSHYGITAFNHPLNLTKQQLSEVALMTTSVDVLVSICVIFAMSFVPASFVVFLI 1620 1630 1640 1650 1660 1670 1820 1830 1840 1850 1860 1870 pF1KA1 AEKSTKAKHLQFVSGCNPIIYWLANYVWDMLNYLVPATCCVIILFVFDLPAYTSPTNFPA :. .:::::::.:: .:.::::.:.:::: ::.:::: .::.. :. .:.: ::.:. CCDS67 QERVSKAKHLQFISGVKPVIYWLSNFVWDMCNYVVPATLVIIIFICFQQKSYVSSTNLPV 1680 1690 1700 1710 1720 1730 1880 1890 1900 1910 1920 1930 pF1KA1 VLSLFLLYGWSITPIMYPASFWFEVPSSAYVFLIVINLFIGITATVATFLLQLFEHDKDL . :.:::::::::.:::::: :..::.::: : .::::::...::::.:.:: .: : CCDS67 LALLLLLYGWSITPLMYPASFVFKIPSTAYVVLTSVNLFIGINGSVATFVLELFTDNK-L 1740 1750 1760 1770 1780 1790 1940 1950 1960 1970 1980 1990 pF1KA1 KVVNSYLKSCFLIFPNYNLGHGLMEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVA . .:. ::: :::::.. ::.::..:. :. . . ..:. ... ::. ::.: :.: : CCDS67 NNINDILKSVFLIFPHFCLGRGLIDMVKNQAMADALERFGE-NRFVSPLSWDLVGRNLFA 1800 1810 1820 1830 1840 1850 2000 2010 2020 2030 2040 2050 pF1KA1 MAVEGVVGFLLTIMCQYNFLRRPQRMPVSTKPVED-DVDVASERQRVLRGDADNDMVKIE ::::::: ::.:.. :: :. ::. . .. .:..: : :: ::::.: : ..::...:. CCDS67 MAVEGVVFFLITVLIQYRFFIRPRPVNAKLSPLNDEDEDVRRERQRILDGGGQNDILEIK 1860 1870 1880 1890 1900 1910 2060 2070 2080 2090 2100 2110 pF1KA1 NLTKVYKSRKIGRILAVDRLCLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFV .:::.:. :: : ::::.:.:. :::::::::::::::.::::::::: ..: :.::. CCDS67 ELTKIYR-RK--RKPAVDRICVGIPPGECFGLLGVNGAGKSSTFKMLTGDTTVTRGDAFL 1920 1930 1940 1950 1960 1970 2120 2130 2140 2150 2160 2170 pF1KA1 NGHSVLKELLQVQQSLGYCPQCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKL : .:.:... .:.:..::::: ::. . ::.:::..... :::. :. ..: .::..:: CCDS67 NKNSILSNIHEVHQNMGYCPQFDAITELLTGREHVEFFALLRGVPEKEVGKVGEWAIRKL 1980 1990 2000 2010 2020 2030 2180 2190 2200 2210 2220 2230 pF1KA1 ELTKYADKPAGTYSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIK :.::..: ::.::::::::::::.:::: : .::::::::::::::::::: :...: CCDS67 GLVKYGEKYAGNYSGGNKRKLSTAMALIGGPPVVFLDEPTTGMDPKARRFLWNCALSVVK 2040 2050 2060 2070 2080 2090 2240 2250 2260 2270 2280 2290 pF1KA1 TGRSVVLTSHSMEECEALCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQ-SV ::::::::::::::::::::.:::::::.:::::.::::::::::: :.:: .:. .. CCDS67 EGRSVVLTSHSMEECEALCTRMAIMVNGRFRCLGSVQHLKNRFGDGYTIVVRIAGSNPDL 2100 2110 2120 2130 2140 2150 2300 2310 2320 2330 2340 2350 pF1KA1 KDVVRFFNRNFPEAMLKERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTT : : ::. :: ..:::.:.. .:::: : :::..:: . : . : :::::::::: CCDS67 KPVQDFFGLAFPGSVLKEKHRNMLQYQLPSSLSSLARIFSILSQSKKRLHIEDYSVSQTT 2160 2170 2180 2190 2200 2210 2360 2370 2380 2390 2400 2410 pF1KA1 LDNVFVNFAKKQSDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDT ::.::::::: :::. CCDS67 LDQVFVNFAKDQSDDDHLKDLSLHKNQTVVDVAVLTSFLQDEKVKESYV 2220 2230 2240 2250 2260 >>CCDS747.1 ABCA4 gene_id:24|Hs108|chr1 (2273 aa) initn: 4252 init1: 1041 opt: 2288 Z-score: 1861.4 bits: 358.4 E(32554): 2.3e-97 Smith-Waterman score: 4809; 37.1% identity (64.1% similar) in 2460 aa overlap (1-2367:1-2255) 10 20 30 40 50 60 pF1KA1 MGFLHQLQLLLWKNVTLKRRSPWVLAFEIFIPLVLFFILLGLRQKKPTISVKEAFYTAAP :::..:.::::::: ::..:. .. :. :: ::..:. ::. .: : .: . CCDS74 MGFVRQIQLLLWKNWTLRKRQKIRFVVELVWPLSLFLVLIWLRNANPLYSHHECHFPNKA 10 20 30 40 50 60 70 80 90 100 110 pF1KA1 LTSAGILPVMQSL-C----PDGQRDEFGFLQYANSTVTQ-LLERLDRVVEEGNLFDPARP . :::.:: .:.. : : : : :. .. .: :. : .: . : CCDS74 MPSAGMLPWLQGIFCNVNNPCFQSPTPGESPGIVSNYNNSILARVYRDFQELLMNAPESQ 70 80 90 100 110 120 120 130 140 150 160 170 pF1KA1 SLG---SELEALRQHLEALSAGPGTSGSHLDRSTVSSFSLDSVARNPQELWRFLTQNLSL :: .::. : : ...: . : .: . .. . .. .. . : :: .:..: CCDS74 HLGRIWTELHILSQFMDTLRTHP-------ERIAGRGIRIRDILKDEETLTLFLIKNIGL 130 140 150 160 170 180 190 200 210 220 230 pF1KA1 PNSTAQALLAARVDPPEVYHLLFGPSSALDSQSGLHKGQEPWSRLGGNPLFRMEELLLAP .:.. :. ..: : . : : : . .... . CCDS74 SDSVVYLLINSQVRPEQFAH--------------------------GVPDLALKDIACSE 180 190 200 240 250 260 270 280 290 pF1KA1 ALLEQLTCTPGSGELGRILTVPESQKGALQGYRDAVCSGQAAARARRFSGLSAELRNQLD ::::.. . ::. . . : :.:: . .. .. . : ..: CCDS74 ALLERF--------------IIFSQRRGAKTVRYALCSLSQGT----LQWIEDTLYANVD 210 220 230 240 300 310 320 330 340 350 pF1KA1 VAKVSQQLGLDAPNGSDSSPQAPPPRRLQALLGDLLDAQKVLQDVDVLSALALLLPQGAC :. . : :. :: :. : ..:.:. . .. . . : :: CCDS74 FFKLFRVL----PTLLDSRSQGINLRSWGGILSDM--SPRIQEFIHRPSMQDLLW----- 250 260 270 280 290 360 370 380 390 400 pF1KA1 TGRTPGPPASGAGGAANGTGAGAVMGPNATAEEGAPSAAA---LATPDTLQGQCSAFVQL . : : :: . : .:: . : : ... :. ... .::. . CCDS74 VTR----PLMQNGGPETFT---KLMGILSDLLCGYPEGGGSRVLSFNWYEDNNYKAFLGI 300 310 320 330 340 350 410 420 430 440 450 460 pF1KA1 WAGLQ-PILCGNNRTIEPEALRRGNMSSLGFTSKEQRNLGLLVHLMTSNPKILYAPAGSE . . :: . :: .. : .:. : : :: ::::.: . CCDS74 DSTRKDPIYSYDRRTTSFCNALIQSLESNPLTKIAWRAAKPL--LM---GKILYTPDSPA 360 370 380 390 400 470 480 490 500 510 pF1KA1 VDRVILKANETFAFVGNVTHYAQVWLNISAKIRSFLEQGRLQQHLR----------WLQQ . :.. .:: :: . .: . ...: ... .: :.... .. .: .:.. CCDS74 ARRILKNANSTFEELEHVRKLVKAWEEVGPQIWYFFDNSTQMNMIRDTLGNPTVKDFLNR 410 420 430 440 450 460 520 530 540 550 560 570 pF1KA1 YVAELRLHPEALNLSLDELPPALRQDNFSLPSGMALLQQLDTIDNAACGWIQFMSKVSVD ..: . ::. : . : . :... .. . .. : . :.. . .: CCDS74 QLGEEGITAEAILNFLYKGPRESQADDMA---NFDWRDIFNITDRTLRLVNQYLECLVLD 470 480 490 500 510 520 580 590 600 610 620 630 pF1KA1 IFKGFPDEESIVNYTLNQAYQDNVTVFASVIFQTRKD--GSLPPHVHYKIRQNSSFTEKT :... :: .... .:. ..:. .:.:.: .::::::.::::.. . .::: CCDS74 KFESYNDETQLTQRALSL-LEENM-FWAGVVFPDMYPWTSSLPPHVKYKIRMDIDVVEKT 530 540 550 560 570 580 640 650 660 670 680 690 pF1KA1 NEIRRAYWRPGPNTGGRFYFLY---GFVWIQDMMERAIIDTFVGHDVVEPGSYVQMFPYP :.:. :: :: . : : ::...:::.:..: . : .. : :.:..::: CCDS74 NKIKDRYWDSGPRADPVEDFRYIWGGFAYLQDMVEQGITRSQVQAEA-PVGIYLQQMPYP 590 600 610 620 630 640 700 710 720 730 740 750 pF1KA1 CYTRDDFLFVIEHMMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAW :.. :.:...... .:. ::..:.:::.::.. :: ::: ::::..:..:..::: : .: CCDS74 CFVDDSFMIILNRCFPIFMVLAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTW 650 660 670 680 690 700 760 770 780 790 800 810 pF1KA1 FITGFVQLSISVTALTAILKYGQVLMHSHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKL :. .: .:.:. :: .. .:..: .: :..::: ....::::.:::.:...:::.: CCDS74 FLDSFSIMSMSIFLLTIFIMHGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASL 710 720 730 740 750 760 820 830 840 850 860 870 pF1KA1 ASACGGIIYFLSYVPYMYVAIREEVAHDKITAFEKCIASLMSTTAFGLGSKYFALYEVAG :.::.:.::: :.:.. . :..:: : .::.: .:::.:..:.. .: : CCDS74 AAACSGVIYFTLYLPHILCFAWQ----DRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQG 770 780 790 800 810 880 890 900 910 920 930 pF1KA1 VGIQWHTFSQSPVEGDDFNLLLAVTMLMVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQ .:.:: ....::.:::.:..::.. :...::.:::.:.::.. : :: :: : :::: :: CCDS74 LGLQWSNIGNSPTEGDEFSFLLSMQMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQ 820 830 840 850 860 870 940 950 960 970 980 990 pF1KA1 KSYWLGSGRTEAWEWSWPWARTPRLSVMEED--QACAMESRRFEETRGMEEEPTHLPLVV .::::: :. . . .: :. :: . .... :: .:.: .: : CCDS74 ESYWLG-GEGCSTREERALEKTEPLTEETEDPEHPEGIHDSFFE-----REHPGWVPGV- 880 890 900 910 920 1000 1010 1020 1030 1040 1050 pF1KA1 CVDKLTKVYKDDKKLALNKLSLNLYENQVVSFLGHNGAGKTTTMSILTGLFPPTSGSATI :: .:.:... . :...:....::::...::::::::::::.::::::.:::::.. . CCDS74 CVKNLVKIFEPCGRPAVDRLNITFYENQITAFLGHNGAGKTTTLSILTGLLPPTSGTVLV 930 940 950 960 970 980 1060 1070 1080 1090 1100 1110 pF1KA1 YGHDIRTEMDEIRKNLGMCPQHNVLFDRLTVEEHLWFYSRLKSMAQEEIRREMDKMIEDL :.::.: .: .:..::::::::.:: .::: ::. ::..::. .::: . ::. :.:: CCDS74 GGRDIETSLDAVRQSLGMCPQHNILFHHLTVAEHMLFYAQLKGKSQEEAQLEMEAMLEDT 990 1000 1010 1020 1030 1040 1120 1130 1140 1150 1160 1170 pF1KA1 ELSNKRHSLVQTLSGGMKRKLSVAIAFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKP : .::. .: :::::.::::::::::: ....::::::.:::::.::.::::.:::. CCDS74 GLHHKRNEEAQDLSGGMQRKLSVAIAFVGDAKVVILDEPTSGVDPYSRRSIWDLLLKYRS 1050 1060 1070 1080 1090 1100 1180 1190 1200 1210 1220 pF1KA1 GRTILLSTHHMDEADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGYRLTLVKR----PAE ::::..::::::::::::::::::..:.: : :.:::::. .: : ::::.. .. CCDS74 GRTIIMSTHHMDEADLLGDRIAIIAQGRLYCSGTPLFLKNCFGTGLYLTLVRKMKNIQSQ 1110 1120 1130 1140 1150 1160 1230 1240 1250 1260 1270 pF1KA1 PGGPQ------EPGLASSPPGRAP-LSSCSEL-----QVSQFIRKHVASCLLVSDTSTEL : . :.... :... :. . : .. . . .:: :: . :: CCDS74 RKGSEGTCSCSSKGFSTTCPAHVDDLTPEQVLDGDVNELMDVVLHHVPEAKLVECIGQEL 1170 1180 1190 1200 1210 1220 1280 1290 1300 1310 1320 1330 pF1KA1 SYILPSEAAKKGAFERLFRHLERSLDALHLSSFGLMDTTLEEVFLKVSEEDQSLENSEAD ..::.. :. :. :::.::..: : :::::. :: :::.::::.:...: . CCDS74 IFLLPNKNFKHRAYASLFRELEETLADLGLSSFGISDTPLEEIFLKVTEDSDSGPLFAGG 1230 1240 1250 1260 1270 1280 1340 1350 1360 1370 1380 1390 pF1KA1 VKESRKDVLPGAEGPASG-EGHAGNLARCSELTQSQASLQSASSVGSARGDEGAGYTDVY ....:..: : . : : . .::. . :.. . : : :: CCDS74 AQQKRENVNP--RHPCLGPREKAGQTPQDSNVCSPGAP---------AAHPEG------- 1290 1300 1310 1320 1330 1400 1410 1420 1430 1440 1450 pF1KA1 GDYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGWLKVRQFHGLLVKRFHCARRN .: : .:. : . : : ... ..::::::. . :. CCDS74 ---QP----PPEPEC---------------PGPQLNTGTQLVLQHVQALLVKRFQHTIRS 1340 1350 1360 1460 1470 1480 1490 1500 1510 pF1KA1 SKALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQYHNYTQPRGNFIPYANEERR : ...::.::: :: .:. ... .: .:. : :.: : : . CCDS74 HKDFLAQIVLPATFVFLALMLSIVIPPFGEYPALTLHPWIYG-----------------Q 1370 1380 1390 1400 1410 1520 1530 1540 1550 1560 1570 pF1KA1 EYRLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSLGPTLNLSSGESRLLAARFFDS .: . . . .:.. : : .:..:. : . CCDS74 QYTFFSMDEPGSEQFT--------VLADVLLNKPG----------------------FGN 1420 1430 1440 1580 1590 1600 1610 1620 1630 pF1KA1 MCL-ESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWNVSLPPTAGPEMWTSAPSLPR :: :.. : .: : .:: :: :.. . ::.. : CCDS74 RCLKEGWLPEYPCGN---STPWKTPSVSP----------NIT--QLFQKQKWTQVNPSP- 1450 1460 1470 1480 1640 1650 1660 1670 1680 pF1KA1 LVREPVRCTCSAQGTGFS-CPSSVGGHPPQMRVV-TGDILTDITGHNVSEYLLFT----- ::. . : . :: ..:: :: .:. . .:: :.: .:.:..:. : CCDS74 ----SCRCSTREKLTMLPECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALI 1490 1500 1510 1520 1530 1540 1690 1700 1710 pF1KA1 ----SDRFRLH--RYGAITFGNVLKSIPAS----------FG----------TRA----- ...: .. :::.:..:. : .: . .: :: CCDS74 RSSLKSKFWVNEQRYGGISIGGKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEI 1550 1560 1570 1580 1590 1600 1720 1730 1740 1750 1760 1770 pF1KA1 PPMVRKIAVRRAAQVFYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPM : ..... .. .:..::::.:.. ..:: .::::::.:::.. .: ::::: ..:. CCDS74 PDFLKHLETEDNIKVWFNNKGWHALVSFLNVAHNAILRASLPKDR-SPEEYGITVISQPL 1610 1620 1630 1640 1650 1660 1780 1790 1800 1810 1820 1830 pF1KA1 NKTSASLS-LDYLLQGTDVVIAIFIIVAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPI : :. .:: . : ..:.:.:: .: .:::::::::..:. :. .:.:::::.:: .: CCDS74 NLTKEQLSEITVLTTSVDAVVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPT 1670 1680 1690 1700 1710 1720 1840 1850 1860 1870 1880 1890 pF1KA1 IYWLANYVWDMLNYLVPATCCVIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPA ::..:..::..:: : : : :.. :. ::::: :.::...:.:::::.. :.:::: CCDS74 TYWVTNFLWDIMNYSVSAGLVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPA 1730 1740 1750 1760 1770 1780 1900 1910 1920 1930 1940 1950 pF1KA1 SFWFEVPSSAYVFLIVINLFIGITATVATFLLQLFEHDKDLKVVNSYLKSCFLIFPNYNL :: :.:::.::: : ::::::.... ::.:.:::... : :. :.. ...::.. : CCDS74 SFLFDVPSTAYVALSCANLFIGINSSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCL 1790 1800 1810 1820 1830 1840 1960 1970 1980 1990 2000 2010 pF1KA1 GHGLMEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYNF :.::...: .. ... ::..:. .. .::.::.. ..: ::.::::: ::::.. : .: CCDS74 GRGLIDLALSQAVTDVYARFGE-EHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQRHF 1850 1860 1870 1880 1890 1900 2020 2030 2040 2050 2060 2070 pF1KA1 -LRRPQRMPVSTKPVEDDVDVASERQRVLRGDADNDMVKIENLTKVYKSRKIGRILAVDR : . :.. :..: ::: ::::.. : .:......:::.: . . :::: CCDS74 FLSQWIAEPTKEPIVDEDDDVAEERQRIITGGNKTDILRLHELTKIYPGTSSP---AVDR 1910 1920 1930 1940 1950 2080 2090 2100 2110 2120 2130 pF1KA1 LCLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQVQQSLGYC ::.:::::::::::::::::::.:::::::: ..:.:.: : :.:.: .. .:.:..::: CCDS74 LCVGVRPGECFGLLGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNMGYC 1960 1970 1980 1990 2000 2010 2140 2150 2160 2170 2180 2190 pF1KA1 PQCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPAGTYSGGNKR :: ::. . ::.:::: ::.::::. .. .:..:....: :: ::: :::::::::: CCDS74 PQFDAIDELLTGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNKR 2020 2030 2040 2050 2060 2070 2200 2210 2220 2230 2240 2250 pF1KA1 KLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSVVLTSHSMEECEALC :::::::::: : ...::::::::::.:::.:::.:...:. ::.::::::::::::::: CCDS74 KLSTAIALIGCPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECEALC 2080 2090 2100 2110 2120 2130 2260 2270 2280 2290 2300 pF1KA1 TRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQS-----VKDVVRFFNRNFPEAM :::::::.: .::.:.:::::..:::::..:.. :: .. .. : .::. ::: .. CCDS74 TRLAIMVKGAFRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGSV 2140 2150 2160 2170 2180 2190 2310 2320 2330 2340 2350 2360 pF1KA1 LKERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKKQSDN .:::.. .:.:..: :::..:. . . . : ::.:::.:::::.:::::::.:... CCDS74 QRERHYNMLQFQVSSS--SLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTES 2200 2210 2220 2230 2240 2250 2370 2380 2390 2400 2410 2420 pF1KA1 LEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFEEERAQL CCDS74 HDLPLHPRAAGASRQAQD 2260 2270 >>CCDS12055.1 ABCA7 gene_id:10347|Hs108|chr19 (2146 aa) initn: 3904 init1: 1068 opt: 2207 Z-score: 1795.8 bits: 346.2 E(32554): 1e-93 Smith-Waterman score: 4453; 38.2% identity (63.9% similar) in 2285 aa overlap (179-2399:39-2146) 150 160 170 180 190 200 pF1KA1 FSLDSVARNPQELWRFLTQNLSLPNSTAQALLAAR-VDPPEVYHLLFGPSSALDSQSGLH :.:.: :: .: :.. : : CCDS12 LLLWKNFMYRRRQPVQLLVELLWPLFLFFILVAVRHSHPPLEHHECHFPNKPLPSA---- 10 20 30 40 50 60 210 220 230 240 250 260 pF1KA1 KGQEPWSRLGGNPLFRMEELLLAPALLEQLTCTPGSGELGRILTVPESQKGALQGYRDAV : :: : : :. . : : ::: : ::. . .: . : . .: CCDS12 -GTVPW--LQG--LICNVNNTCFPQL------TPGE-EPGRLSNFNDSLVSRLLADARTV 70 80 90 100 110 270 280 290 300 310 320 pF1KA1 CSGQAAARARRFSGLSAELRNQLDVAKVSQQLGLDAPNGSDSSPQAPPPRRLQALLGDLL .: .: :. ..::. .: : .:. . : :. . .:: :: . :: .:: CCDS12 LGGASAHRT--LAGLG-KLIATLRAARSTAQ-----PQPTKQSPLEPPMLDVAELLTSLL 120 130 140 150 160 330 340 350 360 370 pF1KA1 ----------DAQKVLQDV-DVLSALA--LLLPQGACTGRTPGPPASGAGGAANGTGAG- .::. :... .. :: :: .. :. :..: . . . CCDS12 RTESLGLALGQAQEPLHSLLEAAEDLAQELLALRSLVELRALLQRPRGTSGPLELLSEAL 170 180 190 200 210 220 380 390 400 410 420 430 pF1KA1 -AVMGPNATAEEGAPSAAALATPDTLQGQCSAFVQLWAGLQPILCGNNRTIEPEALRR-G .: ::..:. .:: . : .. .: .: . .. : . : CCDS12 CSVRGPSSTV---GPSLNWYEASDLME---------LVGQEPESALPDSSLSPACSELIG 230 240 250 260 270 440 450 460 470 480 490 pF1KA1 NMSSLGFTSKEQRNLGLLVHLMTSNPKILYAPAGSEVDRVILKANETFAFVGNVTHYAQV ..: .. : : :. :.:.:: . ... ..:.:: . . .: CCDS12 ALDSHPLSRLLWRRLKPLIL-----GKLLFAPDTPFTRKLMAQVNRTFEELTLLRDVREV 280 290 300 310 320 500 510 520 530 540 550 pF1KA1 WLNISAKIRSFLEQGRLQQHLRWLQQYVAELRLHPEALNLSLDELPPALRQDNFSLP-SG : .. .: .:.... :. : :. : : .:. . :.. ::: .: : :: CCDS12 WEMLGPRIFTFMNDSSNVAMLQRLLQMQDEGRRQPRPGGR--DHME-ALR--SFLDPGSG 330 340 350 360 370 380 560 570 580 590 600 pF1KA1 MALLQQLDTIDNAACGWIQFMSK-VSVDIFKGFPDEESIVNYTLNQAYQDNVTVFASVIF :. . . : . ... .:.: ... :.: ..:. .: : .. .:.:.: CCDS12 GYSWQDAHADVGHLVGTLGRVTECLSLDKLEAAPSEAALVSRAL-QLLAEH-RFWAGVVF 390 400 410 420 430 440 610 620 630 640 650 pF1KA1 QTRKDGSLP---P-------HVHYKIRQNSSFTEKTNEIRRAYWRPGPNTGGRFYFLY-- .:.: : : ::. :::.. . . .::.:: .: ::: . . : CCDS12 LGPEDSSDPTEHPTPDLGPGHVRIKIRMDIDVVTRTNKIRDRFWDPGPAADPLTDLRYVW 450 460 470 480 490 500 660 670 680 690 700 710 pF1KA1 -GFVWIQDMMERAIIDTFVGHDVVEPGSYVQMFPYPCYTRDDFLFVIEHMMPLCMVISWV :::..::..::: . .. : . . : :.:..:::::. : :: :. . .:: ....:. CCDS12 GGFVYLQDLVERAAVRVLSGANP-RAGLYLQQMPYPCYVDDVFLRVLSRSLPLFLTLAWI 510 520 530 540 550 720 730 740 750 760 770 pF1KA1 YSVAMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVTALTAILKYGQV :::..:.. .: ::: ::...:..:::. :: :..::.. . . .:.. :. .:: :.. CCDS12 YSVTLTVKAVVREKETRLRDTMRAMGLSRAVLWLGWFLSCLGPFLLSAALLVLVLKLGDI 560 570 580 590 600 610 780 790 800 810 820 830 pF1KA1 LMHSHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSYVPYMY-VAIRE : .:: ...::::..::::. ::.:...:.:.::.::::. :: :.::. :: : CCDS12 LPYSHPGVVFLFLAAFAVATVTQSFLLSAFFSRANLAAACGGLAYFSLYLPYVLCVAWR- 620 630 640 650 660 670 840 850 860 870 880 890 pF1KA1 EVAHDKITAFEKCIASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQSPVEGDDFNLLLA :.. : . :::.: .:::.: . .:: : : : :::. . :. .: :.: . CCDS12 ----DRLPAGGRVAASLLSPVAFGFGCESLALLEEQGEGAQWHNVGTRPT-ADVFSLAQV 680 690 700 710 720 730 900 910 920 930 940 950 pF1KA1 VTMLMVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTP .:..::..::. :::.::: ::.::.:.:: ::...::: : : : : CCDS12 SGLLLLDAALYGLATWYLEAVCPGQYGIPEPWNFPFRRSYWCG-----------P--RPP 740 750 760 770 780 960 970 980 990 1000 1010 pF1KA1 RLSVMEEDQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKVYKDDKKLALNKLSLNLY . : .. .:: : : : : .: : . . . :: :::..: CCDS12 K-----SPAPCPTP---LDPKVLVEEAPPGLSPGVSVRSLEKRFPGSPQPALRGLSLDFY 790 800 810 820 830 1020 1030 1040 1050 1060 1070 pF1KA1 ENQVVSFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRTEMDEIRKNLGMCPQHNVL ......::::::::::::.:::.:::::..::: : :::.:. : :: .::.:::.::: CCDS12 QGHITAFLGHNGAGKTTTLSILSGLFPPSGGSAFILGHDVRSSMAAIRPHLGVCPQYNVL 840 850 860 870 880 890 1080 1090 1100 1110 1120 1130 pF1KA1 FDRLTVEEHLWFYSRLKSMAQEEIRREMDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAI :: :::.::.:::.:::... . :.:....:. : .:. .. :::::.::::::: CCDS12 FDMLTVDEHVWFYGRLKGLSAAVVGPEQDRLLQDVGLVSKQSVQTRHLSGGMQRKLSVAI 900 910 920 930 940 950 1140 1150 1160 1170 1180 1190 pF1KA1 AFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIIS ::::::...::::::::::: .::.::.:.:::. :::..:::::.:::.:::::.:... CCDS12 AFVGGSQVVILDEPTAGVDPASRRGIWELLLKYREGRTLILSTHHLDEAELLGDRVAVVA 960 970 980 990 1000 1010 1200 1210 1220 1230 1240 1250 pF1KA1 HGKLKCCGSPLFLKGTYGDGYRLTLVKR--PAEPGGPQEPGLASSPPGRAPLSSCSEL-- :.: ::::::::. :.:: ::::: : . . . .: : .. :. CCDS12 GGRLCCCGSPLFLRRHLGSGYYLTLVKARLPLTTNEKADTDMEGSVDTRQEKKNGSQGSR 1020 1030 1040 1050 1060 1070 1260 1270 1280 1290 1300 pF1KA1 ----QVSQFIRKHVASCLLVSDTSTELSYILPSEAAKKGAFERLFRHLERSLDALHLSSF :. .... : . :: . :: .:: .:. :.: :::.:. : :.:... CCDS12 VGTPQLLALVQHWVPGARLVEELPHELVLVLPYTGAHDGSFATLFRELDTRLAELRLTGY 1080 1090 1100 1110 1120 1130 1310 1320 1330 1340 1350 1360 pF1KA1 GLMDTTLEEVFLKVSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAG-NLARCSELT :. ::.:::.:::: :: ::. :. :. : : :: ... .. CCDS12 GISDTSLEEIFLKVVEE------CAADT-----DMEDGSCGQHLCTGIAGLDVTLRLKMP 1140 1150 1160 1170 1180 1370 1380 1390 1400 1410 1420 pF1KA1 QSQASLQSASSVGSA-RGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVGQG ....:... .::: . :.:.: :: :. .:.. ::.: CCDS12 PQETALENGEPAGSAPETDQGSG-----------------PDAVG--RVQGWALTR---- 1190 1200 1210 1430 1440 1450 1460 1470 1480 pF1KA1 SRKLDGGWLKVRQFHGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGDLP .:...::.::: :::. ..::.::.:::.:: .:.. .: :: .: : CCDS12 -----------QQLQALLLKRFLLARRSRRGLFAQIVLPALFVGLALVFSLIVPPFGHYP 1220 1230 1240 1250 1260 1490 1500 1510 1520 1530 1540 pF1KA1 PLVLSPSQYHNYTQPRGNFIPYANEERR--EYRLRLSPDASPQQLVSTFRLPSGVGATCV : :::..: .. .. : . : : :. . : :. :. . . : CCDS12 ALRLSPTMYGAQVSFFSEDAPGDPGRARLLEALLQEAGLEEPPVQHSSHRFSAPEVPAEV 1270 1280 1290 1300 1310 1320 1550 1560 1570 1580 1590 1600 pF1KA1 LKSPANGSLGPTLNLSSGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPAS : :.:. : . . .:: . : : . ::::. . ... . CCDS12 AKVLASGNWTPESPSPACQCSRPGARRLLPDC--------PAAAGGPPPPQAVTGSGEVV 1330 1340 1350 1360 1370 1610 1620 1630 1640 1650 1660 pF1KA1 PDEDLQAWNVSLPPTAGPEMWTSAPSLPRLVREPVRC---TCSAQGTGFSCPSSVGGHPP ..: . :.: . . :::::. .. . .. ::: .::. : CCDS12 --QNLTGRNLSD---------FLVKTYPRLVRQGLKTKKWVNEVRYGGFS----LGGRDP 1380 1390 1400 1410 1420 1670 1680 1690 1700 1710 1720 pF1KA1 QMRVVTGDILTDITGHNVSEYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMVRK . .:. : :..: : . : ::. :::.. : ... CCDS12 GL--PSGQEL----GRSVEELWALLSPL----PGGAL--DRVLKNLTA--------WAHS 1430 1440 1450 1460 1730 1740 1750 1760 1770 pF1KA1 IAVRRAAQVFYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPA--AYGITVTNHPMNKTS . .. . ....::::.::: ...: .::::::.:: . :: :..::. :::.: :. CCDS12 LDAQDSLKIWFNNKGWHSMVAFVNRASNAILRAHLPPG---PARHAHSITTLNHPLNLTK 1470 1480 1490 1500 1510 1520 1780 1790 1800 1810 1820 1830 pF1KA1 ASLSLDYLLQGT-DVVIAIFIIVAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPIIYWL .:: :. .. ::...: .. :::::::::.. :. :. :.:::::...: .: .::: CCDS12 EQLSEGALMASSVDVLVSICVVFAMSFVPASFTLVLIEERVTRAKHLQLMGGLSPTLYWL 1530 1540 1550 1560 1570 1580 1840 1850 1860 1870 1880 1890 pF1KA1 ANYVWDMLNYLVPATCCVIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFWF .:..::: :::::: :.:...:. ::..:.:.::.: :.:::::::::.::::::.: CCDS12 GNFLWDMCNYLVPACIVVLIFLAFQQRAYVAPANLPALLLLLLLYGWSITPLMYPASFFF 1590 1600 1610 1620 1630 1640 1900 1910 1920 1930 1940 1950 pF1KA1 EVPSSAYVFLIVINLFIGITATVATFLLQLFEHDKDLKVVNSYLKSCFLIFPNYNLGHGL :::.::: : :::::::....:::.:.:: :. :. :. ::. :::::.. ::.:: CCDS12 SVPSTAYVVLTCINLFIGINGSMATFVLELFS-DQKLQEVSRILKQVFLIFPHFCLGRGL 1650 1660 1670 1680 1690 1700 1960 1970 1980 1990 2000 2010 pF1KA1 MEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYNFLRRP ..:. :. . . . ..:. ...::..:..: ..:.::...: . .:.:.. :. : CCDS12 IDMVRNQAMADAFERLGD-RQFQSPLRWEVVGKNLLAMVIQGPLFLLFTLLLQH----RS 1710 1720 1730 1740 1750 2020 2030 2040 2050 2060 2070 pF1KA1 QRMP---VSTKPV--EDDVDVASERQRVLRGDADNDMVKIENLTKVYKSRKIGRILAVDR : .: : . :. :.: ::: ::.::..: ...:.. ..::::::... :. :::: CCDS12 QLLPQPRVRSLPLLGEEDEDVARERERVVQGATQGDVLVLRNLTKVYRGQ---RMPAVDR 1760 1770 1780 1790 1800 1810 2080 2090 2100 2110 2120 2130 pF1KA1 LCLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQVQQSLGYC ::::. :::::::::::::::::::.:.::: .. ::: . :::: .: .. :.::: CCDS12 LCLGIPPGECFGLLGVNGAGKTSTFRMVTGDTLASRGEAVLAGHSVAREPSAAHLSMGYC 1820 1830 1840 1850 1860 1870 2140 2150 2160 2170 2180 2190 pF1KA1 PQCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPAGTYSGGNKR :: ::.:. ::.::::.: .::::. . :... .: .: :. :::.::::::::::: CCDS12 PQSDAIFELLTGREHLELLARLRGVPEAQVAQTAGSGLARLGLSWYADRPAGTYSGGNKR 1880 1890 1900 1910 1920 1930 2200 2210 2220 2230 2240 2250 pF1KA1 KLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSVVLTSHSMEECEALC ::.::.::.: :: .:::::::::::.::::::: .: ... ::::.::::::::::::: CCDS12 KLATALALVGDPAVVFLDEPTTGMDPSARRFLWNSLLAVVREGRSVMLTSHSMEECEALC 1940 1950 1960 1970 1980 1990 2260 2270 2280 2290 2300 2310 pF1KA1 TRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQSVKDVVRFFNRNFPEAMLKERH .:::::::::.::::: ::::.::. :. .:.:. ...: . .. : .:: : :.: : CCDS12 SRLAIMVNGRFRCLGSPQHLKGRFAAGHTLTLRVPAARS-QPAAAFVAAEFPGAELREAH 2000 2010 2020 2030 2040 2050 2320 2330 2340 2350 2360 pF1KA1 HTKVQYQLK-SEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKKQS---DNL ....:: . . .::.::... .. :.::.::::: :..::. :.: :. :. CCDS12 GGRLRFQLPPGGRCALARVFGELAVHGAEHGVEDFSVSQTMLEEVFLYFSKDQGKDEDTE 2060 2070 2080 2090 2100 2110 2370 2380 2390 2400 2410 2420 pF1KA1 EQQET----EPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFEEER ::.:. .: .:: : : : .: : : CCDS12 EQKEAGVGVDPAPGLQHPKRVSQFLDDPSTAETVL 2120 2130 2140 2430 pF1KA1 AQLSFNTDTLC >>CCDS47584.1 ABCA13 gene_id:154664|Hs108|chr7 (5058 aa) initn: 2410 init1: 626 opt: 1627 Z-score: 1317.5 bits: 258.9 E(32554): 4.6e-67 Smith-Waterman score: 3293; 33.1% identity (64.0% similar) in 1958 aa overlap (458-2377:3317-5047) 430 440 450 460 470 480 pF1KA1 LRRGNMSSLGFTSKEQRNLGLLVHLMTSNPKILYAPAGSEVDRVILKANETFAFVGNVTH ::::.: :...:: ::: :: .: .. CCDS47 TPFCLKLYQEILQLPNGALVWTFLKPILHGKILYTPNTPEINKVIQKANYTFYIVDKLKT 3290 3300 3310 3320 3330 3340 490 500 510 520 530 540 pF1KA1 YAQVWLNISAKI-RSFLEQ--GRLQQHLR--WLQQYVAELRLHPEALNLSLDELPPALRQ ... :..:. . :: : ..::. :: .....: : .:: ...:.: :. CCDS47 LSETLLEMSSLFQRSGSGQMFNQLQEALRNKFVRNFV-ENQLH-----IDVDKLTEKLQT 3350 3360 3370 3380 3390 3400 550 560 570 580 590 pF1KA1 DNFSLPSGMALLQQLDTIDNAACGWIQFMSKVSVDI-----FKGFPDEES--IVNYTLNQ . .::... ...:. : ..:.... :.. .. : .: :.. .. CCDS47 YG-------GLLDEM--FNHAGAGRFRFLGSILVNLSSCVALNRFQALQSVDILETKAHE 3410 3420 3430 3440 3450 600 610 620 630 640 pF1KA1 AYQDNVTVFASVIFQT-------RKDG-SLPPHVHYKIRQNSSFTEKTNEIRRAYWRPGP :.: . .::.::.. :... .::::: : :: : .. .:. .. :. : CCDS47 LLQQN-SFLASIIFSNSLFDKNFRSESVKLPPHVSYTIRTNVLYSVRTDVVKNPSWKFHP 3460 3470 3480 3490 3500 3510 650 660 670 680 690 700 pF1KA1 NT--GGRFYFLYGFVWIQDMMERAIIDTFVGHDVVEPGSYVQMFPYPCYTRDDFLFVIEH .. . : . : :. .:::.::::: . .:....::.. .: ::::.: : :: . CCDS47 QNLPADGFKYNYVFAPLQDMIERAIILVQTGQEALEPAAQTQAAPYPCHTSDLFLNNVGF 3520 3530 3540 3550 3560 3570 710 720 730 740 750 760 pF1KA1 MMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVT ..:: :...:. ::: ....: :.: ...: :. ::.. ..:..:::. ... :.:: . CCDS47 FFPLIMMLTWMVSVASMVRKLVYEQEIQIEEYMRMMGVHPVIHFLAWFLENMAVLTISSA 3580 3590 3600 3610 3620 3630 770 780 790 800 810 820 pF1KA1 ALTAILKYGQVLMHSHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSY .:. .:: . .. ::.. :..::: ......:. .:.:...:.:. :. : ...:..:. CCDS47 TLAIVLKTSGIFAHSNTFIVFLFLLDFGMSVVMLSYLLSAFFSQANTAALCTSLVYMISF 3640 3650 3660 3670 3680 3690 830 840 850 860 870 880 pF1KA1 VPYMYVAIREEVAHDKITAFEKCIASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQSPV .::. . : :.... .. . :.:::::: : .... : .::::... :. . CCDS47 LPYIVLL----VLHNQLSFVNQTFLCLLSTTAFGQGVFFITFLEGQETGIQWNNMYQA-L 3700 3710 3720 3730 3740 890 900 910 920 930 940 pF1KA1 EGDDFNLLLAVTMLMVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAW : ... . :.. :. .: . ::. . :: .:: .:::::. ::: . : CCDS47 EQGGMTFGWVCWMILFDSSLYFLCGWYLSNLIPGTFGLRKPWYFPFTASYWKSVGFLVEK 3750 3760 3770 3780 3790 3800 950 960 970 980 990 1000 pF1KA1 EWSWPWARTPRLSVMEEDQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKVYKDDKKL . . . .. .... ....:. : .: . :: ..:: : . .: CCDS47 RQYFLSSSLFFFNENFDNKGSSLQNREGE----LEGSAPGVTLV----SVTKEY-EGHKA 3810 3820 3830 3840 3850 1010 1020 1030 1040 1050 1060 pF1KA1 ALNKLSLNLYENQVVSFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRTEMDEIRKN ... :::..:..:....:: ::::::: .:.:::: :::::. : :....:.....: . CCDS47 VVQDLSLTFYRDQITALLGTNGAGKTTIISMLTGLHPPTSGTIIINGKNLQTDLSRVRME 3860 3870 3880 3890 3900 3910 1070 1080 1090 1100 1110 1120 pF1KA1 LGMCPQHNVLFDRLTVEEHLWFYSRLKS--MAQEEIRREMDKMIEDLELSNKRHSLVQTL ::.:::...:.: :::.::: ... .:. ...:....... ..:..:....:. ...: CCDS47 LGVCPQQDILLDNLTVREHLLLFASIKAPQWTKKELHQQVNQTLQDVDLTQHQHKQTRAL 3920 3930 3940 3950 3960 3970 1130 1140 1150 1160 1170 1180 pF1KA1 SGGMKRKLSVAIAFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDE :::.:::::..:::.: ::...:::::.:::: .:...::..:::. ::::...:::.:: CCDS47 SGGLKRKLSLGIAFMGMSRTVVLDEPTSGVDPCSRHSLWDILLKYREGRTIIFTTHHLDE 3980 3990 4000 4010 4020 4030 1190 1200 1210 1220 1230 1240 pF1KA1 ADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPPGRA :. :.::.:...::.:.::: :. :: .::.: ::::...:. . . .: CCDS47 AEALSDRVAVLQHGRLRCCGPPFCLKEAYGQGLRLTLTRQPSVLEAHDLKDMA------- 4040 4050 4060 4070 4080 1250 1260 1270 1280 1290 1300 pF1KA1 PLSSCSELQVSQFIRKHVASCLLVSDTSTELSYILPSEAAKKGAFERLFRHLERSLDALH : :...:. .. . .: .....::.: .:... :. .. ::. :...: :: CCDS47 ----C----VTSLIKIYIPQAFLKDSSGSELTYTIPKDT-DKACLKGLFQALDENLHQLH 4090 4100 4110 4120 4130 4140 1310 1320 1330 1340 1350 1360 pF1KA1 LSSFGLMDTTLEEVFLKVSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCS :...:. ::::::::: . ... :... . . .. : . . . :. :.::: CCDS47 LTGYGISDTTLEEVFLMLLQDS----NKKSHIALGTESELQNHRPTGHLSGYCGSLAR-- 4150 4160 4170 4180 4190 1370 1380 1390 1400 1410 1420 pF1KA1 ELTQSQASLQSASSVGSARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVG : .: CCDS47 ------------------------------------------PATV-------------- 1430 1440 1450 1460 1470 1480 pF1KA1 QGSRKLDGGWLKVRQFHGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGD :: . : . : ..:..:.. . : .:. ....:::..:: .:: . . : . CCDS47 QGVQLLRA------QVAAILARRLRRTLRAGKSTLADLLLPVLFVALAMGLFMVRPLATE 4200 4210 4220 4230 4240 4250 1490 1500 1510 1520 1530 1540 pF1KA1 LPPLVLSPSQYHNYTQPRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGVGATCV ::: :.:..: .: : :. . :: CCDS47 YPPLRLTPGHY----------------QRAE----------------TYFFSSG------ 4260 4270 1550 1560 1570 1580 1590 1600 pF1KA1 LKSPANGSLGPTLNLSSGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPAS : .:.:. :.: .: : : :: ... .: ..: CCDS47 ---------GDNLDLT----RVLLRKFRD--------QDLPCADL-----NPRQKNS--- 4280 4290 4300 1610 1620 1630 1640 1650 1660 pF1KA1 PDEDLQAWNVSLPPTAGPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGHPPQMR . : .. : . ::. : : : ..::. .. : . CCDS47 -----SCWRTD--PFSHPEFQDS-------------CGC------LKCPNR-SASAPYLT 4310 4320 4330 1670 1680 1690 1700 1710 1720 pF1KA1 VVTGDILTDITGHNVSEYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMVRKIAV : : ...: :. :::: :.. :: :. .:: :: ::. : . . .. CCDS47 NHLGHTLLNLSGFNMEEYLLAPSEKPRL---GGWSFG--LK-IPSEAGGANGNISKPPTL 4340 4350 4360 4370 4380 4390 1730 1740 1750 1760 1770 1780 pF1KA1 RRAAQVFYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMNKTSASLSL :.:.::.::.::.:.::: ::: :: .:: . . ::::. .::.. .: :. CCDS47 ---AKVWYNQKGFHSLPSYLNHLNNLILWQHLPPTV-DWRQYGITLYSHPYG--GALLNE 4400 4410 4420 4430 4440 1790 1800 1810 1820 1830 1840 pF1KA1 DYLLQGT-DVVIAIFIIVAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPIIYWLANYVW : .:.. . .:. :....:.. ::. .: .. ::.:: .:: . .::..:... CCDS47 DKILESIRQCGVALCIVLGFSILSASIGSSVVRDRVIGAKRLQHISGLGYRMYWFTNFLY 4450 4460 4470 4480 4490 4500 1850 1860 1870 1880 1890 1900 pF1KA1 DMLNYLVPATCCVIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFWFEVPSS ::: ::: . :: .. .:.: :.: :. :. :. :.:.. : :: : : . CCDS47 DMLFYLVSVCLCVAVIVAFQLTAFTFRKNLAATALLLSLFGYATLPWMYLMSRIFSSSDV 4510 4520 4530 4540 4550 4560 1910 1920 1930 1940 1950 pF1KA1 AYVFLIVINLFIGITATVATF---LLQLFEHDKDLKVVNSYLKSCFLIFPNYNLGHGLME :.. . .:...:. . . :. :: .. . :.:. . . :: : :::.. ::.::.: CCDS47 AFISYVSLNFIFGLCTMLITIMPRLLAIISKAKNLQNIYDVLKWVFTIFPQFCLGQGLVE 4570 4580 4590 4600 4610 4620 1960 1970 1980 1990 2000 2010 pF1KA1 MAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYNFLRRPQR . ::. . ..: .:.. :::: ... .: .: .:.: .:: .. ....:: :. CCDS47 LCYNQIKYDLTHNFG-IDSYVSPFEMNFLGWIFVQLASQGTVLLLLRVLLHWDLLRWPRG 4630 4640 4650 4660 4670 4680 2020 2030 2040 2050 2060 2070 pF1KA1 MPVSTKPVED--DVDVASERQRVLRGDADNDMVKIENLTKVYKSRKIGRILAVDRLCLGV . :.. :.:: .:..::..: ...:.. . ::.: :. : . :.::. . ::. CCDS47 HSTLQGTVKSSKDTDVEKEEKRVFEGRTNGDILVLYNLSKHYR-RFFQNIIAVQDISLGI 4690 4700 4710 4720 4730 4740 2080 2090 2100 2110 2120 2130 pF1KA1 RPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVN---GHSV-LKELLQVQQSLGYCP ::::::::::::::..:::::.:. : :.:.:.. : .: :. . .:::: CCDS47 PKGECFGLLGVNGAGKSTTFKMLNGEVSLTSGHAIIRTPMGDAVDLSSAGTAGVLIGYCP 4750 4760 4770 4780 4790 4800 2140 2150 2160 2170 2180 2190 pF1KA1 QCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPAGTYSGGNKRK : ::: . ::. ::: : :::: . .:. ...:.: .::::..:::::.::: CCDS47 QQDALDELLTGWEHLYYYCSLRGIPRQCIPEVAGDLIRRLHLEAHADKPVATYSGGTKRK 4810 4820 4830 4840 4850 4860 2200 2210 2220 2230 2240 2250 pF1KA1 LSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSVVLTSHSMEECEALCT ::::.::.: : ...::::..:::: ..:.::. :. .. : ..::::::::::::::: CCDS47 LSTALALVGKPDILLLDEPSSGMDPCSKRYLWQTIMKEVREGCAAVLTSHSMEECEALCT 4870 4880 4890 4900 4910 4920 2260 2270 2280 2290 2300 pF1KA1 RLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRT--KSSQ--SVKDVVRFFNRNFPEAMLK :::::::: ..:::: ::.:::::::: . : ...: .:.: .... :: ..: CCDS47 RLAIMVNGSFKCLGSPQHIKNRFGDGYTVKVWLCKEANQHCTVSDHLKLY---FPGIQFK 4930 4940 4950 4960 4970 4980 2310 2320 2330 2340 2350 2360 pF1KA1 ERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKKQSDNLE .: . ..:.. .. ::..:. .:. . :.:. ::..::::..::.:::..:...: CCDS47 GQHLNLLEYHVPKRWGCLADLFKVIENNKTFLNIKHYSINQTTLEQVFINFASEQQQTL- 4990 5000 5010 5020 5030 5040 2370 2380 2390 2400 2410 2420 pF1KA1 QQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFEEERAQLSF : : :: CCDS47 -QSTLDPSTDSHHTHHLPI 5050 >>CCDS33373.1 ABCA12 gene_id:26154|Hs108|chr2 (2277 aa) initn: 2275 init1: 608 opt: 1396 Z-score: 1134.4 bits: 223.9 E(32554): 7.3e-57 Smith-Waterman score: 3505; 34.3% identity (65.1% similar) in 1950 aa overlap (458-2364:490-2251) 430 440 450 460 470 480 pF1KA1 LRRGNMSSLGFTSKEQRNLGLLVHLMTSNPKILYAPAGSEVDRVILKANETFAFVGNVTH .::::: . . .. :.: :. .... . CCDS33 TPFCFSLYKDIINMPAGPVIWAFLKPMLLGRILYAPYNPVTKAIMEKSNVTLRQLAELRE 460 470 480 490 500 510 490 500 510 520 530 pF1KA1 YAQVWLNISAK-IRSF--LEQG--RLQQHLR--WLQQYVAELRLHPEALNL--SLDELPP .: :.. : . :: :.:. ::. :: ..: .: .. . .:..: ..::: CCDS33 KSQEWMDKSPLFMNSFHLLNQAIPMLQNTLRNPFVQVFV-KFSVGLDAVELLKQIDELD- 520 530 540 550 560 570 540 550 560 570 580 590 pF1KA1 ALRQDNFSLPSGMALLQQLDTIDNAACGWIQFMSKVSVDIFKGFPDEESIVNYTLNQAYQ :: ..: ... ...::.:... . ... : : : ... . . . .. :. CCDS33 ILR---LKLENNIDIIDQLNTLSSLT---VNISSCVLYDRIQAAKTIDEM-EREAKRLYK 580 590 600 610 620 630 600 610 620 630 640 pF1KA1 DNVTVFASVIFQTRKDGS-----------LPPHVHYKIRQNSSFTEKTNEIRRAYWRPGP .: .:.::::. .. : ::: ..: ::.. . .. : .: : ::: CCDS33 SN-ELFGSVIFKLPSNRSWHRGYDSGNVFLPPVIKYTIRMSLKTAQTTRSLRTKIWAPGP 640 650 660 670 680 650 660 670 680 690 700 pF1KA1 NTGGRFYFLYG--FVWIQDMMERAIIDTFVGHDVVEPGSYVQMFPYPCYTRDDFLFVIEH ... .:: :...:: .:::::. .:.. : . :: .::::. .:.:: . . CCDS33 HNSPSHNQIYGRAFIYLQDSIERAIIELQTGRNSQEIAVQVQAIPYPCFMKDNFLTSVSY 690 700 710 720 730 740 710 720 730 740 750 760 pF1KA1 MMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVT .:. ....:: .: ....: ::. ::.: :: ::.:. :. ::.: . : .... CCDS33 SLPIVLMVAWVVFIAAFVKKLVYEKDLRLHEYMKMMGVNSCSHFFAWLIESVGFLLVTIV 750 760 770 780 790 800 770 780 790 800 810 820 pF1KA1 ALTAILKYGQVLMHSHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSY : :::.:..: ... :..:... :. ..: . .:.::.......:. :..::.... CCDS33 ILIIILKFGNILPKTNGFILFLYFSDYSFSVIAMSYLISVFFNNTNIAALIGSLIYIIAF 810 820 830 840 850 860 830 840 850 860 870 880 pF1KA1 VPYMYVAIREEVAHDKITAFEKCIASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQSPV :.. .. : .... : . ::.: :::. .:.:.: :: :.:.::... ::: CCDS33 FPFIVLVTVE----NELSYVLKVFMSLLSPTAFSYASQYIARYEEQGIGLQWENMYTSPV 870 880 890 900 910 920 890 900 910 920 930 940 pF1KA1 EGDDFNLLLAVTMLMVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQKSYW---LGSGRT . : .. ....:. .: ...::.. : :: ::. :::::. ::: .: ... CCDS33 QDDTTSFGWLCCLILADSFIYFLIAWYVRNVFPGTYGMAAPWYFPILPSYWKERFGCAEV 930 940 950 960 970 980 950 960 970 980 990 1000 pF1KA1 EAWEWSWPWARTPRLSVMEEDQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKVYKDD . : : : ..: .. . : .. . ..: :: : . : . .::.: CCDS33 KP-EKSNGLMFT---NIMMQNTNPSA-SPEYMFSSNIEPEPKDLTVGVALHGVTKIY--G 990 1000 1010 1020 1030 1010 1020 1030 1040 1050 1060 pF1KA1 KKLALNKLSLNLYENQVVSFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRTEMDEI .:.:...:.::.::....:.:: ::::::::.:.::::: ..:. .::.::.:.. . CCDS33 SKVAVDNLNLNFYEGHITSLLGPNGAGKTTTISMLTGLFGASAGTIFVYGKDIKTDLHTV 1040 1050 1060 1070 1080 1090 1070 1080 1090 1100 1110 1120 pF1KA1 RKNLGMCPQHNVLFDRLTVEEHLWFYSRLK--SMAQEEIRREMDKMIEDLELSNKRHSLV :::.:.: ::.:::. ::..::: .:. .: .......:. . ..: : ..::. : CCDS33 RKNMGVCMQHDVLFSYLTTKEHLLLYGSIKVPHWTKKQLHEEVKRTLKDTGLYSHRHKRV 1100 1110 1120 1130 1140 1150 1130 1140 1150 1160 1170 1180 pF1KA1 QTLSGGMKRKLSVAIAFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHH :::::::::::..::..::::..:::::..:::: .::.:::.: : : .:::.::::: CCDS33 GTLSGGMKRKLSISIALIGGSRVVILDEPSTGVDPCSRRSIWDVISKNKTARTIILSTHH 1160 1170 1180 1190 1200 1210 1190 1200 1210 1220 1230 1240 pF1KA1 MDEADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPP .:::..:.::::.. .: :.:::::..:: ..::::.:::.:. . :.: .. CCDS33 LDEAEVLSDRIAFLEQGGLRCCGSPFYLKEAFGDGYHLTLTKK-------KSPNLNAN-- 1220 1230 1240 1250 1260 1250 1260 1270 1280 1290 pF1KA1 GRAPLSSCSELQVSQFIRKHVASCLLVSDTSTELSYILPSEAAK-KGAFERLFRHLERSL . :. . :. .:..:. : : . :: :.:: ..: .::. :.: :. .. CCDS33 -----AVCDTMAVTAMIQSHLPEAYLKEDIGGELVYVLPPFSTKVSGAYLSLLRALDNGM 1270 1280 1290 1300 1310 1320 1300 1310 1320 1330 1340 1350 pF1KA1 DALHLSSFGLMDTTLEEVFLKVSEEDQSLENSEADVKE-SRKDVLPGAEGPASGEGHAGN :... .:. :::.:::::....:.: .:: .... ..: . :...:.. CCDS33 GDLNIGCYGISDTTVEEVFLNLTKESQ--KNSAMSLEHLTQKKI---------GNSNANG 1330 1340 1350 1360 1370 1360 1370 1380 1390 1400 1410 pF1KA1 LARCSELTQSQASLQSASSVGSARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEA .. ..: ::.: ...:: .: :.. CCDS33 ISTPDDL-----------SVSS------SNFTD------------RD-DKI--------- 1380 1390 1420 1430 1440 1450 1460 1470 pF1KA1 LSRVGQGSRKLDGGWLKVRQFHGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSV :.: : : ::: : .... ..:.:::: .::: :.:..:..:: :: .:: .. CCDS33 LTR---GER-LDGFGLLLKKIMAILIKRFHHTRRNWKGLIAQVILPIVFVTTAMGLGTLR 1400 1410 1420 1430 1440 1450 1480 1490 1500 1510 1520 1530 pF1KA1 PEIGDLPPLVLSPSQYHNYTQPRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGV .. : . .::: : . : : ::: :. : : . :::.. :. CCDS33 NSSNSYPEIQISPSLYGTSEQT--AF--YAN-----YH----P--STEALVSAMWDFPGI 1460 1470 1480 1490 1540 1550 1560 1570 1580 1590 pF1KA1 GATCVLKSPANGSLGPTLNLSSGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPS : :: : : .::.. CCDS33 DNMC-------------LNTS------------DLQCLNK-------------------- 1500 1510 1600 1610 1620 1630 1640 1650 pF1KA1 DSPASPDEDLQAWNVSLPPTAGPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGH :: :. ::.: : .. . :.:: . ::. . CCDS33 DS-------LEKWNTSGEPITNFGV----------------CSCSENVQ--ECPK-FNYS 1520 1530 1540 1660 1670 1680 1690 1700 1710 pF1KA1 PPQMRVVTGDILTDITGHNVSEYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMV ::. :. ..... ..::. : .::. :...: .:::. .:: : . : . : CCDS33 PPHRRTYSSQVIYNLTGQRVENYLISTANEFVQKRYGGWSFGLPL-TKDLRFDITGVP-- 1550 1560 1570 1580 1590 1600 1720 1730 1740 1750 1760 1770 pF1KA1 RKIAVRRAAQVFYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMN--K : : :.:.:. .::::.:.::::::: .::.:. :: . : .:: . .::. . CCDS33 ---ANRTLAKVWYDPEGYHSLPAYLNSLNNFLLRVNM--SKYDAARHGIIMYSHPYPGVQ 1610 1620 1630 1640 1650 1780 1790 1800 1810 1820 1830 pF1KA1 TSASLSLDYLLQGTDVVIAIFIIVAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPIIYW . . ... :. :...:. :....: . ::::...: :..::::.:: .:: . :: CCDS33 DQEQATISSLI---DILVALSILMGYSVTTASFVTYVVREHQTKAKQLQHISGIGVTCYW 1660 1670 1680 1690 1700 1710 1840 1850 1860 1870 1880 1890 pF1KA1 LANYVWDMLNYLVPATCCVIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFW ..:...::. ::::.. . :. .: :::. : .:. :: :.::.:.. :: . CCDS33 VTNFIYDMVFYLVPVAFSIGIIAIFKLPAFYSENNLGAVSLLLLLFGYATFSWMYLLAGL 1720 1730 1740 1750 1760 1770 1900 1910 1920 1930 1940 1950 pF1KA1 FEVPSSAYVFLIVINLFIGITA----TVATFLLQLFEHDKDLKVVNSYLKSCFLIFPNYN :. . :.. . .:::.::.. .:. :: . .: :.... :: :::::.. CCDS33 FHETGMAFITYVCVNLFFGINSIVSLSVVYFLSKEKPNDPTLELISETLKRIFLIFPQFC 1780 1790 1800 1810 1820 1830 1960 1970 1980 1990 2000 2010 pF1KA1 LGHGLMEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYN .:.::.:.. .. . .. : . . :: . . .::.. .:.. : : .. . . CCDS33 FGYGLIELSQQQSVLDFLKAYG-VEYPNETFEMNKLGAMFVALVSQGTMFFSLRLLINES 1840 1850 1860 1870 1880 1890 2020 2030 2040 2050 2060 pF1KA1 FLRRPQ---RMPVST---KPVEDDVDVASERQRVLRGDADNDMVKIENLTKVYKSRKIGR .... . : :. . ...: :: .:: :: : :. :.:.. :::.:. . . CCDS33 LIKKLRLFFRKFNSSHVRETIDEDEDVRAERLRVESGAAEFDLVQLYCLTKTYQLIH-KK 1900 1910 1920 1930 1940 1950 2070 2080 2090 2100 2110 2120 pF1KA1 ILAVDRLCLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQVQ :.::. . .:. :::::::::::::::. ::::::: ..:. .. ... .. . CCDS33 IIAVNNISIGIPAGECFGLLGVNGAGKTTIFKMLTGDIIPSSGNILIRNKTGSLGHVDSH 1960 1970 1980 1990 2000 2010 2130 2140 2150 2160 2170 2180 pF1KA1 QSL-GYCPQCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPAGT .:: ::::: ::: : .:..::: .:.:..:: :: ..:. :..:.: . :. .. CCDS33 SSLVGYCPQEDALDDLVTVEEHLYFYARVHGIPEKDIKETVHKLLRRLHLMPFKDRATSM 2020 2030 2040 2050 2060 2070 2190 2200 2210 2220 2230 2240 pF1KA1 YSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSVVLTSHSM : :.:::::::.:::: :....::::..:::::..: ::..: . ... ::.:::::: CCDS33 CSYGTKRKLSTALALIGKPSILLLDEPSSGMDPKSKRHLWKIISEEVQNKCSVILTSHSM 2080 2090 2100 2110 2120 2130 2250 2260 2270 2280 2290 2300 pF1KA1 EECEALCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQ-SVKDVVRFFNRNFP ::::::::::::::::...:.::.::.:.::: :. . :. :... ... ...:.. .:: CCDS33 EECEALCTRLAIMVNGKFQCIGSLQHIKSRFGRGFTVKVHLKNNKVTMETLTKFMQLHFP 2140 2150 2160 2170 2180 2190 2310 2320 2330 2340 2350 2360 pF1KA1 EAMLKERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKKQ ...::..: . ..:.. ..:..:. .: . .:.: .. ::::::..::.:::: : CCDS33 KTYLKDQHLSMLEYHVPVTAGGVANIFDLLETNKTALNITNFLVSQTTLEEVFINFAKDQ 2200 2210 2220 2230 2240 2250 2370 2380 2390 2400 2410 2420 pF1KA1 SDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFEEER CCDS33 KSYETADTSSQGSTISVDSQDDQMES 2260 2270 >>CCDS33372.1 ABCA12 gene_id:26154|Hs108|chr2 (2595 aa) initn: 2599 init1: 608 opt: 1396 Z-score: 1133.5 bits: 223.9 E(32554): 8.1e-57 Smith-Waterman score: 3505; 34.3% identity (65.1% similar) in 1950 aa overlap (458-2364:808-2569) 430 440 450 460 470 480 pF1KA1 LRRGNMSSLGFTSKEQRNLGLLVHLMTSNPKILYAPAGSEVDRVILKANETFAFVGNVTH .::::: . . .. :.: :. .... . CCDS33 TPFCFSLYKDIINMPAGPVIWAFLKPMLLGRILYAPYNPVTKAIMEKSNVTLRQLAELRE 780 790 800 810 820 830 490 500 510 520 530 pF1KA1 YAQVWLNISAK-IRSF--LEQG--RLQQHLR--WLQQYVAELRLHPEALNL--SLDELPP .: :.. : . :: :.:. ::. :: ..: .: .. . .:..: ..::: CCDS33 KSQEWMDKSPLFMNSFHLLNQAIPMLQNTLRNPFVQVFV-KFSVGLDAVELLKQIDELD- 840 850 860 870 880 890 540 550 560 570 580 590 pF1KA1 ALRQDNFSLPSGMALLQQLDTIDNAACGWIQFMSKVSVDIFKGFPDEESIVNYTLNQAYQ :: ..: ... ...::.:... . ... : : : ... . . . .. :. CCDS33 ILR---LKLENNIDIIDQLNTLSSLT---VNISSCVLYDRIQAAKTIDEM-EREAKRLYK 900 910 920 930 940 600 610 620 630 640 pF1KA1 DNVTVFASVIFQTRKDGS-----------LPPHVHYKIRQNSSFTEKTNEIRRAYWRPGP .: .:.::::. .. : ::: ..: ::.. . .. : .: : ::: CCDS33 SN-ELFGSVIFKLPSNRSWHRGYDSGNVFLPPVIKYTIRMSLKTAQTTRSLRTKIWAPGP 950 960 970 980 990 1000 650 660 670 680 690 700 pF1KA1 NTGGRFYFLYG--FVWIQDMMERAIIDTFVGHDVVEPGSYVQMFPYPCYTRDDFLFVIEH ... .:: :...:: .:::::. .:.. : . :: .::::. .:.:: . . CCDS33 HNSPSHNQIYGRAFIYLQDSIERAIIELQTGRNSQEIAVQVQAIPYPCFMKDNFLTSVSY 1010 1020 1030 1040 1050 1060 710 720 730 740 750 760 pF1KA1 MMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVT .:. ....:: .: ....: ::. ::.: :: ::.:. :. ::.: . : .... CCDS33 SLPIVLMVAWVVFIAAFVKKLVYEKDLRLHEYMKMMGVNSCSHFFAWLIESVGFLLVTIV 1070 1080 1090 1100 1110 1120 770 780 790 800 810 820 pF1KA1 ALTAILKYGQVLMHSHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSY : :::.:..: ... :..:... :. ..: . .:.::.......:. :..::.... CCDS33 ILIIILKFGNILPKTNGFILFLYFSDYSFSVIAMSYLISVFFNNTNIAALIGSLIYIIAF 1130 1140 1150 1160 1170 1180 830 840 850 860 870 880 pF1KA1 VPYMYVAIREEVAHDKITAFEKCIASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQSPV :.. .. : .... : . ::.: :::. .:.:.: :: :.:.::... ::: CCDS33 FPFIVLVTVE----NELSYVLKVFMSLLSPTAFSYASQYIARYEEQGIGLQWENMYTSPV 1190 1200 1210 1220 1230 1240 890 900 910 920 930 940 pF1KA1 EGDDFNLLLAVTMLMVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQKSYW---LGSGRT . : .. ....:. .: ...::.. : :: ::. :::::. ::: .: ... CCDS33 QDDTTSFGWLCCLILADSFIYFLIAWYVRNVFPGTYGMAAPWYFPILPSYWKERFGCAEV 1250 1260 1270 1280 1290 1300 950 960 970 980 990 1000 pF1KA1 EAWEWSWPWARTPRLSVMEEDQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKVYKDD . : : : ..: .. . : .. . ..: :: : . : . .::.: CCDS33 KP-EKSNGLMFT---NIMMQNTNPSA-SPEYMFSSNIEPEPKDLTVGVALHGVTKIY--G 1310 1320 1330 1340 1350 1010 1020 1030 1040 1050 1060 pF1KA1 KKLALNKLSLNLYENQVVSFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRTEMDEI .:.:...:.::.::....:.:: ::::::::.:.::::: ..:. .::.::.:.. . CCDS33 SKVAVDNLNLNFYEGHITSLLGPNGAGKTTTISMLTGLFGASAGTIFVYGKDIKTDLHTV 1360 1370 1380 1390 1400 1410 1070 1080 1090 1100 1110 1120 pF1KA1 RKNLGMCPQHNVLFDRLTVEEHLWFYSRLK--SMAQEEIRREMDKMIEDLELSNKRHSLV :::.:.: ::.:::. ::..::: .:. .: .......:. . ..: : ..::. : CCDS33 RKNMGVCMQHDVLFSYLTTKEHLLLYGSIKVPHWTKKQLHEEVKRTLKDTGLYSHRHKRV 1420 1430 1440 1450 1460 1470 1130 1140 1150 1160 1170 1180 pF1KA1 QTLSGGMKRKLSVAIAFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHH :::::::::::..::..::::..:::::..:::: .::.:::.: : : .:::.::::: CCDS33 GTLSGGMKRKLSISIALIGGSRVVILDEPSTGVDPCSRRSIWDVISKNKTARTIILSTHH 1480 1490 1500 1510 1520 1530 1190 1200 1210 1220 1230 1240 pF1KA1 MDEADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPP .:::..:.::::.. .: :.:::::..:: ..::::.:::.:. . :.: .. CCDS33 LDEAEVLSDRIAFLEQGGLRCCGSPFYLKEAFGDGYHLTLTKK-------KSPNLNAN-- 1540 1550 1560 1570 1580 1250 1260 1270 1280 1290 pF1KA1 GRAPLSSCSELQVSQFIRKHVASCLLVSDTSTELSYILPSEAAK-KGAFERLFRHLERSL . :. . :. .:..:. : : . :: :.:: ..: .::. :.: :. .. CCDS33 -----AVCDTMAVTAMIQSHLPEAYLKEDIGGELVYVLPPFSTKVSGAYLSLLRALDNGM 1590 1600 1610 1620 1630 1640 1300 1310 1320 1330 1340 1350 pF1KA1 DALHLSSFGLMDTTLEEVFLKVSEEDQSLENSEADVKE-SRKDVLPGAEGPASGEGHAGN :... .:. :::.:::::....:.: .:: .... ..: . :...:.. CCDS33 GDLNIGCYGISDTTVEEVFLNLTKESQ--KNSAMSLEHLTQKKI---------GNSNANG 1650 1660 1670 1680 1690 1360 1370 1380 1390 1400 1410 pF1KA1 LARCSELTQSQASLQSASSVGSARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEA .. ..: ::.: ...:: .: :.. CCDS33 ISTPDDL-----------SVSS------SNFTD------------RD-DKI--------- 1700 1710 1420 1430 1440 1450 1460 1470 pF1KA1 LSRVGQGSRKLDGGWLKVRQFHGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSV :.: : : ::: : .... ..:.:::: .::: :.:..:..:: :: .:: .. CCDS33 LTR---GER-LDGFGLLLKKIMAILIKRFHHTRRNWKGLIAQVILPIVFVTTAMGLGTLR 1720 1730 1740 1750 1760 1480 1490 1500 1510 1520 1530 pF1KA1 PEIGDLPPLVLSPSQYHNYTQPRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGV .. : . .::: : . : : ::: :. : : . :::.. :. CCDS33 NSSNSYPEIQISPSLYGTSEQT--AF--YAN-----YH----P--STEALVSAMWDFPGI 1770 1780 1790 1800 1810 1540 1550 1560 1570 1580 1590 pF1KA1 GATCVLKSPANGSLGPTLNLSSGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPS : :: : : .::.. CCDS33 DNMC-------------LNTS------------DLQCLNK-------------------- 1820 1600 1610 1620 1630 1640 1650 pF1KA1 DSPASPDEDLQAWNVSLPPTAGPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGH :: :. ::.: : .. . :.:: . ::. . CCDS33 DS-------LEKWNTSGEPITNFGV----------------CSCSENVQ--ECPK-FNYS 1830 1840 1850 1860 1660 1670 1680 1690 1700 1710 pF1KA1 PPQMRVVTGDILTDITGHNVSEYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMV ::. :. ..... ..::. : .::. :...: .:::. .:: : . : . : CCDS33 PPHRRTYSSQVIYNLTGQRVENYLISTANEFVQKRYGGWSFGLPL-TKDLRFDITGVP-- 1870 1880 1890 1900 1910 1720 1730 1740 1750 1760 1770 pF1KA1 RKIAVRRAAQVFYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMN--K : : :.:.:. .::::.:.::::::: .::.:. :: . : .:: . .::. . CCDS33 ---ANRTLAKVWYDPEGYHSLPAYLNSLNNFLLRVNM--SKYDAARHGIIMYSHPYPGVQ 1920 1930 1940 1950 1960 1970 1780 1790 1800 1810 1820 1830 pF1KA1 TSASLSLDYLLQGTDVVIAIFIIVAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPIIYW . . ... :. :...:. :....: . ::::...: :..::::.:: .:: . :: CCDS33 DQEQATISSLI---DILVALSILMGYSVTTASFVTYVVREHQTKAKQLQHISGIGVTCYW 1980 1990 2000 2010 2020 2030 1840 1850 1860 1870 1880 1890 pF1KA1 LANYVWDMLNYLVPATCCVIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFW ..:...::. ::::.. . :. .: :::. : .:. :: :.::.:.. :: . CCDS33 VTNFIYDMVFYLVPVAFSIGIIAIFKLPAFYSENNLGAVSLLLLLFGYATFSWMYLLAGL 2040 2050 2060 2070 2080 2090 1900 1910 1920 1930 1940 1950 pF1KA1 FEVPSSAYVFLIVINLFIGITA----TVATFLLQLFEHDKDLKVVNSYLKSCFLIFPNYN :. . :.. . .:::.::.. .:. :: . .: :.... :: :::::.. CCDS33 FHETGMAFITYVCVNLFFGINSIVSLSVVYFLSKEKPNDPTLELISETLKRIFLIFPQFC 2100 2110 2120 2130 2140 2150 1960 1970 1980 1990 2000 2010 pF1KA1 LGHGLMEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYN .:.::.:.. .. . .. : . . :: . . .::.. .:.. : : .. . . CCDS33 FGYGLIELSQQQSVLDFLKAYG-VEYPNETFEMNKLGAMFVALVSQGTMFFSLRLLINES 2160 2170 2180 2190 2200 2210 2020 2030 2040 2050 2060 pF1KA1 FLRRPQ---RMPVST---KPVEDDVDVASERQRVLRGDADNDMVKIENLTKVYKSRKIGR .... . : :. . ...: :: .:: :: : :. :.:.. :::.:. . . CCDS33 LIKKLRLFFRKFNSSHVRETIDEDEDVRAERLRVESGAAEFDLVQLYCLTKTYQLIH-KK 2220 2230 2240 2250 2260 2070 2080 2090 2100 2110 2120 pF1KA1 ILAVDRLCLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQVQ :.::. . .:. :::::::::::::::. ::::::: ..:. .. ... .. . CCDS33 IIAVNNISIGIPAGECFGLLGVNGAGKTTIFKMLTGDIIPSSGNILIRNKTGSLGHVDSH 2270 2280 2290 2300 2310 2320 2130 2140 2150 2160 2170 2180 pF1KA1 QSL-GYCPQCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPAGT .:: ::::: ::: : .:..::: .:.:..:: :: ..:. :..:.: . :. .. CCDS33 SSLVGYCPQEDALDDLVTVEEHLYFYARVHGIPEKDIKETVHKLLRRLHLMPFKDRATSM 2330 2340 2350 2360 2370 2380 2190 2200 2210 2220 2230 2240 pF1KA1 YSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSVVLTSHSM : :.:::::::.:::: :....::::..:::::..: ::..: . ... ::.:::::: CCDS33 CSYGTKRKLSTALALIGKPSILLLDEPSSGMDPKSKRHLWKIISEEVQNKCSVILTSHSM 2390 2400 2410 2420 2430 2440 2250 2260 2270 2280 2290 2300 pF1KA1 EECEALCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQ-SVKDVVRFFNRNFP ::::::::::::::::...:.::.::.:.::: :. . :. :... ... ...:.. .:: CCDS33 EECEALCTRLAIMVNGKFQCIGSLQHIKSRFGRGFTVKVHLKNNKVTMETLTKFMQLHFP 2450 2460 2470 2480 2490 2500 2310 2320 2330 2340 2350 2360 pF1KA1 EAMLKERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKKQ ...::..: . ..:.. ..:..:. .: . .:.: .. ::::::..::.:::: : CCDS33 KTYLKDQHLSMLEYHVPVTAGGVANIFDLLETNKTALNITNFLVSQTTLEEVFINFAKDQ 2510 2520 2530 2540 2550 2560 2370 2380 2390 2400 2410 2420 pF1KA1 SDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFEEER CCDS33 KSYETADTSSQGSTISVDSQDDQMES 2570 2580 2590 >>CCDS10466.1 ABCA3 gene_id:21|Hs108|chr16 (1704 aa) initn: 2972 init1: 905 opt: 1139 Z-score: 926.8 bits: 185.0 E(32554): 2.7e-45 Smith-Waterman score: 3082; 34.0% identity (59.9% similar) in 1943 aa overlap (512-2370:39-1702) 490 500 510 520 530 pF1KA1 VGNVTHYAQVWLNISAKIRSFLEQGRLQQHLRWLQQYVAELRLHPEAL---NLSLDELPP : ::. . . :.: . :..::: CCDS10 LLLWKNYTLQKRKVLVTVLELFLPLLFSGILIWLRLKIQSENV-PNATIYPGQSIQELPL 10 20 30 40 50 60 540 550 560 570 580 590 pF1KA1 ALRQDNFSLPSGMALLQQLDTIDNAACGWIQFMSK-VSVDI-FKGFPDEESIVNYTLNQA . .: :. : . . ..:: . . . . ... .:::.:... .: CCDS10 FF---TFPPPGDTWELAYIPSHSDAAKTVTETVRRALVINMRVRGFPSEKDFEDYI---- 70 80 90 100 110 120 600 610 620 630 pF1KA1 YQDNVT--VFASVIFQTRKDGS---LPPHVHYKIR-----------QNSSFTEKTNE--- :: . :.:.:.:. . : :: :.:..: :..:: : .: CCDS10 RYDNCSSSVLAAVVFEHPFNHSKEPLPLAVKYHLRFSYTRRNYMWTQTGSFFLKETEGWH 130 140 150 160 170 180 640 650 660 670 680 pF1KA1 ---IRRAYWRPGPNT-----GGRF-YFLYGFVWIQDMMERAII----DTFVGHDVVEPGS . . ::: ::. :. ::. .: ..:::. :. . . . CCDS10 TTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVDRAIMEYHADAATRQLFQRLTV 190 200 210 220 230 240 690 700 710 720 730 740 pF1KA1 YVQMFPYPCYTRDDFLFVIEHMMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMKTMGLN .. :::: . : :: .:....:: ...:..:.. . .: :::.:::: :. :::. CCDS10 TIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIARAVVQEKERRLKEYMRMMGLS 250 260 270 280 290 300 750 760 770 780 790 pF1KA1 NAVHWVAWFITGFVQLSISVTALTAILKYG-----QVLMHSHVVIIWLFLAVYAVATIMF . .:: :::. :. : :... .: .. :: .: .. :: .:..:: : CCDS10 SWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLSRSDPSLVLAFLLCFAISTISF 310 320 330 340 350 360 800 810 820 830 840 850 pF1KA1 CFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREEVAHDKITAFEKCIASLMSTTAFG :.::...:::..:.: ::..::..:.::..:: : .. .: .: . :.:..:.. CCDS10 SFMVSTFFSKANMAAAFGGFLYFFTYIPYFFVAPR----YNWMTLSQKLCSCLLSNVAMA 370 380 390 400 410 860 870 880 890 900 910 pF1KA1 LGSKYFALYEVAGVGIQWHTFSQSPVE-GDDFNLLLAVTMLMVDAVVYGILTWYIEAVHP .:.. .. .:. :.::::. . :::. ::: . .. ::..:.:.::..:::.::: : CCDS10 MGAQLIGKFEAKGMGIQWRDL-LSPVNVDDDFCFGQVLGMLLLDSVLYGLVTWYMEAVFP 420 430 440 450 460 470 920 930 940 950 960 970 pF1KA1 GMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTPRLSVMEEDQACAMESRRFEETRG :..:.:.:::: .. ::: :. :. : . . : :.... :: CCDS10 GQFGVPQPWYFFIMPSYWCGKPRAVAGKEE-----------EDSDPEKALRNEYFEA--- 480 490 500 510 520 980 990 1000 1010 1020 1030 pF1KA1 MEEEPTHLPLVVCVDKLTKVYK--DDKKLALNKLSLNLYENQVVSFLGHNGAGKTTTMSI :: : . . .:.::.. . . :. :.:::::.:.. .:::::::::::.:. CCDS10 ---EPEDLVAGIKIKHLSKVFRVGNKDRAAVRDLNLNLYEGQITVLLGHNGAGKTTTLSM 530 540 550 560 570 1040 1050 1060 1070 1080 1090 pF1KA1 LTGLFPPTSGSATIYGHDIRTEMDEIRKNLGMCPQHNVLFDRLTVEEHLWFYSRLKSMAQ :::::::::: : : :..: .: .:::.::.::::..::: ::: :::.::..::.... CCDS10 LTGLFPPTSGRAYISGYEISQDMVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKGLSR 580 590 600 610 620 630 1100 1110 1120 1130 1140 1150 pF1KA1 EEIRREMDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAIAFVGGSRAIILDEPTAGVDPY .. .:. .:.. . : .: .: . :::::.::::..::...::...::::::.:.: CCDS10 QKCPEEVKQMLHIIGLEDKWNSRSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSGMDAI 640 650 660 670 680 690 1160 1170 1180 1190 1200 1210 pF1KA1 ARRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGY .:::::::. . : :::.:.:: :::::::::::::...:.:.:::: :::: :: :: CCDS10 SRRAIWDLLQRQKSDRTIVLTTHFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKYGAGY 700 710 720 730 740 750 1220 1230 1240 1250 1260 1270 pF1KA1 RLTLVKRPAEPGGPQEPGLASSPPGRAPLSSCSELQVSQFIRKHVASCLLVSDTSTELSY ..::::.: :. ..::....:: . : :....:::. CCDS10 HMTLVKEP----------------------HCNPEDISQLVHHHVPNATLESSAGAELSF 760 770 780 790 1280 1290 1300 1310 1320 1330 pF1KA1 ILPSEAAKKGAFERLFRHLERSLDALHLSSFGLMDTTLEEVFLKVSEEDQSLENSEADVK ::: :.... :: :: .::.. : ..::: ::.:::::.:.. : .: :.. CCDS10 ILPRESTHR--FEGLFAKLEKKQKELGIASFGASITTMEEVFLRVGK----LVDSSMDIQ 800 810 820 830 840 850 1340 1350 1360 1370 1380 1390 pF1KA1 ESRKDVLPGAEGPASGEGHAGNLARCSELTQSQASLQSASSVGSARGDEGAGYTDVYGDY . ::. . . : .:.. : :.: :. ..: : CCDS10 AIQ---LPALQ--YQHERRASDWAVDSNLC------------GAMDPSDGIG-------- 860 870 880 1400 1410 1420 1430 1440 1450 pF1KA1 RPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGW-LKVRQFHGLLVKRFHCARRNSK .: : : :. ::. : :. .:: ....:. . :. : CCDS10 -------------ALIEEERTAV--------KLNTGLALHCQQFWAMFLKKAAYSWREWK 890 900 910 920 1460 1470 1480 1490 1500 1510 pF1KA1 ALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQYHNYTQPRGNFIPYANEERREY . .:.:.: : .:. . :. : : : :. ..: . : CCDS10 MVAAQVLVPLTCVTLALLAINYSSELFDDPMLRLTLGEYGRTVVP--------------- 930 940 950 960 1520 1530 1540 1550 1560 1570 pF1KA1 RLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSLGPTLNLSSGESRLLAARFFDSMC : .: : :.: CCDS10 ----------------FSVP-------------------------GTSQL---------- 970 1580 1590 1600 1610 1620 1630 pF1KA1 LESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWNVSLPPTAGPEMWTSAPSLPRLVR : ::. . .:. ::: CCDS10 ------GQQLSEHL--------KDA-------LQAE------------------------ 980 990 1640 1650 1660 1670 1680 1690 pF1KA1 EPVRCTCSAQGTGFSCPSSVGGHPPQMRVVTGDILTDITGHNVSEYLLFTSDRFRLHRYG :. : : : ::. :.:.: : .. : CCDS10 ---------------------GQEP--REVLGDL---------EEFLIF---RASVEGGG 1000 1010 1700 1710 1720 1730 1740 1750 pF1KA1 AITFGNVLKSIPASFGTRAPPMVRKIAVRRAAQVFYNNKGYHSMPTYLNSLNNAILRANL : : . ::: : .. : ......::..::: : : ..: .. CCDS10 ---F-NERCLVAASF--------RDVGERTVVNALFNNQAYHSPATALAVVDNLLF---- 1020 1030 1040 1050 1060 1760 1770 1780 1790 1800 1810 pF1KA1 PKSKGNPAAYGITVTNHPMNKTSASLSLDYLLQGTDVV-IAIFIIVAMSFVPASFVVFLV : .: : .:.:.: :. ... . . : . .: ::. .. ::.:. ..: .. : CCDS10 -KLLCGPHA-SIVVSNFPQPRSALQAAKDQFNEGRKGFDIALNLLFAMAFLASTFSILAV 1070 1080 1090 1100 1110 1120 1820 1830 1840 1850 1860 1870 pF1KA1 AEKSTKAKHLQFVSGCNPIIYWLANYVWDMLNYLVPATCCVIILFVFDLPAYTSPTNFPA .:....:::.::::: . .::. .::....:.:. .... .::. :.: .. CCDS10 SERAVQAKHVQFVSGVHVASFWLSALLWDLISFLIPSLLLLVVFKAFDVRAFTRDGHMAD 1130 1140 1150 1160 1170 1180 1880 1890 1900 1910 1920 1930 pF1KA1 VLSLFLLYGWSITPIMYPASFWFEVPSSAYVFLIVINLFIGITATVATFLLQLFEHDKDL .: :.:::::.: :.:: .:.: ..::. : ..:.. :: ::::. . . . CCDS10 TLLLLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSGI----ATFLMVTIMRIPAV 1190 1200 1210 1220 1230 1940 1950 1960 1970 1980 pF1KA1 KV--VNSYLKSCFLIFPNYNLGHGLMEMAYNEY----------INEYYAKIGQFDKMKSP :. ... : ::..::. :: .. . :..: . .: : ... ... CCDS10 KLEELSKTLDHVFLVLPNHCLGMAVSSF-YENYETRRYCTSSEVAAHYCKKYNIQYQENF 1240 1250 1260 1270 1280 1290 1990 2000 2010 2020 pF1KA1 FEWDI--VTRGLVAMAVEGVVGFLLTIMCQYNFLRRPQ-----------------RMPVS . :. : : ...::. : . ..: .. . :.:.: . :::: CCDS10 YAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQRLRGILCALRRRRTLTELYTRMPV- 1300 1310 1320 1330 1340 1350 2030 2040 2050 2060 2070 2080 pF1KA1 TKPVEDDVDVASERQRVLRGDADNDM---VKIENLTKVYKSRKIGRILAVDRLCLGVRPG . .: :::.:: :.: . :. . . :..:.:::..: .:::::: :.:. : CCDS10 ---LPEDQDVADERTRILAPSPDSLLHTPLIIKELSKVYEQRVP--LLAVDRLSLAVQKG 1360 1370 1380 1390 1400 2090 2100 2110 2120 2130 2140 pF1KA1 ECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQVQQSLGYCPQCDALFD ::::::: ::::::.:::::::.:: :.:.:::.:: . ... .:.: .::::: :::.: CCDS10 ECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGHRISSDVGKVRQRIGYCPQFDALLD 1410 1420 1430 1440 1450 1460 2150 2160 2170 2180 2190 2200 pF1KA1 ELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPAGTYSGGNKRKLSTAIAL ..:.:: : .:.::::: . . :. .:. : : .:.: . ::::::::::::.::: CCDS10 HMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLVRTYSGGNKRKLSTGIAL 1470 1480 1490 1500 1510 1520 2210 2220 2230 2240 2250 2260 pF1KA1 IGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSVVLTSHSMEECEALCTRLAIMVN :: :: ::::::.::::: :::.::. . ..:.....:::::::::::::::::::. CCDS10 IGEPAVIFLDEPSTGMDPVARRLLWDTVARARESGKAIIITSHSMEECEALCTRLAIMVQ 1530 1540 1550 1560 1570 1580 2270 2280 2290 2300 2310 pF1KA1 GRLRCLGSIQHLKNRFGDGYMITVRTKS---SQSVKDVVRFFNRNFPEAMLKERHHTKVQ :...:::: ::::..::.:: . ....: ...... : . .:: ..:...:. :. CCDS10 GQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQEALEEFKAFVDLTFPGSVLEDEHQGMVH 1590 1600 1610 1620 1630 1640 2320 2330 2340 2350 2360 2370 pF1KA1 YQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKKQSDNLEQQETEPPS :.: .. .: :.::. .:... :..:::::: .:..::..::. : . :. CCDS10 YHLPGRDLSWAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFAHLQPPTAEEGR 1650 1660 1670 1680 1690 1700 2380 2390 2400 2410 2420 2430 pF1KA1 ALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFEEERAQLSFNTDTLC >>CCDS11685.1 ABCA5 gene_id:23461|Hs108|chr17 (1642 aa) initn: 1372 init1: 524 opt: 722 Z-score: 587.1 bits: 122.1 E(32554): 2.2e-26 Smith-Waterman score: 1570; 26.2% identity (53.3% similar) in 1902 aa overlap (524-2366:52-1618) 500 510 520 530 540 550 pF1KA1 NISAKIRSFLEQGRLQQHLRWLQQYVAELRLHPEALNLSLDELPPALRQ--DNFSLPSGM .:: : . .:.: . :.:.: . CCDS11 YLIKCRTKKSSVQEILFPLFFLFWLILISMMHP---NKKYEEVPNIELNPMDKFTLSN-- 30 40 50 60 70 560 570 580 590 600 pF1KA1 ALLQQLDTIDNAACGWIQFMSKVSVD------IFKGFPDEESIVNYTLNQAYQDNVTVFA :. . : . . .:.:::.: : . . .:. ... .:.. . :. CCDS11 -LILGYTPVTNITSS---IMQKVSTDHLPDVIITEEYTNEKEMLTSSLSKP-----SNFV 80 90 100 110 120 610 620 630 640 650 660 pF1KA1 SVIFQTRKDGSLPPHVHYKIRQNSSFTEKTNEIRRAYW--RPGPNTGGRF--YFLYGFVW .:.: ::. . :..: : . : : : . . . :. ::. CCDS11 GVVF---KDS-----MSYELR----FFPDMIPVSSIYMDSRAGCSKSCEAAQYWSSGFTV 130 140 150 160 170 670 680 690 700 710 pF1KA1 IQDMMERAIIDTFVGHDV---VEPGSYVQMFPYPCYTRDDFLFVIEHMMPLCMVISWV-Y .: .. :::. .. .. .: . : : : : . .. . .::.. . CCDS11 LQASIDAAIIQLKTNVSLWKELESTKAVIMGETAVVEIDTF---PRGVILIYLVIAFSPF 180 190 200 210 220 230 720 730 740 750 760 770 pF1KA1 SVAMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVTALTAILKYGQVL . ..: :::::::...:: .: :::.... :..: . ...: . .. : :.. ...: CCDS11 GYFLAI-HIVAEKEKKIKEFLKIMGLHDTAFWLSWVLL-YTSLIFLMSLLMAVIATASLL 240 250 260 270 280 290 780 790 800 810 820 830 pF1KA1 M-HSHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREE . .: ..:.:.. .:......: .... :..:.: . ::. :. : . .... CCDS11 FPQSSSIVIFLLFFLYGLSSVFFALMLTPLFKKSKHV----GIVEFFVTVAFGFIGLMII 300 310 320 330 340 840 850 860 870 880 890 pF1KA1 VAHDKITAFEKCIASLMST---TAFGLGSKYFALYEVAGVGIQWHTFSQSPVEGDDFNLL . : .: : .. :.: .: .: : . : .. ... .: . :. CCDS11 L----IESFPKSLVWLFSPFCHCTFVIGIAQVMHLEDFNEGASFSNLTAGP-----YPLI 350 360 370 380 390 900 910 920 930 940 950 pF1KA1 LAVTMLMVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWAR ... :: .... : .:. :.. : :: .:: : . :. ::: : :. .: CCDS11 ITIIMLTLNSIFYVLLAVYLDQVIPGEFGLRRSSLYFLKPSYWSKSKRN--YEELSEGNV 400 410 420 430 440 450 960 970 980 990 1000 1010 pF1KA1 TPRLSVMEEDQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKVY--KDDKKLALNKLS . .: : . . : : : .. . :.: : .. :: .:: CCDS11 NGNISFSEIIEPVSSEFVGKEAIR--------------ISGIQKTYRKKGENVEALRNLS 460 470 480 490 500 1020 1030 1040 1050 1060 pF1KA1 LNLYENQVVSFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRTEMDEI---RKNLGM ...::.:....:::.:.::.: :.:: :: ::..: :.:::: . .:.::. :: .:. CCDS11 FDIYEGQITALLGHSGTGKSTLMNILCGLCPPSDGFASIYGHRV-SEIDEMFEARKMIGI 510 520 530 540 550 560 1070 1080 1090 1100 1110 1120 pF1KA1 CPQHNVLFDRLTVEEHLWFYSRLKSMAQEEIRREMDKMIEDLELSNKRHSLVQTLSGGMK ::: .. :: :::::.: . . .:.. ..: .:..:.. ::.... . . .. ::::.: CCDS11 CPQLDIHFDVLTVEENLSILASIKGIPANNIIQEVQKVLLDLDMQTIKDNQAKKLSGGQK 570 580 590 600 610 620 1130 1140 1150 1160 1170 1180 pF1KA1 RKLSVAIAFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDEADLLG ::::..:: .:. . ..:::::::.:: .:. .:.:. : .:. ..::: :::::.:. CCDS11 RKLSLGIAVLGNPKILLLDEPTAGMDPCSRHIVWNLLKYRKANRVTVFSTHFMDEADILA 630 640 650 660 670 680 1190 1200 1210 1220 1230 1240 pF1KA1 DRIAIISHGKLKCCGSPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPPGRAPLSSC :: :.::.: ::: :: .:::. .: ::::.. . : CCDS11 DRKAVISQGMLKCVGSSMFLKSKWGIGYRLSMYID----------------------KYC 690 700 710 1250 1260 1270 1280 1290 1300 pF1KA1 SELQVSQFIRKHVASCLLVSDTSTELSYILPSEAAKKGAFERLFRHLERSLDALHLSSFG . ..:.....:. . :..... .: : :: . : : :: :. : . : . :.: CCDS11 ATESLSSLVKQHIPGATLLQQNDQQLVYSLPFKDMDK--FSGLFSALD-SHSNLGVISYG 720 730 740 750 760 770 1310 1320 1330 1340 1350 1360 pF1KA1 LMDTTLEEVFLKVSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCSELTQS . ::::.:::: :: ::.. .. .:. .. : : . .. .:. :: CCDS11 VSMTTLEDVFLK-------LE-VEAEIDQADYSVF--TQQPLEEEMDSKSF---DEMEQS 780 790 800 810 820 1370 1380 1390 1400 1410 1420 pF1KA1 QASLQSASSVGSARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRK . :.:..: .: .. ... CCDS11 L---------------------------------------LILSETKAALVSTMSLWKQQ 830 840 1430 1440 1450 1460 1470 1480 pF1KA1 LDGGWLKVRQFHGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGD-LPPL . . .:: : .:.::.. : .:: .: : . . : . . . :. CCDS11 M----YTIAKFH------FFTLKRESKSVRSVLLLLLIFFTVQIFMFLVHHSFKNAVVPI 850 860 870 880 890 1490 1500 1510 1520 1530 1540 pF1KA1 VLSPSQYHNYTQPRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGVGATCVLKSP : :. : . .: :. :. . . :. : :.. ..:.: : ... .: . : CCDS11 KLVPDLY--FLKP-GD-KPH--KYKTSLLLQNSADSDISDLISFFT-SQNIMVTMINDSD 900 910 920 930 940 1550 1560 1570 1580 1590 1600 pF1KA1 ANGSLGP---TLNLSSGESRLLAARFFDSMCLESFTQGLP-LSNFVPPPPSPAPSDSPAS :..: .::. .:. . : :.: ... .:: : :.. CCDS11 YV-SVAPHSAALNVMHSEKDYVFAAVFNS----TMVYSLPILVNIIS------------- 950 960 970 980 1610 1620 1630 1640 1650 1660 pF1KA1 PDEDLQAWNVSLPPTAGPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGHPPQMR . : :: : ..: :.: . .. CCDS11 -NYYLYHLNV----TETIQIW-STPFFQEI------------------------------ 990 1000 1010 1670 1680 1690 1700 1710 1720 pF1KA1 VVTGDILTDITGHNVSEYLLFTSDRFRLHRY-GAITFGNVLKSIPASFGTRAPPMVRKIA :::. :... : : .: .. ..: :. CCDS11 -------TDIV--------------FKIELYFQAALLGIIVTAMPPYFA----------- 1020 1030 1040 1730 1740 1750 1760 1770 1780 pF1KA1 VRRAAQVFYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPAAY--GITVTNHPMNKTSAS ..: :.. .: . ...: :.:: : .:.. :. CCDS11 --------MENAENHKIKAYTQLKLSGLL----------PSAYWIGQAVVDIPLFFIILI 1050 1060 1070 1080 1790 1800 1810 1820 1830 pF1KA1 LSLDYLLQ---GTDVVIAIFIIVA---MSFVPASFVVFLVAEKSTKAKHLQFVSGCNPII : : :: : . :. :. ...:: : ..: . : : : : CCDS11 LMLGSLLAFHYGLYFYTVKFLAVVFCLIGYVP-SVILFTYIASFTFKKIL------NTKE 1090 1100 1110 1120 1130 1840 1850 1860 1870 1880 1890 pF1KA1 YWLANYVWDMLNYLVPATCCVIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPAS .: ... : : : :. :. . ...:..:. :.. : CCDS11 FW--SFI-----YSVAALACI------------------AITEITFFMGYTIATILHYA- 1140 1150 1160 1900 1910 1920 1930 1940 1950 pF1KA1 FWFEVPSSAYVFLIVINLFIGITATVATFLLQLFEH-DK-DLKVVNSYLKSCFLIFPNYN : . .: : .: . :: :. . .. .. :. .. :.. ::. . :: CCDS11 FCIIIP--IYPLLGCLISFIKISWKNVRKNVDTYNPWDRLSVAVISPYLQCVLWIF---- 1170 1180 1190 1200 1210 1220 1960 1970 1980 1990 2000 2010 pF1KA1 LGHGLMEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYN :... : : : . :.:: .. :.. CCDS11 ----LLQY--------YEKKYGGRSIRKDPFFRNLSTKS--------------------- 1230 1240 1250 2020 2030 2040 2050 2060 pF1KA1 FLRRPQRMPVSTKPVEDDVDVASERQRV--LRGDA---DNDMVKIENLTKVYK------- . ...: ..: :: .:: .: : : .. . . :: : : CCDS11 ---KNRKLPEPPDNEDEDEDVKAERLKVKELMGCQCCEEKPSIMVSNLHKEYDDKKDFLL 1260 1270 1280 1290 1300 2070 2080 2090 2100 2110 pF1KA1 SRKIGRILAVDRLCLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSV-L :::. .. :. . . :. :: .:::: :::::.. ...:.:: :.:..:.. .: CCDS11 SRKVKKV-ATKYISFCVKKGEILGLLGPNGAGKSTIINILVGDIEPTSGQVFLGDYSSET 1310 1320 1330 1340 1350 1360 2120 2130 2140 2150 2160 2170 pF1KA1 KELLQVQQSLGYCPQCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYA .: . . .::::: . :. . : .::...: ..:.: .: .:.. . :.: .. CCDS11 SEDDDSLKCMGYCPQINPLWPDTTLQEHFEIYGAVKGMSASDMKEVISRITHALDLKEHL 1370 1380 1390 1400 1410 1420 2180 2190 2200 2210 2220 2230 pF1KA1 DKPAGTYSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKT-GRSV .: . .: :::: :....: : . .::::.:::::::.. .: : .:. :.. CCDS11 QKTVKKLPAGIKRKLCFALSMLGNPQITLLDEPSTGMDPKAKQHMWRAIRTAFKNRKRAA 1430 1440 1450 1460 1470 1480 2240 2250 2260 2270 2280 2290 pF1KA1 VLTSHSMEECEALCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKS---SQSVKDV .::.: ::: ::.: :.::::.:.:::.:..::::..:: ::.. .. :. . : . CCDS11 ILTTHYMEEAEAVCDRVAIMVSGQLRCIGTVQHLKSKFGKGYFLEIKLKDWIENLEVDRL 1490 1500 1510 1520 1530 1540 2300 2310 2320 2330 2340 2350 pF1KA1 VRFFNRNFPEAMLKERHHTKVQYQLKSEHI-SLAQVFSKMEQVSGVLGIEDYSVSQTTLD : .. ::.: .: . . :.. .: . ::.: : :.:... ...::.:: ::.::. CCDS11 QREIQYIFPNASRQESFSSILAYKIPKEDVQSLSQSFFKLEEAKHAFAIEEYSFSQATLE 1550 1560 1570 1580 1590 1600 2360 2370 2380 2390 2400 2410 pF1KA1 NVFVNFAKKQSDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTED .:::...:.: . CCDS11 QVFVELTKEQEEEDNSCGTLNSTLWWERTQEDRVVF 1610 1620 1630 1640 >>CCDS74138.1 ABCA8 gene_id:10351|Hs108|chr17 (1616 aa) initn: 1343 init1: 524 opt: 718 Z-score: 584.0 bits: 121.5 E(32554): 3.3e-26 Smith-Waterman score: 1584; 26.3% identity (52.7% similar) in 1964 aa overlap (490-2375:11-1604) 460 470 480 490 500 510 pF1KA1 LYAPAGSEVDRVILKANETFAFVGNVTHYAQVWLNISAKIRSFLEQGRLQQH--LRWLQQ :.: . ..::.. :.... ..::.. CCDS74 MRKRKISVCQQTWALLC---KNFLKKWRMKRESLMEWLNS 10 20 30 520 530 540 550 560 pF1KA1 YVAELRLHPEALNLSLDELPPALRQDNFSLPSGMALLQQLDTIDNAACGWI--------- . : : : : . . ..:: : : ..::.... . . CCDS74 LL---------LLLCLYIYPHSHQVNDFSSLLTMDL-GRVDTFNESRFSVVYTPVTNTTQ 40 50 60 70 80 570 580 590 600 610 pF1KA1 QFMSKVSVDIFK------GFPDEESIVNYTLNQAYQDNVTVFASVIFQTRK---DGSLPP :.:.::. : :.:::::: ..: : . ..:... : ..: CCDS74 QIMNKVASTPFLAGKEVLGLPDEESIKEFTANYPEEIVRVTFTNTYSYHLKFLLGHGMPA 90 100 110 120 130 140 620 630 640 650 660 670 pF1KA1 HVHYKIRQNSSFTEKTNEIRR----AYWRPGPNTGGRFYFLYGFVWIQDMMERAIIDTFV . ..: .... .::: ..:. : :: .: .. :::. . CCDS74 KKEHK--DHTAHCYETNEDVYCEVSVFWKEG------------FVALQAAINAAIIEITT 150 160 170 180 190 680 690 700 710 720 730 pF1KA1 GHDVVEP-----GSYVQMFPYPCYTRDDFLFVIEHMMPLCMVISWVYSVAMTIQHIVAEK .:.:.: :. ..: . . :: .. . .::. . .. ... :. CCDS74 NHSVMEELMSVTGKNMKMHSFIGQSG-----VITDLYLFSCIISFSSFIYYASVNVTRER 200 210 220 230 240 740 750 760 770 780 pF1KA1 EHRLKEVMKTMGLNNAVHWVAW--FITGFVQLSISVTALTAILKYGQVLMHSHVVIIWLF . :.: .: ::: ... :..: . .::. . :: ... : .. : .... . CCDS74 K-RMKALMTMMGLRDSAFWLSWGLLYAGFIFIMALFLAL--VIRSTQFIILSGFMVVFSL 250 260 270 280 290 300 790 800 810 820 830 840 pF1KA1 LAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREEVAHDKITAFEKC . .:... . . ::.:.: .:. :. :.. :: : . ... : . : . CCDS74 FLLYGLSLVALAFLMSILVKKSFLT----GLVVFLLTVFWGCLGFTSLYRH--LPASLEW 310 320 330 340 350 850 860 870 880 890 900 pF1KA1 IASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQSPVEGDDFNLLLAVT-MLMVDAVVYG : ::.: :: :: . . .. ..: : .: ::..:.. :: :. .: CCDS74 ILSLLSPFAFMLGMAQLLHLDY---DLNSNAF---PHPSDGSNLIVATNFMLAFDTCLYL 360 370 380 390 400 410 910 920 930 940 950 960 pF1KA1 ILTWYIEAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTPRLSVMEEDQACA :. :.: . :. :: :: : :..:.: . .:. : ::. : CCDS74 ALAIYFEKILPNEYGHRRPPLFFLKSSFWSQTQKTD--------------HVALEDEMDA 420 430 440 450 970 980 990 1000 1010 1020 pF1KA1 MESRRFEETRGMEEEPTHLP--LVVCVDKLTKVYKD--DKKLALNKLSLNLYENQVVSFL : :... .:. : .. .. . ..:: :: :: ::. : ...::.:....: CCDS74 DPS--FHDS--FEQAPPEFQGKEAIRIRNVTKEYKGKPDKIEALKDLVFDIYEGQITAIL 460 470 480 490 500 510 1030 1040 1050 1060 1070 1080 pF1KA1 GHNGAGKTTTMSILTGLFPPTSGSATIYGHDIR--TEMDEIRKNLGMCPQHNVLFDRLTV ::.::::.: ..::.:: ::.::.:::.. . ...... : :.::: :: :: ::: CCDS74 GHSGAGKSTLLNILSGLSVPTKGSVTIYNNKLSEMADLENLSKLTGVCPQSNVQFDFLTV 520 530 540 550 560 570 1090 1100 1110 1120 1130 1140 pF1KA1 EEHLWFYSRLKSMAQEEIRREMDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAIAFVGGS .:.: .....:.. .:. .:..... .::..: . :.:.::::.::::. .::..: CCDS74 RENLRLFAKIKGILPQEVDKEIQRVLLELEMKNIQDVLAQNLSGGQKRKLTFGIAILGDP 580 590 600 610 620 630 1150 1160 1170 1180 1190 1200 pF1KA1 RAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIISHGKLKC . ..:::::::.::..:. .:.:. . : :.::.::. :::::.:.:: ...:.::::: CCDS74 QIFLLDEPTAGLDPFSRHQVWNLLKERKTDRVILFSTQFMDEADILADRKVFLSQGKLKC 640 650 660 670 680 690 1210 1220 1230 1240 1250 1260 pF1KA1 CGSPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPPGRAPLSSCSELQVSQFIRKHV :: :::: .: ::.:.: : : ........:. CCDS74 AGSSLFLKKKWGIGYHLSLQLNEI----------------------CVEENITSLVKQHI 700 710 720 730 1270 1280 1290 1300 1310 1320 pF1KA1 ASCLLVSDTSTELSYILPSEAAKKGAFERLFRHLERSLDALHLSSFGLMDTTLEEVFLKV . : . . .: : :: : ..: : .:.. :. : : . ..:. :::.:::::. CCDS74 PDAKLSAKSEGKLIYTLPLERTNK--FPELYKDLD-SYPDLGIENYGVSMTTLNEVFLKL 740 750 760 770 780 790 1330 1340 1350 1360 1370 1380 pF1KA1 SEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCSELTQSQASLQSA-SSVGS : .: : :.:. .: : ...: .: . : :. : .::.. ...:. CCDS74 --EGKSTIN-ESDIA-----IL----GEVQAE-KADDTERLVEMEQVLSSLNKMRKTIGG 800 810 820 830 1390 1400 1410 1420 1430 1440 pF1KA1 ARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGWLKVRQFH :.: . . :..:: .: ::... CCDS74 ----------------------------VALWRQQICAIARV-----RL----LKLKH-- 840 850 1450 1460 1470 1480 1490 1500 pF1KA1 GLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQYHNYTQP . :::.. .:. : ::.. .::. CCDS74 ------------ERKALLALLLILMAGFC----------------PLLV------EYTMV 860 870 880 1510 1520 1530 1540 1550 1560 pF1KA1 RGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSLGPTLNLSS . : : : .::: . : : ..: . : .: CCDS74 K----IYQN----SYTWELSPH--------LYFLAPG-------QQPHD----PLTQL-- 890 900 910 1570 1580 1590 1600 1610 pF1KA1 GESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWNVSLPPTA- :. . : ...:. .... :..: : CCDS74 ----LIINK-----------TGASIDDFI----------------QSVEHQNIALEVDAF 920 930 940 1620 1630 1640 1650 1660 1670 pF1KA1 GPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGHPPQMRVVTGDILTDITGHNVS : . :. :: . . : :. .. .:: .. :. .: :: :: CCDS74 GTRNGTDDPSYNGAI---TVC-CNEKNYSFSLACNAK------RLNCFPVLMDI----VS 950 960 970 980 990 1680 1690 1700 1710 1720 1730 pF1KA1 EYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMVRKIAVRRAAQVFYNNKGYHSM . :: : : .. .: ..: .: CCDS74 NGLL---------------------------GMVKP----SVHIRTERSTFLEN------ 1000 1010 1740 1750 1760 1770 1780 1790 pF1KA1 PTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMNKTSASLSLDYLLQGTDVVIAIFII .. :: .. : :.. : . CCDS74 ------------------GQDNPIGF-----------------LAYIM---------FWL 1020 1800 1810 1820 1830 1840 1850 pF1KA1 VAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPIIYWLANYVWDMLNYLVPATCCVIILF : : : ... . . ...:. .:: .: ::... . :. :.. ...: CCDS74 VLTSSCPPYIAMSSIDDYKNRARSQLRISGLSPSAYWFGQALVDVSLYFL------VFVF 1030 1040 1050 1060 1070 1080 1860 1870 1880 1890 1900 pF1KA1 VFDLPAYTSPTNFPAVLSLFLL---------YGWSITPIMYPASFWFEVP---SSAYVF- .. : .: : :: .: .. :..:. . : :: :. :. . : CCDS74 IY-LMSYIS--NFEDMLLTIIHIIQIPCAVGYSFSLIFMTYVISFIFRKGRKNSGIWSFC 1090 1100 1110 1120 1130 1140 1910 1920 1930 1940 1950 1960 pF1KA1 LIVINLFIGITATVATFLLQLFEHDKDLKVVNSYLKSCFLIFPNYNLGHGLM--EMAYNE . :...: .:: : ...:: .:. . . ::: : .: .. .. .. CCDS74 FYVVTVF-----SVAGFAFSIFE--SDIPFIFT-----FLIPPATMIGCLFLSSHLLFSS 1150 1160 1170 1180 1970 1980 1990 2000 2010 2020 pF1KA1 YINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGVVGFLLTIMC-QYNFLRRPQRM-P- ..: . : . :: :. ::.:. : ...: .. .: : CCDS74 LFSEERMDVQPFLVFLIPFLHFII--------------FLFTLRCLEWKFGKKSMRKDPF 1190 1200 1210 1220 1230 2030 2040 2050 2060 pF1KA1 ----VSTKPVE---DDVDVASERQRVLRG----DADNDMVKIEN-LTKVYKSRKIGRI-- : .: : .: :: :: :. . . :. : : . : : : ... : . CCDS74 FSSDVCQNPEEPEGEDEDVQMERVRTANALNSTNFDEKPVIIASCLRKEYAGKRKGCFSK 1240 1250 1260 1270 1280 1290 2070 2080 2090 2100 2110 2120 pF1KA1 ----LAVDRLCLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELL .:. . . :: :: .:::: :::::....:..::: . :.:.....: . : CCDS74 RKNKIATRNVSFCVRKGEVLGLLGHNGAGKSTSIKVITGDTKPTAGQVLLKGSGGGDAL- 1300 1310 1320 1330 1340 1350 2130 2140 2150 2160 2170 2180 pF1KA1 QVQQSLGYCPQCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPA . :::::: .::. .::.:.::..:. ..:. : .. .. :.: .:. CCDS74 ---EFLGYCPQENALWPNLTVRQHLEVYAAVKGLRKGDAEVAITRLVDALKLQDQLKSPV 1360 1370 1380 1390 1400 1410 2190 2200 2210 2220 2230 2240 pF1KA1 GTYSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIK-TGRSVVLTS : : : :::: .....: :. ..::::.:::::.... .:. : .. : :...::. CCDS74 KTLSEGIKRKLCFVLSILGNPSVVLLDEPSTGMDPEGQQQMWQAIRATFRNTERGALLTT 1420 1430 1440 1450 1460 1470 2250 2260 2270 2280 2290 2300 pF1KA1 HSMEECEALCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQSVKDVVRFFNRN : : : ::.: :.::::.:::::.:::::::..:: :.. ...:. .:. . . : CCDS74 HYMAEAEAVCDRVAIMVSGRLRCIGSIQHLKSKFGKDYLLEMKVKNLAQVEPLHAEILRL 1480 1490 1500 1510 1520 1530 2310 2320 2330 2340 2350 2360 pF1KA1 FPEAMLKERHHTKVQYQLKSEHIS-LAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFA ::.: .::. . . :.: : .. :::.: :.:.:. . .:.::.::.::..::.... CCDS74 FPQAARQERYSSLMVYKLPVEDVQPLAQAFFKLEKVKQSFDLEEYSLSQSTLEQVFLELS 1540 1550 1560 1570 1580 1590 2370 2380 2390 2400 2410 2420 pF1KA1 KKQSDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFE :.: . ... .: CCDS74 KEQELGDFEEDFDPSVKWKLLPQEEP 1600 1610 2435 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 20:21:09 2016 done: Wed Nov 2 20:21:10 2016 Total Scan time: 7.900 Total Display time: 1.860 Function used was FASTA [36.3.4 Apr, 2011]