FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDB1439, 2273 aa 1>>>pF1KSDB1439 2273 - 2273 aa - 2273 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.0006+/-0.00116; mu= 18.5653+/- 0.070 mean_var=129.7942+/-25.381, 0's: 0 Z-trim(105.8): 72 B-trim: 0 in 0/52 Lambda= 0.112576 statistics sampled from 8580 (8650) to 8580 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.6), E-opt: 0.2 (0.266), width: 16 Scan time: 6.360 The best scores are: opt bits E(32554) CCDS747.1 ABCA4 gene_id:24|Hs108|chr1 (2273) 15305 2499.0 0 CCDS12055.1 ABCA7 gene_id:10347|Hs108|chr19 (2146) 2882 481.3 2.1e-134 CCDS43909.1 ABCA2 gene_id:20|Hs108|chr9 (2436) 2288 384.9 2.5e-105 CCDS6762.1 ABCA1 gene_id:19|Hs108|chr9 (2261) 2246 378.0 2.7e-103 CCDS33373.1 ABCA12 gene_id:26154|Hs108|chr2 (2277) 1862 315.7 1.6e-84 CCDS33372.1 ABCA12 gene_id:26154|Hs108|chr2 (2595) 1862 315.7 1.8e-84 CCDS47584.1 ABCA13 gene_id:154664|Hs108|chr7 (5058) 1297 224.1 1.3e-56 CCDS10466.1 ABCA3 gene_id:21|Hs108|chr16 (1704) 1130 196.7 7.8e-49 CCDS74138.1 ABCA8 gene_id:10351|Hs108|chr17 (1616) 753 135.4 2e-30 CCDS74139.1 ABCA8 gene_id:10351|Hs108|chr17 (1621) 753 135.4 2e-30 CCDS11683.1 ABCA6 gene_id:23460|Hs108|chr17 (1617) 731 131.9 2.4e-29 CCDS11681.1 ABCA9 gene_id:10350|Hs108|chr17 (1624) 714 129.1 1.6e-28 CCDS11685.1 ABCA5 gene_id:23461|Hs108|chr17 (1642) 709 128.3 2.9e-28 CCDS11684.1 ABCA10 gene_id:10349|Hs108|chr17 (1543) 689 125.0 2.6e-27 >>CCDS747.1 ABCA4 gene_id:24|Hs108|chr1 (2273 aa) initn: 15305 init1: 15305 opt: 15305 Z-score: 13430.6 bits: 2499.0 E(32554): 0 Smith-Waterman score: 15305; 100.0% identity (100.0% similar) in 2273 aa overlap (1-2273:1-2273) 10 20 30 40 50 60 pF1KSD MGFVRQIQLLLWKNWTLRKRQKIRFVVELVWPLSLFLVLIWLRNANPLYSHHECHFPNKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 MGFVRQIQLLLWKNWTLRKRQKIRFVVELVWPLSLFLVLIWLRNANPLYSHHECHFPNKA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD MPSAGMLPWLQGIFCNVNNPCFQSPTPGESPGIVSNYNNSILARVYRDFQELLMNAPESQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 MPSAGMLPWLQGIFCNVNNPCFQSPTPGESPGIVSNYNNSILARVYRDFQELLMNAPESQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD HLGRIWTELHILSQFMDTLRTHPERIAGRGIRIRDILKDEETLTLFLIKNIGLSDSVVYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 HLGRIWTELHILSQFMDTLRTHPERIAGRGIRIRDILKDEETLTLFLIKNIGLSDSVVYL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD LINSQVRPEQFAHGVPDLALKDIACSEALLERFIIFSQRRGAKTVRYALCSLSQGTLQWI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 LINSQVRPEQFAHGVPDLALKDIACSEALLERFIIFSQRRGAKTVRYALCSLSQGTLQWI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD EDTLYANVDFFKLFRVLPTLLDSRSQGINLRSWGGILSDMSPRIQEFIHRPSMQDLLWVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 EDTLYANVDFFKLFRVLPTLLDSRSQGINLRSWGGILSDMSPRIQEFIHRPSMQDLLWVT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD RPLMQNGGPETFTKLMGILSDLLCGYPEGGGSRVLSFNWYEDNNYKAFLGIDSTRKDPIY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 RPLMQNGGPETFTKLMGILSDLLCGYPEGGGSRVLSFNWYEDNNYKAFLGIDSTRKDPIY 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD SYDRRTTSFCNALIQSLESNPLTKIAWRAAKPLLMGKILYTPDSPAARRILKNANSTFEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 SYDRRTTSFCNALIQSLESNPLTKIAWRAAKPLLMGKILYTPDSPAARRILKNANSTFEE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD LEHVRKLVKAWEEVGPQIWYFFDNSTQMNMIRDTLGNPTVKDFLNRQLGEEGITAEAILN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 LEHVRKLVKAWEEVGPQIWYFFDNSTQMNMIRDTLGNPTVKDFLNRQLGEEGITAEAILN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD FLYKGPRESQADDMANFDWRDIFNITDRTLRLVNQYLECLVLDKFESYNDETQLTQRALS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 FLYKGPRESQADDMANFDWRDIFNITDRTLRLVNQYLECLVLDKFESYNDETQLTQRALS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD LLEENMFWAGVVFPDMYPWTSSLPPHVKYKIRMDIDVVEKTNKIKDRYWDSGPRADPVED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 LLEENMFWAGVVFPDMYPWTSSLPPHVKYKIRMDIDVVEKTNKIKDRYWDSGPRADPVED 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD FRYIWGGFAYLQDMVEQGITRSQVQAEAPVGIYLQQMPYPCFVDDSFMIILNRCFPIFMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 FRYIWGGFAYLQDMVEQGITRSQVQAEAPVGIYLQQMPYPCFVDDSFMIILNRCFPIFMV 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD LAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSMSIFLLTIFIM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 LAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSMSIFLLTIFIM 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD HGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYFTLYLPHILCF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 HGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYFTLYLPHILCF 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD AWQDRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLLSM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 AWQDRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLLSM 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD QMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCSTREERALEKTEPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 QMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCSTREERALEKTEPL 850 860 870 880 890 900 910 920 930 940 950 960 pF1KSD TEETEDPEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFEPCGQPAVDRLNITFYENQITA ::::::::::::::::::::::::::::::::::::::::::.::::::::::::::::: CCDS74 TEETEDPEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFEPCGRPAVDRLNITFYENQITA 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KSD FLGHNGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQHNILFHHLTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 FLGHNGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQHNILFHHLTV 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KSD AEHMLFYAQLKGKSQEEAQLEMEAMLEDTGLHHKRNEEAQDLSGGMQRKLSVAIAFVGDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 AEHMLFYAQLKGKSQEEAQLEMEAMLEDTGLHHKRNEEAQDLSGGMQRKLSVAIAFVGDA 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KSD KVVILDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAIIAQGRLYC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 KVVILDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAIIAQGRLYC 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KSD SGTPLFLKNCFGTGLYLTLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAHVDDLTPEQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 SGTPLFLKNCFGTGLYLTLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAHVDDLTPEQV 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KSD LDGDVNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFKHRAYASLFRELEETLADLGLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 LDGDVNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFKHRAYASLFRELEETLADLGLS 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KSD SFGISDTPLEEIFLKVTEDSDSGPLFAGGAQQKRENVNPRHPCLGPREKAGQTPQDSNVC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 SFGISDTPLEEIFLKVTEDSDSGPLFAGGAQQKRENVNPRHPCLGPREKAGQTPQDSNVC 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KSD SPGAPAAHPEGQPPPEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHKDFLAQIVLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 SPGAPAAHPEGQPPPEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHKDFLAQIVLP 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KSD ATFVFLALMLSIVIPPFGEYPALTLHPWIYGQQYTFFSMDEPGSEQFTVLADVLLNKPGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 ATFVFLALMLSIVIPPFGEYPALTLHPWIYGQQYTFFSMDEPGSEQFTVLADVLLNKPGF 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KSD GNRCLKEGWLPEYPCGNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSCRCSTREKLTMLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 GNRCLKEGWLPEYPCGNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSCRCSTREKLTMLP 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KSD ECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSKFWVNEQRYGGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 ECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSKFWVNEQRYGGI 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KSD SIGGKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHLETEDNIKVWFN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 SIGGKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHLETEDNIKVWFN 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KSD NKGWHALVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLSEITVLTTSVDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 NKGWHALVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLSEITVLTTSVDA 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KSD VVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFLWDIMNYSVSAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 VVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFLWDIMNYSVSAG 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KSD LVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPSTAYVALSCANL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 LVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPSTAYVALSCANL 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KSD FIGINSSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGLIDLALSQAVTDVYAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 FIGINSSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGLIDLALSQAVTDVYAR 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KSD FGEEHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQRHFFLSQWIAEPTKEPIVDEDDD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 FGEEHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQRHFFLSQWIAEPTKEPIVDEDDD 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KSD VAEERQRIITGGNKTDILRLHELTKIYPGTSSPAVDRLCVGVRPGECFGLLGVNGAGKTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 VAEERQRIITGGNKTDILRLHELTKIYPGTSSPAVDRLCVGVRPGECFGLLGVNGAGKTT 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KSD TFKMLTGDTTVTSGDATVAGKSILTNISEVHQNMGYCPQFDAIDELLTGREHLYLYARLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 TFKMLTGDTTVTSGDATVAGKSILTNISEVHQNMGYCPQFDAIDELLTGREHLYLYARLR 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KSD GVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNKRKLSTAIALIGCPPLVLLDEPTTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 GVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNKRKLSTAIALIGCPPLVLLDEPTTG 2050 2060 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 pF1KSD MDPQARRMLWNVIVSIIREGRAVVLTSHSMEECEALCTRLAIMVKGAFRCMGTIQHLKSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 MDPQARRMLWNVIVSIIREGRAVVLTSHSMEECEALCTRLAIMVKGAFRCMGTIQHLKSK 2110 2120 2130 2140 2150 2160 2170 2180 2190 2200 2210 2220 pF1KSD FGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGSVQRERHYNMLQFQVSSSSLARIFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 FGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGSVQRERHYNMLQFQVSSSSLARIFQ 2170 2180 2190 2200 2210 2220 2230 2240 2250 2260 2270 pF1KSD LLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTESHDLPLHPRAAGASRQAQD ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS74 LLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTESHDLPLHPRAAGASRQAQD 2230 2240 2250 2260 2270 >>CCDS12055.1 ABCA7 gene_id:10347|Hs108|chr19 (2146 aa) initn: 5472 init1: 1357 opt: 2882 Z-score: 2526.6 bits: 481.3 E(32554): 2.1e-134 Smith-Waterman score: 6334; 45.1% identity (70.3% similar) in 2286 aa overlap (1-2257:1-2109) 10 20 30 40 50 60 pF1KSD MGFVRQIQLLLWKNWTLRKRQKIRFVVELVWPLSLFLVLIWLRNANPLYSHHECHFPNKA :.: :..::::::. :.:: ....:::.::: ::..:. .:...: ::::::::: CCDS12 MAFWTQLMLLLWKNFMYRRRQPVQLLVELLWPLFLFFILVAVRHSHPPLEHHECHFPNKP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD MPSAGMLPWLQGIFCNVNNPCFQSPTPGESPGIVSNYNNSILARVYRDFQELLMNAPESQ .:::: .:::::..::::: :: . :::: :: .::.:.:...:. : . .: .: : CCDS12 LPSAGTVPWLQGLICNVNNTCFPQLTPGEEPGRLSNFNDSLVSRLLADARTVLGGA--SA 70 80 90 100 110 130 140 150 160 170 180 pF1KSD HLGRIWTELHILSQFMDTLRTHPERIAGRGIRIRDILKDEETLTLFLIKNIGLSDSVVYL : : :.... ::: :.:. CCDS12 H-----RTLAGLGKLIATLR------AARS------------------------------ 120 130 190 200 210 220 230 240 pF1KSD LINSQVRPEQFAHGVPDLALKDIACSEALLERFIIFSQRRGAKTVRYALCSLSQGTLQWI ..: .: . . : . :.: :: .. : .:. : : CCDS12 --TAQPQPTKQSPLEPPML--DVA---ELLTSLL-----------RTESLGLALGQAQ-- 140 150 160 170 250 260 270 280 290 300 pF1KSD EDTLYANVDFFKLFRVLPTLLDSRSQGINLRSWGGILSDMSPRIQEFIHRPSMQDLLWVT . : .::.. :.. ::.. :. .: CCDS12 --------------EPLHSLLEAAE-------------DLA---QELLALRSLVEL---- 180 190 200 310 320 330 340 350 pF1KSD RPLMQNGGPETFTKLMGILSDLLCGYPEGGGSRVL-SFNWYEDNNYKAFLGIDSTRKDPI : :.: :. . . .::. ::. .: .: : :.:::: .. ..: . : CCDS12 RALLQR--PRGTSGPLELLSEALCSV-RGPSSTVGPSLNWYEASDLMELVGQEPESALP- 210 220 230 240 250 360 370 380 390 400 410 pF1KSD YSYDRRTTSFCNALIQSLESNPLTKIAWRAAKPLLMGKILYTPDSPAARRILKNANSTFE : . :. :: .:.:.::... :: :::..::.:..::.: .:... ..: ::: CCDS12 ---DSSLSPACSELIGALDSHPLSRLLWRRLKPLILGKLLFAPDTPFTRKLMAQVNRTFE 260 270 280 290 300 310 420 430 440 450 460 470 pF1KSD ELEHVRKLVKAWEEVGPQIWYFFDNSTQMNMIRDTLGNPTVKDFLNRQLGEEGIT-AEAI :: .: . ..:: .::.:. :...:... :.. : ..: :: : ::. CCDS12 ELTLLRDVREVWEMLGPRIFTFMNDSSNVAMLQRLL---QMQDEGRRQPRPGGRDHMEAL 320 330 340 350 360 370 480 490 500 510 520 530 pF1KSD LNFLYKGPRESQADDMANFDWRDIFNITDRTLRLVNQYLECLVLDKFESYNDETQLTQRA .:: : ....:.: . . . ... ::: :::.:. .:. :..:: CCDS12 RSFLDPGS--------GGYSWQDAHADVGHLVGTLGRVTECLSLDKLEAAPSEAALVSRA 380 390 400 410 420 540 550 560 570 580 590 pF1KSD LSLLEENMFWAGVVF--------PDMYPWTSSLPPHVKYKIRMDIDVVEKTNKIKDRYWD :.:: :. ::::::: : .: . : ::. ::::::::: .::::.::.:: CCDS12 LQLLAEHRFWAGVVFLGPEDSSDPTEHPTPDLGPGHVRIKIRMDIDVVTRTNKIRDRFWD 430 440 450 460 470 480 600 610 620 630 640 650 pF1KSD SGPRADPVEDFRYIWGGFAYLQDMVEQGITRSQVQAEAPVGIYLQQMPYPCFVDDSFMII :: :::. :.::.::::.::::.::.. .: :. .:.:::::::::.::: :. . CCDS12 PGPAADPLTDLRYVWGGFVYLQDLVERAAVRVLSGANPRAGLYLQQMPYPCYVDDVFLRV 490 500 510 520 530 540 660 670 680 690 700 710 pF1KSD LNRCFPIFMVLAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSM :.: .:.:..:::::::..:::..: ::: ::..:.. .:.: ::.: :::. .. . . CCDS12 LSRSLPLFLTLAWIYSVTLTVKAVVREKETRLRDTMRAMGLSRAVLWLGWFLSCLGPFLL 550 560 570 580 590 600 720 730 740 750 760 770 pF1KSD SIFLLTIFIMHGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYF : ::.. . : :: :: : ..:::: ::..::. ::::.:::.:.:::::.:. :: CCDS12 SAALLVLVLKLGDILPYSHPGVVFLFLAAFAVATVTQSFLLSAFFSRANLAAACGGLAYF 610 620 630 640 650 660 780 790 800 810 820 830 pF1KSD TLYLPHILCFAWQDRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTE .::::..:: ::.::. : . :.::::::::::: : :. .:::: : :: :.:. :: CCDS12 SLYLPYVLCVAWRDRLPAGGRVAASLLSPVAFGFGCESLALLEEQGEGAQWHNVGTRPT- 670 680 690 700 710 720 840 850 860 870 880 890 pF1KSD GDEFSFLLSMQMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCSTRE .: ::. ..:::::.::: .:::. : ::.:: : :: : ...::: :. : CCDS12 ADVFSLAQVSGLLLLDAALYGLATWYLEAVCPGQYGIPEPWNFPFRRSYW-----CGPRP 730 740 750 760 770 900 910 920 930 940 950 pF1KSD ERALEKTEPLTEETEDPEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFEPCGQPAVDRLN .. : : : :. . :. :: ::: :..: : : :::. :. CCDS12 PKS-----PAPCPT--PLDPK----VLVEEAPPGLSPGVSVRSLEKRFPGSPQPALRGLS 780 790 800 810 820 960 970 980 990 1000 1010 pF1KSD ITFYENQITAFLGHNGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQ . ::...:::::::::::::::::::.::.::..:.... :.:...:. :.: ::.::: CCDS12 LDFYQGHITAFLGHNGAGKTTTLSILSGLFPPSGGSAFILGHDVRSSMAAIRPHLGVCPQ 830 840 850 860 870 880 1020 1030 1040 1050 1060 1070 pF1KSD HNILFHHLTVAEHMLFYAQLKGKSQEEAQLEMEAMLEDTGLHHKRNEEAQDLSGGMQRKL .:.:: ::: ::. ::..::: : . :.. .:.:.:: :.. ... ::::::::: CCDS12 YNVLFDMLTVDEHVWFYGRLKGLSAAVVGPEQDRLLQDVGLVSKQSVQTRHLSGGMQRKL 890 900 910 920 930 940 1080 1090 1100 1110 1120 1130 pF1KSD SVAIAFVGDAKVVILDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRI :::::::: ..::::::::.:::: :::.::.:::::: :::.:.::::.:::.:::::. CCDS12 SVAIAFVGGSQVVILDEPTAGVDPASRRGIWELLLKYREGRTLILSTHHLDEAELLGDRV 950 960 970 980 990 1000 1140 1150 1160 1170 1180 pF1KSD AIIAQGRLYCSGTPLFLKNCFGTGLYLTLVRKMKNIQSQRKGS---EGTCSCSSKGFSTT :..: ::: : :.::::. .:.: :::::. . ...:.. ::. . .. . . CCDS12 AVVAGGRLCCCGSPLFLRRHLGSGYYLTLVKARLPLTTNEKADTDMEGSVDTRQEKKNGS 1010 1020 1030 1040 1050 1060 1190 1200 1210 1220 1230 1240 pF1KSD CPAHVDDLTPEQVLDGDVNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFKHRAYASLF ..: ::. :. .: : :: :.::: . .::...:: . . ..:.:: CCDS12 QGSRVG--TPQ---------LLALVQHWVPGARLVEELPHELVLVLPYTGAHDGSFATLF 1070 1080 1090 1100 1110 1250 1260 1270 1280 1290 1300 pF1KSD RELEETLADLGLSSFGISDTPLEEIFLKVTEDSDSGPLFAGGAQQKRENVNPRHPCLGP- :::. ::.: :...::::: ::::::::.:. . . :. . : : : CCDS12 RELDTRLAELRLTGYGISDTSLEEIFLKVVEECAADTDMEDGSCGQ-------HLCTGIA 1120 1130 1140 1150 1160 1170 1310 1320 1330 1340 1350 pF1KSD ----REKAGQTPQDSNVCSPGAPAAHPEGQPPPEPECPGPQLN---TGTQLVLQHVQALL . . ::.. . . : :: :. : . ::. : :. :..:::: CCDS12 GLDVTLRLKMPPQETALEN-GEPA----GSAPETDQGSGPDAVGRVQGWALTRQQLQALL 1180 1190 1200 1210 1220 1360 1370 1380 1390 1400 1410 pF1KSD VKRFQHTIRSHKDFLAQIVLPATFVFLALMLSIVIPPFGEYPALTLHPWIYGQQYTFFSM .::: . ::.. ..::::::: :: :::..:...::::.:::: : : .:: : .::: CCDS12 LKRFLLARRSRRGLFAQIVLPALFVGLALVFSLIVPPFGHYPALRLSPTMYGAQVSFFSE 1230 1240 1250 1260 1270 1280 1420 1430 1440 1450 1460 1470 pF1KSD DEPGSEQFTVLADVLLNKPGFGNRCLKEGWLPEYPCGNSTP-WKTPSVSPNITQLFQKQK : ::. . : ..::.. : : : : .:. ...: : ...... . . CCDS12 DAPGDPGRARLLEALLQEAG----------LEEPPVQHSSHRFSAPEVPAEVAKVLASGN 1290 1300 1310 1320 1330 1480 1490 1500 1510 1520 1530 pF1KSD WTQVNPSPSCRCSTREKLTMLPECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTY :: .:::.:.:: .::.:: .::: :::: . : :..:.:: ::.:::::::: CCDS12 WTPESPSPACQCSRPGARRLLPDCPAAAGGPPPPQAVTGSGEVVQNLTGRNLSDFLVKTY 1340 1350 1360 1370 1380 1390 1540 1550 1560 1570 1580 1590 pF1KSD PALIRSSLKSKFWVNEQRYGGISIGGKLPVVPITGEALVGFLSDLGRIMN-VSGGPITRE : :.:..::.: :::: ::::.:.::. : .: .:. : . .: ... . :: . : CCDS12 PRLVRQGLKTKKWVNEVRYGGFSLGGRDPGLP-SGQELGRSVEELWALLSPLPGGALDR- 1400 1410 1420 1430 1440 1450 1600 1610 1620 1630 1640 1650 pF1KSD ASKEIPDFLKHLETEDNIKVWFNNKGWHALVSFLNVAHNAILRASLPKDRSPEEYGITVI . :.. . . :...:..:.::::::::..:.:.: : :::::: :: . . ..::.. CCDS12 VLKNLTAWAHSLDAQDSLKIWFNNKGWHSMVAFVNRASNAILRAHLPPGPARHAHSITTL 1460 1470 1480 1490 1500 1510 1660 1670 1680 1690 1700 1710 pF1KSD SQPLNLTKEQLSEITVLTTSVDAVVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISG ..::::::::::: .....:::..:.:::.:.::::::::.: ::.:::...::::...: CCDS12 NHPLNLTKEQLSEGALMASSVDVLVSICVVFAMSFVPASFTLVLIEERVTRAKHLQLMGG 1520 1530 1540 1550 1560 1570 1720 1730 1740 1750 1760 1770 pF1KSD VSPTTYWVTNFLWDIMNYSVSAGLVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPM .::: ::. :::::. :: : : .:: ::..::..::..: :::::. :::::::.. :. CCDS12 LSPTLYWLGNFLWDMCNYLVPACIVVLIFLAFQQRAYVAPANLPALLLLLLLYGWSITPL 1580 1590 1600 1610 1620 1630 1780 1790 1800 1810 1820 1830 pF1KSD MYPASFLFDVPSTAYVALSCANLFIGINSSAITFILELFENNRTLLRFNAVLRKLLIVFP ::::::.:.:::::::.:.: :::::::.: ::.:::: ... : . . .:......:: CCDS12 MYPASFFFSVPSTAYVVLTCINLFIGINGSMATFVLELFSDQK-LQEVSRILKQVFLIFP 1640 1650 1660 1670 1680 1690 1840 1850 1860 1870 1880 1890 pF1KSD HFCLGRGLIDLALSQAVTDVYARFGEEHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQ ::::::::::.. .::..:.. :.:... .:..:...::::.:::..: ...:.:::.: CCDS12 HFCLGRGLIDMVRNQAMADAFERLGDRQFQSPLRWEVVGKNLLAMVIQGPLFLLFTLLLQ 1700 1710 1720 1730 1740 1750 1900 1910 1920 1930 1940 1950 pF1KSD RHFFLSQWIAEPTKE--PIV-DEDDDVAEERQRIITGGNKTDILRLHELTKIYPGTSSPA .. :: . .: . :.. .::.:::.::.:.. :... :.: :..:::.: : :: CCDS12 HR---SQLLPQPRVRSLPLLGEEDEDVARERERVVQGATQGDVLVLRNLTKVYRGQRMPA 1760 1770 1780 1790 1800 1960 1970 1980 1990 2000 2010 pF1KSD VDRLCVGVRPGECFGLLGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNM :::::.:. ::::::::::::::::.::.:.:::: .. :.:..::.:. . : .: .: CCDS12 VDRLCLGIPPGECFGLLGVNGAGKTSTFRMVTGDTLASRGEAVLAGHSVAREPSAAHLSM 1810 1820 1830 1840 1850 1860 2020 2030 2040 2050 2060 2070 pF1KSD GYCPQFDAIDELLTGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGG ::::: ::: ::::::::: : ::::::: .. ..:. .. :::. ::: ::::::: CCDS12 GYCPQSDAIFELLTGREHLELLARLRGVPEAQVAQTAGSGLARLGLSWYADRPAGTYSGG 1870 1880 1890 1900 1910 1920 2080 2090 2100 2110 2120 2130 pF1KSD NKRKLSTAIALIGCPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECE :::::.::.::.: : .:.::::::::::.:::.::: .....::::.:.:::::::::: CCDS12 NKRKLATALALVGDPAVVFLDEPTTGMDPSARRFLWNSLLAVVREGRSVMLTSHSMEECE 1930 1940 1950 1960 1970 1980 2140 2150 2160 2170 2180 2190 pF1KSD ALCTRLAIMVKGAFRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFP :::.::::::.: :::.:. ::::..:. :. .:... . ... :. : ..:: CCDS12 ALCSRLAIMVNGRFRCLGSPQHLKGRFAAGHTLTLRVPAARSQ------PAAAFVAAEFP 1990 2000 2010 2020 2030 2040 2200 2210 2220 2230 2240 2250 pF1KSD GSVQRERHYNMLQFQVSSS---SLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQ :. :: : . :.::. . .:::.: : : .:..::.:: :..::. :.:. CCDS12 GAELREAHGGRLRFQLPPGGRCALARVFGELAVHGAEHGVEDFSVSQTMLEEVFLYFSKD 2050 2060 2070 2080 2090 2100 2260 2270 pF1KSD QTESHDLPLHPRAAGASRQAQD : ...: CCDS12 QGKDEDTEEQKEAGVGVDPAPGLQHPKRVSQFLDDPSTAETVL 2110 2120 2130 2140 >>CCDS43909.1 ABCA2 gene_id:20|Hs108|chr9 (2436 aa) initn: 4208 init1: 1041 opt: 2288 Z-score: 2004.4 bits: 384.9 E(32554): 2.5e-105 Smith-Waterman score: 4627; 37.1% identity (64.2% similar) in 2369 aa overlap (97-2255:88-2368) 70 80 90 100 110 120 pF1KSD LPWLQGIFCNVNNPCFQSPTPGESPGIVSNYNNS----ILARVYRDFQELLMNAPESQHL : :: .: :. : .: . : : CCDS43 TAAPLTSAGILPVMQSLCPDGQRDEFGFLQYANSTVTQLLERLDRVVEEGNLFDPARPSL 60 70 80 90 100 110 130 140 150 160 170 pF1KSD GRIWTELHILSQFMDTLRTHP-------ERIAGRGIRIRDILKDEETLTLFLIKNIGLSD : .::. : : ...: . : .: . .. . .. .. . : :: .:..: . CCDS43 G---SELEALRQHLEALSAGPGTSGSHLDRSTVSSFSLDSVARNPQELWRFLTQNLSLPN 120 130 140 150 160 170 180 190 200 pF1KSD SVVYLLINSQVRPEQFAH--------------------------GVPDLALKDIACSEAL :.. :. ..: : . : : : . .... . :: CCDS43 STAQALLAARVDPPEVYHLLFGPSSALDSQSGLHKGQEPWSRLGGNPLFRMEELLLAPAL 180 190 200 210 220 230 210 220 230 240 250 pF1KSD LERF--------------IIFSQRRGAKTVRYALCSLSQGT----LQWIEDTLYANVDFF ::.. . ::. . . : :.:: . .. .. . : ..: CCDS43 LEQLTCTPGSGELGRILTVPESQKGALQGYRDAVCSGQAAARARRFSGLSAELRNQLDVA 240 250 260 270 280 290 260 270 280 290 300 pF1KSD KLFRVL----PTLLDSRSQGINLRSWGGILSDM--SPRIQEFIHRPSMQDLLW-----VT :. . : :. :: :. : ..:.:. . .. . . : :: . CCDS43 KVSQQLGLDAPNGSDSSPQAPPPRRLQALLGDLLDAQKVLQDVDVLSALALLLPQGACTG 300 310 320 330 340 350 310 320 330 340 350 pF1KSD R----PLMQNGGPETFT---KLMGILSDLLCGYPEGGGSRVLSFNWYEDNNYKAFLGIDS : : :: . : .:: . : : ... :. ... .::. . . CCDS43 RTPGPPASGAGGAANGTGAGAVMGPNATAEEGAPSAAA---LATPDTLQGQCSAFVQLWA 360 370 380 390 400 410 360 370 380 390 400 pF1KSD TRKDPIYSYDRRTTSFCNALIQSLESNPLTKIAWRAAKPL--LMG---KILYTPDSPAAR . :: . :: .. : .:. : : :: ::::.: . . CCDS43 GLQ-PILCGNNRTIEPEALRRGNMSSLGFTSKEQRNLGLLVHLMTSNPKILYAPAGSEVD 420 430 440 450 460 470 410 420 430 440 450 460 pF1KSD RILKNANSTFEELEHVRKLVKAWEEVGPQIWYFFDNSTQMNMIRDTLGNPTVKDFLNRQL :.. .:: :: . .: . ...: ... .: :.... .. .: .:.. . CCDS43 RVILKANETFAFVGNVTHYAQVWLNISAEIRSFLEQGRLQQHLR----------WLQQYV 480 490 500 510 520 470 480 490 500 510 520 pF1KSD GEEGITAEAILNFLYKGPRESQADDMA---NFDWRDIFNITDRTLRLVNQYLECLVLDKF .: . ::. : . : . :... .. . .. : . :.. . .: : CCDS43 AELRLHPEALNLSLDELPPALRQDNFSLPSGMALLQQLDTIDNAACGWIQFMSKVSVDIF 530 540 550 560 570 580 530 540 550 560 570 580 pF1KSD ESYNDETQLTQRALSL-LEENM-FWAGVVFPDMYPWTSSLPPHVKYKIRMDIDVVEKTNK ... :: .... .:. ..:. .:.:.: .::::::.::::.. . .::::. CCDS43 KGFPDEESIVNYTLNQAYQDNVTVFASVIFQTRKD--GSLPPHVHYKIRQNSSFTEKTNE 590 600 610 620 630 590 600 610 620 630 640 pF1KSD IKDRYWDSGPRADPVEDFRYIWGGFAYLQDMVEQGITRSQVQAEA--PVGIYLQQMPYPC :. :: :: . : : ::...:::.:..: . : .. : : :.:..:::: CCDS43 IRRAYWRPGPNTGGRFYFLY---GFVWIQDMMERAIIDTFVGHDVVEP-GSYVQMFPYPC 640 650 660 670 680 690 650 660 670 680 690 700 pF1KSD FVDDSFMIILNRCFPIFMVLAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTWF .. :.:...... .:. ::..:.:::.::.. :: ::: ::::..:..:..::: : .:: CCDS43 YTRDDFLFVIEHMMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWF 700 710 720 730 740 750 710 720 730 740 750 760 pF1KSD LDSFSIMSMSIFLLTIFIMHGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLA . .: .:.:. :: .. .:..: .: :..::: ....::::.:::.:...:::.:: CCDS43 ITGFVQLSISVTALTAILKYGQVLMHSHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKLA 760 770 780 790 800 810 770 780 790 800 810 pF1KSD AACSGVIYFTLYLPHILCFAWQ----DRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQGL .::.:.::: :.:.. . :..:: : .::.: .:::.:..:.. .: :. CCDS43 SACGGIIYFLSYVPYMYVAIREEVAHDKITAFEKCIASLMSTTAFGLGSKYFALYEVAGV 820 830 840 850 860 870 820 830 840 850 860 870 pF1KSD GLQWSNIGNSPTEGDEFSFLLSMQMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQE :.:: ....::.:::.:..::.. :...::.:::.:.::.. : :: :: : :::: ::. CCDS43 GIQWHTFSQSPVEGDDFNLLLAVTMLMVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQK 880 890 900 910 920 930 880 890 900 910 920 930 pF1KSD SYWLG-GEGCSTREERALEKTEPLTEETEDPEHPEGIHDSFFER-----EHPGWVPGV-C ::::: :. . . .: :. :: . .... ::. :.: .: : : CCDS43 SYWLGSGRTEAWEWSWPWARTPRLSVMEED--QACAMESRRFEETRGMEEEPTHLPLVVC 940 950 960 970 980 990 940 950 960 970 980 990 pF1KSD VKNLVKIFEPCGQPAVDRLNITFYENQITAFLGHNGAGKTTTLSILTGLLPPTSGTVLVG : .:.:... . :...:....::::...::::::::::::.::::::.:::::.. . CCDS43 VDKLTKVYKDDKKLALNKLSLNLYENQVVSFLGHNGAGKTTTMSILTGLFPPTSGSATIY 1000 1010 1020 1030 1040 1050 1000 1010 1020 1030 1040 1050 pF1KSD GRDIETSLDAVRQSLGMCPQHNILFHHLTVAEHMLFYAQLKGKSQEEAQLEMEAMLEDTG :.::.: .: .:..::::::::.:: .::: ::. ::..::. .::: . ::. :.:: CCDS43 GHDIRTEMDEIRKNLGMCPQHNVLFDRLTVEEHLWFYSRLKSMAQEEIRREMDKMIEDLE 1060 1070 1080 1090 1100 1110 1060 1070 1080 1090 1100 1110 pF1KSD LHHKRNEEAQDLSGGMQRKLSVAIAFVGDAKVVILDEPTSGVDPYSRRSIWDLLLKYRSG : .::. .: :::::.::::::::::: ....::::::.:::::.::.::::.:::. : CCDS43 LSNKRHSLVQTLSGGMKRKLSVAIAFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKPG 1120 1130 1140 1150 1160 1170 1120 1130 1140 1150 1160 1170 pF1KSD RTIIMSTHHMDEADLLGDRIAIIAQGRLYCSGTPLFLKNCFGTGLYLTLVRKMKNIQSQR :::..::::::::::::::::::..:.: : :.:::::. .: : ::::.. .. CCDS43 RTILLSTHHMDEADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGYRLTLVKR----PAEP 1180 1190 1200 1210 1220 1180 1190 1200 1210 1220 1230 pF1KSD KGSEGTCSCSSKGFSTTCPAHVDDLTPEQVLDGDVNELMDVVLHHVPEAKLVECIGQELI : . :.... :... :. . : .. . . .:: :: . :: CCDS43 GGPQ------EPGLASSPPGRAP-LSSCSEL-----QVSQFIRKHVASCLLVSDTSTELS 1230 1240 1250 1260 1270 1240 1250 1260 1270 1280 1290 pF1KSD FLLPNKNFKHRAYASLFRELEETLADLGLSSFGISDTPLEEIFLKVTEDSDSGPLFAGGA ..::.. :. :. ::..::..: : :::::. :: :::.::::.:...: . . CCDS43 YILPSEAAKKGAFERLFQHLERSLDALHLSSFGLMDTTLEEVFLKVSEEDQSLENSEADV 1280 1290 1300 1310 1320 1330 1300 1310 1320 1330 pF1KSD QQKRENVNP--RHPCLGPREKAGQTPQDSNVCSPGAP---------AAHPEG-------- ...:..: : . : : . .::. . :.. . : : :: CCDS43 KESRKDVLPGAEGPASG-EGHAGNLARCSELTQSQASLQSASSVGSARGDEGAGYTDVYG 1340 1350 1360 1370 1380 1390 1340 1350 1360 1370 pF1KSD --QP----PPEPEC---------------PGPQLNTGTQLVLQHVQALLVKRFQHTIRSH .: : .:. : . : : ... ..::::::. . :. CCDS43 DYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGWLKVRQFHGLLVKRFHCARRNS 1400 1410 1420 1430 1440 1450 1380 1390 1400 1410 pF1KSD KDFLAQIVLPATFVFLALMLSIVIPPFGEYPALTLHPWIYG-----------------QQ : ...::.::: :: .:. ... .: .:. : :.: : : .. CCDS43 KALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQYHNYTQPRGNFIPYANEERRE 1460 1470 1480 1490 1500 1510 1420 1430 1440 pF1KSD YTFFSMDEPGSEQFT--------VLADVLLNKPG----------------------FGNR : . . . .:.. : : .:..:. : . CCDS43 YRLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSLGPTLNLSSGESRLLAARFFDSM 1520 1530 1540 1550 1560 1570 1450 1460 1470 1480 pF1KSD CLKEGWLPEYPCGN---STPWKTPSVSP----------NIT--QLFQKQKWTQVNPSPS- :: :.. : .: : .:: :: :.. . ::.. : CCDS43 CL-ESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWNVSLPPTAGPEMWTSAPSLPRL 1580 1590 1600 1610 1620 1630 1490 1500 1510 1520 1530 1540 pF1KSD ----CRCSTREKLTMLPECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIR ::. . : . :: ..:: :: .:. . .:: :.: .:.:..:. : CCDS43 VREPVRCTCSAQGTGFS-CPSSVGGHPPQMRVV-TGDILTDITGHNVSEYLLFT------ 1640 1650 1660 1670 1680 1550 1560 1570 1580 1590 1600 pF1KSD SSLKSKFWVNEQRYGGISIGGKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIP ...: . .:::.:..:. : .: ...: :: : CCDS43 ---SDRFRL--HRYGAITFGNVLKSIP----------ASFG----------TRA-----P 1690 1700 1710 1610 1620 1630 1640 1650 1660 pF1KSD DFLKHLETEDNIKVWFNNKGWHALVSFLNVAHNAILRASLPKDR-SPEEYGITVISQPLN ..... .. .:..::::.:.. ..:: .::::::.:::.. .: ::::: ..:.: CCDS43 PMVRKIAVRRAAQVFYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMN 1720 1730 1740 1750 1760 1770 1670 1680 1690 1700 1710 1720 pF1KSD LTKEQLSEITVLTTSVDAVVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTT :. .:: . : ..:.:.:: .: .:::::::::..:. :. .:.:::::.:: .: CCDS43 KTSASLS-LDYLLQGTDVVIAIFIIVAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPII 1780 1790 1800 1810 1820 1830 1730 1740 1750 1760 1770 1780 pF1KSD YWVTNFLWDIMNYSVSAGLVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPAS ::..:..::..:: : : : :.. :. ::::: :.::...:.:::::.. :.::::: CCDS43 YWLANYVWDMLNYLVPATCCVIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPAS 1840 1850 1860 1870 1880 1890 1790 1800 1810 1820 1830 1840 pF1KSD FLFDVPSTAYVALSCANLFIGINSSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLG : :.:::.::: : ::::::.... ::.:.:::... : :. :.. ...::.. :: CCDS43 FWFEVPSSAYVFLIVINLFIGITATVATFLLQLFEHDKDLKVVNSYLKSCFLIFPNYNLG 1900 1910 1920 1930 1940 1950 1850 1860 1870 1880 1890 1900 pF1KSD RGLIDLALSQAVTDVYARFGE-EHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQRHFF .::...: .. ... ::..:. .. .::.::.. ..: ::.::::: ::::.. : .: CCDS43 HGLMEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYNF- 1960 1970 1980 1990 2000 2010 1910 1920 1930 1940 1950 pF1KSD LSQWIAEPTKEPIVDEDDDVAEERQRIITGGNKTDILRLHELTKIYPGTSSP---AVDRL : . :.. :..: ::: ::::.. : .:......:::.: . . ::::: CCDS43 LRRPQRMPVSTKPVEDDVDVASERQRVLRGDADNDMVKIENLTKVYKSRKIGRILAVDRL 2020 2030 2040 2050 2060 2070 1960 1970 1980 1990 2000 2010 pF1KSD CVGVRPGECFGLLGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNMGYCP :.:::::::::::::::::::.:::::::: ..:.:.: : :.:.: .. .:.:..:::: CCDS43 CLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQVQQSLGYCP 2080 2090 2100 2110 2120 2130 2020 2030 2040 2050 2060 2070 pF1KSD QFDAIDELLTGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNKRK : ::. . ::.:::: ::.::::. .. .:..:....: :: ::: ::::::::::: CCDS43 QCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPAGTYSGGNKRK 2140 2150 2160 2170 2180 2190 2080 2090 2100 2110 2120 2130 pF1KSD LSTAIALIGCPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECEALCT ::::::::: : ...::::::::::.:::.:::.:...:. ::.:::::::::::::::: CCDS43 LSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSVVLTSHSMEECEALCT 2200 2210 2220 2230 2240 2250 2140 2150 2160 2170 2180 2190 pF1KSD RLAIMVKGAFRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGSVQ ::::::.: .::.:.:::::..:::::..:.. :: .. .. : .::. ::: .. CCDS43 RLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQS-----VKDVVRFFNRNFPEAML 2260 2270 2280 2290 2300 2200 2210 2220 2230 2240 2250 pF1KSD RERHYNMLQFQVSSS--SLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTESH .:::.. .:.:..: :::..:. . . . : ::.:::.:::::.:::::::.:... CCDS43 KERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKKQSDNL 2310 2320 2330 2340 2350 2360 2260 2270 pF1KSD DLPLHPRAAGASRQAQD CCDS43 EQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFEEERAQLS 2370 2380 2390 2400 2410 2420 >>CCDS6762.1 ABCA1 gene_id:19|Hs108|chr9 (2261 aa) initn: 5519 init1: 2148 opt: 2246 Z-score: 1968.0 bits: 378.0 E(32554): 2.7e-103 Smith-Waterman score: 7617; 50.9% identity (77.2% similar) in 2274 aa overlap (6-2261:6-2236) 10 20 30 40 50 60 pF1KSD MGFVRQIQLLLWKNWTLRKRQKIRFVVELVWPLSLFLVLIWLRNANPLYSHHECHFPNKA :..:::::: :.:.:: ....:..::: .::.:: .: . : : .::::::::: CCDS67 MACWPQLRLLLWKNLTFRRRQTCQLLLEVAWPLFIFLILISVRLSYPPYEQHECHFPNKA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD MPSAGMLPWLQGIFCNVNNPCFQSPTPGESPGIVSNYNNSILARVYRDFQELLMNAPESQ ::::: :::.:::.::.:::::. :::::.::.:.:.:.::.::.. : ..::. . .. CCDS67 MPSAGTLPWVQGIICNANNPCFRYPTPGEAPGVVGNFNKSIVARLFSDARRLLLYSQKDT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD HLGRIWTELHILSQFMDTLRTHPERIAGRGIRIRDILKDEETLTLFLIKNIGLSDSVVYL . . :. :.:. . .. .....:.: :.::.. :: .:..: :.: CCDS67 SMKDMRKVLRTLQQI---------KKSSSNLKLQDFLVDNETFSGFLYHNLSLPKSTVDK 130 140 150 160 170 190 200 210 220 230 pF1KSD LINSQVRPEQ-FAHGVPDLALKDIACSEALLERFIIFSQRRGAKTVRYALCSLSQGTLQW .. ..: .. : .: .: : .. :. . :..: . : . : ::.: . : CCDS67 MLRADVILHKVFLQGY-QLHLTSL-CNGSKSEEMIQL----GDQEVS-ELCGLPREKLAA 180 190 200 210 220 240 250 260 270 280 290 pF1KSD IEDTLYANVDFFK-LFRVLPTLLDSRSQGINLRSWGGILSDMSPRIQEFIHRPSMQDLLW : .: .:.:..: ..:.: . :. . .. .: ... ::.. : .:. CCDS67 AERVLRSNMDILKPILRTLNSTSPFPSKELA-EATKTLLHSLGTLAQELFSMRSWSDMRQ 230 240 250 260 270 280 300 310 320 330 340 350 pF1KSD VTRPLMQNGGPETFTKLMGILSDLLCGYPEGGGSRVLSFNWYEDNNYKAFLGIDSTRKDP . : . .. . :... .: ..::.::::: .. :.::::::::::..: ..:..: CCDS67 EVMFLTNVNSSSSSTQIYQAVSRIVCGHPEGGGLKIKSLNWYEDNNYKALFGGNGTEEDA 290 300 310 320 330 340 360 370 380 390 400 410 pF1KSD IYSYDRRTTSFCNALIQSLESNPLTKIAWRAAKPLLMGKILYTPDSPAARRILKNANSTF :: :: .:: :...:::.::..: :.: ::::.::::::::.::.:... ..:.:: CCDS67 ETFYDNSTTPYCNDLMKNLESSPLSRIIWKALKPLLVGKILYTPDTPATRQVMAEVNKTF 350 360 370 380 390 400 420 430 440 450 460 470 pF1KSD EELEHVRKLVKAWEEVGPQIWYFFDNSTQMNMIRDTLGNPTVKDFLNRQLGEEGITAEAI .:: . : :::..:.:: :..:: .:...: : . : ..:: ::. : CCDS67 QELAVFHDLEGMWEELSPKIWTFMENSQEMDLVRMLLDSRDNDHFWEQQLDGLDWTAQDI 410 420 430 440 450 460 480 490 500 510 520 530 pF1KSD LNFLYKGPRESQADDMANFDWRDIFNITDRTLRLVNQYLECLVLDKFESYNDETQLTQRA . :: : :.. :... . . ::. :: :....: .....::. :.:.: :. : ... CCDS67 VAFLAKHPEDVQSSNGSVYTWREAFNETNQAIRTISRFMECVNLNKLEPIATEVWLINKS 470 480 490 500 510 520 540 550 560 570 580 590 pF1KSD LSLLEENMFWAGVVFPDMYPWTSSLPPHVKYKIRMDIDVVEKTNKIKDRYWDSGPRADPV . ::.: ::::.:: . : . :: ::::::::::: ::.:::::: ::: :::::: CCDS67 MELLDERKFWAGIVFTGITPGSIELPHHVKYKIRMDIDNVERTNKIKDGYWDPGPRADPF 530 540 550 560 570 580 600 610 620 630 640 650 pF1KSD EDFRYIWGGFAYLQDMVEQGITRSQVQAEAPVGIYLQQMPYPCFVDDSFMIILNRCFPIF ::.::.:::::::::.:::.: : . .: .:.:.:::::::.::: :. ...: .:.: CCDS67 EDMRYVWGGFAYLQDVVEQAIIRVLTGTEKKTGVYMQQMPYPCYVDDIFLRVMSRSMPLF 590 600 610 620 630 640 660 670 680 690 700 710 pF1KSD MVLAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSMSIFLLTIF :.:::::::.. .:.:: ::: :::::.. .:..:...: .::..:. . .: ::... CCDS67 MTLAWIYSVAVIIKGIVYEKEARLKETMRIMGLDNSILWFSWFISSLIPLLVSAGLLVVI 650 660 670 680 690 700 720 730 740 750 760 770 pF1KSD IMHGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYFTLYLPHIL . : .: :::: ..:.:: .:...::. :::.::.::.:.:::::.:.::::::::..: CCDS67 LKLGNLLPYSDPSVVFVFLSVFAVVTILQCFLISTLFSRANLAAACGGIIYFTLYLPYVL 710 720 730 740 750 760 780 790 800 810 820 830 pF1KSD CFAWQDRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLL : :::: . :: .::::::::::: ::.. :::::.:.::.:. .::.: : :.. CCDS67 CVAWQDYVGFTLKIFASLLSPVAFGFGCEYFALFEEQGIGVQWDNLFESPVEEDGFNLTT 770 780 790 800 810 820 840 850 860 870 880 890 pF1KSD SMQMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCSTREERALEKTE :..:::.:. .::...::.. ::::.:: : :::: .:::.: :.. ::.. CCDS67 SVSMMLFDTFLYGVMTWYIEAVFPGQYGIPRPWYFPCTKSYWFG--------EESDEKSH 830 840 850 860 870 900 910 920 930 940 950 pF1KSD PLTEETEDPEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFEPCGQPAVDRLNITFYENQI : ... . : . .:.: :: ..::::... . ::: : ..:::.:: CCDS67 PGSNQKR-------ISEICMEEEPTHLKLGVSIQNLVKVYRDGMKVAVDGLALNFYEGQI 880 890 900 910 920 960 970 980 990 1000 1010 pF1KSD TAFLGHNGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQHNILFHHL :.::::::::::::.::::::.::::::. . :.::.. ....::.::.:::::.:: : CCDS67 TSFLGHNGAGKTTTMSILTGLFPPTSGTAYILGKDIRSEMSTIRQNLGVCPQHNVLFDML 930 940 950 960 970 980 1020 1030 1040 1050 1060 1070 pF1KSD TVAEHMLFYAQLKGKSQEEAQLEMEAMLEDTGL-HHKRNEEAQDLSGGMQRKLSVAIAFV :: ::. :::.::: :..... ::: : :.:: : . ....::::::::::::.::: CCDS67 TVEEHIWFYARLKGLSEKHVKAEMEQMALDVGLPSSKLKSKTSQLSGGMQRKLSVALAFV 990 1000 1010 1020 1030 1040 1080 1090 1100 1110 1120 1130 pF1KSD GDAKVVILDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAIIAQGR : .:::::::::.::::::::.::.::::::.:::::.:::::::::.::::::::..:. CCDS67 GGSKVVILDEPTAGVDPYSRRGIWELLLKYRQGRTIILSTHHMDEADVLGDRIAIISHGK 1050 1060 1070 1080 1090 1100 1140 1150 1160 1170 1180 1190 pF1KSD LYCSGTPLFLKNCFGTGLYLTLVRK-MKNIQSQRKGSEGTCSCSSKGFS---TTCPAHVD : : :. ::::: .::: :::::.: ... :. ..: .: : .: : .. : . CCDS67 LCCVGSSLFLKNQLGTGYYLTLVKKDVESSLSSCRNSSSTVSYLKKEDSVSQSSSDAGLG 1110 1120 1130 1140 1150 1160 1200 1210 1220 1230 1240 1250 pF1KSD DLTPEQVLDGDVNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFKHRAYASLFRELEET . ..: ::. . ... .:: ::.::: ::.:: ..:: . :. :.. ::.:... CCDS67 SDHESDTLTIDVSAISNLIRKHVSEARLVEDIGHELTYVLPYEAAKEGAFVELFHEIDDR 1170 1180 1190 1200 1210 1220 1260 1270 1280 1290 1300 pF1KSD LADLGLSSFGISDTPLEEIFLKVTEDSDSGPLFAGG---AQQKRENVNPRHPCLGP-REK :.:::.::.:::.: ::::::::.:.: . : :...:. . .. :: : : CCDS67 LSDLGISSYGISETTLEEIFLKVAEESGVDAETSDGTLPARRNRRAFGDKQSCLRPFTED 1230 1240 1250 1260 1270 1280 1310 1320 1330 1340 1350 1360 pF1KSD AGQTPQDSNVCSPGAPAAHPEGQPPPEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRS . :.::.. . . :. . : : .:. :. ::: ::. . :: CCDS67 DAADPNDSDIDPESRETDLLSGM-----DGKGSYQVKGWKLTQQQFVALLWKRLLIARRS 1290 1300 1310 1320 1330 1340 1370 1380 1390 1400 1410 1420 pF1KSD HKDFLAQIVLPATFVFLALMLSIVIPPFGEYPALTLHPWIYGQQYTFFSMDEPGSEQFTV .: :.:::::::.:: .::..:...::::.::.: :.::.:..:::: : : : . CCDS67 RKGFFAQIVLPAVFVCIALVFSLIVPPFGKYPSLELQPWMYNEQYTFVSNDAPEDTGTLE 1350 1360 1370 1380 1390 1400 1430 1440 1450 1460 1470 1480 pF1KSD LADVLLNKPGFGNRCLKEGWLPEYPC-GNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSC : ..: . ::::.::.. . .:. :: .. : : : .: .:::. .::. ::::.: CCDS67 LLNALTKDPGFGTRCMEGNPIPDTPCQAGEEEWTTAPVPQTIMDLFQNGNWTMQNPSPAC 1410 1420 1430 1440 1450 1460 1490 1500 1510 1520 1530 1540 pF1KSD RCSTREKLTMLPECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKS .::. . ::: :: :::::::::: : ...:::::: :::::.::::: .: .:::. CCDS67 QCSSDKIKKMLPVCPPGAGGLPPPQRKQNTADILQDLTGRNISDYLVKTYVQIIAKSLKN 1470 1480 1490 1500 1510 1520 1550 1560 1570 1580 1590 1600 pF1KSD KFWVNEQRYGGISIG-GKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLK :.:::: ::::.:.: .. ..: . : . .... . .... . . . . :. CCDS67 KIWVNEFRYGGFSLGVSNTQALPPSQE-VNDAIKQMKKHLKLAKDSSADRFLNSLGRFMT 1530 1540 1550 1560 1570 1580 1610 1620 1630 1640 1650 1660 pF1KSD HLETEDNIKVWFNNKGWHALVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQ :.:..:.:::::::::::. ::::: .::::::.: : ..: .::::....::::::.: CCDS67 GLDTKNNVKVWFNNKGWHAISSFLNVINNAILRANLQKGENPSHYGITAFNHPLNLTKQQ 1590 1600 1610 1620 1630 1640 1670 1680 1690 1700 1710 1720 pF1KSD LSEITVLTTSVDAVVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTN :::....:::::..:.:::::.:::::::::..::::::.:.:::::::::.:. ::..: CCDS67 LSEVALMTTSVDVLVSICVIFAMSFVPASFVVFLIQERVSKAKHLQFISGVKPVIYWLSN 1650 1660 1670 1680 1690 1700 1730 1740 1750 1760 1770 1780 pF1KSD FLWDIMNYSVSAGLVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDV :.::. :: : : ::. ::: ::.:.:.: :::.:. :::::::.. :.::::::.: . CCDS67 FVWDMCNYVVPATLVIIIFICFQQKSYVSSTNLPVLALLLLLYGWSITPLMYPASFVFKI 1710 1720 1730 1740 1750 1760 1790 1800 1810 1820 1830 1840 pF1KSD PSTAYVALSCANLFIGINSSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGLID ::::::.:. .:::::::.:. ::.:::: .:. : .: .:......:::::::::::: CCDS67 PSTAYVVLTSVNLFIGINGSVATFVLELFTDNK-LNNINDILKSVFLIFPHFCLGRGLID 1770 1780 1790 1800 1810 1820 1850 1860 1870 1880 1890 1900 pF1KSD LALSQAVTDVYARFGEEHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQRHFFLSQWIA .. .::..:. ::::.. ..:. :::.:.:::::.:::::.::.:.:.: .::. . CCDS67 MVKNQAMADALERFGENRFVSPLSWDLVGRNLFAMAVEGVVFFLITVLIQYRFFIRPRPV 1830 1840 1850 1860 1870 1880 1910 1920 1930 1940 1950 1960 pF1KSD EPTKEPIVDEDDDVAEERQRIITGGNKTDILRLHELTKIYPGTSSPAVDRLCVGVRPGEC . :. :::.:: .:::::. ::...:::...:::::: .:::::.:::. :::: CCDS67 NAKLSPLNDEDEDVRRERQRILDGGGQNDILEIKELTKIYRRKRKPAVDRICVGIPPGEC 1890 1900 1910 1920 1930 1940 1970 1980 1990 2000 2010 2020 pF1KSD FGLLGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNMGYCPQFDAIDELL :::::::::::..:::::::::::: ::: . .:::.:: ::::::::::::::: ::: CCDS67 FGLLGVNGAGKSSTFKMLTGDTTVTRGDAFLNKNSILSNIHEVHQNMGYCPQFDAITELL 1950 1960 1970 1980 1990 2000 2030 2040 2050 2060 2070 2080 pF1KSD TGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNKRKLSTAIALIG :::::. ..: ::::: .:. ::..:.:..:::. :.. ::.::::::::::::.:::: CCDS67 TGREHVEFFALLRGVPEKEVGKVGEWAIRKLGLVKYGEKYAGNYSGGNKRKLSTAMALIG 2010 2020 2030 2040 2050 2060 2090 2100 2110 2120 2130 2140 pF1KSD CPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECEALCTRLAIMVKGA ::.:.::::::::::.:::.::: .:...:::.:::::::::::::::::.::::.: CCDS67 GPPVVFLDEPTTGMDPKARRFLWNCALSVVKEGRSVVLTSHSMEECEALCTRMAIMVNGR 2070 2080 2090 2100 2110 2120 2150 2160 2170 2180 2190 2200 pF1KSD FRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGSVQRERHYNMLQ :::.:..::::..::::: ....: . . :::.::..:: ::::: .:.: :::: CCDS67 FRCLGSVQHLKNRFGDGYTIVVRIAGSN----PDLKPVQDFFGLAFPGSVLKEKHRNMLQ 2130 2140 2150 2160 2170 2210 2220 2230 2240 2250 2260 pF1KSD FQVSSS--SLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTES-H--DLPLHP .:. :: ::::::..: . : : ::.:::.:::::::::::::.:... : :: :: CCDS67 YQLPSSLSSLARIFSILSQSKKRLHIEDYSVSQTTLDQVFVNFAKDQSDDDHLKDLSLHK 2180 2190 2200 2210 2220 2230 2270 pF1KSD RAAGASRQAQD CCDS67 NQTVVDVAVLTSFLQDEKVKESYV 2240 2250 2260 >>CCDS33373.1 ABCA12 gene_id:26154|Hs108|chr2 (2277 aa) initn: 2534 init1: 779 opt: 1862 Z-score: 1630.9 bits: 315.7 E(32554): 1.6e-84 Smith-Waterman score: 3882; 34.7% identity (66.0% similar) in 1969 aa overlap (343-2273:434-2272) 320 330 340 350 360 370 pF1KSD TKLMGILSDLLCGYPEGGGSRVLSFNWYEDNNYKAFLGIDSTRKDPI--YSYDRRTTSFC :. : :: :... :. .: :: CCDS33 FSTISQALCSQGITTEYLTAMLPSSQRPKGNHTKDFLTYKLTKEQIASKYGIPINSTPFC 410 420 430 440 450 460 380 390 400 410 420 430 pF1KSD NALIQSLESNPLTKIAWRAAKPLLMGKILYTPDSPAARRILKNANSTFEELEHVRKLVKA .: ... . : . : ::.:.:.:::.: .:... :....: :...: ..:. . CCDS33 FSLYKDIINMPAGPVIWAFLKPMLLGRILYAPYNPVTKAIMEKSNVTLRQLAELREKSQE 470 480 490 500 510 520 440 450 460 470 480 pF1KSD WEEVGPQIWYFFDNSTQ-MNMIRDTLGNPTVKDFLNRQLGEEGITAEAILNFLYKGPRES : . .: . : .: . :...:: :: :. :.. ..: ... : : : CCDS33 WMDKSPLFMNSFHLLNQAIPMLQNTLRNPFVQVFVKFSVGLDAVE-------LLKQIDEL 530 540 550 560 570 490 500 510 520 530 540 pF1KSD QADDMANFDWRDIFNITDRTLRLVNQYLECLVLDKFESYNDETQLTQRALSLLEENMFWA . . . ::.. . :. . :.. :.... . .. ..: : . : ... CCDS33 DILRLKLENNIDIIDQLNTLSSLTVNISSCVLYDRIQAAKTIDEMEREAKRLYKSNELFG 580 590 600 610 620 630 550 560 570 580 590 600 pF1KSD GVVF--PDMYPWTSS-------LPPHVKYKIRMDIDVVEKTNKIKDRYWDSGPRADPVED .:.: :. : . ::: .:: :::.. ... : ... . : ::. .: .. CCDS33 SVIFKLPSNRSWHRGYDSGNVFLPPVIKYTIRMSLKTAQTTRSLRTKIWAPGPHNSPSHN 640 650 660 670 680 690 610 620 630 640 650 pF1KSD FRYIWG-GFAYLQDMVEQGITRSQV-QAEAPVGIYLQQMPYPCFVDDSFMIILNRCFPIF :.: .: :::: .:..: . :. . ... .: .:::::. :.:. .. .:: CCDS33 --QIYGRAFIYLQDSIERAIIELQTGRNSQEIAVQVQAIPYPCFMKDNFLTSVSYSLPIV 700 710 720 730 740 750 660 670 680 690 700 710 pF1KSD MVLAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSMSIFLLTIF ...::. .. ::..: ::.:::.: .: .::.. . .:...: ... ..: .: :. CCDS33 LMVAWVVFIAAFVKKLVYEKDLRLHEYMKMMGVNSCSHFFAWLIESVGFLLVTIVILIII 760 770 780 790 800 810 720 730 740 750 760 770 pF1KSD IMHGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYFTLYLPHIL . : :: .. :::::.. .: ..: . .:.:.::.....:: ...::. ..: :. CCDS33 LKFGNILPKTNGFILFLYFSDYSFSVIAMSYLISVFFNNTNIAALIGSLIYIIAFFPFIV 820 830 840 850 860 870 780 790 800 810 820 830 pF1KSD CFAWQDRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLL . ..... :: .:::::.::.....:..:.::::.:::: :. .::.. : :: CCDS33 LVTVENELSYVLKVFMSLLSPTAFSYASQYIARYEEQGIGLQWENMYTSPVQDDTTSFGW 880 890 900 910 920 930 840 850 860 870 880 890 pF1KSD SMQMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCS-TREERA--LE ..: :. .: :.:::. .:::: :: :::: . ::: ::. .. :.. : CCDS33 LCCLILADSFIYFLIAWYVRNVFPGTYGMAAPWYFPILPSYWKERFGCAEVKPEKSNGLM 940 950 960 970 980 990 900 910 920 930 940 950 pF1KSD KTEPLTEETEDPEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFEPCGQPAVDRLNITFYE :. . ..:. :: . .: .: : . :: .....::. .. ::: ::..::: CCDS33 FTNIMMQNTNPSASPEYMFSSNIEPEPKDLTVGVALHGVTKIY--GSKVAVDNLNLNFYE 1000 1010 1020 1030 1040 1050 960 970 980 990 1000 1010 pF1KSD NQITAFLGHNGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQHNILF ..::..:: ::::::::.:.::::. ..::..: :.::.:.: .::...:.: ::..:: CCDS33 GHITSLLGPNGAGKTTTISMLTGLFGASAGTIFVYGKDIKTDLHTVRKNMGVCMQHDVLF 1060 1070 1080 1090 1100 1110 1020 1030 1040 1050 1060 1070 pF1KSD HHLTVAEHMLFYAQLKGKSQEEAQL--EMEAMLEDTGLHHKRNEEAQDLSGGMQRKLSVA .::. ::.:.:...: . :: :.. :.::::. .:.... :::::.::::.. CCDS33 SYLTTKEHLLLYGSIKVPHWTKKQLHEEVKRTLKDTGLYSHRHKRVGTLSGGMKRKLSIS 1120 1130 1140 1150 1160 1170 1080 1090 1100 1110 1120 1130 pF1KSD IAFVGDAKVVILDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAII ::..: ..:::::::..:::: :::::::.. : ...::::.::::.:::..:.::::.. CCDS33 IALIGGSRVVILDEPSTGVDPCSRRSIWDVISKNKTARTIILSTHHLDEAEVLSDRIAFL 1180 1190 1200 1210 1220 1230 1140 1150 1160 1170 1180 1190 pF1KSD AQGRLYCSGTPLFLKNCFGTGLYLTLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAHVD :: : : :.:..::. :: : .:::..: .: .....: CCDS33 EQGGLRCCGSPFYLKEAFGDGYHLTLTKK----KSPNLNANAVC---------------- 1240 1250 1260 1270 1200 1210 1220 1230 1240 1250 pF1KSD DLTPEQVLDGDVNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFK-HRAYASLFRELEE :. . .. :.::: : : :: ::...:: . : :: ::.: :.. CCDS33 ----------DTMAVTAMIQSHLPEAYLKEDIGGELVYVLPPFSTKVSGAYLSLLRALDN 1280 1290 1300 1310 1320 1260 1270 1280 1290 1300 1310 pF1KSD TLADLGLSSFGISDTPLEEIFLKVTEDSDSGPLFAGGAQQKRENVNPRHPCLGPREKAG- ..::... .::::: .::.::..:..:... . .. :... .. .: . : CCDS33 GMGDLNIGCYGISDTTVEEVFLNLTKESQKN------SAMSLEHLTQKK--IGNSNANGI 1330 1340 1350 1360 1370 1320 1330 1340 1350 1360 1370 pF1KSD QTPQDSNVCSPGAPAAHPEGQPPPEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHK .::.: .: : . . . : .:. : :.:....:.:.:::.:: :. : CCDS33 STPDDLSVSSSNFT------DRDDKILTRGERLD-GFGLLLKKIMAILIKRFHHTRRNWK 1380 1390 1400 1410 1420 1380 1390 1400 1410 1420 pF1KSD DFLAQIVLPATFVFLALMLSIVIPPFGEYPALTLHPWIYG--QQYTFFSMDEPGSEQFTV ..::..:: .:: :. :. . . :: . . : .:: .: .:.. .:..: . CCDS33 GLIAQVILPIVFVTTAMGLGTLRNSSNSYPEIQISPSLYGTSEQTAFYANYHPSTE---A 1430 1440 1450 1460 1470 1480 1430 1440 1450 1460 1470 1480 pF1KSD LADVLLNKPGFGNRCLKEGWLPEYPCGNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSCR :.... . ::. : ::. . : . :.: : : ::.. : CCDS33 LVSAMWDFPGIDNMCLNTSDLQCLNKDSLEKWNT-SGEP-ITNF------------GVCS 1490 1500 1510 1520 1530 1490 1500 1510 1520 1530 1540 pF1KSD CSTREKLTMLPECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSK :: . :::. . ::.: :.... .:: . . ..:..: .. CCDS33 CSEN-----VQECPKF--NYSPPHRRTYSSQVIYNLTGQRVENYLISTANEFV------- 1540 1550 1560 1570 1550 1560 1570 1580 1590 1600 pF1KSD FWVNEQRYGGISIGGKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHL ..:::: :.: .:.: .:: :. ...: : .: .: CCDS33 ----QKRYGGWSFG-----LPLT--------KDL-RF-DITGVPANRTLAK--------- 1580 1590 1600 1610 1620 1630 1640 1650 1660 pF1KSD ETEDNIKVWFNNKGWHALVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLS ::.. .:.:.: ..:: .: .::... : . ..:: . :.: ...: CCDS33 -------VWYDPEGYHSLPAYLNSLNNFLLRVNMSK-YDAARHGIIMYSHPYPGVQDQ-- 1610 1620 1630 1640 1650 1670 1680 1690 1700 1710 1720 pF1KSD EITVLTTSVDAVVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFL : ..... .: .::. .....: . :::: :...:. .:.:.:: :::.. : ::::::. CCDS33 EQATISSLIDILVALSILMGYSVTTASFVTYVVREHQTKAKQLQHISGIGVTCYWVTNFI 1660 1670 1680 1690 1700 1710 1730 1740 1750 1760 1770 1780 pF1KSD WDIMNYSVSAGLVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPS .:.. : : ... .::. :. :. : .:: :. ::::.:.:.. :: . :: . CCDS33 YDMVFYLVPVAFSIGIIAIFKLPAFYSENNLGAVSLLLLLFGYATFSWMYLLAGLFHETG 1720 1730 1740 1750 1760 1770 1790 1800 1810 1820 1830 1840 pF1KSD TAYVALSCANLFIGINS----SAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGL :... :.:::.:::: :.. :. . :. :: .. .:......::.::.: :: CCDS33 MAFITYVCVNLFFGINSIVSLSVVYFLSKEKPNDPTLELISETLKRIFLIFPQFCFGYGL 1780 1790 1800 1810 1820 1830 1850 1860 1870 1880 1890 pF1KSD IDLALSQAVTDVYARFGEEHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQR------H :.:. .:.: : .: :. . :. . .: . :.: .:...: : ::... . CCDS33 IELSQQQSVLDFLKAYGVEYPNETFEMNKLGAMFVALVSQGTMFFSLRLLINESLIKKLR 1840 1850 1860 1870 1880 1890 1900 1910 1920 1930 1940 1950 pF1KSD FFLSQWIAEPTKEPIVDEDDDVAEERQRIITGGNKTDILRLHELTKIYPGTSSP--AVDR .:. .. . ..: : :::.:: :: :. .:. . :...:. ::: : . ::. CCDS33 LFFRKFNSSHVRETI-DEDEDVRAERLRVESGAAEFDLVQLYCLTKTYQLIHKKIIAVNN 1900 1910 1920 1930 1940 1950 1960 1970 1980 1990 2000 2010 pF1KSD LCVGVRPGECFGLLGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNM-GY . .:. :::::::::::::::: ::::::: .::. . .:. . . :... :: CCDS33 ISIGIPAGECFGLLGVNGAGKTTIFKMLTGDIIPSSGNILIRNKTGSLGHVDSHSSLVGY 1960 1970 1980 1990 2000 2010 2020 2030 2040 2050 2060 2070 pF1KSD CPQFDAIDELLTGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNK ::: ::.:.:.: .::::.:::..:.: ..:..... .. : : . : .. : :.: CCDS33 CPQEDALDDLVTVEEHLYFYARVHGIPEKDIKETVHKLLRRLHLMPFKDRATSMCSYGTK 2020 2030 2040 2050 2060 2070 2080 2090 2100 2110 2120 2130 pF1KSD RKLSTAIALIGCPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECEAL ::::::.:::: : ..:::::..::::...: ::..: ... .:.:::::::::::: CCDS33 RKLSTALALIGKPSILLLDEPSSGMDPKSKRHLWKIISEEVQNKCSVILTSHSMEECEAL 2080 2090 2100 2110 2120 2130 2140 2150 2160 2170 2180 2190 pF1KSD CTRLAIMVKGAFRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGS ::::::::.: :.:.:..::.::.:: :. : ...:. : .. . .:.: .:: . CCDS33 CTRLAIMVNGKFQCIGSLQHIKSRFGRGFTVKVHLKNNK----VTMETLTKFMQLHFPKT 2140 2150 2160 2170 2180 2190 2200 2210 2220 2230 2240 2250 pF1KSD VQRERHYNMLQFQV--SSSSLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTE ...: .::...: .....: ::.:: ..: .: : .. :.::::..::.::::.: CCDS33 YLKDQHLSMLEYHVPVTAGGVANIFDLLETNKTALNITNFLVSQTTLEEVFINFAKDQKS 2200 2210 2220 2230 2240 2250 2260 2270 pF1KSD SHDLPLHPRAAGASRQAQD . ... : ..:: CCDS33 YETADTSSQGSTISVDSQDDQMES 2260 2270 >>CCDS33372.1 ABCA12 gene_id:26154|Hs108|chr2 (2595 aa) initn: 2534 init1: 779 opt: 1862 Z-score: 1630.1 bits: 315.7 E(32554): 1.8e-84 Smith-Waterman score: 3882; 34.7% identity (66.0% similar) in 1969 aa overlap (343-2273:752-2590) 320 330 340 350 360 370 pF1KSD TKLMGILSDLLCGYPEGGGSRVLSFNWYEDNNYKAFLGIDSTRKDPI--YSYDRRTTSFC :. : :: :... :. .: :: CCDS33 FSTISQALCSQGITTEYLTAMLPSSQRPKGNHTKDFLTYKLTKEQIASKYGIPINSTPFC 730 740 750 760 770 780 380 390 400 410 420 430 pF1KSD NALIQSLESNPLTKIAWRAAKPLLMGKILYTPDSPAARRILKNANSTFEELEHVRKLVKA .: ... . : . : ::.:.:.:::.: .:... :....: :...: ..:. . CCDS33 FSLYKDIINMPAGPVIWAFLKPMLLGRILYAPYNPVTKAIMEKSNVTLRQLAELREKSQE 790 800 810 820 830 840 440 450 460 470 480 pF1KSD WEEVGPQIWYFFDNSTQ-MNMIRDTLGNPTVKDFLNRQLGEEGITAEAILNFLYKGPRES : . .: . : .: . :...:: :: :. :.. ..: ... : : : CCDS33 WMDKSPLFMNSFHLLNQAIPMLQNTLRNPFVQVFVKFSVGLDAVE-------LLKQIDEL 850 860 870 880 890 490 500 510 520 530 540 pF1KSD QADDMANFDWRDIFNITDRTLRLVNQYLECLVLDKFESYNDETQLTQRALSLLEENMFWA . . . ::.. . :. . :.. :.... . .. ..: : . : ... CCDS33 DILRLKLENNIDIIDQLNTLSSLTVNISSCVLYDRIQAAKTIDEMEREAKRLYKSNELFG 900 910 920 930 940 950 550 560 570 580 590 600 pF1KSD GVVF--PDMYPWTSS-------LPPHVKYKIRMDIDVVEKTNKIKDRYWDSGPRADPVED .:.: :. : . ::: .:: :::.. ... : ... . : ::. .: .. CCDS33 SVIFKLPSNRSWHRGYDSGNVFLPPVIKYTIRMSLKTAQTTRSLRTKIWAPGPHNSPSHN 960 970 980 990 1000 1010 610 620 630 640 650 pF1KSD FRYIWG-GFAYLQDMVEQGITRSQV-QAEAPVGIYLQQMPYPCFVDDSFMIILNRCFPIF :.: .: :::: .:..: . :. . ... .: .:::::. :.:. .. .:: CCDS33 --QIYGRAFIYLQDSIERAIIELQTGRNSQEIAVQVQAIPYPCFMKDNFLTSVSYSLPIV 1020 1030 1040 1050 1060 1070 660 670 680 690 700 710 pF1KSD MVLAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSMSIFLLTIF ...::. .. ::..: ::.:::.: .: .::.. . .:...: ... ..: .: :. CCDS33 LMVAWVVFIAAFVKKLVYEKDLRLHEYMKMMGVNSCSHFFAWLIESVGFLLVTIVILIII 1080 1090 1100 1110 1120 1130 720 730 740 750 760 770 pF1KSD IMHGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYFTLYLPHIL . : :: .. :::::.. .: ..: . .:.:.::.....:: ...::. ..: :. CCDS33 LKFGNILPKTNGFILFLYFSDYSFSVIAMSYLISVFFNNTNIAALIGSLIYIIAFFPFIV 1140 1150 1160 1170 1180 1190 780 790 800 810 820 830 pF1KSD CFAWQDRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLL . ..... :: .:::::.::.....:..:.::::.:::: :. .::.. : :: CCDS33 LVTVENELSYVLKVFMSLLSPTAFSYASQYIARYEEQGIGLQWENMYTSPVQDDTTSFGW 1200 1210 1220 1230 1240 1250 840 850 860 870 880 890 pF1KSD SMQMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCS-TREERA--LE ..: :. .: :.:::. .:::: :: :::: . ::: ::. .. :.. : CCDS33 LCCLILADSFIYFLIAWYVRNVFPGTYGMAAPWYFPILPSYWKERFGCAEVKPEKSNGLM 1260 1270 1280 1290 1300 1310 900 910 920 930 940 950 pF1KSD KTEPLTEETEDPEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFEPCGQPAVDRLNITFYE :. . ..:. :: . .: .: : . :: .....::. .. ::: ::..::: CCDS33 FTNIMMQNTNPSASPEYMFSSNIEPEPKDLTVGVALHGVTKIY--GSKVAVDNLNLNFYE 1320 1330 1340 1350 1360 1370 960 970 980 990 1000 1010 pF1KSD NQITAFLGHNGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQHNILF ..::..:: ::::::::.:.::::. ..::..: :.::.:.: .::...:.: ::..:: CCDS33 GHITSLLGPNGAGKTTTISMLTGLFGASAGTIFVYGKDIKTDLHTVRKNMGVCMQHDVLF 1380 1390 1400 1410 1420 1430 1020 1030 1040 1050 1060 1070 pF1KSD HHLTVAEHMLFYAQLKGKSQEEAQL--EMEAMLEDTGLHHKRNEEAQDLSGGMQRKLSVA .::. ::.:.:...: . :: :.. :.::::. .:.... :::::.::::.. CCDS33 SYLTTKEHLLLYGSIKVPHWTKKQLHEEVKRTLKDTGLYSHRHKRVGTLSGGMKRKLSIS 1440 1450 1460 1470 1480 1490 1080 1090 1100 1110 1120 1130 pF1KSD IAFVGDAKVVILDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAII ::..: ..:::::::..:::: :::::::.. : ...::::.::::.:::..:.::::.. CCDS33 IALIGGSRVVILDEPSTGVDPCSRRSIWDVISKNKTARTIILSTHHLDEAEVLSDRIAFL 1500 1510 1520 1530 1540 1550 1140 1150 1160 1170 1180 1190 pF1KSD AQGRLYCSGTPLFLKNCFGTGLYLTLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAHVD :: : : :.:..::. :: : .:::..: .: .....: CCDS33 EQGGLRCCGSPFYLKEAFGDGYHLTLTKK----KSPNLNANAVC---------------- 1560 1570 1580 1590 1200 1210 1220 1230 1240 1250 pF1KSD DLTPEQVLDGDVNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFK-HRAYASLFRELEE :. . .. :.::: : : :: ::...:: . : :: ::.: :.. CCDS33 ----------DTMAVTAMIQSHLPEAYLKEDIGGELVYVLPPFSTKVSGAYLSLLRALDN 1600 1610 1620 1630 1640 1260 1270 1280 1290 1300 1310 pF1KSD TLADLGLSSFGISDTPLEEIFLKVTEDSDSGPLFAGGAQQKRENVNPRHPCLGPREKAG- ..::... .::::: .::.::..:..:... . .. :... .. .: . : CCDS33 GMGDLNIGCYGISDTTVEEVFLNLTKESQKN------SAMSLEHLTQKK--IGNSNANGI 1650 1660 1670 1680 1690 1320 1330 1340 1350 1360 1370 pF1KSD QTPQDSNVCSPGAPAAHPEGQPPPEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHK .::.: .: : . . . : .:. : :.:....:.:.:::.:: :. : CCDS33 STPDDLSVSSSNFT------DRDDKILTRGERLD-GFGLLLKKIMAILIKRFHHTRRNWK 1700 1710 1720 1730 1740 1380 1390 1400 1410 1420 pF1KSD DFLAQIVLPATFVFLALMLSIVIPPFGEYPALTLHPWIYG--QQYTFFSMDEPGSEQFTV ..::..:: .:: :. :. . . :: . . : .:: .: .:.. .:..: . CCDS33 GLIAQVILPIVFVTTAMGLGTLRNSSNSYPEIQISPSLYGTSEQTAFYANYHPSTE---A 1750 1760 1770 1780 1790 1800 1430 1440 1450 1460 1470 1480 pF1KSD LADVLLNKPGFGNRCLKEGWLPEYPCGNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSCR :.... . ::. : ::. . : . :.: : : ::.. : CCDS33 LVSAMWDFPGIDNMCLNTSDLQCLNKDSLEKWNT-SGEP-ITNF------------GVCS 1810 1820 1830 1840 1490 1500 1510 1520 1530 1540 pF1KSD CSTREKLTMLPECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSK :: . :::. . ::.: :.... .:: . . ..:..: .. CCDS33 CSEN-----VQECPKF--NYSPPHRRTYSSQVIYNLTGQRVENYLISTANEFV------- 1850 1860 1870 1880 1890 1550 1560 1570 1580 1590 1600 pF1KSD FWVNEQRYGGISIGGKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHL ..:::: :.: .:.: .:: :. ...: : .: .: CCDS33 ----QKRYGGWSFG-----LPLT--------KDL-RF-DITGVPANRTLAK--------- 1900 1910 1920 1610 1620 1630 1640 1650 1660 pF1KSD ETEDNIKVWFNNKGWHALVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLS ::.. .:.:.: ..:: .: .::... : . ..:: . :.: ...: CCDS33 -------VWYDPEGYHSLPAYLNSLNNFLLRVNMSK-YDAARHGIIMYSHPYPGVQDQ-- 1930 1940 1950 1960 1970 1670 1680 1690 1700 1710 1720 pF1KSD EITVLTTSVDAVVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFL : ..... .: .::. .....: . :::: :...:. .:.:.:: :::.. : ::::::. CCDS33 EQATISSLIDILVALSILMGYSVTTASFVTYVVREHQTKAKQLQHISGIGVTCYWVTNFI 1980 1990 2000 2010 2020 2030 1730 1740 1750 1760 1770 1780 pF1KSD WDIMNYSVSAGLVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPS .:.. : : ... .::. :. :. : .:: :. ::::.:.:.. :: . :: . CCDS33 YDMVFYLVPVAFSIGIIAIFKLPAFYSENNLGAVSLLLLLFGYATFSWMYLLAGLFHETG 2040 2050 2060 2070 2080 2090 1790 1800 1810 1820 1830 1840 pF1KSD TAYVALSCANLFIGINS----SAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGL :... :.:::.:::: :.. :. . :. :: .. .:......::.::.: :: CCDS33 MAFITYVCVNLFFGINSIVSLSVVYFLSKEKPNDPTLELISETLKRIFLIFPQFCFGYGL 2100 2110 2120 2130 2140 2150 1850 1860 1870 1880 1890 pF1KSD IDLALSQAVTDVYARFGEEHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQR------H :.:. .:.: : .: :. . :. . .: . :.: .:...: : ::... . CCDS33 IELSQQQSVLDFLKAYGVEYPNETFEMNKLGAMFVALVSQGTMFFSLRLLINESLIKKLR 2160 2170 2180 2190 2200 2210 1900 1910 1920 1930 1940 1950 pF1KSD FFLSQWIAEPTKEPIVDEDDDVAEERQRIITGGNKTDILRLHELTKIYPGTSSP--AVDR .:. .. . ..: : :::.:: :: :. .:. . :...:. ::: : . ::. CCDS33 LFFRKFNSSHVRETI-DEDEDVRAERLRVESGAAEFDLVQLYCLTKTYQLIHKKIIAVNN 2220 2230 2240 2250 2260 2270 1960 1970 1980 1990 2000 2010 pF1KSD LCVGVRPGECFGLLGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNM-GY . .:. :::::::::::::::: ::::::: .::. . .:. . . :... :: CCDS33 ISIGIPAGECFGLLGVNGAGKTTIFKMLTGDIIPSSGNILIRNKTGSLGHVDSHSSLVGY 2280 2290 2300 2310 2320 2330 2020 2030 2040 2050 2060 2070 pF1KSD CPQFDAIDELLTGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNK ::: ::.:.:.: .::::.:::..:.: ..:..... .. : : . : .. : :.: CCDS33 CPQEDALDDLVTVEEHLYFYARVHGIPEKDIKETVHKLLRRLHLMPFKDRATSMCSYGTK 2340 2350 2360 2370 2380 2390 2080 2090 2100 2110 2120 2130 pF1KSD RKLSTAIALIGCPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECEAL ::::::.:::: : ..:::::..::::...: ::..: ... .:.:::::::::::: CCDS33 RKLSTALALIGKPSILLLDEPSSGMDPKSKRHLWKIISEEVQNKCSVILTSHSMEECEAL 2400 2410 2420 2430 2440 2450 2140 2150 2160 2170 2180 2190 pF1KSD CTRLAIMVKGAFRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGS ::::::::.: :.:.:..::.::.:: :. : ...:. : .. . .:.: .:: . CCDS33 CTRLAIMVNGKFQCIGSLQHIKSRFGRGFTVKVHLKNNK----VTMETLTKFMQLHFPKT 2460 2470 2480 2490 2500 2510 2200 2210 2220 2230 2240 2250 pF1KSD VQRERHYNMLQFQV--SSSSLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTE ...: .::...: .....: ::.:: ..: .: : .. :.::::..::.::::.: CCDS33 YLKDQHLSMLEYHVPVTAGGVANIFDLLETNKTALNITNFLVSQTTLEEVFINFAKDQKS 2520 2530 2540 2550 2560 2570 2260 2270 pF1KSD SHDLPLHPRAAGASRQAQD . ... : ..:: CCDS33 YETADTSSQGSTISVDSQDDQMES 2580 2590 >>CCDS47584.1 ABCA13 gene_id:154664|Hs108|chr7 (5058 aa) initn: 2349 init1: 673 opt: 1297 Z-score: 1130.1 bits: 224.1 E(32554): 1.3e-56 Smith-Waterman score: 3634; 33.6% identity (62.5% similar) in 2197 aa overlap (110-2262:3036-5046) 80 90 100 110 120 130 pF1KSD PCFQSPTPGESPGIVSNYNNSILARVYRDFQELLMNAPESQHLGRIWTELHILSQFMDTL :.: : : . : . :. . . :.... CCDS47 LSSTLESFKSSLENATGQDCTSQPRLETVQQHLYMLA---KSLEETWSSGNPIMTFLSNF 3010 3020 3030 3040 3050 3060 140 150 160 170 180 190 pF1KSD RTHPERIAGRGIRIRDILKDEETLTLFLIKNIGLSDSVVYLLINSQVRPEQFAHGVPDLA . . ..:.:..:. :: : ..: .:. ... ...... . .. .: CCDS47 TVTED------VKIKDLMKNITKLTEELRSSIQISNETIHSILEANISHSKVLFSALTVA 3070 3080 3090 3100 3110 200 210 220 230 240 250 pF1KSD LKDIACSEALLERFIIFSQRRGAKTVRYALCSLSQGTLQWIEDTLYANVDFFKLFRVLPT :. :.. .:. .. : . . . . :::: . . . : :.: . : . : CCDS47 LSG-KCDQEILHLLLTFPKGEKSWIAAEELCSLPGSKVYSLIVLLSRNLDV-RAF-IYKT 3120 3130 3140 3150 3160 3170 260 270 280 290 300 pF1KSD LLDSRSQGINLRSWGGILSDMSP----------RIQEFIHRPSMQDLLWVT--RPLMQNG :. :...:. : : :.:..: . ::.: .. :: . . . :: CCDS47 LMPSEANGL-LNSLLDIVSSLSALLAKAQHVFEYLPEFLHTFKITALLETLDFQQVSQNV 3180 3190 3200 3210 3220 3230 310 320 330 340 350 360 pF1KSD GPET--FTKLMGILSDLLCGYPEGGGSRVLSFNWYEDNNYKAFLGIDSTRKDPIYSYDRR .. : ... ... ..: . .: . . : . . : :. .: .. . CCDS47 QARSSAFGSFQFVMK-MVC---KDQASFLSDSNMFINLPRVKELLEDDKEK---FNIPED 3240 3250 3260 3270 3280 370 380 390 400 410 420 pF1KSD TTSFCNALIQSLESNPLTKIAWRAAKPLLMGKILYTPDSPAARRILKNANSTFEELEHVR .: :: : : . . : ..: ::.: :::::::..: .....:: :: ..... CCDS47 STPFCLKLYQEILQLPNGALVWTFLKPILHGKILYTPNTPEINKVIQKANYTFYIVDKLK 3290 3300 3310 3320 3330 3340 430 440 450 460 470 480 pF1KSD KLVKAWEEVGPQIWYFFDNSTQM-NMIRDTLGNPTVKDFLNRQLGEEGITAEAILNFL-- : .. :.. . ..: :: :.....: : :..:.. :: : .. . . : CCDS47 TLSETLLEMSSLFQR--SGSGQMFNQLQEALRNKFVRNFVENQLH---IDVDKLTEKLQT 3350 3360 3370 3380 3390 3400 490 500 510 520 530 540 pF1KSD YKGPRESQADDMANFDWRDIFNITDRTLRLVNQYLECLVLDKFESYNDETQLTQRALSLL : : :.: : : . : :: :..:..:.. .. : .: :: CCDS47 YGG----LLDEMFNHAGAGRFRFLGSIL--VNLS-SCVALNRFQALQSVDILETKAHELL 3410 3420 3430 3440 3450 550 560 570 580 590 pF1KSD EENMFWAGVVFPD------MYPWTSSLPPHVKYKIRMDIDVVEKTNKIKDRYWDSGPRAD ..: : :...: . . . .:::::.: :: .. .:. .:. : :. CCDS47 QQNSFLASIIFSNSLFDKNFRSESVKLPPHVSYTIRTNVLYSVRTDVVKNPSWKFHPQNL 3460 3470 3480 3490 3500 3510 600 610 620 630 640 650 pF1KSD PVEDFRYIWGGFAYLQDMVEQGITRSQVQAEA--PVGIYLQQMPYPCFVDDSFMIILNRC :.. :.: . :: ::::.:..: :. :: :.. : :::: ..: :. .. CCDS47 PADGFKYNYV-FAPLQDMIERAIILVQTGQEALEPAA-QTQAAPYPCHTSDLFLNNVGFF 3520 3530 3540 3550 3560 3570 660 670 680 690 700 710 pF1KSD FPIFMVLAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSMSIFL ::..:.:.:. ::. :...: :.:....: .. .:: .. . .:::........: CCDS47 FPLIMMLTWMVSVASMVRKLVYEQEIQIEEYMRMMGVHPVIHFLAWFLENMAVLTISSAT 3580 3590 3600 3610 3620 3630 720 730 740 750 760 770 pF1KSD LTIFIMHGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYFTLYL :.: . . :. .:. ::.::::: :. ...:: .:::.:::.:. :: :....:. .: CCDS47 LAIVLKTSGIFAHSNTFIVFLFLLDFGMSVVMLSYLLSAFFSQANTAALCTSLVYMISFL 3640 3650 3660 3670 3680 3690 780 790 800 810 820 830 pF1KSD PHILCFAWQDRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTEGDEF :.:. .. ..... . . ::: .::: :. ... .: : :.::.:. .. .: . CCDS47 PYIVLLVLHNQLSFVNQTFLCLLSTTAFGQGVFFITFLEGQETGIQWNNMYQALEQGG-M 3700 3710 3720 3730 3740 3750 840 850 860 870 880 890 pF1KSD SFLLSMQMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCSTREERAL .: :.:.:...: : .:::....:: .: :::: . ::: . ... : CCDS47 TFGWVCWMILFDSSLYFLCGWYLSNLIPGTFGLRKPWYFPFTASYWKSVGFLVEKRQYFL 3760 3770 3780 3790 3800 3810 900 910 920 930 940 950 pF1KSD EKTEPLTEETEDPEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFEPCGQPAV-DRLNITF .. . .:. : . : . : : : .::: . ...: .: :. :: . :..:: CCDS47 SSSLFFFNENFDNK---GSSLQNREGELEGSAPGVTLVSVTKEYE--GHKAVVQDLSLTF 3820 3830 3840 3850 3860 960 970 980 990 1000 1010 pF1KSD YENQITAFLGHNGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQHNI :..::::.:: ::::::: .:.:::: ::::::....:....:.:. ::. ::.:::..: CCDS47 YRDQITALLGTNGAGKTTIISMLTGLHPPTSGTIIINGKNLQTDLSRVRMELGVCPQQDI 3870 3880 3890 3900 3910 3920 1020 1030 1040 1050 1060 1070 pF1KSD LFHHLTVAEHMLFYAQLKGK--SQEEAQLEMEAMLEDTGLHHKRNEEAQDLSGGMQRKLS :. .::: ::.:..:..:. ...: . ... :.:. : ........ ::::..:::: CCDS47 LLDNLTVREHLLLFASIKAPQWTKKELHQQVNQTLQDVDLTQHQHKQTRALSGGLKRKLS 3930 3940 3950 3960 3970 3980 1080 1090 1100 1110 1120 1130 pF1KSD VAIAFVGDAKVVILDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIA ..:::.: ...:.:::::::::: ::.:.::.::::: :::::..:::.:::. :.::.: CCDS47 LGIAFMGMSRTVVLDEPTSGVDPCSRHSLWDILLKYREGRTIIFTTHHLDEAEALSDRVA 3990 4000 4010 4020 4030 4040 1140 1150 1160 1170 1180 1190 pF1KSD IIAQGRLYCSGTPLFLKNCFGTGLYLTLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAH .. .::: : : :. ::. .: :: :::.:. .. :: CCDS47 VLQHGRLRCCGPPFCLKEAYGQGLRLTLTRQ----------------------PSVLEAH 4050 4060 4070 4080 1200 1210 1220 1230 1240 1250 pF1KSD VDDLTPEQVLDGDVNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFKHRAYASLFRELE :: :. . ... ..:.: : . :.:: . .: :. . .::. :. CCDS47 --DLK-------DMACVTSLIKIYIPQAFLKDSSGSELTYTIP-KDTDKACLKGLFQALD 4090 4100 4110 4120 4130 1260 1270 1280 1290 1300 1310 pF1KSD ETLADLGLSSFGISDTPLEEIFLKVTEDSDSGPLFAGGAQQKRENVNPRHPCLGPREKAG :.: .: :...::::: :::.:: . .::.. .: :.... .: : CCDS47 ENLHQLHLTGYGISDTTLEEVFLMLLQDSNKKSHIALGTESELQNHRP------------ 4140 4150 4160 4170 4180 1320 1330 1340 1350 1360 1370 pF1KSD QTPQDSNVCSPGAPAAHPEGQPPPEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHK : . :. : :. : : :.::. .: :.:..:...:.:. : CCDS47 -TGHLSGYC--GSLAR--------------PATVQGVQLLRAQVAAILARRLRRTLRAGK 4190 4200 4210 4220 1380 1390 1400 1410 1420 1430 pF1KSD DFLAQIVLPATFVFLALMLSIVIPPFGEYPALTLHPWIYGQQYTFFSMDEPGSEQFTVLA . ::...::. :: ::. : .: : ::: : : : : . :.: . :.... :. CCDS47 STLADLLLPVLFVALAMGLFMVRPLATEYPPLRLTPGHYQRAETYFFSS--GGDNLD-LT 4230 4240 4250 4260 4270 4280 1440 1450 1460 1470 1480 pF1KSD DVLLNKPGFGNRCLKEGWL-PEYPCGNSTPWKT-PSVSPNITQLFQKQKWTQVNPSPSCR ::: : : .. : . : :. ::. :.: : :. :: :: CCDS47 RVLLRK--FRDQDLPCADLNPRQK--NSSCWRTDPFSHPE----FQD----------SCG 4290 4300 4310 4320 1490 1500 1510 1520 1530 1540 pF1KSD CSTREKLTMLPECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSK : .::. ... : :.. . : .:. :. ..:. :. CCDS47 CL---------KCPNRSAS--APYLTNHLGHTLLNLSGFNMEEYLLA--PS--------- 4330 4340 4350 4360 1550 1560 1570 1580 1590 1600 pF1KSD FWVNEQRYGGISIGGKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHL .. : :: :.: :.: .:: : : :.: : CCDS47 ---EKPRLGGWSFGLKIP-----SEA--G-----GANGNISKPPTL-------------- 4370 4380 4390 1610 1620 1630 1640 1650 1660 pF1KSD ETEDNIKVWFNNKGWHALVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLS :::.:.::.:.: :.:: .: :: :: . ..::::. :.: . :. CCDS47 -----AKVWYNQKGFHSLPSYLNHLNNLILWQHLPPTVDWRQYGITLYSHPYG--GALLN 4400 4410 4420 4430 4440 1670 1680 1690 1700 1710 1720 pF1KSD EITVLTTSVDAVVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFL : .: . . ::.:.....:.. ::. ....:: .:.:: :::.. :: :::: CCDS47 EDKILESIRQCGVALCIVLGFSILSASIGSSVVRDRVIGAKRLQHISGLGYRMYWFTNFL 4450 4460 4470 4480 4490 4500 1730 1740 1750 1760 1770 1780 pF1KSD WDIMNYSVSAGLVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPS .:.. : ::. : :.....:: :.: .:: : . :: :.:.:..: :: : .:. . CCDS47 YDMLFYLVSVCLCVAVIVAFQLTAFTFRKNLAATALLLSLFGYATLPWMYLMSRIFSSSD 4510 4520 4530 4540 4550 4560 1790 1800 1810 1820 1830 1840 pF1KSD TAYVALSCANLFIGINSSAITFI---LELFENNRTLLRFNAVLRKLLIVFPHFCLGRGLI .:... :...:. . ::.. : .. . ..: . ::. .. .::.::::.::. CCDS47 VAFISYVSLNFIFGLCTMLITIMPRLLAIISKAKNLQNIYDVLKWVFTIFPQFCLGQGLV 4570 4580 4590 4600 4610 4620 1850 1860 1870 1880 1890 1900 pF1KSD DLALSQAVTDVYARFGEEHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQRHFFLSQWI .: .: :. :: . ..::. ...: . .. .:.: .:: .:. :. : .: CCDS47 ELCYNQIKYDLTHNFGIDSYVSPFEMNFLGWIFVQLASQGTVLLLLRVLL--HWDLLRWP 4630 4640 4650 4660 4670 4680 1910 1920 1930 1940 1950 1960 pF1KSD -AEPTKEPIV--DEDDDVAEERQRIITGGNKTDILRLHELTKIYPG--TSSPAVDRLCVG .. : . : ..: :: .:..:.. : .. ::: :..:.: : . ::. . .: CCDS47 RGHSTLQGTVKSSKDTDVEKEEKRVFEGRTNGDILVLYNLSKHYRRFFQNIIAVQDISLG 4690 4700 4710 4720 4730 4740 1970 1980 1990 2000 2010 pF1KSD VRPGECFGLLGVNGAGKTTTFKMLTGDTTVTSGDATV---AGKSI-LTNISEVHQNMGYC . ::::::::::::::.::::::.:....::: : . : .. :.. . . .::: CCDS47 IPKGECFGLLGVNGAGKSTTFKMLNGEVSLTSGHAIIRTPMGDAVDLSSAGTAGVLIGYC 4750 4760 4770 4780 4790 4800 2020 2030 2040 2050 2060 2070 pF1KSD PQFDAIDELLTGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNKR :: ::.:::::: :::: : :::.: . : .::. :. : : ..:: ..:::::.:: CCDS47 PQQDALDELLTGWEHLYYYCSLRGIPRQCIPEVAGDLIRRLHLEAHADKPVATYSGGTKR 4810 4820 4830 4840 4850 4860 2080 2090 2100 2110 2120 2130 pF1KSD KLSTAIALIGCPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECEALC :::::.::.: : ..:::::..:::: ..:.::..:.. .::: :.:::::::::::::: CCDS47 KLSTALALVGKPDILLLDEPSSGMDPCSKRYLWQTIMKEVREGCAAVLTSHSMEECEALC 4870 4880 4890 4900 4910 4920 2140 2150 2160 2170 2180 2190 pF1KSD TRLAIMVKGAFRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGSV :::::::.:.:.:.:. ::.:..::::: : . . . .. : . .. ::: CCDS47 TRLAIMVNGSFKCLGSPQHIKNRFGDGYTVKVWLCKEANQ----HCTVSDHLKLYFPGIQ 4930 4940 4950 4960 4970 2200 2210 2220 2230 2240 2250 pF1KSD QRERHYNMLQFQVSS--SSLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTES . .: :.:...: . . :: .:... ..: : :..::..::::.:::.:::..: .. CCDS47 FKGQHLNLLEYHVPKRWGCLADLFKVIENNKTFLNIKHYSINQTTLEQVFINFASEQQQT 4980 4990 5000 5010 5020 5030 2260 2270 pF1KSD HDLPLHPRAAGASRQAQD . : : CCDS47 LQSTLDPSTDSHHTHHLPI 5040 5050 >>CCDS10466.1 ABCA3 gene_id:21|Hs108|chr16 (1704 aa) initn: 3017 init1: 963 opt: 1130 Z-score: 990.2 bits: 196.7 E(32554): 7.8e-49 Smith-Waterman score: 3094; 35.1% identity (62.1% similar) in 1710 aa overlap (590-2252:190-1696) 560 570 580 590 600 610 pF1KSD TSSLPPHVKYKIRMDIDVVEKTNKIKDRYWDSGPRADPVEDFR---YIWGGFAYLQDMVE . ::: : :: :: .: :. CCDS10 RRNYMWTQTGSFFLKETEGWHTTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVD 160 170 180 190 200 210 620 630 640 650 660 670 pF1KSD QGITRSQVQAEAP-----VGIYLQQMPYPCFVDDSFMIILNRCFPIFMVLAWIYSVSMTV ..: . ...: . . . ....::: :. : :.. .. .:....:.. :.. . CCDS10 RAIMEYHADAATRQLFQRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIA 220 230 240 250 260 270 680 690 700 710 720 pF1KSD KSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSMSI-FLLTIFIMHGR----ILH ...: ::: :::: .. .:.:. . : .::: : .. .. :. .: .. . .: CCDS10 RAVVQEKERRLKEYMRMMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLS 280 290 300 310 320 330 730 740 750 760 770 780 pF1KSD YSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYFTLYLPHILCFAWQDRM ::: ... ::: :. .:: . :..:::::::..::: .: .:: :.:... . : CCDS10 RSDPSLVLAFLLCFAISTISFSFMVSTFFSKANMAAAFGGFLYFFTYIPYFFVAPRYNWM 340 350 360 370 380 390 790 800 810 820 830 840 pF1KSD TAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLLSMQMMLLD : : ::: ::...:.. . .:: .:.:.:: .. . . :.: : . :.::: CCDS10 TLSQKLCSCLLSNVAMAMGAQLIGKFEAKGMGIQWRDLLSPVNVDDDFCFGQVLGMLLLD 400 410 420 430 440 450 850 860 870 880 890 900 pF1KSD AAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCSTREERALEKTEPLTEETED ...:::..::.. ::::..:.: ::::... ::: : . ::. : :: : CCDS10 SVLYGLVTWYMEAVFPGQFGVPQPWYFFIMPSYWCG-------KPRAVAGKE---EEDSD 460 470 480 490 500 910 920 930 940 950 960 pF1KSD PEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFEPCGQP--AVDRLNITFYENQITAFLGH :: ..... .:: : : :. .:.: :.:. .. :: ::...::.:::..::: CCDS10 PE--KALRNEYFEAEPEDLVAGIKIKHLSKVFRVGNKDRAAVRDLNLNLYEGQITVLLGH 510 520 530 540 550 560 970 980 990 1000 1010 1020 pF1KSD NGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQHNILFHHLTVAEHM ::::::::::.::::.::::: . ..: .: .. .:.:::.::::.::: .::::::. CCDS10 NGAGKTTTLSMLTGLFPPTSGRAYISGYEISQDMVQIRKSLGLCPQHDILFDNLTVAEHL 570 580 590 600 610 620 1030 1040 1050 1060 1070 1080 pF1KSD LFYAQLKGKSQEEAQLEMEAMLEDTGLHHKRNEEAQDLSGGMQRKLSVAIAFVGDAKVVI ::::::: :... :.. ::. ::. : : ... :::::.::::..::... .::.: CCDS10 YFYAQLKGLSRQKCPEEVKQMLHIIGLEDKWNSRSRFLSGGMRRKLSIGIALIAGSKVLI 630 640 650 660 670 680 1090 1100 1110 1120 1130 1140 pF1KSD LDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAIIAQGRLYCSGTP :::::::.: :::.::::: . .: :::...:: :::::::::::::.:.:.: : :. CCDS10 LDEPTSGMDAISRRAIWDLLQRQKSDRTIVLTTHFMDEADLLGDRIAIMAKGELQCCGSS 690 700 710 720 730 740 1150 1160 1170 1180 1190 1200 pF1KSD LFLKNCFGTGLYLTLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAHVDDLTPEQVLDGD ::::. .:.: ..:::. : :. :: : CCDS10 LFLKQKYGAGYHMTLVK------------EPHCN------------------PE-----D 750 760 770 1210 1220 1230 1240 1250 1260 pF1KSD VNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFKHRAYASLFRELEETLADLGLSSFGI ...: : ::::.: : : :: :.:: .. :: . .:: .::. .::..::: CCDS10 ISQL---VHHHVPNATLESSAGAELSFILPRES-THR-FEGLFAKLEKKQKELGIASFGA 780 790 800 810 820 1270 1280 1290 1300 1310 1320 pF1KSD SDTPLEEIFLKVTEDSDSGPLFAGGAQQKRENVNPRHPCLGPREKAGQTPQDSNVCSPGA : : .::.::.: . ::. . . : .. .: ...:.. :::.:. CCDS10 SITTMEEVFLRVGKLVDSS-MDIQAIQLP--ALQYQH-----ERRASDWAVDSNLCGAMD 830 840 850 860 870 1330 1340 1350 1360 1370 1380 pF1KSD PAAHPEGQPP-PEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHKDFLAQIVLPATF :. .: : : . .:::: : :. :...:. .. : : ::...: : CCDS10 PS---DGIGALIEEERTAVKLNTGLALHCQQFWAMFLKKAAYSWREWKMVAAQVLVPLTC 880 890 900 910 920 930 1390 1400 1410 1420 1430 1440 pF1KSD VFLALMLSIVIPPFGEYPALTLHPWIYGQQYTFFSMDEPGSEQFTVLADVLLNKPGFGNR : :::. . . : : : ::. . ::. ::. :. :.. CCDS10 VTLALLAINYSSELFDDPMLRLTLGEYGRTVVPFSV--PGTSQL-------------GQQ 940 950 960 970 980 1450 1460 1470 1480 1490 1500 pF1KSD CLKEGWLPEYPCGNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSCRCSTREKLTMLPECP .: .. . .: . . : . :.. .. CCDS10 ----------------------LSEHLKDALQAE-----GQEPREVLGDLEEFLIFRASV 990 1000 1010 1510 1520 1530 1540 1550 1560 pF1KSD EGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSKFWVNEQRYGGISIG :: ::. .: .. ..:. .:.. . : :.: : . CCDS10 EG-GGF--NERCLVAAS-FRDVGERTVVNALF-----------------NNQAYHS---- 1020 1030 1040 1570 1580 1590 1600 1610 1620 pF1KSD GKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHLETEDNIKVWFNNKG : :. :.: ::. CCDS10 ------PATALAVV-----------------------------------DNL-------- 1050 1060 1630 1640 1650 1660 1670 1680 pF1KSD WHALVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLSEITVLTTSVDAVVA : ..: : .:. ...:. :: :. .:.:..: . : .: CCDS10 ---LFKLLCGPHASIVVSNFPQPRSA-----------LQAAKDQFNEGR---KGFD--IA 1070 1080 1090 1100 1690 1700 1710 1720 1730 1740 pF1KSD ICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFLWDIMNYSVSAGLVV . ..:.:.:. ..: . ..::. ..::.::.::: ...:.. .:::.... . . :.. CCDS10 LNLLFAMAFLASTFSILAVSERAVQAKHVQFVSGVHVASFWLSALLWDLISFLIPSLLLL 1110 1120 1130 1140 1150 1160 1750 1760 1770 1780 1790 1800 pF1KSD GIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPSTAYVALSCANLFIG .: .:. .:.: .. . ::::::::.::.:: .:.: .:::. :. :.. : CCDS10 VVFKAFDVRAFTRDGHMADTLLLLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSG 1170 1180 1190 1200 1210 1220 1810 1820 1830 1840 1850 pF1KSD INSSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGLIDL---------ALSQAV : . .. :... : ... .: ....:.:. ::: .. .. :. : CCDS10 IATFLMVTIMRI--PAVKLEELSKTLDHVFLVLPNHCLGMAVSSFYENYETRRYCTSSEV 1230 1240 1250 1260 1270 1860 1870 1880 1890 1900 pF1KSD TDVYAR-FGEEHSANPFHWDL--IGKNLFAMVVEGVVYFLLTLLVQRHFFLS-------- . : . .. ... : . :. .:. . .:.. : .:..: .:.. ... CCDS10 AAHYCKKYNIQYQENFYAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQRLRGILCAL 1280 1290 1300 1310 1320 1330 1910 1920 1930 1940 1950 pF1KSD ---QWIAE-PTKEPIVDEDDDVAEERQRIITGGNKTDI---LRLHELTKIYPGTSSP--A . ..: :. :.. ::.:::.:: ::.. . . . : ..::.:.: : : CCDS10 RRRRTLTELYTRMPVLPEDQDVADERTRILAPSPDSLLHTPLIIKELSKVYE-QRVPLLA 1340 1350 1360 1370 1380 1390 1960 1970 1980 1990 2000 2010 pF1KSD VDRLCVGVRPGECFGLLGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNM :::: ..:. :::::::: ::::::::::::::. ..::::: :.:. : .....:.: . CCDS10 VDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGHRISSDVGKVRQRI 1400 1410 1420 1430 1440 1450 2020 2030 2040 2050 2060 2070 pF1KSD GYCPQFDAIDELLTGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGG ::::::::. . .:::: : .::::::.: ..: .. ....: : .:. :. ::::: CCDS10 GYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLVRTYSGG 1460 1470 1480 1490 1500 1510 2080 2090 2100 2110 2120 2130 pF1KSD NKRKLSTAIALIGCPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECE :::::::.::::: : ...::::.::::: :::.::.... . :.:...::::::::: CCDS10 NKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTVARARESGKAIIITSHSMEECE 1520 1530 1540 1550 1560 1570 2140 2150 2160 2170 2180 2190 pF1KSD ALCTRLAIMVKGAFRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFP ::::::::::.: :.:.:. ::::::::.:: . :..: .. :. . : . .:: CCDS10 ALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQ--EALEEFKAFVDLTFP 1580 1590 1600 1610 1620 1630 2200 2210 2220 2230 2240 2250 pF1KSD GSVQRERHYNMLQFQVSSSSL--ARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQ ::: ...: .:..... . .: :..: .: . :.. ...:::.: .:.:::..::. : CCDS10 GSVLEDEHQGMVHYHLPGRDLSWAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFAHLQ 1640 1650 1660 1670 1680 1690 2260 2270 pF1KSD TESHDLPLHPRAAGASRQAQD CCDS10 PPTAEEGR 1700 >>CCDS74138.1 ABCA8 gene_id:10351|Hs108|chr17 (1616 aa) initn: 1279 init1: 488 opt: 753 Z-score: 659.6 bits: 135.4 E(32554): 2e-30 Smith-Waterman score: 1462; 26.9% identity (54.6% similar) in 1695 aa overlap (605-2252:173-1593) 580 590 600 610 620 630 pF1KSD IDVVEKTNKIKDRYWDSGPRADPVEDFRYIWG-GFAYLQDMVEQGI---TRSQVQAEAPV : ::. :: .. .: : .. : . CCDS74 HGMPAKKEHKDHTAHCYETNEDVYCEVSVFWKEGFVALQAAINAAIIEITTNHSVMEELM 150 160 170 180 190 200 640 650 660 670 680 pF1KSD GIYLQQMPYPCFVDDSFMIILNRCFPIFMVLA-WIYSVSMTVKSIVLEKELRLKETLKNQ .. ..: . :. .: .: : .. .. .:: .:..: :.. :.: . . CCDS74 SVTGKNMKMHSFIGQSGVITDLYLFSCIISFSSFIYYASVNVTR---ERK-RMKALMTMM 210 220 230 240 250 690 700 710 720 730 740 pF1KSD GVSNAVIWCTW-FLDSFSIMSMSIFLLTIFIMHGRILHYSDPFILFLFLLAFSTATIMLC :. ....: .: .: . :. :..:: .. : ... : ...: ..: .. . . : CCDS74 GLRDSAFWLSWGLLYAGFIFIMALFL-ALVIRSTQFIILSGFMVVFSLFLLYGLSLVALA 260 270 280 290 300 310 750 760 770 780 790 800 pF1KSD FLLSTFFSKASLAAACSGVIYFTLYLPHILCFAWQD---RMTAELKKAVSLLSPVAFGFG ::.: . .:. : .:.. : : . :... . .. : :. .::::: :: .: CCDS74 FLMSILVKKSFL----TGLVVFLLTV-FWGCLGFTSLYRHLPASLEWILSLLSPFAFMLG 320 330 340 350 360 370 810 820 830 840 850 860 pF1KSD TEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLLSMQMMLLDAAVYGLLAWYLDQVFPGDY :.... :. :: :..:... .. . :. .:. .: :: :.....:..: CCDS74 MAQLLHLD---YDLN-SNAFPHPSDGSNL-IVATNFMLAFDTCLYLALAIYFEKILPNEY 380 390 400 410 420 870 880 890 900 910 920 pF1KSD GTPLPWYFLLQESYWLGGEGCSTREERALEKTEPLTEETEDPEHPEGIHDSFFEREHPGW : : :.:. :.: .::. .. : : : ..:::: :. : . CCDS74 GHRRPPLFFLKSSFW-----------SQTQKTDHVALEDEMDADP-SFHDSF-EQAPPEF 430 440 450 460 470 930 940 950 960 970 pF1KSD V--PGVCVKNLVKIFEPCGQP----AVDRLNITFYENQITAFLGHNGAGKTTTLSILTGL .. ..:..: .. :.: :. : . .::.::::.:::.::::.: :.::.:: CCDS74 QGKEAIRIRNVTKEYK--GKPDKIEALKDLVFDIYEGQITAILGHSGAGKSTLLNILSGL 480 490 500 510 520 530 980 990 1000 1010 1020 1030 pF1KSD LPPTSGTVLVGGRDIE--TSLDAVRQSLGMCPQHNILFHHLTVAEHMLFYAQLKGKSQEE ::.:.: . . . ..:. . . :.::: :. : ::: :.. ..:..:: .: CCDS74 SVPTKGSVTIYNNKLSEMADLENLSKLTGVCPQSNVQFDFLTVRENLRLFAKIKGILPQE 540 550 560 570 580 590 1040 1050 1060 1070 1080 1090 pF1KSD AQLEMEAMLEDTGLHHKRNEEAQDLSGGMQRKLSVAIAFVGDAKVVILDEPTSGVDPYSR .. :.. .: . ... .. ::.::::..:::. .::..:: .. .:::::.:.::.:: CCDS74 VDKEIQRVLLELEMKNIQDVLAQNLSGGQKRKLTFGIAILGDPQIFLLDEPTAGLDPFSR 600 610 620 630 640 650 1100 1110 1120 1130 1140 1150 pF1KSD RSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAIIAQGRLYCSGTPLFLKNCFGTGLYL ...:.:: . .. :.:..::. :::::.:.:: ....::.: :.:. ::::. .: : .: CCDS74 HQVWNLLKERKTDRVILFSTQFMDEADILADRKVFLSQGKLKCAGSSLFLKKKWGIGYHL 660 670 680 690 700 710 1160 1170 1180 1190 1200 1210 pF1KSD TLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAHVDDLTPEQVLDGDVNELMDVVLHHVP .: ....: : ..... .: .:.: CCDS74 SL--QLNEI------------CVEENITS------------------------LVKQHIP 720 730 1220 1230 1240 1250 1260 1270 pF1KSD EAKLVECIGQELIFLLPNKNFKHRAYASLFRELEETLADLGLSSFGISDTPLEEIFLKVT .::: .::. :: . . . :...:. . :::. ..:.: : :.:.:::. CCDS74 DAKLSAKSEGKLIYTLPLE--RTNKFPELYKDLD-SYPDLGIENYGVSMTTLNEVFLKLE 740 750 760 770 780 790 1280 1290 1300 1310 1320 1330 pF1KSD EDS---DSGPLFAGGAQQKRENVNPRHPCLGPREKAGQTPQDSNVCSPGAPAAHPEGQPP : .: . : .: .. . . : : :. : : . : CCDS74 GKSTINESDIAILGEVQAEKADDTER---LVEMEQ---------VLSSLNKMRKTIG--- 800 810 820 830 1340 1350 1360 1370 1380 1390 pF1KSD PEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHKDFLAQI-VLPATFVFLALMLSIV :. : :.. :. :. . . .: .:: . .: : : : . ..: CCDS74 ------------GVALWRQQICAIARVRLLKLKHERKALLALLLILMAGFCPLLVEYTMV 840 850 860 870 880 1400 1410 1420 1430 1440 pF1KSD IPPFGEYPALTLHPWIYGQQYTFFSMDEPGSEQFTVLADVLL-NKPG-----FGNRCLKE . : . : : .: :.. ::.. :...:. :: : : . .. CCDS74 KIYQNSY-TWELSPHLY-----FLA---PGQQPHDPLTQLLIINKTGASIDDFIQSVEHQ 890 900 910 920 930 1450 1460 1470 1480 1490 1500 pF1KSD GWLPEYPC-GNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSCRCSTREKLTMLPECPEGA . : :. . :: . :: ... : : : :... .:. .: CCDS74 NIALEVDAFGTRNGTDDPSYNGAITVCCNEK-----NYSFSLACNAK-RLNCFP------ 940 950 960 970 980 1510 1520 1530 1540 1550 1560 pF1KSD GGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSKFWVNEQRYGGISIGGKL .:.:... .. .:: :.. . .: : : : CCDS74 --------------VLMDIVSNGLLG-MVK--PSVHIRTERSTFLENGQDN--------- 990 1000 1010 1570 1580 1590 1600 1610 1620 pF1KSD PVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHLETEDNIKVWFNNKGWHA :: :::. . . .... : . : :. .. ... :. . : . CCDS74 ---PI------GFLAYIMFWLVLTSSCPPYIAMSSIDDYKNRARSQLRISGLSPSAYWFG 1020 1030 1040 1050 1060 1630 1640 1650 1660 1670 1680 pF1KSD LVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLSEITVLTTSVDAVVAICV ....:. .. . . : .. ::. .. : : . . :. CCDS74 Q-ALVDVSLYFLVFVFI--------YLMSYISNFEDM----------LLTIIHIIQIPCA 1070 1080 1090 1100 1690 1700 1710 1720 1730 1740 pF1KSD I-FSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFLWDIMNYSVSAGLVVGI . .:.:.. ..:. .: .. :. ::. : : . . .:: ::.. .: CCDS74 VGYSFSLIFMTYVISFIFRKGRKN------SGI-----WSFCF-YVVTVFSV-AGFAFSI 1110 1120 1130 1140 1150 1750 1760 1770 1780 1790 1800 pF1KSD FIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPSTAYVALSCANLFIGIN : ..: . ..: :: ::... .: ::. CCDS74 F----------ESDIPFIFTFL-------IP---PATMI-----------GC--LFL--- 1160 1170 1180 1810 1820 1830 1840 1850 1860 pF1KSD SSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGLIDLALSQAVTDVYARFGEEH :: . : :: ..: .. :. :: : :: . :. : : : CCDS74 SSHLLFS-SLFSEERMDVQPFLVF---LIPFLHFIIF--LFTL-----------RCLE-- 1190 1200 1210 1220 1870 1880 1890 1900 1910 1920 pF1KSD SANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQRHFFLSQWIAEPTKEPIVDEDDDVAEER : . :.. .. :.:. . . .:: ::.:: :: CCDS74 ------WKFGKKSM-----------------RKDPFFSSDVCQNPEEP-EGEDEDVQMER 1230 1240 1250 1930 1940 1950 1960 1970 pF1KSD QRIITGGNKTD-----ILRLHELTKIYPGT---------SSPAVDRLCVGVRPGECFGLL : .. :.:. .. : : : : .. :. . :: :: .::: CCDS74 VRTANALNSTNFDEKPVIIASCLRKEYAGKRKGCFSKRKNKIATRNVSFCVRKGEVLGLL 1260 1270 1280 1290 1300 1310 1980 1990 2000 2010 2020 2030 pF1KSD GVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNMGYCPQFDAIDELLTGRE : :::::.:..:..:::: :.:.. . : .. ... . .::::: .:. :: :. CCDS74 GHNGAGKSTSIKVITGDTKPTAGQVLLKG----SGGGDALEFLGYCPQENALWPNLTVRQ 1320 1330 1340 1350 1360 1370 2040 2050 2060 2070 2080 2090 pF1KSD HLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNKRKLSTAIALIGCPPL :: .:: ..:. . : . . . .: : . : : : :::: .....: : . CCDS74 HLEVYAAVKGLRKGDAEVAITRLVDALKLQDQLKSPVKTLSEGIKRKLCFVLSILGNPSV 1380 1390 1400 1410 1420 1430 2100 2110 2120 2130 2140 2150 pF1KSD VLLDEPTTGMDPQARRMLWNVIVSIIREG-RAVVLTSHSMEECEALCTRLAIMVKGAFRC ::::::.:::::......:..: . .:. :...::.: : : ::.: :.::::.: .:: CCDS74 VLLDEPSTGMDPEGQQQMWQAIRATFRNTERGALLTTHYMAEAEAVCDRVAIMVSGRLRC 1440 1450 1460 1470 1480 1490 2160 2170 2180 2190 2200 2210 pF1KSD MGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGSVQRERHYNMLQFQV .:.::::::::: :.. ::.:. : ...:.. . :: ....::. ... ... CCDS74 IGSIQHLKSKFGKDYLLEMKVKN-----LAQVEPLHAEILRLFPQAARQERYSSLMVYKL 1500 1510 1520 1530 1540 2220 2230 2240 2250 2260 pF1KSD ---SSSSLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTESHDLPLHPRAAGA . . ::. : : . :.:. .::::..:.::.:::....:.: CCDS74 PVEDVQPLAQAFFKLEKVKQSFDLEEYSLSQSTLEQVFLELSKEQELGDFEEDFDPSVKW 1550 1560 1570 1580 1590 1600 2270 pF1KSD SRQAQD CCDS74 KLLPQEEP 1610 >>CCDS74139.1 ABCA8 gene_id:10351|Hs108|chr17 (1621 aa) initn: 1279 init1: 488 opt: 753 Z-score: 659.6 bits: 135.4 E(32554): 2e-30 Smith-Waterman score: 1459; 26.9% identity (54.7% similar) in 1696 aa overlap (605-2252:173-1598) 580 590 600 610 620 630 pF1KSD IDVVEKTNKIKDRYWDSGPRADPVEDFRYIWG-GFAYLQDMVEQGI---TRSQVQAEAPV : ::. :: .. .: : .. : . CCDS74 HGMPAKKEHKDHTAHCYETNEDVYCEVSVFWKEGFVALQAAINAAIIEITTNHSVMEELM 150 160 170 180 190 200 640 650 660 670 680 pF1KSD GIYLQQMPYPCFVDDSFMIILNRCFPIFMVLA-WIYSVSMTVKSIVLEKELRLKETLKNQ .. ..: . :. .: .: : .. .. .:: .:..: :.. :.: . . CCDS74 SVTGKNMKMHSFIGQSGVITDLYLFSCIISFSSFIYYASVNVTR---ERK-RMKALMTMM 210 220 230 240 250 690 700 710 720 730 740 pF1KSD GVSNAVIWCTW-FLDSFSIMSMSIFLLTIFIMHGRILHYSDPFILFLFLLAFSTATIMLC :. ....: .: .: . :. :..:: .. : ... : ...: ..: .. . . : CCDS74 GLRDSAFWLSWGLLYAGFIFIMALFL-ALVIRSTQFIILSGFMVVFSLFLLYGLSLVALA 260 270 280 290 300 310 750 760 770 780 790 800 pF1KSD FLLSTFFSKASLAAACSGVIYFTLYLPHILCFAWQD---RMTAELKKAVSLLSPVAFGFG ::.: . .:. : .:.. : : . :... . .. : :. .::::: :: .: CCDS74 FLMSILVKKSFL----TGLVVFLLTV-FWGCLGFTSLYRHLPASLEWILSLLSPFAFMLG 320 330 340 350 360 370 810 820 830 840 850 860 pF1KSD TEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLLSMQMMLLDAAVYGLLAWYLDQVFPGDY :.... :. :: :..:... .. . :. .:. .: :: :.....:..: CCDS74 MAQLLHLD---YDLN-SNAFPHPSDGSNL-IVATNFMLAFDTCLYLALAIYFEKILPNEY 380 390 400 410 420 870 880 890 900 910 920 pF1KSD GTPLPWYFLLQESYWLGGEGCSTREERALEKTEPLTEETEDPEHPEGIHDSFFEREHPGW : : :.:. :.: .::. .. : : : ..:::: :. : . CCDS74 GHRRPPLFFLKSSFW-----------SQTQKTDHVALEDEMDADP-SFHDSF-EQAPPEF 430 440 450 460 470 930 940 950 960 970 pF1KSD V--PGVCVKNLVKIFEPCGQP----AVDRLNITFYENQITAFLGHNGAGKTTTLSILTGL .. ..:..: .. :.: :. : . .::.::::.:::.::::.: :.::.:: CCDS74 QGKEAIRIRNVTKEYK--GKPDKIEALKDLVFDIYEGQITAILGHSGAGKSTLLNILSGL 480 490 500 510 520 530 980 990 1000 1010 1020 1030 pF1KSD LPPTSGTVLVGGRDIE--TSLDAVRQSLGMCPQHNILFHHLTVAEHMLFYAQLKGKSQEE ::.:.: . . . ..:. . . :.::: :. : ::: :.. ..:..:: .: CCDS74 SVPTKGSVTIYNNKLSEMADLENLSKLTGVCPQSNVQFDFLTVRENLRLFAKIKGILPQE 540 550 560 570 580 590 1040 1050 1060 1070 1080 1090 pF1KSD AQLEMEAMLEDTGLHHKRNEEAQDLSGGMQRKLSVAIAFVGDAKVVILDEPTSGVDPYSR .. :.. .: . ... .. ::.::::..:::. .::..:: .. .:::::.:.::.:: CCDS74 VDKEIQRVLLELEMKNIQDVLAQNLSGGQKRKLTFGIAILGDPQIFLLDEPTAGLDPFSR 600 610 620 630 640 650 1100 1110 1120 1130 1140 1150 pF1KSD RSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAIIAQGRLYCSGTPLFLKNCFGTGLYL ...:.:: . .. :.:..::. :::::.:.:: ....::.: :.:. ::::. .: : .: CCDS74 HQVWNLLKERKTDRVILFSTQFMDEADILADRKVFLSQGKLKCAGSSLFLKKKWGIGYHL 660 670 680 690 700 710 1160 1170 1180 1190 1200 1210 pF1KSD TLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAHVDDLTPEQVLDGDVNELMDVVLHHVP .: ....: : ..... .: .:.: CCDS74 SL--QLNEI------------CVEENITS------------------------LVKQHIP 720 730 1220 1230 1240 1250 1260 1270 pF1KSD EAKLVECIGQELIFLLPNKNFKHRAYASLFRELEETLADLGLSSFGISDTPLEEIFLKVT .::: .::. :: . . . :...:. . :::. ..:.: : :.:.:::. CCDS74 DAKLSAKSEGKLIYTLPLE--RTNKFPELYKDLD-SYPDLGIENYGVSMTTLNEVFLKLE 740 750 760 770 780 790 1280 1290 1300 1310 1320 1330 pF1KSD EDS---DSGPLFAGGAQQKRENVNPRHPCLGPREKAGQTPQDSNVCSPGAPAAHPEGQPP : .: . : .: .. . . : : :. : : . : CCDS74 GKSTINESDIAILGEVQAEKADDTER---LVEMEQ---------VLSSLNKMRKTIG--- 800 810 820 830 1340 1350 1360 1370 1380 1390 pF1KSD PEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHKDFLAQI-VLPATFVFLALMLSIV :. : :.. :. :. . . .: .:: . .: : : : . ..: CCDS74 ------------GVALWRQQICAIARVRLLKLKHERKALLALLLILMAGFCPLLVEYTMV 840 850 860 870 880 1400 1410 1420 1430 1440 pF1KSD IPPFGEYPALTLHPWIYGQQYTFFSMDEPGSEQFTVLADVLL-NKPG-----FGNRCLKE . : . : : .: :.. ::.. :...:. :: : : . .. CCDS74 KIYQNSY-TWELSPHLY-----FLA---PGQQPHDPLTQLLIINKTGASIDDFIQSVEHQ 890 900 910 920 930 1450 1460 1470 1480 1490 1500 pF1KSD GWLPEYPC-GNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSCRCSTREKLTMLPECPEGA . : :. . :: . :: ... : : : :... .:. .: CCDS74 NIALEVDAFGTRNGTDDPSYNGAITVCCNEK-----NYSFSLACNAK-RLNCFP------ 940 950 960 970 980 1510 1520 1530 1540 1550 1560 pF1KSD GGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSKFWVNEQRYGGISIGGKL .:.:... .. .:: :.. . .: : : : CCDS74 --------------VLMDIVSNGLLG-MVK--PSVHIRTERSTFLENGQDN--------- 990 1000 1010 1570 1580 1590 1600 1610 1620 pF1KSD PVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHLETEDNIKVWFNNKGWHA :: :::. . . .... : . : :. .. ... :. . : . CCDS74 ---PI------GFLAYIMFWLVLTSSCPPYIAMSSIDDYKNRARSQLRISGLSPSAYWFG 1020 1030 1040 1050 1060 1630 1640 1650 1660 1670 1680 pF1KSD LVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLSEITVLTTSVDAVVAICV ....:. .. . . : .. ::. .. : : . . :. CCDS74 Q-ALVDVSLYFLVFVFI--------YLMSYISNFEDM----------LLTIIHIIQIPCA 1070 1080 1090 1100 1690 1700 1710 1720 1730 1740 pF1KSD I-FSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFLWDIMNYSVSAGLVVGI . .:.:.. ..:. .: .. :. ::. : : . . .:: ::.. .: CCDS74 VGYSFSLIFMTYVISFIFRKGRKN------SGI-----WSFCF-YVVTVFSV-AGFAFSI 1110 1120 1130 1140 1150 1750 1760 1770 1780 1790 1800 pF1KSD FIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPSTAYVALSCANLFIGIN : ..: . ..: :: ::... .: ::. CCDS74 F----------ESDIPFIFTFL-------IP---PATMI-----------GC--LFL--- 1160 1170 1180 1810 1820 1830 1840 1850 1860 pF1KSD SSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGLIDLALSQAVTDVYARFGEEH :: . : :: ..: .. :. :: : :: . :. : . .::.. CCDS74 SSHLLFS-SLFSEERMDVQPFLVF---LIPFLHFII--FLFTLRCLE------WKFGKKS 1190 1200 1210 1220 1870 1880 1890 1900 1910 1920 pF1KSD -SANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQRHFFLSQWIAEPTKEPIVDEDDDVAEE .:: : .. : :. . . .:: ::.:: : CCDS74 MRKDPF-------------------FRIS---PR----SSDVCQNPEEP-EGEDEDVQME 1230 1240 1250 1260 1930 1940 1950 1960 1970 pF1KSD RQRIITGGNKTD-----ILRLHELTKIYPGT---------SSPAVDRLCVGVRPGECFGL : : .. :.:. .. : : : : .. :. . :: :: .:: CCDS74 RVRTANALNSTNFDEKPVIIASCLRKEYAGKRKGCFSKRKNKIATRNVSFCVRKGEVLGL 1270 1280 1290 1300 1310 1320 1980 1990 2000 2010 2020 2030 pF1KSD LGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNMGYCPQFDAIDELLTGR :: :::::.:..:..:::: :.:.. . : .. ... . .::::: .:. :: : CCDS74 LGHNGAGKSTSIKVITGDTKPTAGQVLLKG----SGGGDALEFLGYCPQENALWPNLTVR 1330 1340 1350 1360 1370 2040 2050 2060 2070 2080 2090 pF1KSD EHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNKRKLSTAIALIGCPP .:: .:: ..:. . : . . . .: : . : : : :::: .....: : CCDS74 QHLEVYAAVKGLRKGDAEVAITRLVDALKLQDQLKSPVKTLSEGIKRKLCFVLSILGNPS 1380 1390 1400 1410 1420 1430 2100 2110 2120 2130 2140 pF1KSD LVLLDEPTTGMDPQARRMLWNVIVSIIREG-RAVVLTSHSMEECEALCTRLAIMVKGAFR .::::::.:::::......:..: . .:. :...::.: : : ::.: :.::::.: .: CCDS74 VVLLDEPSTGMDPEGQQQMWQAIRATFRNTERGALLTTHYMAEAEAVCDRVAIMVSGRLR 1440 1450 1460 1470 1480 1490 2150 2160 2170 2180 2190 2200 pF1KSD CMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGSVQRERHYNMLQFQ :.:.::::::::: :.. ::.:. : ...:.. . :: ....::. ... .. CCDS74 CIGSIQHLKSKFGKDYLLEMKVKN-----LAQVEPLHAEILRLFPQAARQERYSSLMVYK 1500 1510 1520 1530 1540 1550 2210 2220 2230 2240 2250 2260 pF1KSD V---SSSSLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTESHDLPLHPRAAG . . . ::. : : . :.:. .::::..:.::.:::....:.: CCDS74 LPVEDVQPLAQAFFKLEKVKQSFDLEEYSLSQSTLEQVFLELSKEQELGDFEEDFDPSVK 1560 1570 1580 1590 1600 1610 2270 pF1KSD ASRQAQD CCDS74 WKLLPQEEP 1620 2273 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 19:20:44 2016 done: Thu Nov 3 19:20:45 2016 Total Scan time: 6.360 Total Display time: 2.030 Function used was FASTA [36.3.4 Apr, 2011]