FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0880, 709 aa 1>>>pF1KSDA0880 709 - 709 aa - 709 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.1373+/-0.000839; mu= 21.9689+/- 0.051 mean_var=84.6763+/-16.519, 0's: 0 Z-trim(108.1): 31 B-trim: 27 in 1/52 Lambda= 0.139378 statistics sampled from 9956 (9982) to 9956 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.666), E-opt: 0.2 (0.307), width: 16 Scan time: 4.140 The best scores are: opt bits E(32554) CCDS8235.1 SLCO2B1 gene_id:11309|Hs108|chr11 ( 709) 4771 969.6 0 CCDS44683.1 SLCO2B1 gene_id:11309|Hs108|chr11 ( 687) 4619 939.1 0 CCDS53679.1 SLCO2B1 gene_id:11309|Hs108|chr11 ( 565) 3792 772.7 0 CCDS3084.1 SLCO2A1 gene_id:6578|Hs108|chr3 ( 643) 941 199.5 1.3e-50 CCDS8683.1 SLCO1C1 gene_id:53919|Hs108|chr12 ( 712) 940 199.3 1.7e-50 CCDS53757.1 SLCO1C1 gene_id:53919|Hs108|chr12 ( 730) 902 191.7 3.4e-48 CCDS45354.1 SLCO3A1 gene_id:28232|Hs108|chr15 ( 692) 796 170.3 8.5e-42 CCDS10371.1 SLCO3A1 gene_id:28232|Hs108|chr15 ( 710) 796 170.3 8.7e-42 CCDS6205.1 SLCO5A1 gene_id:81796|Hs108|chr8 ( 848) 763 163.8 9.8e-40 CCDS8684.1 SLCO1B3 gene_id:28234|Hs108|chr12 ( 702) 695 150.0 1.1e-35 CCDS53759.1 SLCO1C1 gene_id:53919|Hs108|chr12 ( 612) 668 144.5 4.4e-34 CCDS8685.1 SLCO1B1 gene_id:10599|Hs108|chr12 ( 691) 665 144.0 7.2e-34 CCDS44843.1 SLCO1B7 gene_id:338821|Hs108|chr12 ( 640) 627 136.3 1.4e-31 CCDS8686.1 SLCO1A2 gene_id:6579|Hs108|chr12 ( 670) 625 135.9 1.9e-31 CCDS34205.1 SLCO4C1 gene_id:353189|Hs108|chr5 ( 724) 583 127.5 6.9e-29 CCDS55243.1 SLCO5A1 gene_id:81796|Hs108|chr8 ( 687) 547 120.3 1e-26 CCDS55242.1 SLCO5A1 gene_id:81796|Hs108|chr8 ( 793) 521 115.1 4.1e-25 CCDS75282.1 SLCO6A1 gene_id:133482|Hs108|chr5 ( 657) 476 106.0 1.9e-22 CCDS34206.1 SLCO6A1 gene_id:133482|Hs108|chr5 ( 719) 476 106.0 2e-22 CCDS53758.1 SLCO1C1 gene_id:53919|Hs108|chr12 ( 663) 327 76.0 2e-13 CCDS78042.1 SLCO6A1 gene_id:133482|Hs108|chr5 ( 466) 310 72.4 1.7e-12 >>CCDS8235.1 SLCO2B1 gene_id:11309|Hs108|chr11 (709 aa) initn: 4771 init1: 4771 opt: 4771 Z-score: 5183.5 bits: 969.6 E(32554): 0 Smith-Waterman score: 4771; 100.0% identity (100.0% similar) in 709 aa overlap (1-709:1-709) 10 20 30 40 50 60 pF1KSD MGPRIGPAGEVPQVPDKETKATMGTENTPGGKASPDPQDVRPSVFHNIKLFVLCHSLLQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 MGPRIGPAGEVPQVPDKETKATMGTENTPGGKASPDPQDVRPSVFHNIKLFVLCHSLLQL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD AQLMISGYLKSSISTVEKRFGLSSQTSGLLASFNEVGNTALIVFVSYFGSRVHRPRMIGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 AQLMISGYLKSSISTVEKRFGLSSQTSGLLASFNEVGNTALIVFVSYFGSRVHRPRMIGY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD GAILVALAGLLMTLPHFISEPYRYDNTSPEDMPQDFKASLCLPTTSAPASAPSNGNCSSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 GAILVALAGLLMTLPHFISEPYRYDNTSPEDMPQDFKASLCLPTTSAPASAPSNGNCSSY 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD TETQHLSVVGIMFVAQTLLGVGGVPIQPFGISYIDDFAHNSNSPLYLGILFAVTMMGPGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 TETQHLSVVGIMFVAQTLLGVGGVPIQPFGISYIDDFAHNSNSPLYLGILFAVTMMGPGL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD AFGLGSLMLRLYVDINQMPEGGISLTIKDPRWVGAWWLGFLIAAGAVALAAIPYFFFPKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 AFGLGSLMLRLYVDINQMPEGGISLTIKDPRWVGAWWLGFLIAAGAVALAAIPYFFFPKE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD MPKEKRELQFRRKVLAVTDSPARKGKDSPSKQSPGESTKKQDGLVQIAPNLTVIQFIKVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 MPKEKRELQFRRKVLAVTDSPARKGKDSPSKQSPGESTKKQDGLVQIAPNLTVIQFIKVF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD PRVLLQTLRHPIFLLVVLSQVCLSSMAAGMATFLPKFLERQFSITASYANLLIGCLSFPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 PRVLLQTLRHPIFLLVVLSQVCLSSMAAGMATFLPKFLERQFSITASYANLLIGCLSFPS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD VIVGIVVGGVLVKRLHLGPVGCGALCLLGMLLCLFFSLPLFFIGCSSHQIAGITHQTSAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 VIVGIVVGGVLVKRLHLGPVGCGALCLLGMLLCLFFSLPLFFIGCSSHQIAGITHQTSAH 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD PGLELSPSCMEACSCPLDGFNPVCDPSTRVEYITPCHAGCSSWVVQDALDNSQVFYTNCS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 PGLELSPSCMEACSCPLDGFNPVCDPSTRVEYITPCHAGCSSWVVQDALDNSQVFYTNCS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD CVVEGNPVLAGSCDSTCSHLVVPFLLLVSLGSALACLTHTPSFMLILRGVKKEDKTLAVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 CVVEGNPVLAGSCDSTCSHLVVPFLLLVSLGSALACLTHTPSFMLILRGVKKEDKTLAVG 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD IQFMFLRILAWMPSPVIHGSAIDTTCVHWALSCGRRAVCRYYNNDLLRNRFIGLQFFFKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 IQFMFLRILAWMPSPVIHGSAIDTTCVHWALSCGRRAVCRYYNNDLLRNRFIGLQFFFKT 610 620 630 640 650 660 670 680 690 700 pF1KSD GSVICFALVLAVLRQQDKEARTKESRSSPAVEQQLLVSGPGKKPEDSRV ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 GSVICFALVLAVLRQQDKEARTKESRSSPAVEQQLLVSGPGKKPEDSRV 670 680 690 700 >>CCDS44683.1 SLCO2B1 gene_id:11309|Hs108|chr11 (687 aa) initn: 4619 init1: 4619 opt: 4619 Z-score: 5018.5 bits: 939.1 E(32554): 0 Smith-Waterman score: 4619; 100.0% identity (100.0% similar) in 687 aa overlap (23-709:1-687) 10 20 30 40 50 60 pF1KSD MGPRIGPAGEVPQVPDKETKATMGTENTPGGKASPDPQDVRPSVFHNIKLFVLCHSLLQL :::::::::::::::::::::::::::::::::::::: CCDS44 MGTENTPGGKASPDPQDVRPSVFHNIKLFVLCHSLLQL 10 20 30 70 80 90 100 110 120 pF1KSD AQLMISGYLKSSISTVEKRFGLSSQTSGLLASFNEVGNTALIVFVSYFGSRVHRPRMIGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 AQLMISGYLKSSISTVEKRFGLSSQTSGLLASFNEVGNTALIVFVSYFGSRVHRPRMIGY 40 50 60 70 80 90 130 140 150 160 170 180 pF1KSD GAILVALAGLLMTLPHFISEPYRYDNTSPEDMPQDFKASLCLPTTSAPASAPSNGNCSSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GAILVALAGLLMTLPHFISEPYRYDNTSPEDMPQDFKASLCLPTTSAPASAPSNGNCSSY 100 110 120 130 140 150 190 200 210 220 230 240 pF1KSD TETQHLSVVGIMFVAQTLLGVGGVPIQPFGISYIDDFAHNSNSPLYLGILFAVTMMGPGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TETQHLSVVGIMFVAQTLLGVGGVPIQPFGISYIDDFAHNSNSPLYLGILFAVTMMGPGL 160 170 180 190 200 210 250 260 270 280 290 300 pF1KSD AFGLGSLMLRLYVDINQMPEGGISLTIKDPRWVGAWWLGFLIAAGAVALAAIPYFFFPKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 AFGLGSLMLRLYVDINQMPEGGISLTIKDPRWVGAWWLGFLIAAGAVALAAIPYFFFPKE 220 230 240 250 260 270 310 320 330 340 350 360 pF1KSD MPKEKRELQFRRKVLAVTDSPARKGKDSPSKQSPGESTKKQDGLVQIAPNLTVIQFIKVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MPKEKRELQFRRKVLAVTDSPARKGKDSPSKQSPGESTKKQDGLVQIAPNLTVIQFIKVF 280 290 300 310 320 330 370 380 390 400 410 420 pF1KSD PRVLLQTLRHPIFLLVVLSQVCLSSMAAGMATFLPKFLERQFSITASYANLLIGCLSFPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PRVLLQTLRHPIFLLVVLSQVCLSSMAAGMATFLPKFLERQFSITASYANLLIGCLSFPS 340 350 360 370 380 390 430 440 450 460 470 480 pF1KSD VIVGIVVGGVLVKRLHLGPVGCGALCLLGMLLCLFFSLPLFFIGCSSHQIAGITHQTSAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 VIVGIVVGGVLVKRLHLGPVGCGALCLLGMLLCLFFSLPLFFIGCSSHQIAGITHQTSAH 400 410 420 430 440 450 490 500 510 520 530 540 pF1KSD PGLELSPSCMEACSCPLDGFNPVCDPSTRVEYITPCHAGCSSWVVQDALDNSQVFYTNCS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PGLELSPSCMEACSCPLDGFNPVCDPSTRVEYITPCHAGCSSWVVQDALDNSQVFYTNCS 460 470 480 490 500 510 550 560 570 580 590 600 pF1KSD CVVEGNPVLAGSCDSTCSHLVVPFLLLVSLGSALACLTHTPSFMLILRGVKKEDKTLAVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 CVVEGNPVLAGSCDSTCSHLVVPFLLLVSLGSALACLTHTPSFMLILRGVKKEDKTLAVG 520 530 540 550 560 570 610 620 630 640 650 660 pF1KSD IQFMFLRILAWMPSPVIHGSAIDTTCVHWALSCGRRAVCRYYNNDLLRNRFIGLQFFFKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 IQFMFLRILAWMPSPVIHGSAIDTTCVHWALSCGRRAVCRYYNNDLLRNRFIGLQFFFKT 580 590 600 610 620 630 670 680 690 700 pF1KSD GSVICFALVLAVLRQQDKEARTKESRSSPAVEQQLLVSGPGKKPEDSRV ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GSVICFALVLAVLRQQDKEARTKESRSSPAVEQQLLVSGPGKKPEDSRV 640 650 660 670 680 >>CCDS53679.1 SLCO2B1 gene_id:11309|Hs108|chr11 (565 aa) initn: 3792 init1: 3792 opt: 3792 Z-score: 4120.8 bits: 772.7 E(32554): 0 Smith-Waterman score: 3792; 100.0% identity (100.0% similar) in 560 aa overlap (150-709:6-565) 120 130 140 150 160 170 pF1KSD YGAILVALAGLLMTLPHFISEPYRYDNTSPEDMPQDFKASLCLPTTSAPASAPSNGNCSS :::::::::::::::::::::::::::::: CCDS53 MGPRIEDMPQDFKASLCLPTTSAPASAPSNGNCSS 10 20 30 180 190 200 210 220 230 pF1KSD YTETQHLSVVGIMFVAQTLLGVGGVPIQPFGISYIDDFAHNSNSPLYLGILFAVTMMGPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 YTETQHLSVVGIMFVAQTLLGVGGVPIQPFGISYIDDFAHNSNSPLYLGILFAVTMMGPG 40 50 60 70 80 90 240 250 260 270 280 290 pF1KSD LAFGLGSLMLRLYVDINQMPEGGISLTIKDPRWVGAWWLGFLIAAGAVALAAIPYFFFPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 LAFGLGSLMLRLYVDINQMPEGGISLTIKDPRWVGAWWLGFLIAAGAVALAAIPYFFFPK 100 110 120 130 140 150 300 310 320 330 340 350 pF1KSD EMPKEKRELQFRRKVLAVTDSPARKGKDSPSKQSPGESTKKQDGLVQIAPNLTVIQFIKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 EMPKEKRELQFRRKVLAVTDSPARKGKDSPSKQSPGESTKKQDGLVQIAPNLTVIQFIKV 160 170 180 190 200 210 360 370 380 390 400 410 pF1KSD FPRVLLQTLRHPIFLLVVLSQVCLSSMAAGMATFLPKFLERQFSITASYANLLIGCLSFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 FPRVLLQTLRHPIFLLVVLSQVCLSSMAAGMATFLPKFLERQFSITASYANLLIGCLSFP 220 230 240 250 260 270 420 430 440 450 460 470 pF1KSD SVIVGIVVGGVLVKRLHLGPVGCGALCLLGMLLCLFFSLPLFFIGCSSHQIAGITHQTSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SVIVGIVVGGVLVKRLHLGPVGCGALCLLGMLLCLFFSLPLFFIGCSSHQIAGITHQTSA 280 290 300 310 320 330 480 490 500 510 520 530 pF1KSD HPGLELSPSCMEACSCPLDGFNPVCDPSTRVEYITPCHAGCSSWVVQDALDNSQVFYTNC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 HPGLELSPSCMEACSCPLDGFNPVCDPSTRVEYITPCHAGCSSWVVQDALDNSQVFYTNC 340 350 360 370 380 390 540 550 560 570 580 590 pF1KSD SCVVEGNPVLAGSCDSTCSHLVVPFLLLVSLGSALACLTHTPSFMLILRGVKKEDKTLAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SCVVEGNPVLAGSCDSTCSHLVVPFLLLVSLGSALACLTHTPSFMLILRGVKKEDKTLAV 400 410 420 430 440 450 600 610 620 630 640 650 pF1KSD GIQFMFLRILAWMPSPVIHGSAIDTTCVHWALSCGRRAVCRYYNNDLLRNRFIGLQFFFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GIQFMFLRILAWMPSPVIHGSAIDTTCVHWALSCGRRAVCRYYNNDLLRNRFIGLQFFFK 460 470 480 490 500 510 660 670 680 690 700 pF1KSD TGSVICFALVLAVLRQQDKEARTKESRSSPAVEQQLLVSGPGKKPEDSRV :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 TGSVICFALVLAVLRQQDKEARTKESRSSPAVEQQLLVSGPGKKPEDSRV 520 530 540 550 560 >>CCDS3084.1 SLCO2A1 gene_id:6578|Hs108|chr3 (643 aa) initn: 1728 init1: 484 opt: 941 Z-score: 1021.9 bits: 199.5 E(32554): 1.3e-50 Smith-Waterman score: 1865; 44.0% identity (75.0% similar) in 636 aa overlap (43-666:26-623) 20 30 40 50 60 70 pF1KSD QVPDKETKATMGTENTPGGKASPDPQDVRPSVFHNIKLFVLCHSLLQLAQLMISGYLKSS ::: :::.::::..:::: ::. :.:.::: CCDS30 MGLLPKLGASQGSDTSTSRAGRCARSVFGNIKVFVLCQGLLQLCQLLYSAYFKSS 10 20 30 40 50 80 90 100 110 120 130 pF1KSD ISTVEKRFGLSSQTSGLLASFNEVGNTALIVFVSYFGSRVHRPRMIGYGAILVALAGLLM ..:.::::::::..:::..:.::..:. ::.:::::::::::::.:: :....: ..... CCDS30 LTTIEKRFGLSSSSSGLISSLNEISNAILIIFVSYFGSRVHRPRLIGIGGLFLAAGAFIL 60 70 80 90 100 110 140 150 160 170 180 190 pF1KSD TLPHFISEPYRYDNTSPEDMPQDFKASLCLPT-TSAPASAPSNGNCSSYTETQHLSVVGI :::::.::::.: .: . . ..: :: . : : . . . ::. :. :. CCDS30 TLPHFLSEPYQYTLASTGNNSR-LQAELCQKHWQDLPPSKCHSTTQNPQKETS--SMWGL 120 130 140 150 160 170 200 210 220 230 240 250 pF1KSD MFVAQTLLGVGGVPIQPFGISYIDDFAHNSNSPLYLGILFAVTMMGPGLAFGLGSLMLRL : ::: : :.: ::::::::::.:::.. ::::::..::::....::.... :::.::.. CCDS30 MVVAQLLAGIGTVPIQPFGISYVDDFSEPSNSPLYISILFAISVFGPAFGYLLGSVMLQI 180 190 200 210 220 230 260 270 280 290 300 310 pF1KSD YVDINQMPEGGISLTIKDPRWVGAWWLGFLIAAGAVALAAIPYFFFPKEMPKEKRELQFR .:: ... ....:. ::::.::::::.::... ..:...:.::::. :: . CCDS30 FVDYGRVNTAAVNLVPGDPRWIGAWWLGLLISSALLVLTSFPFFFFPRAMP-------IG 240 250 260 270 280 320 330 340 350 360 370 pF1KSD RKVLAVTDSPARKGKDSPSKQSPGESTKKQDGLVQIAPNLTVIQFIKVFPRVLLQTLRHP : .: . ::: ... :. : ...::: :: ..:. : . CCDS30 AKRAPATADEARKLEEAKSRGS-------------------LVDFIKRFPCIFLRLLMNS 290 300 310 320 380 390 400 410 420 430 pF1KSD IFLLVVLSQVCLSSMAAGMATFLPKFLERQFSITASYANLLIGCLSFPSVIVGIVVGGVL .:.::::.: .::. ::..::: ::::.:.. .:.:::.::: ...:.. .:.. ::.: CCDS30 LFVLVVLAQCTFSSVIAGLSTFLNKFLEKQYGTSAAYANFLIGAVNLPAAALGMLFGGIL 330 340 350 360 370 380 440 450 460 470 480 pF1KSD VKR----LHLGPVGCGALCLLGMLLCLFFSLPLFFIGCSSHQIAGI---THQTSAHPGLE .:: :. : .. ..:.::. ::::.:::. .: . . ..: :: CCDS30 MKRFVFSLQAIPRIATTIITISMILCV----PLFFMGCSTPTVAEVYPPSTSSSIHPQ-- 390 400 410 420 430 440 490 500 510 520 530 540 pF1KSD LSPSCMEACSCPLDGFNPVCDPSTRVEYITPCHAGCSSWVVQDALDNSQVFYTNCSCVVE ::.: . :::: . :.::: . .::..:::::::. ...: ..:..: :::::. CCDS30 -SPACRRDCSCPDSIFHPVCGDNG-IEYLSPCHAGCSNINMSSAT-SKQLIYLNCSCVTG 450 460 470 480 490 550 560 570 580 590 600 pF1KSD GNP-VLAGSCDSTCSHLVVPFLLLVSLGSALACLTHTPSFMLILRGVKKEDKTLAVGIQF :. . .::: :.:...: ..:.:. : .::..:.: .:..:: :..:.:..:.:.:: CCDS30 GSASAKTGSCPVPCAHFLLPAIFLISFVSLIACISHNPLYMMVLRVVNQEEKSFAIGVQF 500 510 520 530 540 550 610 620 630 640 650 660 pF1KSD MFLRILAWMPSPVIHGSAIDTTCVHWALSC-GRRAVCRYYNNDLLRNRFIGLQFFFKTGS ...:.:::.:::...: .:: .:..: : :::..: ::.:: ::.:..:::. .:. . CCDS30 LLMRLLAWLPSPALYGLTIDHSCIRWNSLCLGRRGACAYYDNDALRDRYLGLQMGYKALG 560 570 580 590 600 610 670 680 690 700 pF1KSD VI--CFALVLAVLRQQDKEARTKESRSSPAVEQQLLVSGPGKKPEDSRV .. :: CCDS30 MLLLCFISWRVKKNKEYNVQKAAGLI 620 630 640 >>CCDS8683.1 SLCO1C1 gene_id:53919|Hs108|chr12 (712 aa) initn: 1119 init1: 397 opt: 940 Z-score: 1020.2 bits: 199.3 E(32554): 1.7e-50 Smith-Waterman score: 1264; 32.7% identity (64.9% similar) in 673 aa overlap (29-675:19-666) 10 20 30 40 50 pF1KSD MGPRIGPAGEVPQVPDKETKATMGTENTPGGKAS-----PDPQDVRPSVFHNIKLFVLCH : :. : :. .. .: ..:.:. CCDS86 MDTSSKENIQLFCKTSVQPVGRPSFKTEYPSSEEKQPCC-GELKVFLCAL 10 20 30 40 60 70 80 90 100 110 pF1KSD SLLQLAQLMISGYLKSSISTVEKRFGLSSQTSGLLASFNEVGNTALIVFVSYFGSRVHRP :.. .:. . :::::.:. .:.:: . :. :.. . :.:: .:.::::::...::: CCDS86 SFVYFAKALAEGYLKSTITQIERRFDIPSSLVGVIDGSFEIGNLLVITFVSYFGAKLHRP 50 60 70 80 90 100 120 130 140 150 160 170 pF1KSD RMIGYGAILVALAGLLMTLPHFISEPYRYDNTSPEDMPQDFKASLCLPTTSA--PASA-- ..:: : ...... ::...:.:. : :.:. :: . . .. : :: .:. :.:. CCDS86 KIIGAGCVIMGVGTLLIAMPQFFMEQYKYERYSPSSN-STLSISPCLLESSSQLPVSVME 110 120 130 140 150 160 180 190 200 210 220 230 pF1KSD PSNGNCSSYTETQHLSVVGI-MFVAQTLLGVGGVPIQPFGISYIDDFAHNSNSPLYLGIL :... :. :.. : . : .:... : :.: .::::.::.:.:::: ..:. .:.: . CCDS86 KSKSKISNECEVDTSSSMWIYVFLGNLLRGIGETPIQPLGIAYLDDFASEDNAAFYIGCV 170 180 190 200 210 220 240 250 260 270 280 290 pF1KSD FAVTMMGPGLAFGLGSLMLRLYVDINQMPEGGISLTIKDPRWVGAWWLGFLIAAGAVALA .:...:: ..: :::: .:::::. . :..: :::.::::::::.:::. :: CCDS86 QTVAIIGPIFGFLLGSLCAKLYVDIGFVNLDHITITPKDPQWVGAWWLGYLIAGIISLLA 230 240 250 260 270 280 300 310 320 330 340 350 pF1KSD AIPYFFFPKEMPKEKRELQFRRKVLAVTDSPARKGKDSPSKQSPGESTKKQDGLVQIAPN :.:....:: .:. : .:. ..: :..: . : . . : CCDS86 AVPFWYLPKSLPR----------------SQSREDSNSSSEKSKFIIDDHTDYQTPQGEN 290 300 310 320 330 360 370 380 390 400 pF1KSD LTVIQFIKVFPRVLLQTLRHPI-FLLVVLSQVCLSSMAAGMATFLPKFLERQFSITASYA .... . : : . . .:. :: . : : ..:. ::.:. ::..:.:.. ..: : CCDS86 AKIMEMARDFLPSLKNLFGNPVYFLYLCTSTVQFNSLF-GMVTYKPKYIEQQYGQSSSRA 340 350 360 370 380 390 410 420 430 440 450 460 pF1KSD NLLIGCLSFPSVIVGIVVGGVLVKRLHLGPVGCGALCLLGMLLCLFFSLPLFFIGCSSHQ :..:: ...:.: .:: ::...:..... : . : : . .. .. : :: .:: . . CCDS86 NFVIGLINIPAVALGIFSGGIVMKKFRISVCGAAKLYLGSSVFGYLLFLSLFALGCENSD 400 410 420 430 440 450 470 480 490 500 510 520 pF1KSD IAGIT--HQ----TSAHPGLELSPSCMEACSCPLDGFNPVCDPSTRVEYITPCHAGCSSW .::.: .: .: : .: .: :.: ..:.: . . :.. : :::.. CCDS86 VAGLTVSYQGTKPVSYHERALFS-DCNSRCKCSETKWEPMCGENG-ITYVSACLAGCQT- 460 470 480 490 500 530 540 550 560 570 pF1KSD VVQDALDNSQVFYTNCSCV-----VEGNPV-LAGSC--DSTCSHLVVPFLLLVSLGSALA .. .. .:: ::.:: :: ..: : :. : .. . ::.. . : CCDS86 --SNRSGKNIIFY-NCTCVGIAASKSGNSSGIVGRCQKDNGCPQMFLYFLVISVITSYTL 510 520 530 540 550 560 580 590 600 610 620 630 pF1KSD CLTHTPSFMLILRGVKKEDKTLAVGIQFMFLRILAWMPSPVIHGSAIDTTCVHWALS-CG : :...:.:: .: . :..:.:: . .:.:: .:.:: : :::.:..:... :: CCDS86 SLGGIPGYILLLRCIKPQLKSFALGIYTLAIRVLAGIPAPVYFGVLIDTSCLKWGFKRCG 570 580 590 600 610 620 640 650 660 670 680 690 pF1KSD RRAVCRYYNNDLLRNRFIGLQFFFKTGSVICFALVLAVLRQQDKEARTKESRSSPAVEQQ :. :: :.....:. ..:: .. : :.. :: .:.. CCDS86 SRGSCRLYDSNVFRHIYLGLTVILGTVSILLSIAVLFILKKNYVSKHRSFITKRERTMVS 630 640 650 660 670 680 700 pF1KSD LLVSGPGKKPEDSRV CCDS86 TRFQKENYTTSDHLLQPNYWPGKETQL 690 700 710 >>CCDS53757.1 SLCO1C1 gene_id:53919|Hs108|chr12 (730 aa) initn: 1081 init1: 397 opt: 902 Z-score: 978.8 bits: 191.7 E(32554): 3.4e-48 Smith-Waterman score: 1226; 33.0% identity (65.0% similar) in 646 aa overlap (29-648:19-639) 10 20 30 40 50 pF1KSD MGPRIGPAGEVPQVPDKETKATMGTENTPGGKAS-----PDPQDVRPSVFHNIKLFVLCH : :. : :. .. .: ..:.:. CCDS53 MDTSSKENIQLFCKTSVQPVGRPSFKTEYPSSEEKQPCC-GELKVFLCAL 10 20 30 40 60 70 80 90 100 110 pF1KSD SLLQLAQLMISGYLKSSISTVEKRFGLSSQTSGLLASFNEVGNTALIVFVSYFGSRVHRP :.. .:. . :::::.:. .:.:: . :. :.. . :.:: .:.::::::...::: CCDS53 SFVYFAKALAEGYLKSTITQIERRFDIPSSLVGVIDGSFEIGNLLVITFVSYFGAKLHRP 50 60 70 80 90 100 120 130 140 150 160 170 pF1KSD RMIGYGAILVALAGLLMTLPHFISEPYRYDNTSPEDMPQDFKASLCLPTTSA--PASA-- ..:: : ...... ::...:.:. : :.:. :: . . .. : :: .:. :.:. CCDS53 KIIGAGCVIMGVGTLLIAMPQFFMEQYKYERYSPSSN-STLSISPCLLESSSQLPVSVME 110 120 130 140 150 160 180 190 200 210 220 230 pF1KSD PSNGNCSSYTETQHLSVVGI-MFVAQTLLGVGGVPIQPFGISYIDDFAHNSNSPLYLGIL :... :. :.. : . : .:... : :.: .::::.::.:.:::: ..:. .:.: . CCDS53 KSKSKISNECEVDTSSSMWIYVFLGNLLRGIGETPIQPLGIAYLDDFASEDNAAFYIGCV 170 180 190 200 210 220 240 250 260 270 280 290 pF1KSD FAVTMMGPGLAFGLGSLMLRLYVDINQMPEGGISLTIKDPRWVGAWWLGFLIAAGAVALA .:...:: ..: :::: .:::::. . :..: :::.::::::::.:::. :: CCDS53 QTVAIIGPIFGFLLGSLCAKLYVDIGFVNLDHITITPKDPQWVGAWWLGYLIAGIISLLA 230 240 250 260 270 280 300 310 320 330 340 350 pF1KSD AIPYFFFPKEMPKEKRELQFRRKVLAVTDSPARKGKDSPSKQSPGESTKKQDGLVQIAPN :.:....:: .:. : .:. ..: :..: . : . . : CCDS53 AVPFWYLPKSLPR----------------SQSREDSNSSSEKSKFIIDDHTDYQTPQGEN 290 300 310 320 330 360 370 380 390 400 pF1KSD LTVIQFIKVFPRVLLQTLRHPI-FLLVVLSQVCLSSMAAGMATFLPKFLERQFSITASYA .... . : : . . .:. :: . : : ..:. ::.:. ::..:.:.. ..: : CCDS53 AKIMEMARDFLPSLKNLFGNPVYFLYLCTSTVQFNSLF-GMVTYKPKYIEQQYGQSSSRA 340 350 360 370 380 390 410 420 430 440 450 460 pF1KSD NLLIGCLSFPSVIVGIVVGGVLVKRLHLGPVGCGALCLLGMLLCLFFSLPLFFIGCSSHQ :..:: ...:.: .:: ::...:..... : . : : . .. .. : :: .:: . . CCDS53 NFVIGLINIPAVALGIFSGGIVMKKFRISVCGAAKLYLGSSVFGYLLFLSLFALGCENSD 400 410 420 430 440 450 470 480 490 500 510 520 pF1KSD IAGIT--HQ----TSAHPGLELSPSCMEACSCPLDGFNPVCDPSTRVEYITPCHAGCSSW .::.: .: .: : .: .: :.: ..:.: . . :.. : :::.. CCDS53 VAGLTVSYQGTKPVSYHERALFS-DCNSRCKCSETKWEPMCGENG-ITYVSACLAGCQT- 460 470 480 490 500 530 540 550 560 570 pF1KSD VVQDALDNSQVFYTNCSCV-----VEGNPV-LAGSC--DSTCSHLVVPFLLLVSLGSALA .. .. .:: ::.:: :: ..: : :. : .. . ::.. . : CCDS53 --SNRSGKNIIFY-NCTCVGIAASKSGNSSGIVGRCQKDNGCPQMFLYFLVISVITSYTL 510 520 530 540 550 560 580 590 600 610 620 630 pF1KSD CLTHTPSFMLILRGVKKEDKTLAVGIQFMFLRILAWMPSPVIHGSAIDTTCVHWALS-CG : :...:.:: .: . :..:.:: . .:.:: .:.:: : :::.:..:... :: CCDS53 SLGGIPGYILLLRCIKPQLKSFALGIYTLAIRVLAGIPAPVYFGVLIDTSCLKWGFKRCG 570 580 590 600 610 620 640 650 660 670 680 690 pF1KSD RRAVCRYYNNDLLRNRFIGLQFFFKTGSVICFALVLAVLRQQDKEARTKESRSSPAVEQQ :. :: :.....: CCDS53 SRGSCRLYDSNVFRYQIKSIPASHCYSIPDLHNATDTNKFSCHFTACKTYISGTNCDTGH 630 640 650 660 670 680 >>CCDS45354.1 SLCO3A1 gene_id:28232|Hs108|chr15 (692 aa) initn: 1166 init1: 364 opt: 796 Z-score: 863.9 bits: 170.3 E(32554): 8.5e-42 Smith-Waterman score: 1346; 33.7% identity (67.4% similar) in 668 aa overlap (43-694:34-670) 20 30 40 50 60 70 pF1KSD QVPDKETKATMGTENTPGGKASPDPQDVRPSVFHNIKLFVLCHSLLQLAQLMISGYLKSS : : :::.:.. . :.::: ...:: : CCDS45 KKPGGSSGGGRSGELQGDEAQRNKKKKKKVSCFSNIKIFLVSECALMLAQGTVGAYLVSV 10 20 30 40 50 60 80 90 100 110 120 130 pF1KSD ISTVEKRFGLSSQTSGLLASFNEVGNTALIVFVSYFGSRVHRPRMIGYGAILVALAGLLM ..:.:.::.:.: :..:: :.:: :::.::::::.: ::::.:: :.:..::..:: CCDS45 LTTLERRFNLQSADVGVIASSFEIGNLALILFVSYFGARGHRPRLIGCGGIVMALGALLS 70 80 90 100 110 120 140 150 160 170 180 190 pF1KSD TLPHFISEPYRYDNTSPEDMPQDFKASLCLPTTSAPASAPS-NGNCSSYTETQHLSVVGI .::.:... :.:. . : ..: . :. .:. . : . : :. . . . CCDS45 ALPEFLTHQYKYE--AGEIRWGAEGRDVCAANGSGGDEGPDPDLICRNRTATNMMYL--L 130 140 150 160 170 200 210 220 230 240 250 pF1KSD MFVAQTLLGVGGVPIQPFGISYIDDFAHNSNSPLYLGILFAVTMMGPGLAFGLGSLMLRL .. ::.:::.:..:.::.:.::::: .. ..: ::.::::.. ..::. .: :::. .. CCDS45 LIGAQVLLGIGATPVQPLGVSYIDDHVRRKDSSLYIGILFTMLVFGPACGFILGSFCTKI 180 190 200 210 220 230 260 270 280 290 300 310 pF1KSD YVDINQMPEGGISLTIKDPRWVGAWWLGFLIAAGAVALAAIPYFFFPKEMPKEKRELQFR ::: . .....: ::::.:::: :::. .. . .... .: ::. .: ... CCDS45 YVDAVFIDTSNLDITPDDPRWIGAWWGGFLLCGALLFFSSLLMFGFPQSLPPHSE----- 240 250 260 270 280 290 320 330 340 350 360 pF1KSD RKVLAVTDSPARKGKDSPSKQSPGESTKKQDGLVQ--IAPNLTV--IQFIKVFPRVLLQT :: ..... .. : : ..:... . :. .. .: ..:.:.: . CCDS45 ---------PAMESEQAMLSEREYERPKPSNGVLRHPLEPDSSASCFQQLRVIPKVTKHL 300 310 320 330 340 370 380 390 400 410 420 pF1KSD LRHPIFLLVVLSQVCLS-SMAAGMATFLPKFLERQFSITASYANLLIGCLSFPSVIVGIV : .:.: ..:. .:. ...::.:.:: :.::.::..:.: :: :.: ..: . .:: CCDS45 LSNPVFTCIILA-ACMEIAVVAGFAAFLGKYLEQQFNLTTSSANQLLGMTAIPCACLGIF 350 360 370 380 390 400 430 440 450 460 470 480 pF1KSD VGGVLVKRLHLGPVGCGALCLLGMLLCLFFSLPLFFIGCSSHQIAGIT--HQTSAHPGLE .::.:::.: :. .: . .: :. . ..:.::.. .::.: . .:. :: CCDS45 LGGLLVKKLSLSALGAIRMAMLVNLVSTACYVSFLFLGCDTGPVAGVTVPYGNSTAPGSA 410 420 430 440 450 460 490 500 510 520 530 540 pF1KSD LSP--SCMEACSCPLDGFNPVCDPSTRVEYITPCHAGCSSWVVQDALDNSQVFYTNCSCV :.: : . : : :.:.::: . . :.. : :::.: : :.:.:. CCDS45 LDPYSPCNNNCECQTDSFTPVCG-ADGITYLSACFAGCNS-------TN----LTGCACL 470 480 490 500 510 550 560 570 580 590 pF1KSD V----EGNPVLAGSCDST-CSHLVVPFLLLVSLGSALACLTHTPSFMLILRGVKKEDKTL . :. :. :.: : :.. . :: .. . : .. ...::: ....: :. : :. CCDS45 TTVPAENATVVPGKCPSPGCQEAFLTFLCVMCICSLIGAMAQTPSVIILIRTVSPELKSY 520 530 540 550 560 570 600 610 620 630 640 650 pF1KSD AVGIQFMFLRILAWMPSPVIHGSAIDTTCVHWALSCGRRAVCRYYNNDLLRNRFIGLQFF :.:. :..::.:...: :.: :..::.::. :. ::....: :.: . : .... . CCDS45 ALGVLFLLLRLLGFIPPPLIFGAGIDSTCLFWSTFCGEQGACVLYDNVVYRYLYVSIAIA 580 590 600 610 620 630 660 670 680 690 700 pF1KSD FKTGSVICFALVLAVLRQQDKE-ARTKESRSSPAVEQQLLVSGPGKKPEDSRV .:. . : .. . ::.. :. ...:. : ..: : CCDS45 LKSFAFILYTTTWQCLRKNYKRYIKNHEGGLSTSTEYQDIETEKTCPESHSPSEDSFVRS 640 650 660 670 680 690 >>CCDS10371.1 SLCO3A1 gene_id:28232|Hs108|chr15 (710 aa) initn: 1189 init1: 364 opt: 796 Z-score: 863.7 bits: 170.3 E(32554): 8.7e-42 Smith-Waterman score: 1341; 33.1% identity (66.9% similar) in 680 aa overlap (43-704:34-682) 20 30 40 50 60 70 pF1KSD QVPDKETKATMGTENTPGGKASPDPQDVRPSVFHNIKLFVLCHSLLQLAQLMISGYLKSS : : :::.:.. . :.::: ...:: : CCDS10 KKPGGSSGGGRSGELQGDEAQRNKKKKKKVSCFSNIKIFLVSECALMLAQGTVGAYLVSV 10 20 30 40 50 60 80 90 100 110 120 130 pF1KSD ISTVEKRFGLSSQTSGLLASFNEVGNTALIVFVSYFGSRVHRPRMIGYGAILVALAGLLM ..:.:.::.:.: :..:: :.:: :::.::::::.: ::::.:: :.:..::..:: CCDS10 LTTLERRFNLQSADVGVIASSFEIGNLALILFVSYFGARGHRPRLIGCGGIVMALGALLS 70 80 90 100 110 120 140 150 160 170 180 190 pF1KSD TLPHFISEPYRYDNTSPEDMPQDFKASLCLPTTSAPASAPS-NGNCSSYTETQHLSVVGI .::.:... :.:. . : ..: . :. .:. . : . : :. . . . CCDS10 ALPEFLTHQYKYE--AGEIRWGAEGRDVCAANGSGGDEGPDPDLICRNRTATNMMYL--L 130 140 150 160 170 200 210 220 230 240 250 pF1KSD MFVAQTLLGVGGVPIQPFGISYIDDFAHNSNSPLYLGILFAVTMMGPGLAFGLGSLMLRL .. ::.:::.:..:.::.:.::::: .. ..: ::.::::.. ..::. .: :::. .. CCDS10 LIGAQVLLGIGATPVQPLGVSYIDDHVRRKDSSLYIGILFTMLVFGPACGFILGSFCTKI 180 190 200 210 220 230 260 270 280 290 300 310 pF1KSD YVDINQMPEGGISLTIKDPRWVGAWWLGFLIAAGAVALAAIPYFFFPKEMPKEKRELQFR ::: . .....: ::::.:::: :::. .. . .... .: ::. .: ... CCDS10 YVDAVFIDTSNLDITPDDPRWIGAWWGGFLLCGALLFFSSLLMFGFPQSLPPHSE----- 240 250 260 270 280 290 320 330 340 350 360 pF1KSD RKVLAVTDSPARKGKDSPSKQSPGESTKKQDGLVQ--IAPNLTV--IQFIKVFPRVLLQT :: ..... .. : : ..:... . :. .. .: ..:.:.: . CCDS10 ---------PAMESEQAMLSEREYERPKPSNGVLRHPLEPDSSASCFQQLRVIPKVTKHL 300 310 320 330 340 370 380 390 400 410 420 pF1KSD LRHPIFLLVVLSQVCLS-SMAAGMATFLPKFLERQFSITASYANLLIGCLSFPSVIVGIV : .:.: ..:. .:. ...::.:.:: :.::.::..:.: :: :.: ..: . .:: CCDS10 LSNPVFTCIILA-ACMEIAVVAGFAAFLGKYLEQQFNLTTSSANQLLGMTAIPCACLGIF 350 360 370 380 390 400 430 440 450 460 470 480 pF1KSD VGGVLVKRLHLGPVGCGALCLLGMLLCLFFSLPLFFIGCSSHQIAGIT--HQTSAHPGLE .::.:::.: :. .: . .: :. . ..:.::.. .::.: . .:. :: CCDS10 LGGLLVKKLSLSALGAIRMAMLVNLVSTACYVSFLFLGCDTGPVAGVTVPYGNSTAPGSA 410 420 430 440 450 460 490 500 510 520 530 540 pF1KSD LSP--SCMEACSCPLDGFNPVCDPSTRVEYITPCHAGCSSWVVQDALDNSQVFYTNCSCV :.: : . : : :.:.::: . . :.. : :::.: . :.:.:. CCDS10 LDPYSPCNNNCECQTDSFTPVCG-ADGITYLSACFAGCNSTNL-----------TGCACL 470 480 490 500 510 550 560 570 580 590 pF1KSD V----EGNPVLAGSCDST-CSHLVVPFLLLVSLGSALACLTHTPSFMLILRGVKKEDKTL . :. :. :.: : :.. . :: .. . : .. ...::: ....: :. : :. CCDS10 TTVPAENATVVPGKCPSPGCQEAFLTFLCVMCICSLIGAMAQTPSVIILIRTVSPELKSY 520 530 540 550 560 570 600 610 620 630 640 650 pF1KSD AVGIQFMFLRILAWMPSPVIHGSAIDTTCVHWALSCGRRAVCRYYNNDLLRNRFIGLQFF :.:. :..::.:...: :.: :..::.::. :. ::....: :.: . : .... . CCDS10 ALGVLFLLLRLLGFIPPPLIFGAGIDSTCLFWSTFCGEQGACVLYDNVVYRYLYVSIAIA 580 590 600 610 620 630 660 670 680 690 700 pF1KSD FKTGSVICFALVLAVLRQQDKE-ARTKES--RSSPAVEQQLLVSGPGKKPEDSRV .:. . : .. . ::.. :. ...:. .: . : ... :. : CCDS10 LKSFAFILYTTTWQCLRKNYKRYIKNHEGGLSTSEFFASTLTLDNLGRDPVPANQTHRTK 640 650 660 670 680 690 CCDS10 FIYNLEDHEWCENMESVL 700 710 >>CCDS6205.1 SLCO5A1 gene_id:81796|Hs108|chr8 (848 aa) initn: 1185 init1: 290 opt: 763 Z-score: 826.9 bits: 163.8 E(32554): 9.8e-40 Smith-Waterman score: 1248; 33.3% identity (64.6% similar) in 684 aa overlap (44-689:123-776) 20 30 40 50 60 70 pF1KSD VPDKETKATMGTENTPGGKASPDPQDVRPSVFHNIKLFVLCHSLLQLAQ-LMISGYLKSS :. . . :..: .: . : ::.::::.: CCDS62 GDCNHRVDLSKTFSVSSALAMLQERRCLYVVLTDSRCFLVCMCFLTFIQALMVSGYLSSV 100 110 120 130 140 150 80 90 100 110 120 130 pF1KSD ISTVEKRFGLSSQTSGLLASFNEVGNTALIVFVSYFGSRVHRPRMIGYGAILVALAGLLM :.:.:.:..:.:. ::::.: ..:: ...:::::::.: .:: .. :..:.:... :. CCDS62 ITTIERRYSLKSSESGLLVSCFDIGNLVVVVFVSYFGGRGRRPLWLAVGGLLIAFGAALF 160 170 180 190 200 210 140 150 160 170 180 190 pF1KSD TLPHFISEPYRYDNTSPEDMPQDFKASLCLPTTSAPASAPSNGNCSSYTE-TQHLSVVGI .:::::: ::. .. . . :.: .:: .:. . : : . . ..: :.. CCDS62 ALPHFISPPYQIQELNA-SAPND---GLCQGGNSTATLEPP--ACPKDSGGNNHWVYVAL 220 230 240 250 260 200 210 220 230 240 250 pF1KSD MFVAQTLLGVGGVPIQPFGISYIDDFAHNSNSPLYLGILFAVTMMGPGLAFGLGSLMLRL .. :: :.:.:..:: .: .:.:: ... :: :::.:.... .::.... ::.:.. . CCDS62 FICAQILIGMGSTPIYTLGPTYLDDNVKKENSSLYLAIMYVMGALGPAVGYLLGGLLIGF 270 280 290 300 310 320 260 270 280 290 300 310 pF1KSD YVDINQMPEGGISLTIKDPRWVGAWWLGFLIAAGAVALAAIPYFFFPKEMP-KEKRELQF ::: :.. . : .:::..: :: :::. : :. :. .:.: :::..: ..:.. . CCDS62 YVD----PRNPVHLDQNDPRFIGNWWSGFLLCAIAMFLVIFPMFTFPKKLPPRHKKKKKK 330 340 350 360 370 380 320 330 340 350 360 370 pF1KSD RRKVLAVTDSPARKGKDSPSKQSPGESTKKQDGLVQIAPNLTVIQFIKVFPRVLLQTLRH . .: ::.:. . : :.. :.:. . .. : . .. .::. .. : . CCDS62 KFSVDAVSDDDVLKEKSNNSEQADKKVSSMGFG-----------KDVRDLPRAAVRILSN 390 400 410 420 430 380 390 400 410 420 430 pF1KSD PIFLLVVLSQVCLSSMAAGMATFLPKFLERQFSITASYANLLIGCLSFPSVIVGIVVGGV ::.: :: . :...... ::.:::.: ::.: :: :.. : . ::. ::::.:: CCDS62 MTFLFVSLSYTAESAIVTAFITFIPKFIESQFGIPASNASIYTGVIIVPSAGVGIVLGGY 440 450 460 470 480 490 440 450 460 470 480 pF1KSD LVKRLHLGPVGCGALCLL--GM-LLCLFFSLPLFFIGCSSHQIAGITHQTSAHPGL---- ..:.:.:: . : .. :. ::: :: ::..:: : ...::. .. :.: CCDS62 IIKKLKLGARESAKLAMICSGVSLLC--FST-LFIVGCESINLGGINIPYTTGPSLTMPH 500 510 520 530 540 490 500 510 520 530 540 pF1KSD -ELSPSCMEACSCPLDGFNPVCDPSTRVEYITPCHAGCSSWVVQDALDNSQVFYTNCSCV .:. :: :.: . ..::: : . :..:: ::: : . :... ::.:.:: CCDS62 RNLTGSCNVNCGCKIHEYEPVCG-SDGITYFNPCLAGC---VNSGNLSTGIRNYTECTCV 550 560 570 580 590 600 550 560 570 pF1KSD V--------------------------EGNPVLAGSCDSTCSHLVVPFLLLVSLGSALAC :.. ...:.: ::. :. :::... . . .. CCDS62 QSRQVITPPTVGQRSQLRVVIVKTYLNENGYAVSGKCKRTCNTLI-PFLVFLFIVTFITA 610 620 630 640 650 660 580 590 600 610 620 630 pF1KSD LTHTPSFMLILRGVKKEDKTLAVGIQFMFLRILAWMPSPVIHGSAIDTTCVHWALSCGRR .. .... ::.:. :.. .:.:.::..:: ::..:.:. :..:::::. : :: . CCDS62 CAQPSAIIVTLRSVEDEERPFALGMQFVLLRTLAYIPTPIYFGAVIDTTCMLWQQECGVQ 670 680 690 700 710 720 640 650 660 670 680 690 pF1KSD AVCRYYNNDLLRNRFIGLQFFFK-TGSVICFALVLAVLRQQDKEARTKESRSSPAVEQQL . : :: .: ..:: .: .: .. : .. ..: : .. : : CCDS62 GSCWEYNVTSFRFVYFGLAAGLKFVGFIFIFLAWYSIKYKEDGLQRRRQ-REFPLSTVSE 730 740 750 760 770 780 700 pF1KSD LVSGPGKKPEDSRV CCDS62 RVGHPDNARTRSCPAFSTQGEFHEETGLQKGIQCAAQTYPGPFPEAISSSADPGLEESPA 790 800 810 820 830 840 >>CCDS8684.1 SLCO1B3 gene_id:28234|Hs108|chr12 (702 aa) initn: 960 init1: 406 opt: 695 Z-score: 754.0 bits: 150.0 E(32554): 1.1e-35 Smith-Waterman score: 1218; 32.3% identity (65.4% similar) in 700 aa overlap (27-699:8-677) 10 20 30 40 50 60 pF1KSD MGPRIGPAGEVPQVPDKETKATMGTENTPGGKASPDPQDVRPSVFHNIKLFVLCHSLLQL : . .:: . . .: ...:.:. :. . CCDS86 MDQHQHLNKTAESASSEKKKTRRC--NGFKMFLAALSFSYI 10 20 30 70 80 90 100 110 120 pF1KSD AQLMISGYLKSSISTVEKRFGLSSQTSGLLASFNEVGNTALIVFVSYFGSRVHRPRMIGY :. . . .: ::. .:.:: .::. .::. . :.:: .:::::::::..:::..:: CCDS86 AKALGGIIMKISITQIERRFDISSSLAGLIDGSFEIGNLLVIVFVSYFGSKLHRPKLIGI 40 50 60 70 80 90 130 140 150 160 170 pF1KSD GAILVALAGLLMTLPHFISEPYRYDNTSPEDMPQDFKASL--CL--PTTSAPASAPS--N : .:.. ...: .::::. :::.. . . .. .:: :: : : ...: . CCDS86 GCLLMGTGSILTSLPHFFMGYYRYSKETHINPSENSTSSLSTCLINQTLSFNGTSPEIVE 100 110 120 130 140 150 180 190 200 210 220 230 pF1KSD GNCSSYTETQHLSVVGIMFVAQTLLGVGGVPIQPFGISYIDDFAHNSNSPLYLGILFAVT .: . . . :. . .:... : :.: .:: :.:::::::::....: :::: : :. CCDS86 KDCVKESGS-HMWIY--VFMGNMLRGIGETPIVPLGISYIDDFAKEGHSSLYLGSLNAIG 160 170 180 190 200 210 240 250 260 270 280 290 pF1KSD MMGPGLAFGLGSLMLRLYVDINQMPEGGISLTIKDPRWVGAWWLGFLIAAGAVALAAIPY :.:: ..:.::::. ..::::. . . : .: :: :::::::::::... ...::. CCDS86 MIGPVIGFALGSLFAKMYVDIGYVDLSTIRITPKDSRWVGAWWLGFLVSGLFSIISSIPF 220 230 240 250 260 270 300 310 320 330 340 350 pF1KSD FFFPKE--MPKEKRELQFRRKVLAVTDSPARKGKDSPSKQSPGESTKKQDGLVQIAPNLT ::.::. :...:.... .:: ..:. :. . ..: :... :. CCDS86 FFLPKNPNKPQKERKISLSLHVLKTNDD--RNQTANLTNQ--GKNVTKN----------- 280 290 300 310 320 360 370 380 390 400 410 pF1KSD VIQFIKVFPRVLLQTLRHPIFLLVVLSQVCLSSMAAGMATFLPKFLERQFSITASYANLL : :.. . .: . : . ::::..: :: ::. : :.. :..:.:.. .::.::.: CCDS86 VTGFFQSLKSILTNPL-YVIFLLLTLLQV--SSFI-GSFTYVFKYMEQQYGQSASHANFL 330 340 350 360 370 420 430 440 450 460 470 pF1KSD IGCLSFPSVIVGIVVGGVLVKRLHLGPVGCGALCLLGMLLCLFFSLPLFFIGCSSHQIAG .: ...:.: .:. .:: ..:...:. :: . . .: .. ..:.: : . : :...:: CCDS86 LGIITIPTVATGMFLGGFIIKKFKLSLVGIAKFSFLTSMISFLFQLLYFPLICESKSVAG 380 390 400 410 420 430 480 490 500 510 520 pF1KSD IT------HQTSAHPGLELSPSCMEACSCPLDGFNPVCDPSTRVEYITPCHAGCSSWVVQ .: .....: . :: : :.: . ..::: .. . :..:: :::.: . CCDS86 LTLTYDGNNSVASHVDVPLS-YCNSECNCDESQWEPVCG-NNGITYLSPCLAGCKS---S 440 450 460 470 480 490 530 540 550 560 570 pF1KSD DALDNSQVFYTNCSCV-VEG-----NPVLAGSC--DSTCSHLVVPFLLLVSLGSALACLT ... . ::: ::::: : : . : : :.::.. .. . ..: .. CCDS86 SGIKKHTVFY-NCSCVEVTGLQNRNYSAHLGECPRDNTCTRKFFIYVAIQVINSLFSATG 500 510 520 530 540 550 580 590 600 610 620 630 pF1KSD HTPSFMLILRGVKKEDKTLAVGIQFMFLRILAWMPSPVIHGSAIDTTCVHWAL-SCGRRA : ..: .. :. : :.::.:.: : .: :. . .:. :. :: ::..:. ::: .. CCDS86 GTTFILLTVKIVQPELKALAMGFQSMVIRTLGGILAPIYFGALIDKTCMKWSTNSCGAQG 560 570 580 590 600 610 640 650 660 670 680 690 pF1KSD VCRYYNNDLLRNRFIGLQFFFKTGSVICFALVLAVLRQQ----DKEARTKESRSSPAVEQ .:: ::. .. ..::.. .. ... . . . ..... : .: .: . .. CCDS86 ACRIYNSVFFGRVYLGLSIALRFPALVLYIVFIFAMKKKFQGKDTKASDNERKVMDEANL 620 630 640 650 660 670 700 pF1KSD QLLVSGPGKKPEDSRV ..: .: CCDS86 EFLNNGEHFVPSAGTDSKTCNLDMQDNAAAN 680 690 700 709 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 18:50:02 2016 done: Thu Nov 3 18:50:03 2016 Total Scan time: 4.140 Total Display time: 0.230 Function used was FASTA [36.3.4 Apr, 2011]