FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0360, 659 aa 1>>>pF1KE0360 659 - 659 aa - 659 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.9732+/-0.0009; mu= 21.0885+/- 0.055 mean_var=65.5911+/-13.410, 0's: 0 Z-trim(105.3): 30 B-trim: 453 in 1/50 Lambda= 0.158362 statistics sampled from 8311 (8336) to 8311 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.614), E-opt: 0.2 (0.256), width: 16 Scan time: 2.830 The best scores are: opt bits E(32554) CCDS13903.1 SLC5A4 gene_id:6527|Hs108|chr22 ( 659) 4343 1001.6 0 CCDS13902.1 SLC5A1 gene_id:6523|Hs108|chr22 ( 664) 3222 745.5 5.6e-215 CCDS58805.1 SLC5A1 gene_id:6523|Hs108|chr22 ( 537) 2617 607.2 1.9e-173 CCDS10714.1 SLC5A2 gene_id:6524|Hs108|chr16 ( 672) 2483 576.6 3.8e-164 CCDS30709.2 SLC5A9 gene_id:200010|Hs108|chr1 ( 681) 2183 508.1 1.6e-143 CCDS10625.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 675) 2131 496.2 6.1e-140 CCDS42275.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 596) 2019 470.6 2.8e-132 CCDS58439.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 611) 1957 456.4 5.3e-128 CCDS33549.1 SLC5A3 gene_id:6526|Hs108|chr21 ( 718) 1933 451.0 2.7e-126 CCDS44136.1 SLC5A9 gene_id:200010|Hs108|chr1 ( 706) 1826 426.5 6e-119 CCDS58438.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 605) 1596 373.9 3.5e-103 CCDS58437.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 640) 1576 369.4 8.7e-102 CCDS59278.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 569) 1276 300.8 3.4e-81 CCDS59277.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 560) 1208 285.3 1.6e-76 CCDS11201.2 SLC5A10 gene_id:125206|Hs108|chr17 ( 612) 1207 285.1 2e-76 CCDS58440.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 519) 656 159.1 1.4e-38 CCDS74008.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 566) 511 126.0 1.4e-28 CCDS7860.2 SLC5A12 gene_id:159963|Hs108|chr11 ( 618) 307 79.5 1.6e-14 CCDS12368.1 SLC5A5 gene_id:6528|Hs108|chr19 ( 643) 300 77.9 5e-14 CCDS1740.1 SLC5A6 gene_id:8884|Hs108|chr2 ( 635) 277 72.6 1.9e-12 CCDS2074.1 SLC5A7 gene_id:60482|Hs108|chr2 ( 580) 258 68.2 3.6e-11 >>CCDS13903.1 SLC5A4 gene_id:6527|Hs108|chr22 (659 aa) initn: 4343 init1: 4343 opt: 4343 Z-score: 5357.2 bits: 1001.6 E(32554): 0 Smith-Waterman score: 4343; 100.0% identity (100.0% similar) in 659 aa overlap (1-659:1-659) 10 20 30 40 50 60 pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 PSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVIVQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVIVQR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 CLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGVDVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 CLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGVDVG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 CTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQASEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 CTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQASEK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE0 ELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFCKRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 ELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFCKRV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE0 NEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGSMLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 NEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGSMLV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE0 TLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKSQEETDDGVEEDYPEKSRGCLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 TLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKSQEETDDGVEEDYPEKSRGCLK 550 560 570 580 590 600 610 620 630 640 650 pF1KE0 KAYDLFCGLQKGPKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVFIHGYYA ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 KAYDLFCGLQKGPKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVFIHGYYA 610 620 630 640 650 >>CCDS13902.1 SLC5A1 gene_id:6523|Hs108|chr22 (664 aa) initn: 3266 init1: 2919 opt: 3222 Z-score: 3973.0 bits: 745.5 E(32554): 5.6e-215 Smith-Waterman score: 3222; 70.4% identity (89.9% similar) in 663 aa overlap (2-659:3-664) 10 20 30 40 50 pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFF .:: ::.: : : .: . ::::::::.:::::.::::::::::..:::::.:::: CCDS13 MDSSTWSPKTTAVT-RPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFF 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 LAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPI ::::.:.:::.:::::::::::.:.:::::::::::.: :::.. :....:::.:::: CCDS13 LAGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 YIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYL :::.::.::::::.:::::.:.:::::.:::.. . ::::::.:::::.:::::.::: CCDS13 YIKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 AIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNA :::.:::.::.:: :::::.:::::::::.:::.::.:: ::::.:::::..: :::..: CCDS13 AIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 TPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVIVQ :..: : :.. .:::::::::::::: .:::.::::.:::: : .::::::.::::: CCDS13 IPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQVIVQ 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 RCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGVDV ::: .:.:::::..::.:.::::.:::.:::::::::::::. .:::::::: :.::. : CCDS13 RCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCGTKV 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE0 GCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQASE :::: ::::.:.::::.::::::::::::::::::::::::::::::.:.:.:.::.::: CCDS13 GCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVRKRASE 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE0 KELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFCKR :::.::::.:.:.: .::.:::.:: .:.:::. : .::.:::::::::::.:::: :: CCDS13 KELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLAIFWKR 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE0 VNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGSML ::: ::::::..:: .:. :::::::::::::. ::::: ::::::::::.:.:: :.. CCDS13 VNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILFAISFI 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE0 VTLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKSQEETDDG---VEEDYPEKSR . . :::::::::::::::::: :::: :::::.::::.. .: .: . :::.. CCDS13 TIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEENIQEGPKETIEIETQVPEKKK 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE0 GCLKKAYDLFCGL-QKG-PKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVFI : ...:::::::: :.: ::.:.:::.:.. :.:::::.: :::..:.:.:.:..:.:: CCDS13 GIFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSEKPLWRTVLNVNGIILVTVAVFC 600 610 620 630 640 650 pF1KE0 HGYYA :.:.: CCDS13 HAYFA 660 >>CCDS58805.1 SLC5A1 gene_id:6523|Hs108|chr22 (537 aa) initn: 2686 init1: 2339 opt: 2617 Z-score: 3227.3 bits: 607.2 E(32554): 1.9e-173 Smith-Waterman score: 2617; 70.4% identity (89.9% similar) in 537 aa overlap (128-659:1-537) 100 110 120 130 140 150 pF1KE0 TVTFEWTSSVMLLILGWIFVPIYIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLL :::::.:::::.:.:::::.:::.. . CCDS58 MPEYLRKRFGGQRIQVYLSLLSLLLYIFTK 10 20 30 160 170 180 190 200 210 pF1KE0 ISADIFAGAIFIKLALGLDLYLAIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFI ::::::.:::::.:::::.::::::.:::.::.:: :::::.:::::::::.:::.::.: CCDS58 ISADIFSGAIFINLALGLNLYLAIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLI 40 50 60 70 80 90 220 230 240 250 260 270 pF1KE0 LMGFAFNEVGGYESFTEKYVNATPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWP : ::::.:::::..: :::..: :..: : :.. .:::::::::::::: .:::.::: CCDS58 LTGFAFHEVGGYDAFMEKYMKAIPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWP 100 110 120 130 140 150 280 290 300 310 320 330 pF1KE0 GIIFGMPITALWYWCTNQVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRI :.:::: : .::::::.:::::::: .:.:::::..::.:.::::.:::.:::::::::: CCDS58 GFIFGMSILTLWYWCTDQVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRI 160 170 180 190 200 210 340 350 360 370 380 390 pF1KE0 LYTDMVACVVPSECVKHCGVDVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSI :::. .:::::::: :.::. ::::: ::::.:.::::.::::::::::::::::::::: CCDS58 LYTEKIACVVPSECEKYCGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSI 220 230 240 250 260 270 400 410 420 430 440 450 pF1KE0 FNSASTLFTIDLYTKMRKQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTE :::::::::.:.:.:.::.::::::.::::.:.:.: .::.:::.:: .:.:::. : . CCDS58 FNSASTLFTMDIYAKVRKRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQ 280 290 300 310 320 330 460 470 480 490 500 510 pF1KE0 SISSYLGPPIAAVFVLAIFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNC ::.:::::::::::.:::: ::::: ::::::..:: .:. :::::::::::::. :::: CCDS58 SITSYLGPPIAAVFLLAIFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNC 340 350 360 370 380 390 520 530 540 550 560 570 pF1KE0 PKIICGVHYLYFSIVLFFGSMLVTLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEE : ::::::::::.:.:: :... . :::::::::::::::::: :::: :::::.:::: CCDS58 PTIICGVHYLYFAIILFAISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEE 400 410 420 430 440 450 580 590 600 610 620 630 pF1KE0 KSQEETDDG---VEEDYPEKSRGCLKKAYDLFCGL-QKG-PKLTKEEEEALSKKLTDTSE .. .: .: . :::..: ...:::::::: :.: ::.:.:::.:.. :.::::: CCDS58 ENIQEGPKETIEIETQVPEKKKGIFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSE 460 470 480 490 500 510 640 650 pF1KE0 RPSWRTIVNINAILLLAVVVFIHGYYA .: :::..:.:.:.:..:.:: :.:.: CCDS58 KPLWRTVLNVNGIILVTVAVFCHAYFA 520 530 >>CCDS10714.1 SLC5A2 gene_id:6524|Hs108|chr16 (672 aa) initn: 2666 init1: 1531 opt: 2483 Z-score: 3060.5 bits: 576.6 E(32554): 3.8e-164 Smith-Waterman score: 2641; 56.5% identity (83.4% similar) in 662 aa overlap (14-659:11-672) 10 20 30 40 50 60 pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL :: . : : ::: ::. :::.:..::::.: .:::::.::.:: CCDS10 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFL 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY :::.:.:::.:::::::::::.:.:::::::::::.:.. :::.. ..:.:::.:.:.: CCDS10 AGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVY 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA . .::.:::.::.:::::.:...:::.::::. . ::.:.:.::.::. ::: ..: . CCDS10 LTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYAS 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE0 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT .. ::..: .::.:::::...::::.::...: :. ::::.::.::::: .. .::..:. CCDS10 VIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAA 180 190 200 210 220 230 250 260 270 280 290 pF1KE0 PSVVEGDNLT---ISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVI :.. ... . ::. :: :: ::.:..: ::::.:::....:. :.. ::::..::: CCDS10 TSLTVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 VQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGV ::::: ::...:.::.::.:.:::: :::::::::::::::: : :::::: : . ::. CCDS10 VQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRVCGT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE0 DVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQA .:::.: ::: .:..:::.:::::::.::::.:::::.:::::.:::::.:.::..: .: CCDS10 EVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLRPRA 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE0 SEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFC ...:::..::..:....:::..:.:.::..:.:::. : ...::::.::..::::::.: CCDS10 GDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLALFV 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE0 KRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGS :::::::::::. :: ::: :.: ::..:.:::. :: :: ..::::::::.::::: : CCDS10 PRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLFFCS 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE0 MLVTLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEK--SQEETDDG-----VEED :.:: .:: : ::: ::.:: . ::.: ::: :.::.:. :. ...: .: . CCDS10 GLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPVQNGCPESAMEMN 540 550 560 570 580 590 600 610 620 630 640 pF1KE0 YPEKSRGCL-KKAYDLFCGLQKG-----PKLTKEEEEALSKKLTDTSERPSWRTIVNINA :. : .. :::...: : ::.:: : ...: : :: ::: .::.:: CCDS10 EPQAPAPSLFRQCLLWFCGMSRGGVGSPPPLTQEEAAAAARRLEDISEDPSWARVVNLNA 600 610 620 630 640 650 650 pF1KE0 ILLLAVVVFIHGYYA .:..::.::. :.:: CCDS10 LLMMAVAVFLWGFYA 660 670 >>CCDS30709.2 SLC5A9 gene_id:200010|Hs108|chr1 (681 aa) initn: 2336 init1: 1279 opt: 2183 Z-score: 2690.0 bits: 508.1 E(32554): 1.6e-143 Smith-Waterman score: 2337; 51.8% identity (79.7% similar) in 654 aa overlap (25-659:34-681) 10 20 30 40 50 pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGT .: ::::.::::. :.:::.:. ....::: CCDS30 ELAAMGPGASGDGVRTETAPHIALDSRVGLHAYDISVVVIYFVFVIAVGIWSSIRASRGT 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE0 IGGFFLAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGW :::.:::::.:.:::.::::..::.::. ..::::::::.:.:. :::... .:: ::: CCDS30 IGGYFLAGRSMSWWPIGASLMSSNVGSGLFIGLAGTGAAGGLAVGGFEWNATWLLLALGW 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 IFVPIYIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALG .:::.:: .::.:::.::::::::.:.:::.:.:::.. . ::.:::.::.::..::: CCDS30 VFVPVYIAAGVVTMPQYLKKRFGGQRIQVYMSVLSLILYIFTKISTDIFSGALFIQMALG 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE0 LDLYLAIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTE .:::. :::..::::: .::: .:::::.:::.::. :...:: ..:..:: : .. . CCDS30 WNLYLSTGILLVVTAVYTIAGGLMAVIYTDALQTVIMVGGALVLMFLGFQDVGWYPGLEQ 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE0 KYVNATPSVVEGDNLTI-SASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCT .: .: : :.:. ...:. :: :.:::.:: :.:::::::.:::. . : : ::: CCDS30 RYRQAIP------NVTVPNTTCHLPRPDAFHILRDPVSGDIPWPGLIFGLTVLATWCWCT 250 260 270 280 290 300 310 320 330 340 350 pF1KE0 NQVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVK .:::::: : .:..::.:.. .. .:::.::::..:::::::: :. : :.:: :. : . CCDS30 DQVIVQRSLSAKSLSHAKGGSVLGGYLKILPMFFIVMPGMISRALFPDEVGCVDPDVCQR 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE0 HCGVDVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKM ::. :::.: ::: .:. ::: ::::::..:..:.:::::::::::.:::::::.. .. CCDS30 ICGARVGCSNIAYPKLVMALMPVGLRGLMIAVIMAALMSSLTSIFNSSSTLFTIDVWQRF 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE0 RKQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVL :....:.::...::.::..:.:.::.:.:..: :..:::. : ....:::.:::.:.:.: CCDS30 RRKSTEQELMVVGRVFVVFLVVISILWIPIIQSSNSGQLFDYIQAVTSYLAPPITALFLL 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE0 AIFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVL :::::::.: ::::::. ::..::.::: ::.: . .: . : .. :::::.:.: CCDS30 AIFCKRVTEPGAFWGLVFGLGVGLLRMILEFSYPAPACGEVDRRPAVLKDFHYLYFAILL 480 490 500 510 520 530 540 550 560 570 580 pF1KE0 FFGSMLVTLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKSQEETD--------- . .: . .:: : :::. .: :: : :: ... .:.:.. : .. CCDS30 CGLTAIVIVIVSLCTTPIPEEQLTRLTWWTRNCPLSELEKEAHESTPEISERPAGECPAG 540 550 560 570 580 590 590 600 610 620 630 pF1KE0 DGVEED------YPEK-SRGCLKKAYDLFCGLQKGPK--LTKEEEEALSKKLTDTSERPS :. :. :: ::. : .. ::::. :. :. :. :: .:::. :.: CCDS30 GGAAENSSLGQEQPEAPSRSWGKLLWSWFCGLSGTPEQALSPAEKAALEQKLTSIEEEPL 600 610 620 630 640 650 640 650 pF1KE0 WRTIVNINAILLLAVVVFIHGYYA :: . ::::.::::. .:. ::.: CCDS30 WRHVCNINAVLLLAINIFLWGYFA 660 670 680 >>CCDS10625.1 SLC5A11 gene_id:115584|Hs108|chr16 (675 aa) initn: 2089 init1: 1229 opt: 2131 Z-score: 2625.8 bits: 496.2 E(32554): 6.1e-140 Smith-Waterman score: 2185; 49.2% identity (75.6% similar) in 677 aa overlap (13-659:7-675) 10 20 30 40 50 pF1KE0 MASTVSPSTIAETPEPP---PLSDHIRNA---ADISVIVIYFLVVMAVGLWAMLKTNRGT .:.:: ::. ... .::.:.:.::: :.:::::. .::.: : CCDS10 MESGTSSPQPPQLDPLDAFPQKGLEPGDIAVLVLYFLFVLAVGLWSTVKTKRDT 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 IGGFFLAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGW . :.:::: ::.:::.::::::::.::.:..::::.:::.:... ..: .. .:.:.: CCDS10 VKGYFLAGGDMVWWPVGASLFASNVGSGHFIGLAGSGAATGISVSAYELNGLFSVLMLAW 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 IFVPIYIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALG ::.:::: . : ::::::.::::: :. . :..: ::: . ::.:..::::::. .: CCDS10 IFLPIYIAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYIFTKISVDMYAGAIFIQQSLH 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 LDLYLAIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTE ::::::: :::.:::::..::::.:::::.:::.:::::.. :::..: :::.:.. : CCDS10 LDLYLAIVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIGALTLMGYSFAAVGGMEGLKE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 KYVNATPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTN :: : : : . ..:: :: :.:::::: .:.:.::::..::: : .::::::. CCDS10 KYFLALAS-----NRSENSSCGLPREDAFHIFRDPLTSDLPWPGVLFGMSIPSLWYWCTD 240 250 260 270 280 300 310 320 330 340 350 pF1KE0 QVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKH :::::: : .:..::.:.. .: ::::.::.:.::.:::.::::. :.:::. : : : CCDS10 QVIVQRTLAAKNLSHAKGGALMAAYLKVLPLFIMVFPGMVSRILFPDQVACADPEICQKI 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE0 CGVDVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMR :. ::.. ::: .::::.: ::::::..::.:.::::::::::::::.::.::....: CCDS10 CSNPSGCSDIAYPKLVLELLPTGLRGLMMAVMVAALMSSLTSIFNSASTIFTMDLWNHLR 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE0 KQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLA .::::::.:.::.:::::..:::.:.:.::.::.:::. : .:::::: ::.:.::... CCDS10 PRASEKELMIVGRVFVLLLVLVSILWIPVVQASQGGQLFIYIQSISSYLQPPVAVVFIMG 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE0 IFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLF : ::.::.::::::. :: .::.:.. .: : : :.. : .. ..::::::..: CCDS10 CFWKRTNEKGAFWGLISGLLLGLVRLVLDFIYVQPRCDQPDERPVLVKSIHYLYFSMILS 470 480 490 500 510 520 540 550 560 570 580 pF1KE0 FGSMLVTLGISLLTKPIPDVHLYRLCWVLRNS--TEERIDIDAEEKSQEETDDGVEE--- ..... .: .:.: . .: : :.. .... : : ...:. : CCDS10 TVTLITVSTVSWFTEPPSKEMVSHLTWFTRHDPVVQKEQAPPAAPLSLTLSQNGMPEASS 530 540 550 560 570 580 590 600 610 620 630 pF1KE0 ----------DYPEKSRGC--------LKKAYDLFCGLQ-KGPKLTKEEEEALSKKLTDT . :...: . :: .::.: :: . . ::. ... CCDS10 SSSVQFEMVQENTSKTHSCDMTPKQSKVVKAILWLCGIQEKGKEELPARAEAI---IVSL 590 600 610 620 630 640 640 650 pF1KE0 SERPSWRTIVNINAILLLAVVVFIHGYYA : : .:....: :. .. ..:: ::.: CCDS10 EENPLVKTLLDVNLIFCVSCAIFIWGYFA 650 660 670 >>CCDS42275.1 SLC5A10 gene_id:125206|Hs108|chr17 (596 aa) initn: 2012 init1: 1198 opt: 2019 Z-score: 2488.3 bits: 470.6 E(32554): 2.8e-132 Smith-Waterman score: 2019; 51.8% identity (82.5% similar) in 537 aa overlap (25-561:17-548) 10 20 30 40 50 60 pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL ..::: ::..:: . .:::.:. ...:.:..:.:: CCDS42 MAANSTSDLHTPGTQLSVADIIVITVYFALNVAVGIWSSCRASRNTVNGYFL 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY :::::.:::.:::::::. ::. ..::::.:::.:.:.. :::... .:: :.:.::::: CCDS42 AGRDMTWWPIGASLFASSEGSGLFIGLAGSGAAGGLAVAGFEWNATYVLLALAWVFVPIY 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA :.: ..:.:::..::.::.:...:::.:::.. : :: :..:::.:... :: ..::. CCDS42 ISSEIVTLPEYIQKRYGGQRIRMYLSVLSLLLSVFTKISLDLYAGALFVHICLGWNFYLS 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE0 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT .. :..::.:: .::::.:::::.:::.::..:. :: ::...::: .. :..: CCDS42 TILTLGITALYTIAGGLAAVIYTDALQTLIMVVGAVILTIKAFDQIGGYGQLEAAYAQAI 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE0 PSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVIVQR :: ...:. ::.:..:.::: :::.:: :. ::. : : :::::.:::::: CCDS42 PS-----RTIANTTCHLPRTDAMHMFRDPHTGDLPWTGMTFGLTIMATWYWCTDQVIVQR 240 250 260 270 280 310 320 330 340 350 360 pF1KE0 CLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGVDVG : ..:..:.::. :. .:::.::: :..::::::: :. : :.:::::::.. ::..:: CCDS42 SLSARDLNHAKAGSILASYLKMLPMGLIIMPGMISRALFPDDVGCVVPSECLRACGAEVG 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE0 CTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQASEK :.: ::: .:.:::: ::::::..::::.:::::::::::.:::::.:.. ..: ...:. CCDS42 CSNIAYPKLVMELMPIGLRGLMIAVMLAALMSSLTSIFNSSSTLFTMDIWRRLRPRSGER 350 360 370 380 390 400 430 440 450 460 470 480 pF1KE0 ELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFCKRV :::..::. .. : ::..:.:..: :..:::. : .:..: :.::..:::::..: .:. CCDS42 ELLLVGRLVIVALIGVSVAWIPVLQDSNSGQLFIYMQSVTSSLAPPVTAVFVLGVFWRRA 410 420 430 440 450 460 490 500 510 520 530 540 pF1KE0 NEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGSMLV :::::::::..::..: :.. :: . : :.. : .. ..:::.:...:: : : CCDS42 NEQGAFWGLIAGLVVGATRLVLEFLNPAPPCGEPDTRPAVLGSIHYLHFAVALFALSGAV 470 480 490 500 510 520 550 560 570 580 590 600 pF1KE0 TLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKSQEETDDGVEEDYPEKSRGCLK ... :::: : .:.. : : CCDS42 VVAGSLLTPPPQSVQIENLTWWTLAQDVPLGTKAGDGQTPQKHAFWARVCGFNAILLMCV 530 540 550 560 570 580 >>CCDS58439.1 SLC5A11 gene_id:115584|Hs108|chr16 (611 aa) initn: 1927 init1: 1229 opt: 1957 Z-score: 2411.6 bits: 456.4 E(32554): 5.3e-128 Smith-Waterman score: 2011; 49.3% identity (75.6% similar) in 619 aa overlap (65-659:1-611) 40 50 60 70 80 90 pF1KE0 YFLVVMAVGLWAMLKTNRGTIGGFFLAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAAS :.:::.::::::::.::.:..::::.:::. CCDS58 MVWWPVGASLFASNVGSGHFIGLAGSGAAT 10 20 30 100 110 120 130 140 150 pF1KE0 GVATVTFEWTSSVMLLILGWIFVPIYIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICV :... ..: .. .:.:.:::.:::: . : ::::::.::::: :. . :..: ::: . CCDS58 GISVSAYELNGLFSVLMLAWIFLPIYIAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYI 40 50 60 70 80 90 160 170 180 190 200 210 pF1KE0 VLLISADIFAGAIFIKLALGLDLYLAIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIG ::.:..::::::. .: ::::::: :::.:::::..::::.:::::.:::.::::: CCDS58 FTKISVDMYAGAIFIQQSLHLDLYLAIVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIG 100 110 120 130 140 150 220 230 240 250 260 270 pF1KE0 SFILMGFAFNEVGGYESFTEKYVNATPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDI .. :::..: :::.:.. ::: : : : . ..:: :: :.:::::: .:.:. CCDS58 ALTLMGYSFAAVGGMEGLKEKYFLALAS-----NRSENSSCGLPREDAFHIFRDPLTSDL 160 170 180 190 200 280 290 300 310 320 330 pF1KE0 PWPGIIFGMPITALWYWCTNQVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMI ::::..::: : .::::::.:::::: : .:..::.:.. .: ::::.::.:.::.:::. CCDS58 PWPGVLFGMSIPSLWYWCTDQVIVQRTLAAKNLSHAKGGALMAAYLKVLPLFIMVFPGMV 210 220 230 240 250 260 340 350 360 370 380 390 pF1KE0 SRILYTDMVACVVPSECVKHCGVDVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSL ::::. :.:::. : : : :. ::.. ::: .::::.: ::::::..::.:.::::: CCDS58 SRILFPDQVACADPEICQKICSNPSGCSDIAYPKLVLELLPTGLRGLMMAVMVAALMSSL 270 280 290 300 310 320 400 410 420 430 440 450 pF1KE0 TSIFNSASTLFTIDLYTKMRKQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIH :::::::::.::.::....: .::::::.:.::.:::::..:::.:.:.::.::.:::. CCDS58 TSIFNSASTIFTMDLWNHLRPRASEKELMIVGRVFVLLLVLVSILWIPVVQASQGGQLFI 330 340 350 360 370 380 460 470 480 490 500 510 pF1KE0 YTESISSYLGPPIAAVFVLAIFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAP : .:::::: ::.:.::... : ::.::.::::::. :: .::.:.. .: : : : CCDS58 YIQSISSYLQPPVAVVFIMGCFWKRTNEKGAFWGLISGLLLGLVRLVLDFIYVQPRCDQP 390 400 410 420 430 440 520 530 540 550 560 570 pF1KE0 SNCPKIICGVHYLYFSIVLFFGSMLVTLGISLLTKPIPDVHLYRLCWVLRNS--TEERID .. : .. ..::::::..: ..... .: .:.: . .: : :.. .... CCDS58 DERPVLVKSIHYLYFSMILSTVTLITVSTVSWFTEPPSKEMVSHLTWFTRHDPVVQKEQA 450 460 470 480 490 500 580 590 600 610 pF1KE0 IDAEEKSQEETDDGVEE-------------DYPEKSRGC--------LKKAYDLFCGLQ- : : ...:. : . :...: . :: .::.: CCDS58 PPAAPLSLTLSQNGMPEASSSSSVQFEMVQENTSKTHSCDMTPKQSKVVKAILWLCGIQE 510 520 530 540 550 560 620 630 640 650 pF1KE0 KGPKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVFIHGYYA :: . . ::. ... : : .:....: :. .. ..:: ::.: CCDS58 KGKEELPARAEAI---IVSLEENPLVKTLLDVNLIFCVSCAIFIWGYFA 570 580 590 600 610 >>CCDS33549.1 SLC5A3 gene_id:6526|Hs108|chr21 (718 aa) initn: 1924 init1: 1073 opt: 1933 Z-score: 2381.0 bits: 451.0 E(32554): 2.7e-126 Smith-Waterman score: 1933; 48.5% identity (80.7% similar) in 569 aa overlap (23-583:4-571) 10 20 30 40 50 60 pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFFL . ..:::.....::..:: .:..:: :.::.:..:.:: CCDS33 MRAVLDTADIAIVALYFILVMCIGFFAMWKSNRSTVSGYFL 10 20 30 40 70 80 90 100 110 120 pF1KE0 AGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPIY :::.:.: .:::::.:::::.:..::::.::::: :. ..:... ..: .:::.:.::: CCDS33 AGRSMTWVAIGASLFVSNIGSEHFIGLAGSGAASGFAVGAWEFNALLLLQLLGWVFIPIY 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE0 IKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYLA :.:::.::::::.:::::.:.:::.. :::.. . .:.:...::.::. .:: .::.. CCDS33 IRSGVYTMPEYLSKRFGGHRIQVYFAALSLILYIFTKLSVDLYSGALFIQESLGWNLYVS 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE0 IFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNAT ...:..:::. :.::::..::::::::...:.::.. :: ... :.::.: ..:. :. CCDS33 VILLIGMTALLTVTGGLVAVIYTDTLQALLMIIGALTLMIISIMEIGGFEEVKRRYMLAS 170 180 190 200 210 220 250 260 270 280 290 pF1KE0 P---SVVEGDNLTISASC-YTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQV : :.. ::. . :: .:. ......:. . :.::::.:.:. ...::::..:: CCDS33 PDVTSILLTYNLSNTNSCNVSPKKEALKMLRNPTDEDVPWPGFILGQTPASVWYWCADQV 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE0 IVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCG :::: : .:...:.:.. .: ..:::::::..:.::::::::.:: .::. : .:. :: CCDS33 IVQRVLAAKNIAHAKGSTLMAGFLKLLPMFIIVVPGMISRILFTDDIACINPEHCMLVCG 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE0 VDVGCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQ .::.: ::: .:..:.: ::::::..::.:.:::.: ::::::::.::.:.: .::. CCDS33 SRAGCSNIAYPRLVMKLVPVGLRGLMMAVMIAALMSDLDSIFNSASTIFTLDVYKLIRKS 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE0 ASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIF :: .::.:.::::: ...:.::.:::.. :.::. : . ...:: ::.::.:.:::: CCDS33 ASSRELMIVGRIFVAFMVVISIAWVPIIVEMQGGQMYLYIQEVADYLTPPVAALFLLAIF 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE0 CKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFG :: ::::::.: :.:...: .:.: ::: . : :.: : .: .::.: . ::. CCDS33 WKRCNEQGAFYGGMAGFVLGAVRLILAFAYRAPECDQPDNRPGFIKDIHYMYVATGLFWV 470 480 490 500 510 520 540 550 560 570 580 590 pF1KE0 SMLVTLGISLLTKPIPDVHLYRLC--WVLRNSTEERIDIDAEE--KSQEETDDGVEEDYP . :.:. .:::: : : . : : .: . .. :: : ::.. CCDS33 TGLITVIVSLLTPP-PTKEQIRTTTFWSKKNLVVKENCSPKEEPYKMQEKSILRCSENNE 530 540 550 560 570 580 600 610 620 630 640 650 pF1KE0 EKSRGCLKKAYDLFCGLQKGPKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVV CCDS33 TINHIIPNGKSEDSIKGLQPEDVNLLVTCREEGNPVASLGHSEAETPVDAYSNGQAALMG 590 600 610 620 630 640 >>CCDS44136.1 SLC5A9 gene_id:200010|Hs108|chr1 (706 aa) initn: 2323 init1: 1279 opt: 1826 Z-score: 2248.9 bits: 426.5 E(32554): 6e-119 Smith-Waterman score: 2277; 49.9% identity (76.7% similar) in 679 aa overlap (25-659:34-706) 10 20 30 40 50 pF1KE0 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGT .: ::::.::::. :.:::.:. ....::: CCDS44 ELAAMGPGASGDGVRTETAPHIALDSRVGLHAYDISVVVIYFVFVIAVGIWSSIRASRGT 10 20 30 40 50 60 60 70 80 90 100 pF1KE0 IGGFFLAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWT---------- :::.:::::.:.:::.::::..::.::. ..::::::::.:.:. :::. CCDS44 IGGYFLAGRSMSWWPIGASLMSSNVGSGLFIGLAGTGAAGGLAVGGFEWNMRKSRSGGDR 70 80 90 100 110 120 110 120 130 140 pF1KE0 ---------------SSVMLLILGWIFVPIYIKSGVMTMPEYLKKRFGGERLQVYLSILS .. .:: :::.:::.:: .::.:::.::::::::.:.:::.:.:: CCDS44 GIHPRSHGRTGVRSQATWLLLALGWVFVPVYIAAGVVTMPQYLKKRFGGQRIQVYMSVLS 130 140 150 160 170 180 150 160 170 180 190 200 pF1KE0 LFICVVLLISADIFAGAIFIKLALGLDLYLAIFILLAMTAVYTTTGGLASVIYTDTLQTI :.. . ::.:::.::.::..::: .:::. :::..::::: .::: .:::::.:::. CCDS44 LILYIFTKISTDIFSGALFIQMALGWNLYLSTGILLVVTAVYTIAGGLMAVIYTDALQTV 190 200 210 220 230 240 210 220 230 240 250 260 pF1KE0 IMLIGSFILMGFAFNEVGGYESFTEKYVNATPSVVEGDNLTI-SASCYTPRADSFHIFRD ::. :...:: ..:..:: : .. ..: .: : :.:. ...:. :: :.:::.:: CCDS44 IMVGGALVLMFLGFQDVGWYPGLEQRYRQAIP------NVTVPNTTCHLPRPDAFHILRD 250 260 270 280 290 270 280 290 300 310 320 pF1KE0 AVTGDIPWPGIIFGMPITALWYWCTNQVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLM :.:::::::.:::. . : : :::.:::::: : .:..::.:.. .. .:::.::::.. CCDS44 PVSGDIPWPGLIFGLTVLATWCWCTDQVIVQRSLSAKSLSHAKGGSVLGGYLKILPMFFI 300 310 320 330 340 350 330 340 350 360 370 380 pF1KE0 VMPGMISRILYTDMVACVVPSECVKHCGVDVGCTNYAYPTMVLELMPQGLRGLMLSVMLA :::::::: :. : :.:: :. : . ::. :::.: ::: .:. ::: ::::::..:..: CCDS44 VMPGMISRALFPDEVGCVDPDVCQRICGARVGCSNIAYPKLVMALMPVGLRGLMIAVIMA 360 370 380 390 400 410 390 400 410 420 430 440 pF1KE0 SLMSSLTSIFNSASTLFTIDLYTKMRKQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQ .:::::::::::.:::::::.. ..:....:.::...::.::..:.:.::.:.:..: :. CCDS44 ALMSSLTSIFNSSSTLFTIDVWQRFRRKSTEQELMVVGRVFVVFLVVISILWIPIIQSSN 420 430 440 450 460 470 450 460 470 480 490 500 pF1KE0 NGQLIHYTESISSYLGPPIAAVFVLAIFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGT .:::. : ....:::.:::.:.:.::::::::.: ::::::. ::..::.::: ::.: . CCDS44 SGQLFDYIQAVTSYLAPPITALFLLAIFCKRVTEPGAFWGLVFGLGVGLLRMILEFSYPA 480 490 500 510 520 530 510 520 530 540 550 560 pF1KE0 GSCLAPSNCPKIICGVHYLYFSIVLFFGSMLVTLGISLLTKPIPDVHLYRLCWVLRNSTE .: . : .. :::::.:.: . .: . .:: : :::. .: :: : :: CCDS44 PACGEVDRRPAVLKDFHYLYFAILLCGLTAIVIVIVSLCTTPIPEEQLTRLTWWTRNCPL 540 550 560 570 580 590 570 580 590 600 610 pF1KE0 ERIDIDAEEKSQEETD---------DGVEED------YPEK-SRGCLKKAYDLFCGLQKG ... .:.:.. : .. :. :. :: ::. : .. ::::. CCDS44 SELEKEAHESTPEISERPAGECPAGGGAAENSSLGQEQPEAPSRSWGKLLWSWFCGLSGT 600 610 620 630 640 650 620 630 640 650 pF1KE0 PK--LTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVFIHGYYA :. :. :. :: .:::. :.: :: . ::::.::::. .:. ::.: CCDS44 PEQALSPAEKAALEQKLTSIEEEPLWRHVCNINAVLLLAINIFLWGYFA 660 670 680 690 700 659 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 14:13:19 2016 done: Thu Nov 3 14:13:20 2016 Total Scan time: 2.830 Total Display time: 0.160 Function used was FASTA [36.3.4 Apr, 2011]