FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8725, 664 aa 1>>>pF1KB8725 664 - 664 aa - 664 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3977+/-0.00116; mu= 19.3503+/- 0.069 mean_var=77.4402+/-16.254, 0's: 0 Z-trim(102.8): 34 B-trim: 0 in 0/48 Lambda= 0.145744 statistics sampled from 7086 (7109) to 7086 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.558), E-opt: 0.2 (0.218), width: 16 Scan time: 3.450 The best scores are: opt bits E(32554) CCDS13902.1 SLC5A1 gene_id:6523|Hs108|chr22 ( 664) 4379 931.1 0 CCDS58805.1 SLC5A1 gene_id:6523|Hs108|chr22 ( 537) 3541 754.8 7e-218 CCDS13903.1 SLC5A4 gene_id:6527|Hs108|chr22 ( 659) 3222 687.8 1.3e-197 CCDS10714.1 SLC5A2 gene_id:6524|Hs108|chr16 ( 672) 2809 601.0 1.8e-171 CCDS30709.2 SLC5A9 gene_id:200010|Hs108|chr1 ( 681) 2416 518.3 1.4e-146 CCDS10625.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 675) 2260 485.5 1e-136 CCDS42275.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 596) 2235 480.2 3.5e-135 CCDS58439.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 611) 2110 454.0 2.9e-127 CCDS33549.1 SLC5A3 gene_id:6526|Hs108|chr21 ( 718) 2109 453.8 3.8e-127 CCDS44136.1 SLC5A9 gene_id:200010|Hs108|chr1 ( 706) 2006 432.1 1.2e-120 CCDS58438.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 605) 1679 363.3 5.5e-100 CCDS58437.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 640) 1663 360.0 5.9e-99 CCDS59278.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 569) 1418 308.4 1.7e-83 CCDS59277.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 560) 1317 287.2 4.2e-77 CCDS11201.2 SLC5A10 gene_id:125206|Hs108|chr17 ( 612) 924 204.6 3.4e-52 CCDS58440.1 SLC5A11 gene_id:115584|Hs108|chr16 ( 519) 714 160.4 5.9e-39 CCDS74008.1 SLC5A10 gene_id:125206|Hs108|chr17 ( 566) 589 134.1 5.1e-31 CCDS12368.1 SLC5A5 gene_id:6528|Hs108|chr19 ( 643) 286 70.5 8.6e-12 CCDS7860.2 SLC5A12 gene_id:159963|Hs108|chr11 ( 618) 281 69.4 1.7e-11 >>CCDS13902.1 SLC5A1 gene_id:6523|Hs108|chr22 (664 aa) initn: 4379 init1: 4379 opt: 4379 Z-score: 4976.1 bits: 931.1 E(32554): 0 Smith-Waterman score: 4379; 100.0% identity (100.0% similar) in 664 aa overlap (1-664:1-664) 10 20 30 40 50 60 pF1KB8 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFFL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 AGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPIY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 AGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPIY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 IKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 IKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYLA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 IFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 IFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKAI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 PTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQVIVQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQVIVQR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 CLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCGTKVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 CLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCGTKVG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 CTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVRKRASEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 CTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVRKRASEK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 ELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLAIFWKRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 ELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLAIFWKRV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB8 NEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILFAISFIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 NEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILFAISFIT 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB8 IVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEENIQEGPKETIEIETQVPEKKKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 IVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEENIQEGPKETIEIETQVPEKKKG 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB8 IFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSEKPLWRTVLNVNGIILVTVAVFCH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 IFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSEKPLWRTVLNVNGIILVTVAVFCH 610 620 630 640 650 660 pF1KB8 AYFA :::: CCDS13 AYFA >>CCDS58805.1 SLC5A1 gene_id:6523|Hs108|chr22 (537 aa) initn: 3541 init1: 3541 opt: 3541 Z-score: 4025.2 bits: 754.8 E(32554): 7e-218 Smith-Waterman score: 3541; 100.0% identity (100.0% similar) in 537 aa overlap (128-664:1-537) 100 110 120 130 140 150 pF1KB8 IGGFEWNALVLVVVLGWLFVPIYIKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTK :::::::::::::::::::::::::::::: CCDS58 MPEYLRKRFGGQRIQVYLSLLSLLLYIFTK 10 20 30 160 170 180 190 200 210 pF1KB8 ISADIFSGAIFINLALGLNLYLAIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 ISADIFSGAIFINLALGLNLYLAIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLI 40 50 60 70 80 90 220 230 240 250 260 270 pF1KB8 LTGFAFHEVGGYDAFMEKYMKAIPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 LTGFAFHEVGGYDAFMEKYMKAIPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWP 100 110 120 130 140 150 280 290 300 310 320 330 pF1KB8 GFIFGMSILTLWYWCTDQVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GFIFGMSILTLWYWCTDQVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRI 160 170 180 190 200 210 340 350 360 370 380 390 pF1KB8 LYTEKIACVVPSECEKYCGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 LYTEKIACVVPSECEKYCGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSI 220 230 240 250 260 270 400 410 420 430 440 450 pF1KB8 FNSASTLFTMDIYAKVRKRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 FNSASTLFTMDIYAKVRKRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQ 280 290 300 310 320 330 460 470 480 490 500 510 pF1KB8 SITSYLGPPIAAVFLLAIFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SITSYLGPPIAAVFLLAIFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNC 340 350 360 370 380 390 520 530 540 550 560 570 pF1KB8 PTIICGVHYLYFAIILFAISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 PTIICGVHYLYFAIILFAISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEE 400 410 420 430 440 450 580 590 600 610 620 630 pF1KB8 ENIQEGPKETIEIETQVPEKKKGIFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 ENIQEGPKETIEIETQVPEKKKGIFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSE 460 470 480 490 500 510 640 650 660 pF1KB8 KPLWRTVLNVNGIILVTVAVFCHAYFA ::::::::::::::::::::::::::: CCDS58 KPLWRTVLNVNGIILVTVAVFCHAYFA 520 530 >>CCDS13903.1 SLC5A4 gene_id:6527|Hs108|chr22 (659 aa) initn: 3266 init1: 2919 opt: 3222 Z-score: 3661.4 bits: 687.8 E(32554): 1.3e-197 Smith-Waterman score: 3222; 70.8% identity (90.2% similar) in 664 aa overlap (3-664:2-659) 10 20 30 40 50 pF1KB8 MDSSTWSPKTTAVT-RPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFF .:: ::.: : : .: . ::::::::.:::::.::::::::::..:::::.:::: CCDS13 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAMLKTNRGTIGGFF 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 LAGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPI ::::.:.:::.:::::::::::.:.:::::::::::.: :::.. :....:::.:::: CCDS13 LAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLLILGWIFVPI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 YIKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYL :::.::.::::::.:::::.:.:::::.:::.. . ::::::.:::::.:::::.::: CCDS13 YIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLDLYL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 AIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKA :::.:::.::.:: :::::.:::::::::.:::.::.:: ::::.:::::..: :::..: CCDS13 AIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKYVNA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 IPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQVIVQ :..: : :.. .:::::::::::::: .:::.::::.:::: : .::::::.::::: CCDS13 TPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALWYWCTNQVIVQ 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 RCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCGTKV ::: .:.:::::..::.:.::::.:::.:::::::::::::. .:::::::: :.::. : CCDS13 RCLCGKDMSHVKAACIMCAYLKLLPMFLMVMPGMISRILYTDMVACVVPSECVKHCGVDV 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB8 GCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVRKRASE :::: ::::.:.::::.::::::::::::::::::::::::::::::.:.:.:.::.::: CCDS13 GCTNYAYPTMVLELMPQGLRGLMLSVMLASLMSSLTSIFNSASTLFTIDLYTKMRKQASE 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB8 KELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLAIFWKR :::.::::.:.:.: .::.:::.:: .:.:::. : .::.:::::::::::.:::: :: CCDS13 KELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIAAVFVLAIFCKR 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB8 VNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILFAISFI ::: ::::::..:: .:. :::::::::::::. ::::: ::::::::::.:.:: :.. CCDS13 VNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLYFSIVLFFGSML 480 490 500 510 520 530 540 550 560 570 580 590 pF1KB8 TIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEENIQEGPKETIE-IETQVPEKK . . :::::::::::::::::: :::: :::::.::::.. :: :: . .: . :::. CCDS13 VTLGISLLTKPIPDVHLYRLCWVLRNSTEERIDIDAEEKS-QE---ETDDGVEEDYPEKS 540 550 560 570 580 590 600 610 620 630 640 650 pF1KB8 KGIFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSEKPLWRTVLNVNGIILVTVAVF .: ...:::::::: :.: ::.:.:::.:.. :.:::::.: :::..:.:.:.:..:.:: CCDS13 RGCLKKAYDLFCGL-QKG-PKLTKEEEEALSKKLTDTSERPSWRTIVNINAILLLAVVVF 600 610 620 630 640 650 660 pF1KB8 CHAYFA :.:.: CCDS13 IHGYYA >>CCDS10714.1 SLC5A2 gene_id:6524|Hs108|chr16 (672 aa) initn: 2712 init1: 1600 opt: 2809 Z-score: 3192.0 bits: 601.0 E(32554): 1.8e-171 Smith-Waterman score: 2809; 60.4% identity (85.6% similar) in 659 aa overlap (22-664:19-672) 10 20 30 40 50 60 pF1KB8 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFFL :: : ::: .:. ::..:..::::.: ::::::::.:: CCDS10 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLWSMCRTNRGTVGGYFL 10 20 30 40 50 70 80 90 100 110 120 pF1KB8 AGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPIY :::::::::.:::::::::::::::::::::::::.:..::::::: .:..:::::.:.: CCDS10 AGRSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVY 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB8 IKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYLA . :::.:::.::::::::.::..:::.:::.::::::::.:.::::.::. ::: :.: . CCDS10 LTAGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYAS 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB8 IFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKAI .. ::.:: .::.::::::..::::.:: ..: :. :: :.::::::::.....::. : CCDS10 VIALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAA 180 190 200 210 220 230 250 260 270 280 290 pF1KB8 PTI-VSD----GN-TTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTD .. ::. :: ..: :: :: ::.:..: :.:::::::....:..:.. ::::.: CCDS10 TSLTVSEDPAVGNISSF---CYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSD 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 QVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKY ::::::::..:...:.:.:::::::::: :::.:::::::::::: ...::::: :.. CCDS10 QVIVQRCLAGKSLTHIKAGCILCGYLKLTPMFLMVMPGMISRILYPDEVACVVPEVCRRV 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB8 CGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVR :::.:::.::::: :::.:::::::::::.::::.:::::.:::::.:::::::::...: CCDS10 CGTEVGCSNIAYPRLVVKLMPNGLRGLMLAVMLAALMSSLASIFNSSSTLFTMDIYTRLR 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB8 KRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLA ::...::...:::... .. .:.::.:.::.::.::::::::...:::.::..:::.:: CCDS10 PRAGDRELLLVGRLWVVFIVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAVFVLA 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB8 IFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILF .: :::: ::::::: :::.:..:.: ::..:.:::..:: ::...::::::::::.:: CCDS10 LFVPRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFAIVLF 480 490 500 510 520 530 540 550 560 570 580 pF1KB8 AISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEEN-----IQEG-PKETI : . ...:: : ::: ::.:: .:::.::::: ::::.:.. .:.: :. .. CCDS10 FCSGLLTLTVSLCTAPIPRKHLHRLVFSLRHSKEEREDLDADEQQGSSLPVQNGCPESAM 540 550 560 570 580 590 590 600 610 620 630 640 pF1KB8 EI-ETQVPEKKKGIFRRAYDLFCGLEQHGA---PKMTEEEEKAMKMKMTDTSEKPLWRTV :. : :.: . .::. :::. . :. : .:.:: : .. : :: : : : CCDS10 EMNEPQAPAPS--LFRQCLLWFCGMSRGGVGSPPPLTQEEAAAAARRLEDISEDPSWARV 600 610 620 630 640 650 650 660 pF1KB8 LNVNGIILVTVAVFCHAYFA .:.:......:::: ...: CCDS10 VNLNALLMMAVAVFLWGFYA 660 670 >>CCDS30709.2 SLC5A9 gene_id:200010|Hs108|chr1 (681 aa) initn: 2563 init1: 1409 opt: 2416 Z-score: 2745.3 bits: 518.3 E(32554): 1.4e-146 Smith-Waterman score: 2541; 56.2% identity (82.3% similar) in 655 aa overlap (25-664:34-681) 10 20 30 40 50 pF1KB8 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGT .: :::..::::: :.:::.:. . ..::: CCDS30 ELAAMGPGASGDGVRTETAPHIALDSRVGLHAYDISVVVIYFVFVIAVGIWSSIRASRGT 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB8 VGGFFLAGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGW .::.::::::: ::::::::..::.::: :.::::::::.:.:.::::::: :...::: CCDS30 IGGYFLAGRSMSWWPIGASLMSSNVGSGLFIGLAGTGAAGGLAVGGFEWNATWLLLALGW 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB8 LFVPIYIKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALG .:::.:: :::::::.::.:::::::::::.:.:::.::::::::.::::::.::..::: CCDS30 VFVPVYIAAGVVTMPQYLKKRFGGQRIQVYMSVLSLILYIFTKISTDIFSGALFIQMALG 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB8 LNLYLAIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFME ::::. .::..::.:::.::: ::::::.::::::. :.:.: ..:..:: : .. . CCDS30 WNLYLSTGILLVVTAVYTIAGGLMAVIYTDALQTVIMVGGALVLMFLGFQDVGWYPGLEQ 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB8 KYMKAIPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTD .: .:::. :. ::: :. :: :.:::.:::..::.::::.:::...:. : :::: CCDS30 RYRQAIPN-VTVPNTT----CHLPRPDAFHILRDPVSGDIPWPGLIFGLTVLATWCWCTD 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 QVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKY :::::: ::::..::.::: .: ::::..:::..:::::::: :. ....:: :. :.. CCDS30 QVIVQRSLSAKSLSHAKGGSVLGGYLKILPMFFIVMPGMISRALFPDEVGCVDPDVCQRI 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB8 CGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVR ::..:::.::::: ::. ::: ::::::..:..:.:::::::::::.:::::.:.. . : CCDS30 CGARVGCSNIAYPKLVMALMPVGLRGLMIAVIMAALMSSLTSIFNSSSTLFTIDVWQRFR 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB8 KRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLA ....:.:::..::.:.. :. ::: :.::.::..:::::::::..::::.:::.:.:::: CCDS30 RKSTEQELMVVGRVFVVFLVVISILWIPIIQSSNSGQLFDYIQAVTSYLAPPITALFLLA 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB8 IFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILF :: :::.::::::::..:: .:. ::: ::.: . .: : . :... :::::::.: CCDS30 IFCKRVTEPGAFWGLVFGLGVGLLRMILEFSYPAPACGEVDRRPAVLKDFHYLYFAILLC 480 490 500 510 520 530 540 550 560 570 580 pF1KB8 AISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEEN--IQEGPK------- ... :.::..:: : :::. .: :: : :: ... .:.: . :.: : CCDS30 GLTAIVIVIVSLCTTPIPEEQLTRLTWWTRNCPLSELEKEAHESTPEISERPAGECPAGG 540 550 560 570 580 590 590 600 610 620 630 pF1KB8 ---ETIEIETQVPEK-KKGIFRRAYDLFCGLEQHGAPK--MTEEEEKAMKMKMTDTSEKP :. . . :: ... . .. :::: :.:. .. :. :...:.:. :.: CCDS30 GAAENSSLGQEQPEAPSRSWGKLLWSWFCGL--SGTPEQALSPAEKAALEQKLTSIEEEP 600 610 620 630 640 650 640 650 660 pF1KB8 LWRTVLNVNGIILVTVAVFCHAYFA ::: : :.:...:... .: .::: CCDS30 LWRHVCNINAVLLLAINIFLWGYFA 660 670 680 >>CCDS10625.1 SLC5A11 gene_id:115584|Hs108|chr16 (675 aa) initn: 2309 init1: 1338 opt: 2260 Z-score: 2568.1 bits: 485.5 E(32554): 1e-136 Smith-Waterman score: 2322; 50.5% identity (78.6% similar) in 687 aa overlap (1-664:1-675) 10 20 30 40 50 pF1KB8 MDSSTWSPKTTAVTRPVETH-ELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFF :.:.: ::. . :... . . .::...:.::. :.:::::. .:.: :: :.: CCDS10 MESGTSSPQPPQLD-PLDAFPQKGLEPGDIAVLVLYFLFVLAVGLWSTVKTKRDTVKGYF 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 LAGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPI ::: .:::::.::::::::.:::::.::::.:::.::.....: :.: :..:.:.:.:: CCDS10 LAGGDMVWWPVGASLFASNVGSGHFIGLAGSGAATGISVSAYELNGLFSVLMLAWIFLPI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 YIKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYL :: . :.:::::::::::: :: . :..: :..:::::::.:...:::::. .: :.::: CCDS10 YIAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYIFTKISVDMYAGAIFIQQSLHLDLYL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 AIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKA :: ::::::.::..::::::::::.:::.:::.:.: : :..: :::.... :::. : CCDS10 AIVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIGALTLMGYSFAAVGGMEGLKEKYFLA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 IPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQVIVQ . . :.... : :: :.:::::::::.:::::: .::::: .:::::::::::: CCDS10 LASNRSENSS-----CGLPREDAFHIFRDPLTSDLPWPGVLFGMSIPSLWYWCTDQVIVQ 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 RCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCGTKV : :.:::.::.::: .. .:::..:.::::.:::.::::. ...::. : :.: :.. CCDS10 RTLAAKNLSHAKGGALMAAYLKVLPLFIMVFPGMVSRILFPDQVACADPEICQKICSNPS 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB8 GCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVRKRASE ::..:::: ::.::.:.::::::..::.:.::::::::::::::.::::.. ..: :::: CCDS10 GCSDIAYPKLVLELLPTGLRGLMMAVMVAALMSSLTSIFNSASTIFTMDLWNHLRPRASE 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB8 KELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLAIFWKR :::::.::.:.:.:. .:: :.:.::..:.:::: :::::.::: ::.:.::... :::: CCDS10 KELMIVGRVFVLLLVLVSILWIPVVQASQGGQLFIYIQSISSYLQPPVAVVFIMGCFWKR 420 430 440 450 460 470 480 490 500 510 520 530 pF1KB8 VNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILFAISFI .:: ::::::: :::.:. :.. .: : : .:.. :... ..:::::..:: ....: CCDS10 TNEKGAFWGLISGLLLGLVRLVLDFIYVQPRCDQPDERPVLVKSIHYLYFSMILSTVTLI 480 490 500 510 520 530 540 550 560 570 580 pF1KB8 TIVVISLLTKPIPDVHLYRLCWSLRNS----KEER-----IDLDAEEENIQEGPKET-IE :. ..: .:.: . .: : :.. ::. ..: .... :. . . .. CCDS10 TVSTVSWFTEPPSKEMVSHLTWFTRHDPVVQKEQAPPAAPLSLTLSQNGMPEASSSSSVQ 540 550 560 570 580 590 590 600 610 620 630 pF1KB8 IET------------QVPEKKKGIFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSE .: ..:...: . .: .::....: .. . : . .. : CCDS10 FEMVQENTSKTHSCDMTPKQSKVV--KAILWLCGIQEKGKEELPARAEAII----VSLEE 600 610 620 630 640 640 650 660 pF1KB8 KPLWRTVLNVNGIILVTVAVFCHAYFA .:: .:.:.:: :. :. :.: .::: CCDS10 NPLVKTLLDVNLIFCVSCAIFIWGYFA 650 660 670 >>CCDS42275.1 SLC5A10 gene_id:125206|Hs108|chr17 (596 aa) initn: 2225 init1: 1329 opt: 2235 Z-score: 2540.4 bits: 480.2 E(32554): 3.5e-135 Smith-Waterman score: 2235; 57.9% identity (86.0% similar) in 537 aa overlap (25-561:17-548) 10 20 30 40 50 60 pF1KB8 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFFL ..::: .:..::.. .:::.:. ..:.::.:.:: CCDS42 MAANSTSDLHTPGTQLSVADIIVITVYFALNVAVGIWSSCRASRNTVNGYFL 10 20 30 40 50 70 80 90 100 110 120 pF1KB8 AGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPIY :::.:.:::::::::::. ::: :.::::.:::.:.:..:::::: ....:.:.::::: CCDS42 AGRDMTWWPIGASLFASSEGSGLFIGLAGSGAAGGLAVAGFEWNATYVLLALAWVFVPIY 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB8 IKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYLA :.. .::.:::..::.:::::..:::.::::: .::::: :...::.:... :: :.::. CCDS42 ISSEIVTLPEYIQKRYGGQRIRMYLSVLSLLLSVFTKISLDLYAGALFVHICLGWNFYLS 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB8 IFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKAI .: :.:::::::.::::::::::.:::.::.::..::: :: ..::: . : .:: CCDS42 TILTLGITALYTIAGGLAAVIYTDALQTLIMVVGAVILTIKAFDQIGGYGQLEAAYAQAI 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB8 PTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQVIVQR :. . .::: :. ::.:..:.:::: :::::: :. ::..:.. :::::::::::: CCDS42 PS-RTIANTT----CHLPRTDAMHMFRDPHTGDLPWTGMTFGLTIMATWYWCTDQVIVQR 240 250 260 270 280 310 320 330 340 350 360 pF1KB8 CLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCGTKVG :::....:.:.: :: .:::..:: ...::::::: :. . ..::::::: . ::..:: CCDS42 SLSARDLNHAKAGSILASYLKMLPMGLIIMPGMISRALFPDDVGCVVPSECLRACGAEVG 290 300 310 320 330 340 370 380 390 400 410 420 pF1KB8 CTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVRKRASEK :.::::: ::.:::: ::::::..::::.:::::::::::.::::::::. ..: :..:. CCDS42 CSNIAYPKLVMELMPIGLRGLMIAVMLAALMSSLTSIFNSSSTLFTMDIWRRLRPRSGER 350 360 370 380 390 400 430 440 450 460 470 480 pF1KB8 ELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLAIFWKRV ::...::: :..:::.:.::.:..:...::::: :.::.:: :.::..:::.:..::.:. CCDS42 ELLLVGRLVIVALIGVSVAWIPVLQDSNSGQLFIYMQSVTSSLAPPVTAVFVLGVFWRRA 410 420 430 440 450 460 490 500 510 520 530 540 pF1KB8 NEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILFAISFIT :: ::::::: ::..: .:.. :: . : ::.. :... ..:::.::. :::.: . CCDS42 NEQGAFWGLIAGLVVGATRLVLEFLNPAPPCGEPDTRPAVLGSIHYLHFAVALFALSGAV 470 480 490 500 510 520 550 560 570 580 590 600 pF1KB8 IVVISLLTKPIPDVHLYRLCWSLRNSKEERIDLDAEEENIQEGPKETIEIETQVPEKKKG .:. :::: : .:.. : : CCDS42 VVAGSLLTPPPQSVQIENLTWWTLAQDVPLGTKAGDGQTPQKHAFWARVCGFNAILLMCV 530 540 550 560 570 580 >>CCDS58439.1 SLC5A11 gene_id:115584|Hs108|chr16 (611 aa) initn: 2167 init1: 1338 opt: 2110 Z-score: 2398.2 bits: 454.0 E(32554): 2.9e-127 Smith-Waterman score: 2172; 51.6% identity (79.1% similar) in 622 aa overlap (65-664:1-611) 40 50 60 70 80 90 pF1KB8 YFVVVMAVGLWAMFSTNRGTVGGFFLAGRSMVWWPIGASLFASNIGSGHFVGLAGTGAAS :::::.::::::::.:::::.::::.:::. CCDS58 MVWWPVGASLFASNVGSGHFIGLAGSGAAT 10 20 30 100 110 120 130 140 150 pF1KB8 GIAIGGFEWNALVLVVVLGWLFVPIYIKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYI ::.....: :.: :..:.:.:.:::: . :.:::::::::::: :: . :..: :..:: CCDS58 GISVSAYELNGLFSVLMLAWIFLPIYIAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYI 40 50 60 70 80 90 160 170 180 190 200 210 pF1KB8 FTKISADIFSGAIFINLALGLNLYLAIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVG :::::.:...:::::. .: :.::::: ::::::.::..::::::::::.:::.:::.: CCDS58 FTKISVDMYAGAIFIQQSLHLDLYLAIVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIG 100 110 120 130 140 150 220 230 240 250 260 270 pF1KB8 SLILTGFAFHEVGGYDAFMEKYMKAIPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDL .: : :..: :::.... :::. :. . : . . .: :: :.:::::::::.:: CCDS58 ALTLMGYSFAAVGGMEGLKEKYFLALAS-----NRSENSSCGLPREDAFHIFRDPLTSDL 160 170 180 190 200 280 290 300 310 320 330 pF1KB8 PWPGFIFGMSILTLWYWCTDQVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMI :::: .::::: .::::::::::::: :.:::.::.::: .. .:::..:.::::.:::. CCDS58 PWPGVLFGMSIPSLWYWCTDQVIVQRTLAAKNLSHAKGGALMAAYLKVLPLFIMVFPGMV 210 220 230 240 250 260 340 350 360 370 380 390 pF1KB8 SRILYTEKIACVVPSECEKYCGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSL ::::. ...::. : :.: :.. ::..:::: ::.::.:.::::::..::.:.::::: CCDS58 SRILFPDQVACADPEICQKICSNPSGCSDIAYPKLVLELLPTGLRGLMMAVMVAALMSSL 270 280 290 300 310 320 400 410 420 430 440 450 pF1KB8 TSIFNSASTLFTMDIYAKVRKRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFD :::::::::.::::.. ..: :::::::::.::.:.:.:. .:: :.:.::..:.:::: CCDS58 TSIFNSASTIFTMDLWNHLRPRASEKELMIVGRVFVLLLVLVSILWIPVVQASQGGQLFI 330 340 350 360 370 380 460 470 480 490 500 510 pF1KB8 YIQSITSYLGPPIAAVFLLAIFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEP :::::.::: ::.:.::... ::::.:: ::::::: :::.:. :.. .: : : .: CCDS58 YIQSISSYLQPPVAVVFIMGCFWKRTNEKGAFWGLISGLLLGLVRLVLDFIYVQPRCDQP 390 400 410 420 430 440 520 530 540 550 560 570 pF1KB8 SNCPTIICGVHYLYFAIILFAISFITIVVISLLTKPIPDVHLYRLCWSLRNS----KEER .. :... ..:::::..:: ....::. ..: .:.: . .: : :.. ::. CCDS58 DERPVLVKSIHYLYFSMILSTVTLITVSTVSWFTEPPSKEMVSHLTWFTRHDPVVQKEQA 450 460 470 480 490 500 580 590 600 610 pF1KB8 -----IDLDAEEENIQEGPKET-IEIET------------QVPEKKKGIFRRAYDLFCGL ..: .... :. . . ...: ..:...: . .: .::. CCDS58 PPAAPLSLTLSQNGMPEASSSSSVQFEMVQENTSKTHSCDMTPKQSKVV--KAILWLCGI 510 520 530 540 550 560 620 630 640 650 660 pF1KB8 EQHGAPKMTEEEEKAMKMKMTDTSEKPLWRTVLNVNGIILVTVAVFCHAYFA ...: .. . : . .. :.:: .:.:.:: :. :. :.: .::: CCDS58 QEKGKEELPARAEAII----VSLEENPLVKTLLDVNLIFCVSCAIFIWGYFA 570 580 590 600 610 >>CCDS33549.1 SLC5A3 gene_id:6526|Hs108|chr21 (718 aa) initn: 2065 init1: 1159 opt: 2109 Z-score: 2396.1 bits: 453.8 E(32554): 3.8e-127 Smith-Waterman score: 2115; 50.6% identity (78.5% similar) in 615 aa overlap (23-618:4-615) 10 20 30 40 50 60 pF1KB8 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGTVGGFFL . ..:::.:...::..:: .:..::...::.::.:.:: CCDS33 MRAVLDTADIAIVALYFILVMCIGFFAMWKSNRSTVSGYFL 10 20 30 40 70 80 90 100 110 120 pF1KB8 AGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVPIY :::::.: ::::::.::::: ::.::::.:::::.:.:..:.:::.:. .:::.:.::: CCDS33 AGRSMTWVAIGASLFVSNIGSEHFIGLAGSGAASGFAVGAWEFNALLLLQLLGWVFIPIY 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB8 IKAGVVTMPEYLRKRFGGQRIQVYLSLLSLLLYIFTKISADIFSGAIFINLALGLNLYLA :..:: :::::: :::::.:::::.. :::.::::::.:.:..:::.::. .:: :::.. CCDS33 IRSGVYTMPEYLSKRFGGHRIQVYFAALSLILYIFTKLSVDLYSGALFIQESLGWNLYVS 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB8 IFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYMKAI ..::...::: :.::::.:::::::::...:..:.: : ... :.::.. ..:: : CCDS33 VILLIGMTALLTVTGGLVAVIYTDTLQALLMIIGALTLMIISIMEIGGFEEVKRRYMLAS 170 180 190 200 210 220 250 260 270 280 290 pF1KB8 PTIVS---DGNTTFQEKC-YTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQV : ..: : . ..: .:. ......:.: :.::::::.:.. ..::::.::: CCDS33 PDVTSILLTYNLSNTNSCNVSPKKEALKMLRNPTDEDVPWPGFILGQTPASVWYWCADQV 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB8 IVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCG :::: :.:::..:.::. .. :.:::.::::.:.::::::::.:. :::. : .: :: CCDS33 IVQRVLAAKNIAHAKGSTLMAGFLKLLPMFIIVVPGMISRILFTDDIACINPEHCMLVCG 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB8 TKVGCTNIAYPTLVVELMPNGLRGLMLSVMLASLMSSLTSIFNSASTLFTMDIYAKVRKR ...::.::::: ::..:.: ::::::..::.:.:::.: ::::::::.::.:.: .:: CCDS33 SRAGCSNIAYPRLVMKLVPVGLRGLMMAVMIAALMSDLDSIFNSASTIFTLDVYKLIRKS 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB8 ASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLAIF :: .::::.::.:. .. ::::::::. :.::.. ::: ...:: ::.::.:::::: CCDS33 ASSRELMIVGRIFVAFMVVISIAWVPIIVEMQGGQMYLYIQEVADYLTPPVAALFLLAIF 410 420 430 440 450 460 480 490 500 510 520 530 pF1KB8 WKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILFAI ::: :: :::.: . :...: :.: ::: . : .:.: : .: .::.: : :: . CCDS33 WKRCNEQGAFYGGMAGFVLGAVRLILAFAYRAPECDQPDNRPGFIKDIHYMYVATGLFWV 470 480 490 500 510 520 540 550 560 570 580 pF1KB8 SFITIVVISLLTKPIPDVHLYRLC--WSLRN--------SKEERIDLDAEEENIQEGPKE . . :..:::: : : . : :: .: ::: . .:..: . .. CCDS33 TGLITVIVSLLTPP-PTKEQIRTTTFWSKKNLVVKENCSPKEEPYKM--QEKSILRCSEN 530 540 550 560 570 590 600 610 620 630 640 pF1KB8 TIEIETQVPEKK-----KGIFRRAYDLFCGLEQHGAPKMTEEEEKAMKMKMTDTSEKPLW . :. .:. : ::. . .:. ...: : CCDS33 NETINHIIPNGKSEDSIKGLQPEDVNLLVTCREEGNPVASLGHSEAETPVDAYSNGQAAL 580 590 600 610 620 630 650 660 pF1KB8 RTVLNVNGIILVTVAVFCHAYFA CCDS33 MGEKERKKETDDGGRYWKFIDWFCGFKSKSLSKRSLRDLMEEEAVCLQMLEETRQVKVIL 640 650 660 670 680 690 >>CCDS44136.1 SLC5A9 gene_id:200010|Hs108|chr1 (706 aa) initn: 2549 init1: 1409 opt: 2006 Z-score: 2279.2 bits: 432.1 E(32554): 1.2e-120 Smith-Waterman score: 2481; 54.1% identity (79.3% similar) in 680 aa overlap (25-664:34-706) 10 20 30 40 50 pF1KB8 MDSSTWSPKTTAVTRPVETHELIRNAADISIIVIYFVVVMAVGLWAMFSTNRGT .: :::..::::: :.:::.:. . ..::: CCDS44 ELAAMGPGASGDGVRTETAPHIALDSRVGLHAYDISVVVIYFVFVIAVGIWSSIRASRGT 10 20 30 40 50 60 60 70 80 90 100 pF1KB8 VGGFFLAGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWN---------- .::.::::::: ::::::::..::.::: :.::::::::.:.:.:::::: CCDS44 IGGYFLAGRSMSWWPIGASLMSSNVGSGLFIGLAGTGAAGGLAVGGFEWNMRKSRSGGDR 70 80 90 100 110 120 110 120 130 140 pF1KB8 ---------------ALVLVVVLGWLFVPIYIKAGVVTMPEYLRKRFGGQRIQVYLSLLS : :...:::.:::.:: :::::::.::.:::::::::::.:.:: CCDS44 GIHPRSHGRTGVRSQATWLLLALGWVFVPVYIAAGVVTMPQYLKKRFGGQRIQVYMSVLS 130 140 150 160 170 180 150 160 170 180 190 200 pF1KB8 LLLYIFTKISADIFSGAIFINLALGLNLYLAIFLLLAITALYTITGGLAAVIYTDTLQTV :.::::::::.::::::.::..::: ::::. .::..::.:::.::: ::::::.:::: CCDS44 LILYIFTKISTDIFSGALFIQMALGWNLYLSTGILLVVTAVYTIAGGLMAVIYTDALQTV 190 200 210 220 230 240 210 220 230 240 250 260 pF1KB8 IMLVGSLILTGFAFHEVGGYDAFMEKYMKAIPTIVSDGNTTFQEKCYTPRADSFHIFRDP ::. :.:.: ..:..:: : .. ..: .:::. :. ::: :. :: :.:::.::: CCDS44 IMVGGALVLMFLGFQDVGWYPGLEQRYRQAIPN-VTVPNTT----CHLPRPDAFHILRDP 250 260 270 280 290 270 280 290 300 310 320 pF1KB8 LTGDLPWPGFIFGMSILTLWYWCTDQVIVQRCLSAKNMSHVKGGCILCGYLKLMPMFIMV ..::.::::.:::...:. : :::::::::: ::::..::.::: .: ::::..:::..: CCDS44 VSGDIPWPGLIFGLTVLATWCWCTDQVIVQRSLSAKSLSHAKGGSVLGGYLKILPMFFIV 300 310 320 330 340 350 330 340 350 360 370 380 pF1KB8 MPGMISRILYTEKIACVVPSECEKYCGTKVGCTNIAYPTLVVELMPNGLRGLMLSVMLAS ::::::: :. ....:: :. :.. ::..:::.::::: ::. ::: ::::::..:..:. CCDS44 MPGMISRALFPDEVGCVDPDVCQRICGARVGCSNIAYPKLVMALMPVGLRGLMIAVIMAA 360 370 380 390 400 410 390 400 410 420 430 440 pF1KB8 LMSSLTSIFNSASTLFTMDIYAKVRKRASEKELMIAGRLFILVLIGISIAWVPIVQSAQS :::::::::::.:::::.:.. . :....:.:::..::.:.. :. ::: :.::.::..: CCDS44 LMSSLTSIFNSSSTLFTIDVWQRFRRKSTEQELMVVGRVFVVFLVVISILWIPIIQSSNS 420 430 440 450 460 470 450 460 470 480 490 500 pF1KB8 GQLFDYIQSITSYLGPPIAAVFLLAIFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTG ::::::::..::::.:::.:.:::::: :::.::::::::..:: .:. ::: ::.: . CCDS44 GQLFDYIQAVTSYLAPPITALFLLAIFCKRVTEPGAFWGLVFGLGVGLLRMILEFSYPAP 480 490 500 510 520 530 510 520 530 540 550 560 pF1KB8 SCMEPSNCPTIICGVHYLYFAIILFAISFITIVVISLLTKPIPDVHLYRLCWSLRNSKEE .: : . :... :::::::.: ... :.::..:: : :::. .: :: : :: CCDS44 ACGEVDRRPAVLKDFHYLYFAILLCGLTAIVIVIVSLCTTPIPEEQLTRLTWWTRNCPLS 540 550 560 570 580 590 570 580 590 600 610 pF1KB8 RIDLDAEEEN--IQEGPK----------ETIEIETQVPEK-KKGIFRRAYDLFCGLEQHG ... .:.: . :.: : :. . . :: ... . .. :::: : CCDS44 ELEKEAHESTPEISERPAGECPAGGGAAENSSLGQEQPEAPSRSWGKLLWSWFCGL--SG 600 610 620 630 640 650 620 630 640 650 660 pF1KB8 APK--MTEEEEKAMKMKMTDTSEKPLWRTVLNVNGIILVTVAVFCHAYFA .:. .. :. :...:.:. :.:::: : :.:...:... .: .::: CCDS44 TPEQALSPAEKAALEQKLTSIEEEPLWRHVCNINAVLLLAINIFLWGYFA 660 670 680 690 700 664 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 14:57:51 2016 done: Fri Nov 4 14:57:52 2016 Total Scan time: 3.450 Total Display time: 0.190 Function used was FASTA [36.3.4 Apr, 2011]