FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2728, 643 aa 1>>>pF1KE2728 643 - 643 aa - 643 aa Library: human.CCDS.faa 18921897 residues in 33420 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8943+/-0.000892; mu= 16.3493+/- 0.053 mean_var=76.6212+/-15.843, 0's: 0 Z-trim(106.4): 29 B-trim: 0 in 0/49 Lambda= 0.146521 statistics sampled from 9074 (9096) to 9074 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.627), E-opt: 0.2 (0.272), width: 16 Scan time: 1.800 The best scores are: opt bits E(33420) CCDS12368.1 SLC5A5 gene_id:6528|Hs109|chr19 ( 643) 4233 904.6 0 CCDS9080.1 SLC5A8 gene_id:160728|Hs109|chr12 ( 610) 1953 422.7 7.6e-118 CCDS7860.2 SLC5A12 gene_id:159963|Hs109|chr11 ( 618) 1692 367.5 3.1e-101 CCDS1740.1 SLC5A6 gene_id:8884|Hs109|chr2 ( 635) 1423 310.7 4.2e-84 CCDS10625.1 SLC5A11 gene_id:115584|Hs109|chr16 ( 675) 305 74.3 6.1e-13 CCDS2074.1 SLC5A7 gene_id:60482|Hs109|chr2 ( 580) 302 73.7 8.3e-13 CCDS13903.1 SLC5A4 gene_id:6527|Hs109|chr22 ( 659) 300 73.3 1.2e-12 CCDS10714.1 SLC5A2 gene_id:6524|Hs109|chr16 ( 672) 297 72.6 2e-12 CCDS13902.1 SLC5A1 gene_id:6523|Hs109|chr22 ( 664) 286 70.3 9.7e-12 >>CCDS12368.1 SLC5A5 gene_id:6528|Hs109|chr19 (643 aa) initn: 4233 init1: 4233 opt: 4233 Z-score: 4833.8 bits: 904.6 E(33420): 0 Smith-Waterman score: 4233; 100.0% identity (100.0% similar) in 643 aa overlap (1-643:1-643) 10 20 30 40 50 60 pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFFTGGRRLAALPVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFFTGGRRLAALPVG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 LSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPVFYRLGLTSTYEY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPVFYRLGLTSTYEY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 LEMRFSRAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWASLLSTGIICTFYTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LEMRFSRAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWASLLSTGIICTFYTA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 VGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHSRINLMDFNPDPRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHSRINLMDFNPDPRS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 RYTFWTFVVGGTLVWLSMYGVNQAQVQRYVACRTEKQAKLALLINQVGLFLIVSSAACCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 RYTFWTFVVGGTLVWLSMYGVNQAQVQRYVACRTEKQAKLALLINQVGLFLIVSSAACCG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 IVMFVFYTDCDPLLLGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSIN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 IVMFVFYTDCDPLLLGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSIN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 AMAAVTVEDLIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAALSSLLGGGVLQGSFTVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AMAAVTVEDLIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAALSSLLGGGVLQGSFTVM 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 GVISGPLLGAFILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GVISGPLLGAFILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSA 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 ARCVALSVNASGLLDPALLPANDSSRAPSSGMDASRPALADSFYAISYLYYGALGTLTTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ARCVALSVNASGLLDPALLPANDSSRAPSSGMDASRPALADSFYAISYLYYGALGTLTTV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 LCGALISCLTGPTKRSTLAPGLLWWDLARQTASVAPKEEVAILDDNLVKGPEELPTGNKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LCGALISCLTGPTKRSTLAPGLLWWDLARQTASVAPKEEVAILDDNLVKGPEELPTGNKK 550 560 570 580 590 600 610 620 630 640 pF1KE2 PPGFLPTNEDRLFFLGQKELEGAGSWTPCVGHDGGRDQQETNL ::::::::::::::::::::::::::::::::::::::::::: CCDS12 PPGFLPTNEDRLFFLGQKELEGAGSWTPCVGHDGGRDQQETNL 610 620 630 640 >>CCDS9080.1 SLC5A8 gene_id:160728|Hs109|chr12 (610 aa) initn: 1712 init1: 1633 opt: 1953 Z-score: 2229.4 bits: 422.7 E(33420): 7.6e-118 Smith-Waterman score: 1953; 51.8% identity (81.1% similar) in 550 aa overlap (11-560:9-552) 10 20 30 40 50 60 pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFFTGGRRLAALPVG :: .::: ::: ::..:..::.. ..: :::....::. ::::..:.::. CCDS90 MDTPRGIGTFVVWDYVVFAGMLVISAAIGIYYAFAGGGQQTSKDFLMGGRRMTAVPVA 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 LSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPVFYRLGLTSTYEY :::.::::::: :::.:::.::.: : . . .. :..: .:.::::.::.:::::: CCDS90 LSLTASFMSAVTVLGTPSEVYRFGAIFSIFAFTYFFVVVISAEVFLPVFYKLGITSTYEY 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 LEMRFSRAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWASLLSTGIICTFYTA ::.::.. ::::::. .:: :.:::::::::::: ::::::.:.:.....::..:::: . CCDS90 LELRFNKCVRLCGTVLFIVQTILYTGIVIYAPALALNQVTGFDLWGAVVATGVVCTFYCT 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE2 VGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHSRINLMDFNPDPRS .::.:::.::::::: .:..:: :. ..:.. :: .:. : . .:.:. .:::.: . CCDS90 LGGLKAVIWTDVFQVGIMVAGFASVIIQAVVMQGGISTILNDAYDGGRLNFWNFNPNPLQ 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE2 RYTFWTFVVGGTLVWLSMYGVNQAQVQRYVACRTEKQAKLALLINQVGLFLIVSSAACCG :.::::...:::..: :.:::::.:::::..:... ::::.: :: :::. :.. .. :: CCDS90 RHTFWTIIIGGTFTWTSIYGVNQSQVQRYISCKSRFQAKLSLYINLVGLWAILTCSVFCG 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE2 IVMFVFYTDCDPLLLGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSIN .... : :::: ..::::: :: :::::..: ::.::::.::::::::::.:.::: CCDS90 LALYSRYHDCDPWTAKKVSAPDQLMPYLVLDILQDYPGLPGLFVACAYSGTLSTVSSSIN 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE2 AMAAVTVEDLIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAALSSLLGGGVLQGSFTVM :.::::::::::: .:::. :.: ::.:.:..::. :. .:::.::.:. .::....:. CCDS90 ALAAVTVEDLIKPYFRSLSERSLSWISQGMSVVYGALCIGMAALASLMGA-LLQAALSVF 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE2 GVISGPLLGAFILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSA :...:::.: : ::...: :. :.:.:: ::.:.::::..:: .::: . : . CCDS90 GMVGGPLMGLFALGILVPFANSIGALVGLMAGFAISLWVGIGAQIYPPLPERTLPLHLDI 420 430 440 450 460 470 490 500 510 520 530 540 pF1KE2 ARCVALSVNASGLLDPALLPANDSSRAPSSGMDASRPALADSFYAISYLYYGALGTLTTV : . . : ..:. . .: . : ....: : :..:..::::....:::.:. CCDS90 QGCNS-TYNETNLMTTTEMPFTTSVFQI---YNVQRTPLMDNWYSLSYLYFSTVGTLVTL 480 490 500 510 520 530 550 560 570 580 590 600 pF1KE2 LCGALISCLTGPTKRSTLAPGLLWWDLARQTASVAPKEEVAILDDNLVKGPEELPTGNKK : : :.: :: :.. : : CCDS90 LVGILVSLSTGGRKQN-LDPRYILTKEDFLSNFDIFKKKKHVLSYKSHPVEDGGTDNPAF 540 550 560 570 580 590 >>CCDS7860.2 SLC5A12 gene_id:159963|Hs109|chr11 (618 aa) initn: 1620 init1: 1463 opt: 1692 Z-score: 1931.2 bits: 367.5 E(33420): 3.1e-101 Smith-Waterman score: 1802; 48.4% identity (77.2% similar) in 556 aa overlap (8-563:2-539) 10 20 30 40 50 60 pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFFTGGRRLAALPVG : .:..::: ::: ....:.:::.. .. . . ....:..:::... ::: CCDS78 MEVKNFAVWDYVVFAALFFISSGIGVFFAIKERKKATSREFLVGGRQMSFGPVG 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 LSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPVFYRLGLTSTYEY :::.::::::: :::.:::.::.: .:: . .. :. .::. ::.::::: :.:::::: CCDS78 LSLTASFMSAVTVLGTPSEVYRFGASFLVFFIAYLFVILLTSELFLPVFYRSGITSTYEY 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 LEMRFSRAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWASLLSTGIICTFYTA :..::.. :: .:. ::: :.::::.:.::::: ::::::.:.:.:...:::.:::: . CCDS78 LQLRFNKPVRYAATVIYIVQTILYTGVVVYAPALALNQVTGFDLWGSVFATGIVCTFYCT 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE2 VGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHSRINLMDFNPDPRS .::.:::::::.::.:::. :: .:: .: .:: ..:: . : ::....::. :: CCDS78 LGGLKAVVWTDAFQMVVMIVGFLTVLIQGSTHAGGFHNVLEQSTNGSRLHIFDFDVDPLR 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE2 RYTFWTFVVGGTLVWLSMYGVNQAQVQRYVACRTEKQAKLALLINQVGLFLIVSSAACCG :.::::..::::..::..:::::. .:: ..:.:::.::::: .: .::..:. :. : CCDS78 RHTFWTITVGGTFTWLGIYGVNQSTIQRCISCKTEKHAKLALYFNLLGLWIILVCAVFSG 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE2 IVMFVFYTDCDPLLLGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSIN ..:. . :::: : :::::: :: .:..:: .::.::::.:::.::::::...::: CCDS78 LIMYSHFKDCDPWTSGIISAPDQLMPYFVMEIFATMPGLPGLFVACAFSGTLSTVASSIN 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE2 AMAAVTVEDLIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAALSSLLGGGVLQGSFTVM :.:.:: ::..: . :. . . ::::: :..: : ..:. .:..:: :.:.:... CCDS78 ALATVTFEDFVKSCFPHLSDKLSTWISKGLCLLFGVMCTSMAVAASVMGG-VVQASLSIH 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE2 GVISGPLLGAFILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSA :. .::.:: : ::. .: : :.:.:: .:..::.:::.:: .:: . :: :. CCDS78 GMCGGPMLGLFSLGIVFPFVNWKGALGGLLTGITLSFWVAIGAFIYPAPASKTWPLPLST 420 430 440 450 460 470 490 500 510 520 530 540 pF1KE2 ARCVALSVNASGLLDPALLPANDSSRAPSSGMDASRPALADSFYAISYLYYGALGTLTTV .:. .:.:.: : .: .:::..::..:.::::::.:.: : . CCDS78 DQCIKSNVTATG---PPVL--------------SSRPGIADTWYSISYLYYSAVGCLGCI 480 490 500 510 550 560 570 580 590 600 pF1KE2 LCGALISCLTGPTKRSTLAPGLLWWDLARQTASVAPKEEVAILDDNLVKGPEELPTGNKK . :..:: .:: . . : :. CCDS78 VAGVIISLITGRQRGEDIQPLLIRPVCNLFCFWSKKYKTLCWCGVQHDSGTEQENLENGS 520 530 540 550 560 570 >>CCDS1740.1 SLC5A6 gene_id:8884|Hs109|chr2 (635 aa) initn: 1494 init1: 1209 opt: 1423 Z-score: 1623.7 bits: 310.7 E(33420): 4.2e-84 Smith-Waterman score: 1499; 40.6% identity (70.2% similar) in 630 aa overlap (11-630:23-629) 10 20 30 40 pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARG-GQRSAEDF ::. :: ::.:.:..: .:::. . :: :.... .. CCDS17 MSVGVSTSAPLSPTSGTSVGMSTFSIMDYVVFVLLLVLSLAIGLYHA-CRGWGRHTVGEL 10 20 30 40 50 50 60 70 80 90 100 pF1KE2 FTGGRRLAALPVGLSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMP . . :... :::.::: :.:.::: .:::::: ::.: .. .. .:. .. : .:.: CCDS17 LMADRKMGCLPVALSLLATFQSAVAILGVPSEIYRFGTQYWFLGCCYFLGLLIPAHIFIP 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE2 VFYRLGLTSTYEYLEMRFSRAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWAS ::::: :::.:::::.::...::.:::. .: ..: :.:.:::.: :: :::.:.: : CCDS17 VFYRLHLTSAYEYLELRFNKTVRVCGTVTFIFQMVIYMGVVLYAPSLALNAVTGFDLWLS 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE2 LLSTGIICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHS .:. ::.:: :::.::.:::.::::::..::. : .:. : ::: .: ..:..:. CCDS17 VLALGIVCTVYTALGGLKAVIWTDVFQTLVMFLGQLAVIIVGSAKVGGLGRVWAVASQHG 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE2 RINLMDFNPDPRSRYTFWTFVVGGTLVWLSMYGVNQAQVQRYVACRTEKQAKLALLINQV ::. ....::: :.::::.. ::... ::.:::::::::::.. :::: : :. : CCDS17 RISGFELDPDPFVRHTFWTLAFGGVFMMLSLYGVNQAQVQRYLSSRTEKAAVLSCY--AV 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE2 GLFLIVSSAACC--GIVMFVFYTDCDPLLLGRI-SAPDQYMPLLVLDIFEDLPGVPGLFL : :: . : :.:::..: . :. . . .::::.. .:.:... :::.::::. CCDS17 FPFQQVSLCVGCLIGLVMFAYYQEY-PMSIQQAQAAPDQFVLYFVMDLLKGLPGLPGLFI 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE2 ACAYSGTLSTASTSINAMAAVTVEDLIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAAL :: .::.::: :...:..:.::.::::.: . .. . ...:.::.. :: :: .: . CCDS17 ACLFSGSLSTISSAFNSLATVTMEDLIRPWFPEFSEARAIMLSRGLAFGYGLLCLGMAYI 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE2 SSLLGGGVLQGSFTVMGVISGPLLGAFILGMFLPACNTPGVLAGLGAGLALSLWVALGAT :: .: :::......:...::::: : ::::.: : ::...:: :::....:...:. CCDS17 SSQMGP-VLQAAISIFGMVGGPLLGLFCLGMFFPCANPPGAVVGLLAGLVMAFWIGIGSI 420 430 440 450 460 470 470 480 490 500 510 520 pF1KE2 LYPPSEQTMRVLPSSAARCVALSVNASGLLDPALLPANDSSRAPSSGMDASRPALADSFY . . . .: : . ..: : : :. .. : . . :.:. . :: CCDS17 VTSMGSS----MPPSPSNGSSFS------LPTNLTVATVTTLMPLTTF--SKPTGLQRFY 480 490 500 510 520 530 540 550 560 570 580 pF1KE2 AISYLYYGALGTLTTVLCGALISCLTGPTKRSTLAPGLLWWDLARQTASVAPKEEVAILD ..:::.:.: .. :... : ..: ::: . .: :. .. : . :. : : CCDS17 SLSYLWYSAHNSTTVIVVGLIVSLLTGRMRGRSLNPATIYPVLPKLL-SLLPLSCQKRLH 530 540 550 560 570 580 590 600 610 620 630 pF1KE2 DNLVKGPEELPTG--NKKP-PGFLPTNEDRLFFLGQKELEGA---GSWTPCVGHDGGRDQ : ..: :: .:: : : ..:. :.:. :: . :. CCDS17 CRSY-GQDHLDTGLFPEKPRNGVLGDSRDK----EAMALDGTAYQGSSSTCILQETSL 590 600 610 620 630 640 pF1KE2 QETNL >>CCDS10625.1 SLC5A11 gene_id:115584|Hs109|chr16 (675 aa) initn: 424 init1: 145 opt: 305 Z-score: 346.0 bits: 74.3 E(33420): 6.1e-13 Smith-Waterman score: 460; 25.4% identity (58.8% similar) in 476 aa overlap (16-457:28-492) 10 20 30 40 pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFF : .:..:..: ..::: . .. . ... .: CCDS10 MESGTSSPQPPQLDPLDAFPQKGLEPGDIAVLVLYFLFVLAVGLW-STVKTKRDTVKGYF 10 20 30 40 50 50 60 70 80 90 100 pF1KE2 TGGRRLAALPVGLSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPV .: .. ::: :: :: ... . .:. . . :.. . :. :.. .. : .:.:. CCDS10 LAGGDMVWWPVGASLFASNVGSGHFIGLAGSGAATGISVSAYELNGLFSVLMLAWIFLPI 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE2 FYRLGLTSTYEYLEMRFS--RAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWA . .:. :::. ::. : . ..: .. . .. .:: :....: ::.. CCDS10 YIAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYIFTKISVDMYAGAIFIQQSLHLDLYL 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE2 SLLSTGIICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGG-----PRQVLT .... : . ::..::. ::..::..:...:: : .... . ::: . :. CCDS10 AIVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIGALTLMGYSFAAVGGMEGLKEKYFLA 180 190 200 210 220 230 230 240 250 260 270 pF1KE2 LAQNHS--------RINLMDFNPDPRSRYTFWTFVV-GGTLVWLSMYGVNQAQVQRYVAC ::.:.: : . . . :: . : :. : .. : .. ..:. ::: .: CCDS10 LASNRSENSSCGLPREDAFHIFRDPLTSDLPWPGVLFGMSIPSLWYWCTDQVIVQRTLAA 240 250 260 270 280 290 280 290 300 310 320 pF1KE2 RTEKQAK----LALLINQVGLFLIVSSAACCGIVMFVFYTD---C-DPLLLGRI-SAP-- .. ..:: .: .. . ::..: :.: ... : : :: . .: : : CCDS10 KNLSHAKGGALMAAYLKVLPLFIMVFP----GMVSRILFPDQVACADPEICQKICSNPSG 300 310 320 330 340 350 330 340 350 360 370 pF1KE2 --DQYMPLLVLDIFEDLP-GVPGLFLACAYSGTLSTASTSINAMAAVTVEDL---IKPRL : .: :::.. :: :. ::..: .. .:. .. .:. ... . :: ..:: CCDS10 CSDIAYPKLVLEL---LPTGLRGLMMAVMVAALMSSLTSIFNSASTIFTMDLWNHLRPRA 360 370 380 390 400 410 380 390 400 410 420 430 pF1KE2 RSLAPRKLVIISKGLSLIYG-SACLTVAALSSLLGGGVLQGSFTVMGVISGPLLGAFILG . ..:.:... . :. . : . .... :: .. .. . .. :. .::.: CCDS10 ---SEKELMIVGRVFVLLLVLVSILWIPVVQASQGGQLFIYIQSISSYLQPPVAVVFIMG 420 430 440 450 460 440 450 460 470 480 490 pF1KE2 MFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSAARCVALSVNASGLL : : :.. :: .:: :.: CCDS10 CFWKRTNEKGAFWGLISGLLLGLVRLVLDFIYVQPRCDQPDERPVLVKSIHYLYFSMILS 470 480 490 500 510 520 >>CCDS2074.1 SLC5A7 gene_id:60482|Hs109|chr2 (580 aa) initn: 122 init1: 93 opt: 302 Z-score: 343.6 bits: 73.7 E(33420): 8.3e-13 Smith-Waterman score: 307; 22.0% identity (54.7% similar) in 464 aa overlap (19-457:13-447) 10 20 30 40 50 pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAED----FFTGGRRLAA :: :..:. .:.:.. .. :::. ...::: .. CCDS20 MAFHVEGLIAIIVFYLLILL---VGIWAAWRTKNSGSAEERSEAIIVGGRDIGL 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 LPVGLSLSASFMSAVQVLGVPSEAYR--YGLKFLWMCLGQLLNSVLTALLFMPVFYRLGL : :....:..... . :. .: ::: . .: :. .: .:.: . : CCDS20 LVGGFTMTATWVGGGYINGTAEAVYVPGYGLAWAQAPIGYSLSLILGGLFFAKPMRSKGY 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 TSTYEYLEMRFSRAVRLCGTL--QYIVATMLYTGIVIYAPALILNQVTGLDIWASLLSTG .. . ... ... :. : : ... :.... .. : . .. . .:. :.. .. CCDS20 VTMLDPFQQIYGK--RMGGLLFIPALMGEMFWAAAIFSALGATISVIIDVDMHISVIISA 120 130 140 150 160 180 190 200 210 220 230 pF1KE2 IICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHSRINLM .: :.:: :::. .:..::: :. .. :.:. . : .: .: . . CCDS20 LIATLYTLVGGLYSVAYTDVVQLFCIFVGLWISV---------P-----FALSHPAVADI 170 180 190 200 210 240 250 260 270 280 pF1KE2 DFNPDPRSRYTFWTFVVGGTLV--WLSMY------GVN-QAQVQRYVACRTEKQAKLALL :. . : .: .. : ::. . :. :: :: .. . :.. . CCDS20 GFTAVHAKYQKPWLGTVDSSEVYSWLDSFLLLMLGGIPWQAYFQRVLSSSSATYAQVLSF 220 230 240 250 260 270 290 300 310 320 330 pF1KE2 INQVGLFLIVSSAACCGIVMFVFYTDCDPLLLGRISAP------DQYMPLLVLDIFEDLP . : .... : : . :: . : . : :. .:. ::. . : CCDS20 LAAFGCLVMAIPAILIGAIGAS--TDWNQTAYG-LPDPKTTEEADMILPI-VLQYL--CP 280 290 300 310 320 340 350 360 370 380 390 pF1KE2 GVPGLF-LACAYSGTLSTASTSINAMAAVTVEDLIKPRLRSLAPRKLVI-ISKGLSLIYG ..: :. . ....:.:..:: . ... .... . .:. : : .. . . ...: CCDS20 VYISFFGLGAVSAAVMSSADSSILSASSMFARNIYQLSFRQNASDKEIVWVMRITVFVFG 330 340 350 360 370 380 400 410 420 430 440 450 pF1KE2 SACLTVAALSSLLGGGVLQGSFTVMGVISGPLLGAFILGMFLPACNTPGVLAGLGAGLAL .. ..: :.. . : .: :. :: :: . .:. . :: :..:: .:: : CCDS20 ASATAMALLTKTVYGLWYLSSDLVYIVIFPQLLCV----LFVKGTNTYGAVAGYVSGLFL 390 400 410 420 430 440 460 470 480 490 500 510 pF1KE2 SLWVALGATLYPPSEQTMRVLPSSAARCVALSVNASGLLDPALLPANDSSRAPSSGMDAS . CCDS20 RITGGEPYLYLQPLIFYPGYYPDDNGIYNQKFPFKTLAMVTSFLTNICISYLAKYLFESG 450 460 470 480 490 500 >>CCDS13903.1 SLC5A4 gene_id:6527|Hs109|chr22 (659 aa) initn: 345 init1: 143 opt: 300 Z-score: 340.5 bits: 73.3 E(33420): 1.2e-12 Smith-Waterman score: 421; 22.7% identity (56.0% similar) in 498 aa overlap (5-457:12-497) 10 20 30 40 pF1KE2 MEAVETGERPTFG-----AWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFF :: : : .. : : .:.....:: ..:::. : . .. . :: CCDS13 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAML-KTNRGTIGGFF 10 20 30 40 50 50 60 70 80 90 100 pF1KE2 TGGRRLAALPVGLSLSASFMSAVQVLGVPSEAYRYGLK---FLWMCLGQLLNSVLTALLF .:: .: :.: :: :: ... . .:. . . :. : : .:: . . .: CCDS13 LAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLL---ILGWIF 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE2 MPVFYRLGLTSTYEYLEMRFS--RAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLD .:.. . :. . :::. ::. : . :. .. ..: . :.: :.... . ::: CCDS13 VPIYIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLD 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE2 IWASLLSTGIICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLA .. ... . . ::..::. .:..::..:...:: : ..... . ::: .. CCDS13 LYLAIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKY 180 190 200 210 220 230 230 240 250 260 pF1KE2 QNHS---------RINLMDFNPDPRSRYTF---------WTFVVGG---TLVWLSMYGVN : . :. ..: : . : : .. : : .: .. .: CCDS13 VNATPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALW--YWCTN 240 250 260 270 280 290 270 280 290 300 pF1KE2 QAQVQRYVACRTEKQAKLALLI----NQVGLFLIVSSAACCGIVMFVFYTD--------- :. ::: . . ...: : .. . . .::.: :.. ..::: CCDS13 QVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMP----GMISRILYTDMVACVVPSE 300 310 320 330 340 350 310 320 330 340 350 360 pF1KE2 CDPLLLGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSINAMAAVTVED : .. . .: .::... . :. ::.:. .. .:. .. .:. ... . : CCDS13 CVKHCGVDVGCTNYAYPTMVLELMPQ--GLRGLMLSVMLASLMSSLTSIFNSASTLFTID 360 370 380 390 400 370 380 390 400 410 420 pF1KE2 LIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAALSSL-LGGGVLQGSFTVMGVISGPLL : .. . ..:.: .. . :. . .. . : .. .: ... . .. . .. :. CCDS13 LYTKMRKQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIA 410 420 430 440 450 460 430 440 450 460 470 480 pF1KE2 GAFILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSAARCVALSV ..:.:..: : :.. :: .:::..: CCDS13 AVFVLAIFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLY 470 480 490 500 510 520 >>CCDS10714.1 SLC5A2 gene_id:6524|Hs109|chr16 (672 aa) initn: 275 init1: 135 opt: 297 Z-score: 336.9 bits: 72.6 E(33420): 2e-12 Smith-Waterman score: 441; 25.1% identity (56.8% similar) in 505 aa overlap (2-457:3-497) 10 20 30 40 50 pF1KE2 MEAVETGERPTFGAW--------DYGVFALMLLVSTGIGLWVGLARGGQRSAEDFFTGG : .:.: : .:: : :.: ..:. :.::: .. : .. .. .: .: CCDS10 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLW-SMCRTNRGTVGGYFLAG 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 RRLAALPVGLSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPVFYR : .. ::: :: :: ... . .:. . . :: . . :. .: . :: ::. CCDS10 RSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLT 60 70 80 90 100 110 120 130 140 150 160 pF1KE2 LGLTSTYEYLEMRFS-RAVRL-CGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWASLL :. . .::. ::. : .:: ..:. .. . .. ... :....:. : .:.::.. CCDS10 AGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVI 120 130 140 150 160 170 170 180 190 200 210 pF1KE2 STGIICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQV---------- . : .::..::. :...::. :. :.:.: .... . ::: . CCDS10 ALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATS 180 190 200 210 220 230 220 230 240 250 260 pF1KE2 LTLAQNHSRINLMDFNPDPR-SRYTFWTFVVGGTLVWLSMY-GV----------NQAQVQ ::.... . :. .: :: . : . : : : : .. :. .:. :: CCDS10 LTVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQ 240 250 260 270 280 290 270 280 290 300 310 pF1KE2 RYVACRTEKQAK----LALLINQVGLFLIVSSAACCGIVMFVFYTD---------CDPLL : .: .. . : : .. . .::.: :.. ..: : : . CCDS10 RCLAGKSLTHIKAGCILCGYLKLTPMFLMVMP----GMISRILYPDEVACVVPEVCRRVC 300 310 320 330 340 350 320 330 340 350 360 370 pF1KE2 LGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSINAMAAVTVEDLIKPR ... . .: ::. .. . :. ::.:: .. .:. .. .:. ... . : : : CCDS10 GTEVGCSNIAYPRLVVKLMPN--GLRGLMLAVMLAALMSSLASIFNSSSTLFTMD-IYTR 360 370 380 390 400 410 380 390 400 410 420 430 pF1KE2 LRSLA-PRKLVIISKGLSLIYGSACLTVAAL---SSLLGGGVLQGSFTVMGVISGPLLGA :: : :.:..... : ... . ..:: : .. :: ... .: . .. :. .. CCDS10 LRPRAGDRELLLVGR-LWVVF-IVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAV 420 430 440 450 460 470 440 450 460 470 480 490 pF1KE2 FILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSAARCVALSVNA :.:..:.: : :.. :: .:: ..: CCDS10 FVLALFVPRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFA 480 490 500 510 520 530 >>CCDS13902.1 SLC5A1 gene_id:6523|Hs109|chr22 (664 aa) initn: 292 init1: 144 opt: 286 Z-score: 324.4 bits: 70.3 E(33420): 9.7e-12 Smith-Waterman score: 414; 22.2% identity (58.9% similar) in 487 aa overlap (4-457:17-497) 10 20 30 40 pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDF ::: : .: : ........: ..:::. .. . . .. : CCDS13 MDSSTWSPKTTAVTRPVETHEL-IRNAADISIIVIYFVVVMAVGLWAMFSTN-RGTVGGF 10 20 30 40 50 50 60 70 80 90 100 pF1KE2 FTGGRRLAALPVGLSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMP : .:: .. :.: :: :: ... . .:. . . :. . . . :. :. . ::.: CCDS13 FLAGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVP 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE2 VFYRLGLTSTYEYLEMRFS-RAVRLCGTLQYIVATMLYTGIV--IYAPALILNQVTGLDI .. . :... :::. ::. . ... .: .. ...: : :.. :...: . ::.. CCDS13 IYIKAGVVTMPEYLRKRFGGQRIQVYLSLLSLL-LYIFTKISADIFSGAIFINLALGLNL 120 130 140 150 160 170 170 180 190 200 210 pF1KE2 WASLLSTGIICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGP-------- . ... : ..:: .::. ::..::..:.:.:: : .. . . ::: CCDS13 YLAIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYM 180 190 200 210 220 230 220 230 240 250 260 pF1KE2 RQVLTLAQN-HSRINLMDFNPDPRSRYTF---------WT-FVVGGTLVWLSMYGVNQAQ . . :.... .. .. ..: : . : : :. : ... : .. ..:. CCDS13 KAIPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQVI 240 250 260 270 280 290 270 280 290 300 310 pF1KE2 VQRYVACRTEKQAK----LALLINQVGLFLIVSSAACCGI-----VMFVFYTDCDPLLLG ::: .. .. ...: : .. . .:..: . : . : ..:. CCDS13 VQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCGT 300 310 320 330 340 350 320 330 340 350 360 370 pF1KE2 RISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSINAMAAVTVEDLIKPRLR ... . .: ::.... . :. ::.:. .. .:. .. .:. ... . : : ..: CCDS13 KVGCTNIAYPTLVVELMPN--GLRGLMLSVMLASLMSSLTSIFNSASTLFTMD-IYAKVR 360 370 380 390 400 410 380 390 400 410 420 430 pF1KE2 SLAPRKLVIISKGLSLIY--GSACLTVAALSSLLGGGVLQGSFTVMGVISGPLLGAFILG . : .: ..:. : .. : . : ..: .: ... .. . .. :. ..:.:. CCDS13 KRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLA 420 430 440 450 460 470 440 450 460 470 480 490 pF1KE2 MFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSAARCVALSVNASGLL .: : ::.. :: :: ... CCDS13 IFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILF 480 490 500 510 520 530 643 residues in 1 query sequences 18921897 residues in 33420 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Jul 3 15:00:17 2018 done: Tue Jul 3 15:00:18 2018 Total Scan time: 1.800 Total Display time: 0.150 Function used was FASTA [36.3.4 Apr, 2011]