FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2728, 643 aa
1>>>pF1KE2728 643 - 643 aa - 643 aa
Library: human.CCDS.faa
18921897 residues in 33420 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.8943+/-0.000892; mu= 16.3493+/- 0.053
mean_var=76.6212+/-15.843, 0's: 0 Z-trim(106.4): 29 B-trim: 0 in 0/49
Lambda= 0.146521
statistics sampled from 9074 (9096) to 9074 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.627), E-opt: 0.2 (0.272), width: 16
Scan time: 1.800
The best scores are: opt bits E(33420)
CCDS12368.1 SLC5A5 gene_id:6528|Hs109|chr19 ( 643) 4233 904.6 0
CCDS9080.1 SLC5A8 gene_id:160728|Hs109|chr12 ( 610) 1953 422.7 7.6e-118
CCDS7860.2 SLC5A12 gene_id:159963|Hs109|chr11 ( 618) 1692 367.5 3.1e-101
CCDS1740.1 SLC5A6 gene_id:8884|Hs109|chr2 ( 635) 1423 310.7 4.2e-84
CCDS10625.1 SLC5A11 gene_id:115584|Hs109|chr16 ( 675) 305 74.3 6.1e-13
CCDS2074.1 SLC5A7 gene_id:60482|Hs109|chr2 ( 580) 302 73.7 8.3e-13
CCDS13903.1 SLC5A4 gene_id:6527|Hs109|chr22 ( 659) 300 73.3 1.2e-12
CCDS10714.1 SLC5A2 gene_id:6524|Hs109|chr16 ( 672) 297 72.6 2e-12
CCDS13902.1 SLC5A1 gene_id:6523|Hs109|chr22 ( 664) 286 70.3 9.7e-12
>>CCDS12368.1 SLC5A5 gene_id:6528|Hs109|chr19 (643 aa)
initn: 4233 init1: 4233 opt: 4233 Z-score: 4833.8 bits: 904.6 E(33420): 0
Smith-Waterman score: 4233; 100.0% identity (100.0% similar) in 643 aa overlap (1-643:1-643)
10 20 30 40 50 60
pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFFTGGRRLAALPVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFFTGGRRLAALPVG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 LSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPVFYRLGLTSTYEY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPVFYRLGLTSTYEY
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 LEMRFSRAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWASLLSTGIICTFYTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LEMRFSRAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWASLLSTGIICTFYTA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 VGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHSRINLMDFNPDPRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 VGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHSRINLMDFNPDPRS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 RYTFWTFVVGGTLVWLSMYGVNQAQVQRYVACRTEKQAKLALLINQVGLFLIVSSAACCG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 RYTFWTFVVGGTLVWLSMYGVNQAQVQRYVACRTEKQAKLALLINQVGLFLIVSSAACCG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 IVMFVFYTDCDPLLLGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSIN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 IVMFVFYTDCDPLLLGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSIN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 AMAAVTVEDLIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAALSSLLGGGVLQGSFTVM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 AMAAVTVEDLIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAALSSLLGGGVLQGSFTVM
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 GVISGPLLGAFILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GVISGPLLGAFILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSA
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 ARCVALSVNASGLLDPALLPANDSSRAPSSGMDASRPALADSFYAISYLYYGALGTLTTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ARCVALSVNASGLLDPALLPANDSSRAPSSGMDASRPALADSFYAISYLYYGALGTLTTV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 LCGALISCLTGPTKRSTLAPGLLWWDLARQTASVAPKEEVAILDDNLVKGPEELPTGNKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LCGALISCLTGPTKRSTLAPGLLWWDLARQTASVAPKEEVAILDDNLVKGPEELPTGNKK
550 560 570 580 590 600
610 620 630 640
pF1KE2 PPGFLPTNEDRLFFLGQKELEGAGSWTPCVGHDGGRDQQETNL
:::::::::::::::::::::::::::::::::::::::::::
CCDS12 PPGFLPTNEDRLFFLGQKELEGAGSWTPCVGHDGGRDQQETNL
610 620 630 640
>>CCDS9080.1 SLC5A8 gene_id:160728|Hs109|chr12 (610 aa)
initn: 1712 init1: 1633 opt: 1953 Z-score: 2229.4 bits: 422.7 E(33420): 7.6e-118
Smith-Waterman score: 1953; 51.8% identity (81.1% similar) in 550 aa overlap (11-560:9-552)
10 20 30 40 50 60
pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFFTGGRRLAALPVG
:: .::: ::: ::..:..::.. ..: :::....::. ::::..:.::.
CCDS90 MDTPRGIGTFVVWDYVVFAGMLVISAAIGIYYAFAGGGQQTSKDFLMGGRRMTAVPVA
10 20 30 40 50
70 80 90 100 110 120
pF1KE2 LSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPVFYRLGLTSTYEY
:::.::::::: :::.:::.::.: : . . .. :..: .:.::::.::.::::::
CCDS90 LSLTASFMSAVTVLGTPSEVYRFGAIFSIFAFTYFFVVVISAEVFLPVFYKLGITSTYEY
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE2 LEMRFSRAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWASLLSTGIICTFYTA
::.::.. ::::::. .:: :.:::::::::::: ::::::.:.:.....::..:::: .
CCDS90 LELRFNKCVRLCGTVLFIVQTILYTGIVIYAPALALNQVTGFDLWGAVVATGVVCTFYCT
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE2 VGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHSRINLMDFNPDPRS
.::.:::.::::::: .:..:: :. ..:.. :: .:. : . .:.:. .:::.: .
CCDS90 LGGLKAVIWTDVFQVGIMVAGFASVIIQAVVMQGGISTILNDAYDGGRLNFWNFNPNPLQ
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE2 RYTFWTFVVGGTLVWLSMYGVNQAQVQRYVACRTEKQAKLALLINQVGLFLIVSSAACCG
:.::::...:::..: :.:::::.:::::..:... ::::.: :: :::. :.. .. ::
CCDS90 RHTFWTIIIGGTFTWTSIYGVNQSQVQRYISCKSRFQAKLSLYINLVGLWAILTCSVFCG
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE2 IVMFVFYTDCDPLLLGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSIN
.... : :::: ..::::: :: :::::..: ::.::::.::::::::::.:.:::
CCDS90 LALYSRYHDCDPWTAKKVSAPDQLMPYLVLDILQDYPGLPGLFVACAYSGTLSTVSSSIN
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE2 AMAAVTVEDLIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAALSSLLGGGVLQGSFTVM
:.::::::::::: .:::. :.: ::.:.:..::. :. .:::.::.:. .::....:.
CCDS90 ALAAVTVEDLIKPYFRSLSERSLSWISQGMSVVYGALCIGMAALASLMGA-LLQAALSVF
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE2 GVISGPLLGAFILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSA
:...:::.: : ::...: :. :.:.:: ::.:.::::..:: .::: . : .
CCDS90 GMVGGPLMGLFALGILVPFANSIGALVGLMAGFAISLWVGIGAQIYPPLPERTLPLHLDI
420 430 440 450 460 470
490 500 510 520 530 540
pF1KE2 ARCVALSVNASGLLDPALLPANDSSRAPSSGMDASRPALADSFYAISYLYYGALGTLTTV
: . . : ..:. . .: . : ....: : :..:..::::....:::.:.
CCDS90 QGCNS-TYNETNLMTTTEMPFTTSVFQI---YNVQRTPLMDNWYSLSYLYFSTVGTLVTL
480 490 500 510 520 530
550 560 570 580 590 600
pF1KE2 LCGALISCLTGPTKRSTLAPGLLWWDLARQTASVAPKEEVAILDDNLVKGPEELPTGNKK
: : :.: :: :.. : :
CCDS90 LVGILVSLSTGGRKQN-LDPRYILTKEDFLSNFDIFKKKKHVLSYKSHPVEDGGTDNPAF
540 550 560 570 580 590
>>CCDS7860.2 SLC5A12 gene_id:159963|Hs109|chr11 (618 aa)
initn: 1620 init1: 1463 opt: 1692 Z-score: 1931.2 bits: 367.5 E(33420): 3.1e-101
Smith-Waterman score: 1802; 48.4% identity (77.2% similar) in 556 aa overlap (8-563:2-539)
10 20 30 40 50 60
pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFFTGGRRLAALPVG
: .:..::: ::: ....:.:::.. .. . . ....:..:::... :::
CCDS78 MEVKNFAVWDYVVFAALFFISSGIGVFFAIKERKKATSREFLVGGRQMSFGPVG
10 20 30 40 50
70 80 90 100 110 120
pF1KE2 LSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPVFYRLGLTSTYEY
:::.::::::: :::.:::.::.: .:: . .. :. .::. ::.::::: :.::::::
CCDS78 LSLTASFMSAVTVLGTPSEVYRFGASFLVFFIAYLFVILLTSELFLPVFYRSGITSTYEY
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE2 LEMRFSRAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWASLLSTGIICTFYTA
:..::.. :: .:. ::: :.::::.:.::::: ::::::.:.:.:...:::.:::: .
CCDS78 LQLRFNKPVRYAATVIYIVQTILYTGVVVYAPALALNQVTGFDLWGSVFATGIVCTFYCT
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE2 VGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHSRINLMDFNPDPRS
.::.:::::::.::.:::. :: .:: .: .:: ..:: . : ::....::. ::
CCDS78 LGGLKAVVWTDAFQMVVMIVGFLTVLIQGSTHAGGFHNVLEQSTNGSRLHIFDFDVDPLR
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE2 RYTFWTFVVGGTLVWLSMYGVNQAQVQRYVACRTEKQAKLALLINQVGLFLIVSSAACCG
:.::::..::::..::..:::::. .:: ..:.:::.::::: .: .::..:. :. :
CCDS78 RHTFWTITVGGTFTWLGIYGVNQSTIQRCISCKTEKHAKLALYFNLLGLWIILVCAVFSG
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE2 IVMFVFYTDCDPLLLGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSIN
..:. . :::: : :::::: :: .:..:: .::.::::.:::.::::::...:::
CCDS78 LIMYSHFKDCDPWTSGIISAPDQLMPYFVMEIFATMPGLPGLFVACAFSGTLSTVASSIN
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE2 AMAAVTVEDLIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAALSSLLGGGVLQGSFTVM
:.:.:: ::..: . :. . . ::::: :..: : ..:. .:..:: :.:.:...
CCDS78 ALATVTFEDFVKSCFPHLSDKLSTWISKGLCLLFGVMCTSMAVAASVMGG-VVQASLSIH
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE2 GVISGPLLGAFILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSA
:. .::.:: : ::. .: : :.:.:: .:..::.:::.:: .:: . :: :.
CCDS78 GMCGGPMLGLFSLGIVFPFVNWKGALGGLLTGITLSFWVAIGAFIYPAPASKTWPLPLST
420 430 440 450 460 470
490 500 510 520 530 540
pF1KE2 ARCVALSVNASGLLDPALLPANDSSRAPSSGMDASRPALADSFYAISYLYYGALGTLTTV
.:. .:.:.: : .: .:::..::..:.::::::.:.: : .
CCDS78 DQCIKSNVTATG---PPVL--------------SSRPGIADTWYSISYLYYSAVGCLGCI
480 490 500 510
550 560 570 580 590 600
pF1KE2 LCGALISCLTGPTKRSTLAPGLLWWDLARQTASVAPKEEVAILDDNLVKGPEELPTGNKK
. :..:: .:: . . : :.
CCDS78 VAGVIISLITGRQRGEDIQPLLIRPVCNLFCFWSKKYKTLCWCGVQHDSGTEQENLENGS
520 530 540 550 560 570
>>CCDS1740.1 SLC5A6 gene_id:8884|Hs109|chr2 (635 aa)
initn: 1494 init1: 1209 opt: 1423 Z-score: 1623.7 bits: 310.7 E(33420): 4.2e-84
Smith-Waterman score: 1499; 40.6% identity (70.2% similar) in 630 aa overlap (11-630:23-629)
10 20 30 40
pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARG-GQRSAEDF
::. :: ::.:.:..: .:::. . :: :.... ..
CCDS17 MSVGVSTSAPLSPTSGTSVGMSTFSIMDYVVFVLLLVLSLAIGLYHA-CRGWGRHTVGEL
10 20 30 40 50
50 60 70 80 90 100
pF1KE2 FTGGRRLAALPVGLSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMP
. . :... :::.::: :.:.::: .:::::: ::.: .. .. .:. .. : .:.:
CCDS17 LMADRKMGCLPVALSLLATFQSAVAILGVPSEIYRFGTQYWFLGCCYFLGLLIPAHIFIP
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE2 VFYRLGLTSTYEYLEMRFSRAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWAS
::::: :::.:::::.::...::.:::. .: ..: :.:.:::.: :: :::.:.: :
CCDS17 VFYRLHLTSAYEYLELRFNKTVRVCGTVTFIFQMVIYMGVVLYAPSLALNAVTGFDLWLS
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE2 LLSTGIICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHS
.:. ::.:: :::.::.:::.::::::..::. : .:. : ::: .: ..:..:.
CCDS17 VLALGIVCTVYTALGGLKAVIWTDVFQTLVMFLGQLAVIIVGSAKVGGLGRVWAVASQHG
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE2 RINLMDFNPDPRSRYTFWTFVVGGTLVWLSMYGVNQAQVQRYVACRTEKQAKLALLINQV
::. ....::: :.::::.. ::... ::.:::::::::::.. :::: : :. :
CCDS17 RISGFELDPDPFVRHTFWTLAFGGVFMMLSLYGVNQAQVQRYLSSRTEKAAVLSCY--AV
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE2 GLFLIVSSAACC--GIVMFVFYTDCDPLLLGRI-SAPDQYMPLLVLDIFEDLPGVPGLFL
: :: . : :.:::..: . :. . . .::::.. .:.:... :::.::::.
CCDS17 FPFQQVSLCVGCLIGLVMFAYYQEY-PMSIQQAQAAPDQFVLYFVMDLLKGLPGLPGLFI
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE2 ACAYSGTLSTASTSINAMAAVTVEDLIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAAL
:: .::.::: :...:..:.::.::::.: . .. . ...:.::.. :: :: .: .
CCDS17 ACLFSGSLSTISSAFNSLATVTMEDLIRPWFPEFSEARAIMLSRGLAFGYGLLCLGMAYI
360 370 380 390 400 410
410 420 430 440 450 460
pF1KE2 SSLLGGGVLQGSFTVMGVISGPLLGAFILGMFLPACNTPGVLAGLGAGLALSLWVALGAT
:: .: :::......:...::::: : ::::.: : ::...:: :::....:...:.
CCDS17 SSQMGP-VLQAAISIFGMVGGPLLGLFCLGMFFPCANPPGAVVGLLAGLVMAFWIGIGSI
420 430 440 450 460 470
470 480 490 500 510 520
pF1KE2 LYPPSEQTMRVLPSSAARCVALSVNASGLLDPALLPANDSSRAPSSGMDASRPALADSFY
. . . .: : . ..: : : :. .. : . . :.:. . ::
CCDS17 VTSMGSS----MPPSPSNGSSFS------LPTNLTVATVTTLMPLTTF--SKPTGLQRFY
480 490 500 510 520
530 540 550 560 570 580
pF1KE2 AISYLYYGALGTLTTVLCGALISCLTGPTKRSTLAPGLLWWDLARQTASVAPKEEVAILD
..:::.:.: .. :... : ..: ::: . .: :. .. : . :. : :
CCDS17 SLSYLWYSAHNSTTVIVVGLIVSLLTGRMRGRSLNPATIYPVLPKLL-SLLPLSCQKRLH
530 540 550 560 570 580
590 600 610 620 630
pF1KE2 DNLVKGPEELPTG--NKKP-PGFLPTNEDRLFFLGQKELEGA---GSWTPCVGHDGGRDQ
: ..: :: .:: : : ..:. :.:. :: . :.
CCDS17 CRSY-GQDHLDTGLFPEKPRNGVLGDSRDK----EAMALDGTAYQGSSSTCILQETSL
590 600 610 620 630
640
pF1KE2 QETNL
>>CCDS10625.1 SLC5A11 gene_id:115584|Hs109|chr16 (675 aa)
initn: 424 init1: 145 opt: 305 Z-score: 346.0 bits: 74.3 E(33420): 6.1e-13
Smith-Waterman score: 460; 25.4% identity (58.8% similar) in 476 aa overlap (16-457:28-492)
10 20 30 40
pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFF
: .:..:..: ..::: . .. . ... .:
CCDS10 MESGTSSPQPPQLDPLDAFPQKGLEPGDIAVLVLYFLFVLAVGLW-STVKTKRDTVKGYF
10 20 30 40 50
50 60 70 80 90 100
pF1KE2 TGGRRLAALPVGLSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPV
.: .. ::: :: :: ... . .:. . . :.. . :. :.. .. : .:.:.
CCDS10 LAGGDMVWWPVGASLFASNVGSGHFIGLAGSGAATGISVSAYELNGLFSVLMLAWIFLPI
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE2 FYRLGLTSTYEYLEMRFS--RAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWA
. .:. :::. ::. : . ..: .. . .. .:: :....: ::..
CCDS10 YIAGQVTTMPEYLRKRFGGIRIPIILAVLYLFIYIFTKISVDMYAGAIFIQQSLHLDLYL
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE2 SLLSTGIICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGG-----PRQVLT
.... : . ::..::. ::..::..:...:: : .... . ::: . :.
CCDS10 AIVGLLAITAVYTVAGGLAAVIYTDALQTLIMLIGALTLMGYSFAAVGGMEGLKEKYFLA
180 190 200 210 220 230
230 240 250 260 270
pF1KE2 LAQNHS--------RINLMDFNPDPRSRYTFWTFVV-GGTLVWLSMYGVNQAQVQRYVAC
::.:.: : . . . :: . : :. : .. : .. ..:. ::: .:
CCDS10 LASNRSENSSCGLPREDAFHIFRDPLTSDLPWPGVLFGMSIPSLWYWCTDQVIVQRTLAA
240 250 260 270 280 290
280 290 300 310 320
pF1KE2 RTEKQAK----LALLINQVGLFLIVSSAACCGIVMFVFYTD---C-DPLLLGRI-SAP--
.. ..:: .: .. . ::..: :.: ... : : :: . .: : :
CCDS10 KNLSHAKGGALMAAYLKVLPLFIMVFP----GMVSRILFPDQVACADPEICQKICSNPSG
300 310 320 330 340 350
330 340 350 360 370
pF1KE2 --DQYMPLLVLDIFEDLP-GVPGLFLACAYSGTLSTASTSINAMAAVTVEDL---IKPRL
: .: :::.. :: :. ::..: .. .:. .. .:. ... . :: ..::
CCDS10 CSDIAYPKLVLEL---LPTGLRGLMMAVMVAALMSSLTSIFNSASTIFTMDLWNHLRPRA
360 370 380 390 400 410
380 390 400 410 420 430
pF1KE2 RSLAPRKLVIISKGLSLIYG-SACLTVAALSSLLGGGVLQGSFTVMGVISGPLLGAFILG
. ..:.:... . :. . : . .... :: .. .. . .. :. .::.:
CCDS10 ---SEKELMIVGRVFVLLLVLVSILWIPVVQASQGGQLFIYIQSISSYLQPPVAVVFIMG
420 430 440 450 460
440 450 460 470 480 490
pF1KE2 MFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSAARCVALSVNASGLL
: : :.. :: .:: :.:
CCDS10 CFWKRTNEKGAFWGLISGLLLGLVRLVLDFIYVQPRCDQPDERPVLVKSIHYLYFSMILS
470 480 490 500 510 520
>>CCDS2074.1 SLC5A7 gene_id:60482|Hs109|chr2 (580 aa)
initn: 122 init1: 93 opt: 302 Z-score: 343.6 bits: 73.7 E(33420): 8.3e-13
Smith-Waterman score: 307; 22.0% identity (54.7% similar) in 464 aa overlap (19-457:13-447)
10 20 30 40 50
pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAED----FFTGGRRLAA
:: :..:. .:.:.. .. :::. ...::: ..
CCDS20 MAFHVEGLIAIIVFYLLILL---VGIWAAWRTKNSGSAEERSEAIIVGGRDIGL
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 LPVGLSLSASFMSAVQVLGVPSEAYR--YGLKFLWMCLGQLLNSVLTALLFMPVFYRLGL
: :....:..... . :. .: ::: . .: :. .: .:.: . :
CCDS20 LVGGFTMTATWVGGGYINGTAEAVYVPGYGLAWAQAPIGYSLSLILGGLFFAKPMRSKGY
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 TSTYEYLEMRFSRAVRLCGTL--QYIVATMLYTGIVIYAPALILNQVTGLDIWASLLSTG
.. . ... ... :. : : ... :.... .. : . .. . .:. :.. ..
CCDS20 VTMLDPFQQIYGK--RMGGLLFIPALMGEMFWAAAIFSALGATISVIIDVDMHISVIISA
120 130 140 150 160
180 190 200 210 220 230
pF1KE2 IICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLAQNHSRINLM
.: :.:: :::. .:..::: :. .. :.:. . : .: .: . .
CCDS20 LIATLYTLVGGLYSVAYTDVVQLFCIFVGLWISV---------P-----FALSHPAVADI
170 180 190 200 210
240 250 260 270 280
pF1KE2 DFNPDPRSRYTFWTFVVGGTLV--WLSMY------GVN-QAQVQRYVACRTEKQAKLALL
:. . : .: .. : ::. . :. :: :: .. . :.. .
CCDS20 GFTAVHAKYQKPWLGTVDSSEVYSWLDSFLLLMLGGIPWQAYFQRVLSSSSATYAQVLSF
220 230 240 250 260 270
290 300 310 320 330
pF1KE2 INQVGLFLIVSSAACCGIVMFVFYTDCDPLLLGRISAP------DQYMPLLVLDIFEDLP
. : .... : : . :: . : . : :. .:. ::. . :
CCDS20 LAAFGCLVMAIPAILIGAIGAS--TDWNQTAYG-LPDPKTTEEADMILPI-VLQYL--CP
280 290 300 310 320
340 350 360 370 380 390
pF1KE2 GVPGLF-LACAYSGTLSTASTSINAMAAVTVEDLIKPRLRSLAPRKLVI-ISKGLSLIYG
..: :. . ....:.:..:: . ... .... . .:. : : .. . . ...:
CCDS20 VYISFFGLGAVSAAVMSSADSSILSASSMFARNIYQLSFRQNASDKEIVWVMRITVFVFG
330 340 350 360 370 380
400 410 420 430 440 450
pF1KE2 SACLTVAALSSLLGGGVLQGSFTVMGVISGPLLGAFILGMFLPACNTPGVLAGLGAGLAL
.. ..: :.. . : .: :. :: :: . .:. . :: :..:: .:: :
CCDS20 ASATAMALLTKTVYGLWYLSSDLVYIVIFPQLLCV----LFVKGTNTYGAVAGYVSGLFL
390 400 410 420 430 440
460 470 480 490 500 510
pF1KE2 SLWVALGATLYPPSEQTMRVLPSSAARCVALSVNASGLLDPALLPANDSSRAPSSGMDAS
.
CCDS20 RITGGEPYLYLQPLIFYPGYYPDDNGIYNQKFPFKTLAMVTSFLTNICISYLAKYLFESG
450 460 470 480 490 500
>>CCDS13903.1 SLC5A4 gene_id:6527|Hs109|chr22 (659 aa)
initn: 345 init1: 143 opt: 300 Z-score: 340.5 bits: 73.3 E(33420): 1.2e-12
Smith-Waterman score: 421; 22.7% identity (56.0% similar) in 498 aa overlap (5-457:12-497)
10 20 30 40
pF1KE2 MEAVETGERPTFG-----AWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDFF
:: : : .. : : .:.....:: ..:::. : . .. . ::
CCDS13 MASTVSPSTIAETPEPPPLSDHIRNAADISVIVIYFLVVMAVGLWAML-KTNRGTIGGFF
10 20 30 40 50
50 60 70 80 90 100
pF1KE2 TGGRRLAALPVGLSLSASFMSAVQVLGVPSEAYRYGLK---FLWMCLGQLLNSVLTALLF
.:: .: :.: :: :: ... . .:. . . :. : : .:: . . .:
CCDS13 LAGRDMAWWPMGASLFASNIGSNHYVGLAGTGAASGVATVTFEWTSSVMLL---ILGWIF
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE2 MPVFYRLGLTSTYEYLEMRFS--RAVRLCGTLQYIVATMLYTGIVIYAPALILNQVTGLD
.:.. . :. . :::. ::. : . :. .. ..: . :.: :.... . :::
CCDS13 VPIYIKSGVMTMPEYLKKRFGGERLQVYLSILSLFICVVLLISADIFAGAIFIKLALGLD
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE2 IWASLLSTGIICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQVLTLA
.. ... . . ::..::. .:..::..:...:: : ..... . ::: ..
CCDS13 LYLAIFILLAMTAVYTTTGGLASVIYTDTLQTIIMLIGSFILMGFAFNEVGGYESFTEKY
180 190 200 210 220 230
230 240 250 260
pF1KE2 QNHS---------RINLMDFNPDPRSRYTF---------WTFVVGG---TLVWLSMYGVN
: . :. ..: : . : : .. : : .: .. .:
CCDS13 VNATPSVVEGDNLTISASCYTPRADSFHIFRDAVTGDIPWPGIIFGMPITALW--YWCTN
240 250 260 270 280 290
270 280 290 300
pF1KE2 QAQVQRYVACRTEKQAKLALLI----NQVGLFLIVSSAACCGIVMFVFYTD---------
:. ::: . . ...: : .. . . .::.: :.. ..:::
CCDS13 QVIVQRCLCGKDMSHVKAACIMCAYLKLLPMFLMVMP----GMISRILYTDMVACVVPSE
300 310 320 330 340 350
310 320 330 340 350 360
pF1KE2 CDPLLLGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSINAMAAVTVED
: .. . .: .::... . :. ::.:. .. .:. .. .:. ... . :
CCDS13 CVKHCGVDVGCTNYAYPTMVLELMPQ--GLRGLMLSVMLASLMSSLTSIFNSASTLFTID
360 370 380 390 400
370 380 390 400 410 420
pF1KE2 LIKPRLRSLAPRKLVIISKGLSLIYGSACLTVAALSSL-LGGGVLQGSFTVMGVISGPLL
: .. . ..:.: .. . :. . .. . : .. .: ... . .. . .. :.
CCDS13 LYTKMRKQASEKELLIAGRIFVLLLTVVSIVWVPLVQVSQNGQLIHYTESISSYLGPPIA
410 420 430 440 450 460
430 440 450 460 470 480
pF1KE2 GAFILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSAARCVALSV
..:.:..: : :.. :: .:::..:
CCDS13 AVFVLAIFCKRVNEQGAFWGLMVGLAMGLIRMITEFAYGTGSCLAPSNCPKIICGVHYLY
470 480 490 500 510 520
>>CCDS10714.1 SLC5A2 gene_id:6524|Hs109|chr16 (672 aa)
initn: 275 init1: 135 opt: 297 Z-score: 336.9 bits: 72.6 E(33420): 2e-12
Smith-Waterman score: 441; 25.1% identity (56.8% similar) in 505 aa overlap (2-457:3-497)
10 20 30 40 50
pF1KE2 MEAVETGERPTFGAW--------DYGVFALMLLVSTGIGLWVGLARGGQRSAEDFFTGG
: .:.: : .:: : :.: ..:. :.::: .. : .. .. .: .:
CCDS10 MEEHTEAGSAPEMGAQKALIDNPADILVIAAYFLLVIGVGLW-SMCRTNRGTVGGYFLAG
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 RRLAALPVGLSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMPVFYR
: .. ::: :: :: ... . .:. . . :: . . :. .: . :: ::.
CCDS10 RSMVWWPVGASLFASNIGSGHFVGLAGTGAASGLAVAGFEWNALFVVLLLGWLFAPVYLT
60 70 80 90 100 110
120 130 140 150 160
pF1KE2 LGLTSTYEYLEMRFS-RAVRL-CGTLQYIVATMLYTGIVIYAPALILNQVTGLDIWASLL
:. . .::. ::. : .:: ..:. .. . .. ... :....:. : .:.::..
CCDS10 AGVITMPQYLRKRFGGRRIRLYLSVLSLFLYIFTKISVDMFSGAVFIQQALGWNIYASVI
120 130 140 150 160 170
170 180 190 200 210
pF1KE2 STGIICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGPRQV----------
. : .::..::. :...::. :. :.:.: .... . ::: .
CCDS10 ALLGITMIYTVTGGLAALMYTDTVQTFVILGGACILMGYAFHEVGGYSGLFDKYLGAATS
180 190 200 210 220 230
220 230 240 250 260
pF1KE2 LTLAQNHSRINLMDFNPDPR-SRYTFWTFVVGGTLVWLSMY-GV----------NQAQVQ
::.... . :. .: :: . : . : : : : .. :. .:. ::
CCDS10 LTVSEDPAVGNISSFCYRPRPDSYHLLRHPVTGDLPWPALLLGLTIVSGWYWCSDQVIVQ
240 250 260 270 280 290
270 280 290 300 310
pF1KE2 RYVACRTEKQAK----LALLINQVGLFLIVSSAACCGIVMFVFYTD---------CDPLL
: .: .. . : : .. . .::.: :.. ..: : : .
CCDS10 RCLAGKSLTHIKAGCILCGYLKLTPMFLMVMP----GMISRILYPDEVACVVPEVCRRVC
300 310 320 330 340 350
320 330 340 350 360 370
pF1KE2 LGRISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSINAMAAVTVEDLIKPR
... . .: ::. .. . :. ::.:: .. .:. .. .:. ... . : : :
CCDS10 GTEVGCSNIAYPRLVVKLMPN--GLRGLMLAVMLAALMSSLASIFNSSSTLFTMD-IYTR
360 370 380 390 400 410
380 390 400 410 420 430
pF1KE2 LRSLA-PRKLVIISKGLSLIYGSACLTVAAL---SSLLGGGVLQGSFTVMGVISGPLLGA
:: : :.:..... : ... . ..:: : .. :: ... .: . .. :. ..
CCDS10 LRPRAGDRELLLVGR-LWVVF-IVVVSVAWLPVVQAAQGGQLFDYIQAVSSYLAPPVSAV
420 430 440 450 460 470
440 450 460 470 480 490
pF1KE2 FILGMFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSAARCVALSVNA
:.:..:.: : :.. :: .:: ..:
CCDS10 FVLALFVPRVNEQGAFWGLIGGLLMGLARLIPEFSFGSGSCVQPSACPAFLCGVHYLYFA
480 490 500 510 520 530
>>CCDS13902.1 SLC5A1 gene_id:6523|Hs109|chr22 (664 aa)
initn: 292 init1: 144 opt: 286 Z-score: 324.4 bits: 70.3 E(33420): 9.7e-12
Smith-Waterman score: 414; 22.2% identity (58.9% similar) in 487 aa overlap (4-457:17-497)
10 20 30 40
pF1KE2 MEAVETGERPTFGAWDYGVFALMLLVSTGIGLWVGLARGGQRSAEDF
::: : .: : ........: ..:::. .. . . .. :
CCDS13 MDSSTWSPKTTAVTRPVETHEL-IRNAADISIIVIYFVVVMAVGLWAMFSTN-RGTVGGF
10 20 30 40 50
50 60 70 80 90 100
pF1KE2 FTGGRRLAALPVGLSLSASFMSAVQVLGVPSEAYRYGLKFLWMCLGQLLNSVLTALLFMP
: .:: .. :.: :: :: ... . .:. . . :. . . . :. :. . ::.:
CCDS13 FLAGRSMVWWPIGASLFASNIGSGHFVGLAGTGAASGIAIGGFEWNALVLVVVLGWLFVP
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE2 VFYRLGLTSTYEYLEMRFS-RAVRLCGTLQYIVATMLYTGIV--IYAPALILNQVTGLDI
.. . :... :::. ::. . ... .: .. ...: : :.. :...: . ::..
CCDS13 IYIKAGVVTMPEYLRKRFGGQRIQVYLSLLSLL-LYIFTKISADIFSGAIFINLALGLNL
120 130 140 150 160 170
170 180 190 200 210
pF1KE2 WASLLSTGIICTFYTAVGGMKAVVWTDVFQVVVMLSGFWVVLARGVMLVGGP--------
. ... : ..:: .::. ::..::..:.:.:: : .. . . :::
CCDS13 YLAIFLLLAITALYTITGGLAAVIYTDTLQTVIMLVGSLILTGFAFHEVGGYDAFMEKYM
180 190 200 210 220 230
220 230 240 250 260
pF1KE2 RQVLTLAQN-HSRINLMDFNPDPRSRYTF---------WT-FVVGGTLVWLSMYGVNQAQ
. . :.... .. .. ..: : . : : :. : ... : .. ..:.
CCDS13 KAIPTIVSDGNTTFQEKCYTPRADSFHIFRDPLTGDLPWPGFIFGMSILTLWYWCTDQVI
240 250 260 270 280 290
270 280 290 300 310
pF1KE2 VQRYVACRTEKQAK----LALLINQVGLFLIVSSAACCGI-----VMFVFYTDCDPLLLG
::: .. .. ...: : .. . .:..: . : . : ..:.
CCDS13 VQRCLSAKNMSHVKGGCILCGYLKLMPMFIMVMPGMISRILYTEKIACVVPSECEKYCGT
300 310 320 330 340 350
320 330 340 350 360 370
pF1KE2 RISAPDQYMPLLVLDIFEDLPGVPGLFLACAYSGTLSTASTSINAMAAVTVEDLIKPRLR
... . .: ::.... . :. ::.:. .. .:. .. .:. ... . : : ..:
CCDS13 KVGCTNIAYPTLVVELMPN--GLRGLMLSVMLASLMSSLTSIFNSASTLFTMD-IYAKVR
360 370 380 390 400 410
380 390 400 410 420 430
pF1KE2 SLAPRKLVIISKGLSLIY--GSACLTVAALSSLLGGGVLQGSFTVMGVISGPLLGAFILG
. : .: ..:. : .. : . : ..: .: ... .. . .. :. ..:.:.
CCDS13 KRASEKELMIAGRLFILVLIGISIAWVPIVQSAQSGQLFDYIQSITSYLGPPIAAVFLLA
420 430 440 450 460 470
440 450 460 470 480 490
pF1KE2 MFLPACNTPGVLAGLGAGLALSLWVALGATLYPPSEQTMRVLPSSAARCVALSVNASGLL
.: : ::.. :: :: ...
CCDS13 IFWKRVNEPGAFWGLILGLLIGISRMITEFAYGTGSCMEPSNCPTIICGVHYLYFAIILF
480 490 500 510 520 530
643 residues in 1 query sequences
18921897 residues in 33420 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Jul 3 15:00:17 2018 done: Tue Jul 3 15:00:18 2018
Total Scan time: 1.800 Total Display time: 0.150
Function used was FASTA [36.3.4 Apr, 2011]