FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA0447, 405 aa
1>>>pF1KA0447 405 - 405 aa - 405 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.6264+/-0.000943; mu= 20.6535+/- 0.057
mean_var=63.3144+/-13.066, 0's: 0 Z-trim(104.4): 35 B-trim: 0 in 0/49
Lambda= 0.161184
statistics sampled from 7872 (7896) to 7872 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.616), E-opt: 0.2 (0.243), width: 16
Scan time: 2.570
The best scores are: opt bits E(32554)
CCDS44041.1 SLC35E2B gene_id:728661|Hs108|chr1 ( 405) 2577 608.2 4.4e-174
CCDS55560.1 SLC35E2 gene_id:9906|Hs108|chr1 ( 246) 1263 302.5 2.9e-82
CCDS33.1 SLC35E2 gene_id:9906|Hs108|chr1 ( 266) 1263 302.5 3.1e-82
CCDS12346.2 SLC35E1 gene_id:79939|Hs108|chr19 ( 410) 422 107.1 3.2e-23
CCDS13396.1 SLC35C2 gene_id:51006|Hs108|chr20 ( 365) 270 71.7 1.3e-12
CCDS63292.1 SLC35C2 gene_id:51006|Hs108|chr20 ( 394) 270 71.7 1.3e-12
CCDS41808.1 SLC35E3 gene_id:55508|Hs108|chr12 ( 313) 268 71.2 1.6e-12
>>CCDS44041.1 SLC35E2B gene_id:728661|Hs108|chr1 (405 aa)
initn: 2577 init1: 2577 opt: 2577 Z-score: 3238.8 bits: 608.2 E(32554): 4.4e-174
Smith-Waterman score: 2577; 99.8% identity (100.0% similar) in 405 aa overlap (1-405:1-405)
10 20 30 40 50 60
pF1KA0 MSSSVKTPALEELVPGSEEKPKGRSPLSWGSLFGHRSEKIVFAKSDGGTDENVLTVTITE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MSSSVKTPALEELVPGSEEKPKGRSPLSWGSLFGHRSEKIVFAKSDGGTDENVLTVTITE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA0 TTVIESDLGVWSSRALLYLTLWFFFSFCTLFLNKYILSLLGGEPSMLGAVQMLSTTVIGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TTVIESDLGVWSSRALLYLTLWFFFSFCTLFLNKYILSLLGGEPSMLGAVQMLSTTVIGC
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA0 VKTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATVVLGLVSLKNVAVSFAETVKSSAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VKTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATVVLGLVSLKNVAVSFAETVKSSAP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA0 IFTVIMSRMILGEYTGLLVNLSLIPVMGGLALCTATEISFNVLGFSAALSTNIMDCLQNV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 IFTVIMSRMILGEYTGLLVNLSLIPVMGGLALCTATEISFNVLGFSAALSTNIMDCLQNV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA0 FSKKLLSGDKYRFSAPELQFYTSAAAVAMLVPARVFFTDVPVIGRSGKSFSYNQDVVLLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 FSKKLLSGDKYRFSAPELQFYTSAAAVAMLVPARVFFTDVPVIGRSGKSFSYNQDVVLLL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA0 LTDGVLFHLQSITAYALMGKISPVTFSVASTVKHALSIWLSVIVFGNKITSLSAVGTALV
:::::::::::.::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LTDGVLFHLQSVTAYALMGKISPVTFSVASTVKHALSIWLSVIVFGNKITSLSAVGTALV
310 320 330 340 350 360
370 380 390 400
pF1KA0 TVGVLLYNKARQHQQEALQSLAAATGRAPDDTVEPLLPQDPRQHP
:::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TVGVLLYNKARQHQQEALQSLAAATGRAPDDTVEPLLPQDPRQHP
370 380 390 400
>>CCDS55560.1 SLC35E2 gene_id:9906|Hs108|chr1 (246 aa)
initn: 1263 init1: 1263 opt: 1263 Z-score: 1590.4 bits: 302.5 E(32554): 2.9e-82
Smith-Waterman score: 1263; 100.0% identity (100.0% similar) in 196 aa overlap (1-196:1-196)
10 20 30 40 50 60
pF1KA0 MSSSVKTPALEELVPGSEEKPKGRSPLSWGSLFGHRSEKIVFAKSDGGTDENVLTVTITE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MSSSVKTPALEELVPGSEEKPKGRSPLSWGSLFGHRSEKIVFAKSDGGTDENVLTVTITE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA0 TTVIESDLGVWSSRALLYLTLWFFFSFCTLFLNKYILSLLGGEPSMLGAVQMLSTTVIGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 TTVIESDLGVWSSRALLYLTLWFFFSFCTLFLNKYILSLLGGEPSMLGAVQMLSTTVIGC
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA0 VKTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATVVLGLVSLKNVAVSFAETVKSSAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VKTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATVVLGLVSLKNVAVSFAETVKSSAP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA0 IFTVIMSRMILGEYTGLLVNLSLIPVMGGLALCTATEISFNVLGFSAALSTNIMDCLQNV
::::::::::::::::
CCDS55 IFTVIMSRMILGEYTGRPSDREEREELQLQPGRGAAASDRRSPVPPSERHGVRPHGENLP
190 200 210 220 230 240
>>CCDS33.1 SLC35E2 gene_id:9906|Hs108|chr1 (266 aa)
initn: 1263 init1: 1263 opt: 1263 Z-score: 1589.9 bits: 302.5 E(32554): 3.1e-82
Smith-Waterman score: 1263; 100.0% identity (100.0% similar) in 196 aa overlap (1-196:1-196)
10 20 30 40 50 60
pF1KA0 MSSSVKTPALEELVPGSEEKPKGRSPLSWGSLFGHRSEKIVFAKSDGGTDENVLTVTITE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MSSSVKTPALEELVPGSEEKPKGRSPLSWGSLFGHRSEKIVFAKSDGGTDENVLTVTITE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA0 TTVIESDLGVWSSRALLYLTLWFFFSFCTLFLNKYILSLLGGEPSMLGAVQMLSTTVIGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TTVIESDLGVWSSRALLYLTLWFFFSFCTLFLNKYILSLLGGEPSMLGAVQMLSTTVIGC
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA0 VKTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATVVLGLVSLKNVAVSFAETVKSSAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VKTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATVVLGLVSLKNVAVSFAETVKSSAP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA0 IFTVIMSRMILGEYTGLLVNLSLIPVMGGLALCTATEISFNVLGFSAALSTNIMDCLQNV
::::::::::::::::
CCDS33 IFTVIMSRMILGEYTGRPSDREEREELQLQPGRGAAASDRRSPVPPSERHGVRPHGENLP
190 200 210 220 230 240
>>CCDS12346.2 SLC35E1 gene_id:79939|Hs108|chr19 (410 aa)
initn: 423 init1: 245 opt: 422 Z-score: 530.5 bits: 107.1 E(32554): 3.2e-23
Smith-Waterman score: 425; 30.1% identity (61.0% similar) in 356 aa overlap (34-385:9-351)
10 20 30 40 50 60
pF1KA0 SVKTPALEELVPGSEEKPKGRSPLSWGSLFGHRSEKIVFAKSDGGTDENVLTVTITETTV
:: . :.:.::. :.. ....
CCDS12 MAAAAVGAGHGAGGPGAASSSGGAREGARVAALCLLWY
10 20 30
70 80 90 100 110 120
pF1KA0 IESDLGVWSSRALLY-LTLWFFFSFCTLFLNKYILSLLGGEPSMLGAVQML-STTVIGCV
: : ....: . . :.: .::.: .: : .: : .. . : :
CCDS12 ALSAGGNVVNKVILSAFPFPVTVSLC------HILALCAGLPPLLRAWRVPPAPPVSGPG
40 50 60 70 80 90
130 140 150 160 170 180
pF1KA0 KTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATVVLGLVSLKNVAVSFAETVKSSAPI
. : : . : ... . : : ::.: . ::. .: ::.:.:::.. ::
CCDS12 PSPHPSSGPLLPPR--FYPRYVLPLAF-G-KYFASVS-AHVSIWKVPVSYAHTVKATMPI
100 110 120 130 140
190 200 210 220 230 240
pF1KA0 FTVIMSRMILGEYTGLLVNLSLIPVMGGLALCTATEISFNVLGFSAALSTNIMDCLQNVF
..:..::.:. : . : :::::...:. : :.::.::.. :. .::.... :::.:
CCDS12 WVVLLSRIIMKEKQSTKVYLSLIPIISGVLLATVTELSFDMWGLVSALAATLCFSLQNIF
150 160 170 180 190 200
250 260 270 280 290 300
pF1KA0 SKKLLSGDKYRFSAPELQFYTSAAAVAMLVPARVFFTDVPVIGRSGKSFSYNQDVVLLLL
:::.: . :. .: . :: ...:. :. . : .. :. .::::
CCDS12 SKKVLRDS--RIHHLRLLNILGCHAVFFMIPTWVLVDLSAFLVSSDLTYVYQWPWTLLLL
210 220 230 240 250 260
310 320 330 340 350 360
pF1KA0 T-DGVLFHLQSITAYALMGKISPVTFSVASTVKHALSIWLSVIVFGNKITSLSAVGTALV
. .: :.. :..... .::...:::...:. . : .:.:.. : .:: ...: .
CCDS12 AVSGFCNFAQNVIAFSILNLVSPLSYSVANATKRIMVITVSLIMLRNPVTSTNVLGMMTA
270 280 290 300 310 320
370 380 390 400
pF1KA0 TVGVLLYNKARQH-QQEALQSLAAATGRAPDDTVEPLLPQDPRQHP
.::.::::.. .:.: . : .:
CCDS12 ILGVFLYNKTKYDANQQARKHLLPVTTADLSSKERHRSPLEKPHNGLLFPQHGDYQYGRN
330 340 350 360 370 380
>>CCDS13396.1 SLC35C2 gene_id:51006|Hs108|chr20 (365 aa)
initn: 135 init1: 111 opt: 270 Z-score: 340.1 bits: 71.7 E(32554): 1.3e-12
Smith-Waterman score: 270; 25.9% identity (58.2% similar) in 347 aa overlap (70-403:11-349)
40 50 60 70 80 90
pF1KA0 IVFAKSDGGTDENVLTVTITETTVIESDLGVWSSRALLYLTLWFF-FSFCTLFLNKYILS
.:.. : :.: .. ::. : ::.. .
CCDS13 MGRWALDVAFLWKAVLTLGLVLLYYCFSIGITFYNKWLTK
10 20 30 40
100 110 120 130 140 150
pF1KA0 LLGGEPSMLGAVQMLSTTVIGCV-KTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATV
. : .. ... ... . ..:: : .. .. ::. ..: . ..: :
CCDS13 SFH-FPLFMTMLHLAVIFLFSALSRALVQCSSHRARVVLSWA-DYLRRVAPTALATALDV
50 60 70 80 90
160 170 180 190 200 210
pF1KA0 VLGLVSLKNVAVSFAETVKSSAPIFTVIMSRMI-LGEYTGLLVNLSLIPVMGGLALCTAT
:. :. :.::. .:::: .: .:.: .. : : . :: . :. . ::: . :
CCDS13 GLSNWSFLYVTVSLYTMTKSSAVLFILIFSLIFKLEELRAALVLVVLL-IAGGLFMFTYK
100 110 120 130 140 150
220 230 240 250 260 270
pF1KA0 EISFNVLGFSAALSTNIMDCLQNVFSKKLLSGDKYRFSAP-ELQFYTSAAAVAMLVPARV
.::: ::. .:..... .. .... ::. . .. : . .:. . : : .
CCDS13 STQFNVEGFALVLGASFIGGIRWTLTQMLLQKAELGLQNPIDTMFHLQPLMFLGLFPLFA
160 170 180 190 200 210
280 290 300 310 320
pF1KA0 FFTDVPVIGRSGKSFSYNQDVVLLLLTDGVLFHLQSITAYAL-------MGKISPVTFSV
: . .. : : : . ::. ::: . : :: : .: :..: ... : .:.:.
CCDS13 VFEGLH-LSTSEKIFRF-QDTGLLLRVLGSLF-LGGILAFGLGFSEFLLVSRTSSLTLSI
220 230 240 250 260 270
330 340 350 360 370 380
pF1KA0 ASTVKHALSIWLSVIVFGNKITSLSAVGTALVTVGVLLYN--KARQHQQEALQSLAAATG
:. :.. .. :.. ..:..:. :. .: :: :. :. :: . . .. . . :
CCDS13 AGIFKEVCTLLLAAHLLGDQISLLNWLGFALCLSGISLHVALKALHSRGDGGPKALKGLG
280 290 300 310 320 330
390 400
pF1KA0 RAPDDTVEPLLPQDPRQHP
.:: .: :: .. :.
CCDS13 SSPD--LELLLRSSQREEGDNEEEEYFVAQGQQ
340 350 360
>>CCDS63292.1 SLC35C2 gene_id:51006|Hs108|chr20 (394 aa)
initn: 163 init1: 111 opt: 270 Z-score: 339.7 bits: 71.7 E(32554): 1.3e-12
Smith-Waterman score: 270; 25.9% identity (58.2% similar) in 347 aa overlap (70-403:40-378)
40 50 60 70 80 90
pF1KA0 IVFAKSDGGTDENVLTVTITETTVIESDLGVWSSRALLYLTLWFF-FSFCTLFLNKYILS
.:.. : :.: .. ::. : ::.. .
CCDS63 PLRGVPAPADSGAPVLQPPRMGRWALDVAFLWKAVLTLGLVLLYYCFSIGITFYNKWLTK
10 20 30 40 50 60
100 110 120 130 140 150
pF1KA0 LLGGEPSMLGAVQMLSTTVIGCV-KTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATV
. : .. ... ... . ..:: : .. .. ::. ..: . ..: :
CCDS63 SFH-FPLFMTMLHLAVIFLFSALSRALVQCSSHRARVVLSWA-DYLRRVAPTALATALDV
70 80 90 100 110 120
160 170 180 190 200 210
pF1KA0 VLGLVSLKNVAVSFAETVKSSAPIFTVIMSRMI-LGEYTGLLVNLSLIPVMGGLALCTAT
:. :. :.::. .:::: .: .:.: .. : : . :: . :. . ::: . :
CCDS63 GLSNWSFLYVTVSLYTMTKSSAVLFILIFSLIFKLEELRAALVLVVLL-IAGGLFMFTYK
130 140 150 160 170 180
220 230 240 250 260 270
pF1KA0 EISFNVLGFSAALSTNIMDCLQNVFSKKLLSGDKYRFSAP-ELQFYTSAAAVAMLVPARV
.::: ::. .:..... .. .... ::. . .. : . .:. . : : .
CCDS63 STQFNVEGFALVLGASFIGGIRWTLTQMLLQKAELGLQNPIDTMFHLQPLMFLGLFPLFA
190 200 210 220 230 240
280 290 300 310 320
pF1KA0 FFTDVPVIGRSGKSFSYNQDVVLLLLTDGVLFHLQSITAYAL-------MGKISPVTFSV
: . .. : : : . ::. ::: . : :: : .: :..: ... : .:.:.
CCDS63 VFEGLH-LSTSEKIFRF-QDTGLLLRVLGSLF-LGGILAFGLGFSEFLLVSRTSSLTLSI
250 260 270 280 290 300
330 340 350 360 370 380
pF1KA0 ASTVKHALSIWLSVIVFGNKITSLSAVGTALVTVGVLLYN--KARQHQQEALQSLAAATG
:. :.. .. :.. ..:..:. :. .: :: :. :. :: . . .. . . :
CCDS63 AGIFKEVCTLLLAAHLLGDQISLLNWLGFALCLSGISLHVALKALHSRGDGGPKALKGLG
310 320 330 340 350 360
390 400
pF1KA0 RAPDDTVEPLLPQDPRQHP
.:: .: :: .. :.
CCDS63 SSPD--LELLLRSSQREEGDNEEEEYFVAQGQQ
370 380 390
>>CCDS41808.1 SLC35E3 gene_id:55508|Hs108|chr12 (313 aa)
initn: 241 init1: 150 opt: 268 Z-score: 338.5 bits: 71.2 E(32554): 1.6e-12
Smith-Waterman score: 319; 25.3% identity (59.2% similar) in 316 aa overlap (69-380:10-307)
40 50 60 70 80 90
pF1KA0 KIVFAKSDGGTDENVLTVTITETTVIESDLGVWSSRALLYLTLWFFFSFCTLFLNKYILS
: : : : ..: . :.: .::::.:
CCDS41 MALLVDRVRGHWRIAAGLLFNL--LVSICIVFLNKWIY-
10 20 30
100 110 120 130 140 150
pF1KA0 LLGGEPSMLGAVQMLSTTVIGCVKTLVPCCLYQHKARLSYPPN--FLMTMLFVGLMRFAT
. : :.: .. . .: .: : : . : : ::. .:... : :.. :..
CCDS41 VYHGFPNMSLTLVHFVVTWLG----LYICQKLDIFAPKSLPPSRLLLLALSFCGFVVFTN
40 50 60 70 80 90
160 170 180 190 200 210
pF1KA0 VVLGLVSLKNVAVSFAETVKS-SAPIFTVIMSRMILGEYTGLLVNLSLIPVMGGLALCTA
. ::.: ... . .:. ..:.. .:.. .. ..:.:::. :. : .
CCDS41 L-----SLQNNTIGTYQLAKAMTTPVIIAIQTFCYQKTFS-TRIQLTLIPITLGVILNSY
100 110 120 130 140
220 230 240 250 260 270
pF1KA0 TEISFNVLGFS-AALSTNIMDCLQNVFSKKLLSGDKYRFSAPELQFYTSAAAVAMLVPAR
...:: ::. :::.. . . : . : . . .. .: .: . . :::. :
CCDS41 YDVKFNFLGMVFAALGVLVTSLYQVWVGAKQ---HELQVNSMQLLYYQAPMSSAMLLVAV
150 160 170 180 190 200
280 290 300 310 320 330
pF1KA0 VFFTDVPVIGRSGKSFSYNQDVVLLLLTDGVLFHLQSITAYALMGKISPVTFSVASTVKH
:: ::.:..: .. ...:..: .::. . ... : ..:. ::::... . :
CCDS41 PFFE--PVFGEGGIFGPWSVSALLMVLLSGVIAFMVNLSIYWIIGNTSPVTYNMFGHFKF
210 220 230 240 250 260
340 350 360 370 380 390
pF1KA0 ALSIWLSVIVFGNKITSLSAVGTALVTVGVLLYNKARQHQQEALQSLAAATGRAPDDTVE
.... . ..: . .. .:.: . :.: :.. . .::. .:
CCDS41 CITLFGGYVLFKDPLSINQALGILCTLFGILAYTHFKLSEQEGSRSKLAQRP
270 280 290 300 310
400
pF1KA0 PLLPQDPRQHP
405 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 18:57:56 2016 done: Wed Nov 2 18:57:56 2016
Total Scan time: 2.570 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]