FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA0260, 355 aa
1>>>pF1KA0260 355 - 355 aa - 355 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.4232+/-0.00124; mu= 15.1154+/- 0.073
mean_var=56.3165+/-12.023, 0's: 0 Z-trim(99.3): 32 B-trim: 303 in 1/48
Lambda= 0.170906
statistics sampled from 5655 (5666) to 5655 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.517), E-opt: 0.2 (0.174), width: 16
Scan time: 2.470
The best scores are: opt bits E(32554)
CCDS636.1 SLC35D1 gene_id:23169|Hs108|chr1 ( 355) 2261 566.2 1.5e-161
CCDS6717.1 SLC35D2 gene_id:11046|Hs108|chr9 ( 337) 1236 313.5 1.7e-85
CCDS69625.1 SLC35D2 gene_id:11046|Hs108|chr9 ( 249) 527 138.6 5.4e-33
CCDS34544.1 SLC35D3 gene_id:340146|Hs108|chr6 ( 416) 323 88.4 1.2e-17
>>CCDS636.1 SLC35D1 gene_id:23169|Hs108|chr1 (355 aa)
initn: 2261 init1: 2261 opt: 2261 Z-score: 3013.9 bits: 566.2 E(32554): 1.5e-161
Smith-Waterman score: 2261; 100.0% identity (100.0% similar) in 355 aa overlap (1-355:1-355)
10 20 30 40 50 60
pF1KA0 MAEVHRRQHARVKGEAPAKSSTLRDEEELGMASAETLTVFLKLLAAGFYGVSSFLIVVVN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 MAEVHRRQHARVKGEAPAKSSTLRDEEELGMASAETLTVFLKLLAAGFYGVSSFLIVVVN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA0 KSVLTNYRFPSSLCVGLGQMVATVAVLWVGKALRVVKFPDLDRNVPRKTFPLPLLYFGNQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 KSVLTNYRFPSSLCVGLGQMVATVAVLWVGKALRVVKFPDLDRNVPRKTFPLPLLYFGNQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA0 ITGLFSTKKLNLPMFTVLRRFSILFTMFAEGVLLKKTFSWGIKMTVFAMIIGAFVAASSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 ITGLFSTKKLNLPMFTVLRRFSILFTMFAEGVLLKKTFSWGIKMTVFAMIIGAFVAASSD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA0 LAFDLEGYAFILINDVLTAANGAYVKQKLDSKELGKYGLLYYNALFMILPTLAIAYFTGD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 LAFDLEGYAFILINDVLTAANGAYVKQKLDSKELGKYGLLYYNALFMILPTLAIAYFTGD
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA0 AQKAVEFEGWADTLFLLQFTLSCVMGFILMYATVLCTQYNSALTTTIVGCIKNILITYIG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 AQKAVEFEGWADTLFLLQFTLSCVMGFILMYATVLCTQYNSALTTTIVGCIKNILITYIG
250 260 270 280 290 300
310 320 330 340 350
pF1KA0 MVFGGDYIFTWTNFIGLNISIAGSLVYSYITFTEEQLSKQSEANNKLDIKGKGAV
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 MVFGGDYIFTWTNFIGLNISIAGSLVYSYITFTEEQLSKQSEANNKLDIKGKGAV
310 320 330 340 350
>>CCDS6717.1 SLC35D2 gene_id:11046|Hs108|chr9 (337 aa)
initn: 1219 init1: 1219 opt: 1236 Z-score: 1648.5 bits: 313.5 E(32554): 1.7e-85
Smith-Waterman score: 1236; 57.7% identity (85.2% similar) in 310 aa overlap (42-350:27-336)
20 30 40 50 60 70
pF1KA0 VKGEAPAKSSTLRDEEELGMASAETLTVFLKLLAAGFYGVSSFLIVVVNKSVLTNYRFPS
.::.: :::. :::::.:::..::.: :::
CCDS67 MTAGGQAEAEGAGGEPGAARLPSRVARLLSALFYGTCSFLIVLVNKALLTTYGFPS
10 20 30 40 50
80 90 100 110 120 130
pF1KA0 SLCVGLGQMVATVAVLWVGKALRVVKFPDLDRNVPRKTFPLPLLYFGNQITGLFSTKKLN
. .:.:::.::. .:.:.: ....:::.:...: : ::::::: ::.:.:: ::.::.
CCDS67 PIFLGIGQMAATIMILYVSKLNKIIHFPDFDKKIPVKLFPLPLLYVGNHISGLSSTSKLS
60 70 80 90 100 110
140 150 160 170 180 190
pF1KA0 LPMFTVLRRFSILFTMFAEGVLLKKTFSWGIKMTVFAMIIGAFVAASSDLAFDLEGYAFI
::::::::.:.: .:.. : ..: : .: .: ..:::.:.:::.::.:::::.:::: :.
CCDS67 LPMFTVLRKFTIPLTLLLETIILGKQYSLNIILSVFAIILGAFIAAGSDLAFNLEGYIFV
120 130 140 150 160 170
200 210 220 230 240 250
pF1KA0 LINDVLTAANGAYVKQKLDSKELGKYGLLYYNALFMILPTLAIAYFTGDAQKAVEFEGWA
..::..:::::.:.:::.: :::::::.:.::: :::.::: :. ::: :.:.::. :
CCDS67 FLNDIFTAANGVYTKQKMDPKELGKYGVLFYNACFMIIPTLIISVSTGDLQQATEFNQWK
180 190 200 210 220 230
260 270 280 290 300 310
pF1KA0 DTLFLLQFTLSCVMGFILMYATVLCTQYNSALTTTIVGCIKNILITYIGMVFGGDYIFTW
...:.::: ::: .::.:::.::::. :::::::..:: :::. ..:::...::::::.
CCDS67 NVVFILQFLLSCFLGFLLMYSTVLCSYYNSALTTAVVGAIKNVSVAYIGILIGGDYIFSL
240 250 260 270 280 290
320 330 340 350
pF1KA0 TNFIGLNISIAGSLVYSYITFTEEQLSKQ-SEANNKLDIKGKGAV
::.:::: .::.: ::..:.. . : .: : ::.:
CCDS67 LNFVGLNICMAGGLRYSFLTLSSQLKPKPVGEENICLDLKS
300 310 320 330
>>CCDS69625.1 SLC35D2 gene_id:11046|Hs108|chr9 (249 aa)
initn: 813 init1: 524 opt: 527 Z-score: 705.9 bits: 138.6 E(32554): 5.4e-33
Smith-Waterman score: 655; 40.0% identity (60.3% similar) in 310 aa overlap (42-350:27-248)
20 30 40 50 60 70
pF1KA0 VKGEAPAKSSTLRDEEELGMASAETLTVFLKLLAAGFYGVSSFLIVVVNKSVLTNYRFPS
.::.: :::. :::::.:::..::.: :::
CCDS69 MTAGGQAEAEGAGGEPGAARLPSRVARLLSALFYGTCSFLIVLVNKALLTTYGFPS
10 20 30 40 50
80 90 100 110 120 130
pF1KA0 SLCVGLGQMVATVAVLWVGKALRVVKFPDLDRNVPRKTFPLPLLYFGNQITGLFSTKKLN
. .:.:::.::. .:.:.: ....:::.:...: : ::::::: ::.:.:: ::.::.
CCDS69 PIFLGIGQMAATIMILYVSKLNKIIHFPDFDKKIPVKLFPLPLLYVGNHISGLSSTSKLS
60 70 80 90 100 110
140 150 160 170 180 190
pF1KA0 LPMFTVLRRFSILFTMFAEGVLLKKTFSWGIKMTVFAMIIGAFVAASSDLAFDLEGYAFI
::::::::.:.: .:.. : ..: : .: .: ..:::.:.:::.::
CCDS69 LPMFTVLRKFTIPLTLLLETIILGKQYSLNIILSVFAIILGAFIAA--------------
120 130 140 150 160
200 210 220 230 240 250
pF1KA0 LINDVLTAANGAYVKQKLDSKELGKYGLLYYNALFMILPTLAIAYFTGDAQKAVEFEGWA
CCDS69 ------------------------------------------------------------
260 270 280 290 300 310
pF1KA0 DTLFLLQFTLSCVMGFILMYATVLCTQYNSALTTTIVGCIKNILITYIGMVFGGDYIFTW
::.:::.::::. :::::::..:: :::. ..:::...::::::.
CCDS69 --------------GFLLMYSTVLCSYYNSALTTAVVGAIKNVSVAYIGILIGGDYIFSL
170 180 190 200
320 330 340 350
pF1KA0 TNFIGLNISIAGSLVYSYITFTEEQLSKQ-SEANNKLDIKGKGAV
::.:::: .::.: ::..:.. . : .: : ::.:
CCDS69 LNFVGLNICMAGGLRYSFLTLSSQLKPKPVGEENICLDLKS
210 220 230 240
>>CCDS34544.1 SLC35D3 gene_id:340146|Hs108|chr6 (416 aa)
initn: 286 init1: 227 opt: 323 Z-score: 430.3 bits: 88.4 E(32554): 1.2e-17
Smith-Waterman score: 323; 28.4% identity (56.8% similar) in 310 aa overlap (49-353:18-320)
20 30 40 50 60 70
pF1KA0 KSSTLRDEEELGMASAETLTVFLKLLAAGFYGVSSFLIVVVNKSVLTNYRFPSSLCVGLG
.:: : . .. : ... :.: : : .
CCDS34 MRQLCRGRVLGISVAIAHGVFSGSLNILLKFLISRYQF-SFLTLVQC
10 20 30 40
80 90 100 110 120 130
pF1KA0 QMVATVAV-LWVGKALRVVKFPDLDRNVPRKTFPLPLLYFGNQITGLFSTKKLNLPMFTV
.:.:. : . . : .. : . .. :. . .: .. :.: . :.:::..:
CCDS34 LTSSTAALSLELLRRLGLIAVPPFGLSLARSFAGVAVLSTLQSSLTLWSLRGLSLPMYVV
50 60 70 80 90 100
140 150 160 170 180 190
pF1KA0 LRRFSILFTMFAEGVLLKKTF--SWGIKMTVFAMIIGAFVAASSDLAFDLEGYAFILIND
..: : ::. :::. :. : :. .:. :: .:...::. : ::. ..
CCDS34 FKRCLPLVTMLI-GVLVLKNGAPSPGVLAAVLITTCGAALAGAGDLTGDPIGYVTGVLAV
110 120 130 140 150 160
200 210 220 230 240 250
pF1KA0 VLTAANGAYVKQKLDSKELGKYGLLYYNALFMILPTLAIAYFTG-DAQKAVEFEGWADTL
.. :: . ... . : : : :. : :.: :.. :. .: : :: :
CCDS34 LVHAAYLVLIQKASADTEHGPLTAQYVIAV-SATPLLVICSFASTDSIHAWTFPGWKDPA
170 180 190 200 210 220
260 270 280 290 300 310
pF1KA0 FLLQFTLSCVM-GFILMYATVLCTQYNSALTTTIVGCIKNILITYIGMVFGGDYIFTWTN
.. : ..:.. : . ..:. :: :::.::..:: .:.: .::: .: :
CCDS34 MVCIF-VACILIGCAMNFTTLHCTYINSAVTTSFVGVVKSIATITVGMVAFSDVEPTSLF
230 240 250 260 270 280
320 330 340 350
pF1KA0 FIGLNISIAGSLVYSYITFTEEQLSKQSEANNKLDIKGKGAV
. :. .. ::..: : : . :::. .. :. . .:
CCDS34 IAGVVVNTLGSIIYCVAKFMETR--KQSNYED-LEAQPRGEEAQLSGDQLPFVMEELPGE
290 300 310 320 330 340
CCDS34 GGNGRSEGGEAAGGPAQESRQEVRGSPRGVPLVAGSSEEGSRRSLKDAYLEVWRLVRGTR
350 360 370 380 390 400
355 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 09:15:59 2016 done: Thu Nov 3 09:16:00 2016
Total Scan time: 2.470 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]