FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA0260, 355 aa 1>>>pF1KA0260 355 - 355 aa - 355 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4232+/-0.00124; mu= 15.1154+/- 0.073 mean_var=56.3165+/-12.023, 0's: 0 Z-trim(99.3): 32 B-trim: 303 in 1/48 Lambda= 0.170906 statistics sampled from 5655 (5666) to 5655 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.517), E-opt: 0.2 (0.174), width: 16 Scan time: 2.470 The best scores are: opt bits E(32554) CCDS636.1 SLC35D1 gene_id:23169|Hs108|chr1 ( 355) 2261 566.2 1.5e-161 CCDS6717.1 SLC35D2 gene_id:11046|Hs108|chr9 ( 337) 1236 313.5 1.7e-85 CCDS69625.1 SLC35D2 gene_id:11046|Hs108|chr9 ( 249) 527 138.6 5.4e-33 CCDS34544.1 SLC35D3 gene_id:340146|Hs108|chr6 ( 416) 323 88.4 1.2e-17 >>CCDS636.1 SLC35D1 gene_id:23169|Hs108|chr1 (355 aa) initn: 2261 init1: 2261 opt: 2261 Z-score: 3013.9 bits: 566.2 E(32554): 1.5e-161 Smith-Waterman score: 2261; 100.0% identity (100.0% similar) in 355 aa overlap (1-355:1-355) 10 20 30 40 50 60 pF1KA0 MAEVHRRQHARVKGEAPAKSSTLRDEEELGMASAETLTVFLKLLAAGFYGVSSFLIVVVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 MAEVHRRQHARVKGEAPAKSSTLRDEEELGMASAETLTVFLKLLAAGFYGVSSFLIVVVN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA0 KSVLTNYRFPSSLCVGLGQMVATVAVLWVGKALRVVKFPDLDRNVPRKTFPLPLLYFGNQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 KSVLTNYRFPSSLCVGLGQMVATVAVLWVGKALRVVKFPDLDRNVPRKTFPLPLLYFGNQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA0 ITGLFSTKKLNLPMFTVLRRFSILFTMFAEGVLLKKTFSWGIKMTVFAMIIGAFVAASSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 ITGLFSTKKLNLPMFTVLRRFSILFTMFAEGVLLKKTFSWGIKMTVFAMIIGAFVAASSD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA0 LAFDLEGYAFILINDVLTAANGAYVKQKLDSKELGKYGLLYYNALFMILPTLAIAYFTGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 LAFDLEGYAFILINDVLTAANGAYVKQKLDSKELGKYGLLYYNALFMILPTLAIAYFTGD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA0 AQKAVEFEGWADTLFLLQFTLSCVMGFILMYATVLCTQYNSALTTTIVGCIKNILITYIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 AQKAVEFEGWADTLFLLQFTLSCVMGFILMYATVLCTQYNSALTTTIVGCIKNILITYIG 250 260 270 280 290 300 310 320 330 340 350 pF1KA0 MVFGGDYIFTWTNFIGLNISIAGSLVYSYITFTEEQLSKQSEANNKLDIKGKGAV ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 MVFGGDYIFTWTNFIGLNISIAGSLVYSYITFTEEQLSKQSEANNKLDIKGKGAV 310 320 330 340 350 >>CCDS6717.1 SLC35D2 gene_id:11046|Hs108|chr9 (337 aa) initn: 1219 init1: 1219 opt: 1236 Z-score: 1648.5 bits: 313.5 E(32554): 1.7e-85 Smith-Waterman score: 1236; 57.7% identity (85.2% similar) in 310 aa overlap (42-350:27-336) 20 30 40 50 60 70 pF1KA0 VKGEAPAKSSTLRDEEELGMASAETLTVFLKLLAAGFYGVSSFLIVVVNKSVLTNYRFPS .::.: :::. :::::.:::..::.: ::: CCDS67 MTAGGQAEAEGAGGEPGAARLPSRVARLLSALFYGTCSFLIVLVNKALLTTYGFPS 10 20 30 40 50 80 90 100 110 120 130 pF1KA0 SLCVGLGQMVATVAVLWVGKALRVVKFPDLDRNVPRKTFPLPLLYFGNQITGLFSTKKLN . .:.:::.::. .:.:.: ....:::.:...: : ::::::: ::.:.:: ::.::. CCDS67 PIFLGIGQMAATIMILYVSKLNKIIHFPDFDKKIPVKLFPLPLLYVGNHISGLSSTSKLS 60 70 80 90 100 110 140 150 160 170 180 190 pF1KA0 LPMFTVLRRFSILFTMFAEGVLLKKTFSWGIKMTVFAMIIGAFVAASSDLAFDLEGYAFI ::::::::.:.: .:.. : ..: : .: .: ..:::.:.:::.::.:::::.:::: :. CCDS67 LPMFTVLRKFTIPLTLLLETIILGKQYSLNIILSVFAIILGAFIAAGSDLAFNLEGYIFV 120 130 140 150 160 170 200 210 220 230 240 250 pF1KA0 LINDVLTAANGAYVKQKLDSKELGKYGLLYYNALFMILPTLAIAYFTGDAQKAVEFEGWA ..::..:::::.:.:::.: :::::::.:.::: :::.::: :. ::: :.:.::. : CCDS67 FLNDIFTAANGVYTKQKMDPKELGKYGVLFYNACFMIIPTLIISVSTGDLQQATEFNQWK 180 190 200 210 220 230 260 270 280 290 300 310 pF1KA0 DTLFLLQFTLSCVMGFILMYATVLCTQYNSALTTTIVGCIKNILITYIGMVFGGDYIFTW ...:.::: ::: .::.:::.::::. :::::::..:: :::. ..:::...::::::. CCDS67 NVVFILQFLLSCFLGFLLMYSTVLCSYYNSALTTAVVGAIKNVSVAYIGILIGGDYIFSL 240 250 260 270 280 290 320 330 340 350 pF1KA0 TNFIGLNISIAGSLVYSYITFTEEQLSKQ-SEANNKLDIKGKGAV ::.:::: .::.: ::..:.. . : .: : ::.: CCDS67 LNFVGLNICMAGGLRYSFLTLSSQLKPKPVGEENICLDLKS 300 310 320 330 >>CCDS69625.1 SLC35D2 gene_id:11046|Hs108|chr9 (249 aa) initn: 813 init1: 524 opt: 527 Z-score: 705.9 bits: 138.6 E(32554): 5.4e-33 Smith-Waterman score: 655; 40.0% identity (60.3% similar) in 310 aa overlap (42-350:27-248) 20 30 40 50 60 70 pF1KA0 VKGEAPAKSSTLRDEEELGMASAETLTVFLKLLAAGFYGVSSFLIVVVNKSVLTNYRFPS .::.: :::. :::::.:::..::.: ::: CCDS69 MTAGGQAEAEGAGGEPGAARLPSRVARLLSALFYGTCSFLIVLVNKALLTTYGFPS 10 20 30 40 50 80 90 100 110 120 130 pF1KA0 SLCVGLGQMVATVAVLWVGKALRVVKFPDLDRNVPRKTFPLPLLYFGNQITGLFSTKKLN . .:.:::.::. .:.:.: ....:::.:...: : ::::::: ::.:.:: ::.::. CCDS69 PIFLGIGQMAATIMILYVSKLNKIIHFPDFDKKIPVKLFPLPLLYVGNHISGLSSTSKLS 60 70 80 90 100 110 140 150 160 170 180 190 pF1KA0 LPMFTVLRRFSILFTMFAEGVLLKKTFSWGIKMTVFAMIIGAFVAASSDLAFDLEGYAFI ::::::::.:.: .:.. : ..: : .: .: ..:::.:.:::.:: CCDS69 LPMFTVLRKFTIPLTLLLETIILGKQYSLNIILSVFAIILGAFIAA-------------- 120 130 140 150 160 200 210 220 230 240 250 pF1KA0 LINDVLTAANGAYVKQKLDSKELGKYGLLYYNALFMILPTLAIAYFTGDAQKAVEFEGWA CCDS69 ------------------------------------------------------------ 260 270 280 290 300 310 pF1KA0 DTLFLLQFTLSCVMGFILMYATVLCTQYNSALTTTIVGCIKNILITYIGMVFGGDYIFTW ::.:::.::::. :::::::..:: :::. ..:::...::::::. CCDS69 --------------GFLLMYSTVLCSYYNSALTTAVVGAIKNVSVAYIGILIGGDYIFSL 170 180 190 200 320 330 340 350 pF1KA0 TNFIGLNISIAGSLVYSYITFTEEQLSKQ-SEANNKLDIKGKGAV ::.:::: .::.: ::..:.. . : .: : ::.: CCDS69 LNFVGLNICMAGGLRYSFLTLSSQLKPKPVGEENICLDLKS 210 220 230 240 >>CCDS34544.1 SLC35D3 gene_id:340146|Hs108|chr6 (416 aa) initn: 286 init1: 227 opt: 323 Z-score: 430.3 bits: 88.4 E(32554): 1.2e-17 Smith-Waterman score: 323; 28.4% identity (56.8% similar) in 310 aa overlap (49-353:18-320) 20 30 40 50 60 70 pF1KA0 KSSTLRDEEELGMASAETLTVFLKLLAAGFYGVSSFLIVVVNKSVLTNYRFPSSLCVGLG .:: : . .. : ... :.: : : . CCDS34 MRQLCRGRVLGISVAIAHGVFSGSLNILLKFLISRYQF-SFLTLVQC 10 20 30 40 80 90 100 110 120 130 pF1KA0 QMVATVAV-LWVGKALRVVKFPDLDRNVPRKTFPLPLLYFGNQITGLFSTKKLNLPMFTV .:.:. : . . : .. : . .. :. . .: .. :.: . :.:::..: CCDS34 LTSSTAALSLELLRRLGLIAVPPFGLSLARSFAGVAVLSTLQSSLTLWSLRGLSLPMYVV 50 60 70 80 90 100 140 150 160 170 180 190 pF1KA0 LRRFSILFTMFAEGVLLKKTF--SWGIKMTVFAMIIGAFVAASSDLAFDLEGYAFILIND ..: : ::. :::. :. : :. .:. :: .:...::. : ::. .. CCDS34 FKRCLPLVTMLI-GVLVLKNGAPSPGVLAAVLITTCGAALAGAGDLTGDPIGYVTGVLAV 110 120 130 140 150 160 200 210 220 230 240 250 pF1KA0 VLTAANGAYVKQKLDSKELGKYGLLYYNALFMILPTLAIAYFTG-DAQKAVEFEGWADTL .. :: . ... . : : : :. : :.: :.. :. .: : :: : CCDS34 LVHAAYLVLIQKASADTEHGPLTAQYVIAV-SATPLLVICSFASTDSIHAWTFPGWKDPA 170 180 190 200 210 220 260 270 280 290 300 310 pF1KA0 FLLQFTLSCVM-GFILMYATVLCTQYNSALTTTIVGCIKNILITYIGMVFGGDYIFTWTN .. : ..:.. : . ..:. :: :::.::..:: .:.: .::: .: : CCDS34 MVCIF-VACILIGCAMNFTTLHCTYINSAVTTSFVGVVKSIATITVGMVAFSDVEPTSLF 230 240 250 260 270 280 320 330 340 350 pF1KA0 FIGLNISIAGSLVYSYITFTEEQLSKQSEANNKLDIKGKGAV . :. .. ::..: : : . :::. .. :. . .: CCDS34 IAGVVVNTLGSIIYCVAKFMETR--KQSNYED-LEAQPRGEEAQLSGDQLPFVMEELPGE 290 300 310 320 330 340 CCDS34 GGNGRSEGGEAAGGPAQESRQEVRGSPRGVPLVAGSSEEGSRRSLKDAYLEVWRLVRGTR 350 360 370 380 390 400 355 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 09:15:59 2016 done: Thu Nov 3 09:16:00 2016 Total Scan time: 2.470 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]