FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA0447, 405 aa 1>>>pF1KA0447 405 - 405 aa - 405 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.6264+/-0.000943; mu= 20.6535+/- 0.057 mean_var=63.3144+/-13.066, 0's: 0 Z-trim(104.4): 35 B-trim: 0 in 0/49 Lambda= 0.161184 statistics sampled from 7872 (7896) to 7872 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.616), E-opt: 0.2 (0.243), width: 16 Scan time: 2.570 The best scores are: opt bits E(32554) CCDS44041.1 SLC35E2B gene_id:728661|Hs108|chr1 ( 405) 2577 608.2 4.4e-174 CCDS55560.1 SLC35E2 gene_id:9906|Hs108|chr1 ( 246) 1263 302.5 2.9e-82 CCDS33.1 SLC35E2 gene_id:9906|Hs108|chr1 ( 266) 1263 302.5 3.1e-82 CCDS12346.2 SLC35E1 gene_id:79939|Hs108|chr19 ( 410) 422 107.1 3.2e-23 CCDS13396.1 SLC35C2 gene_id:51006|Hs108|chr20 ( 365) 270 71.7 1.3e-12 CCDS63292.1 SLC35C2 gene_id:51006|Hs108|chr20 ( 394) 270 71.7 1.3e-12 CCDS41808.1 SLC35E3 gene_id:55508|Hs108|chr12 ( 313) 268 71.2 1.6e-12 >>CCDS44041.1 SLC35E2B gene_id:728661|Hs108|chr1 (405 aa) initn: 2577 init1: 2577 opt: 2577 Z-score: 3238.8 bits: 608.2 E(32554): 4.4e-174 Smith-Waterman score: 2577; 99.8% identity (100.0% similar) in 405 aa overlap (1-405:1-405) 10 20 30 40 50 60 pF1KA0 MSSSVKTPALEELVPGSEEKPKGRSPLSWGSLFGHRSEKIVFAKSDGGTDENVLTVTITE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MSSSVKTPALEELVPGSEEKPKGRSPLSWGSLFGHRSEKIVFAKSDGGTDENVLTVTITE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA0 TTVIESDLGVWSSRALLYLTLWFFFSFCTLFLNKYILSLLGGEPSMLGAVQMLSTTVIGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TTVIESDLGVWSSRALLYLTLWFFFSFCTLFLNKYILSLLGGEPSMLGAVQMLSTTVIGC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA0 VKTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATVVLGLVSLKNVAVSFAETVKSSAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 VKTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATVVLGLVSLKNVAVSFAETVKSSAP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA0 IFTVIMSRMILGEYTGLLVNLSLIPVMGGLALCTATEISFNVLGFSAALSTNIMDCLQNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 IFTVIMSRMILGEYTGLLVNLSLIPVMGGLALCTATEISFNVLGFSAALSTNIMDCLQNV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA0 FSKKLLSGDKYRFSAPELQFYTSAAAVAMLVPARVFFTDVPVIGRSGKSFSYNQDVVLLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 FSKKLLSGDKYRFSAPELQFYTSAAAVAMLVPARVFFTDVPVIGRSGKSFSYNQDVVLLL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA0 LTDGVLFHLQSITAYALMGKISPVTFSVASTVKHALSIWLSVIVFGNKITSLSAVGTALV :::::::::::.:::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LTDGVLFHLQSVTAYALMGKISPVTFSVASTVKHALSIWLSVIVFGNKITSLSAVGTALV 310 320 330 340 350 360 370 380 390 400 pF1KA0 TVGVLLYNKARQHQQEALQSLAAATGRAPDDTVEPLLPQDPRQHP ::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TVGVLLYNKARQHQQEALQSLAAATGRAPDDTVEPLLPQDPRQHP 370 380 390 400 >>CCDS55560.1 SLC35E2 gene_id:9906|Hs108|chr1 (246 aa) initn: 1263 init1: 1263 opt: 1263 Z-score: 1590.4 bits: 302.5 E(32554): 2.9e-82 Smith-Waterman score: 1263; 100.0% identity (100.0% similar) in 196 aa overlap (1-196:1-196) 10 20 30 40 50 60 pF1KA0 MSSSVKTPALEELVPGSEEKPKGRSPLSWGSLFGHRSEKIVFAKSDGGTDENVLTVTITE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MSSSVKTPALEELVPGSEEKPKGRSPLSWGSLFGHRSEKIVFAKSDGGTDENVLTVTITE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA0 TTVIESDLGVWSSRALLYLTLWFFFSFCTLFLNKYILSLLGGEPSMLGAVQMLSTTVIGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TTVIESDLGVWSSRALLYLTLWFFFSFCTLFLNKYILSLLGGEPSMLGAVQMLSTTVIGC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA0 VKTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATVVLGLVSLKNVAVSFAETVKSSAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VKTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATVVLGLVSLKNVAVSFAETVKSSAP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA0 IFTVIMSRMILGEYTGLLVNLSLIPVMGGLALCTATEISFNVLGFSAALSTNIMDCLQNV :::::::::::::::: CCDS55 IFTVIMSRMILGEYTGRPSDREEREELQLQPGRGAAASDRRSPVPPSERHGVRPHGENLP 190 200 210 220 230 240 >>CCDS33.1 SLC35E2 gene_id:9906|Hs108|chr1 (266 aa) initn: 1263 init1: 1263 opt: 1263 Z-score: 1589.9 bits: 302.5 E(32554): 3.1e-82 Smith-Waterman score: 1263; 100.0% identity (100.0% similar) in 196 aa overlap (1-196:1-196) 10 20 30 40 50 60 pF1KA0 MSSSVKTPALEELVPGSEEKPKGRSPLSWGSLFGHRSEKIVFAKSDGGTDENVLTVTITE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MSSSVKTPALEELVPGSEEKPKGRSPLSWGSLFGHRSEKIVFAKSDGGTDENVLTVTITE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA0 TTVIESDLGVWSSRALLYLTLWFFFSFCTLFLNKYILSLLGGEPSMLGAVQMLSTTVIGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TTVIESDLGVWSSRALLYLTLWFFFSFCTLFLNKYILSLLGGEPSMLGAVQMLSTTVIGC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA0 VKTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATVVLGLVSLKNVAVSFAETVKSSAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VKTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATVVLGLVSLKNVAVSFAETVKSSAP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA0 IFTVIMSRMILGEYTGLLVNLSLIPVMGGLALCTATEISFNVLGFSAALSTNIMDCLQNV :::::::::::::::: CCDS33 IFTVIMSRMILGEYTGRPSDREEREELQLQPGRGAAASDRRSPVPPSERHGVRPHGENLP 190 200 210 220 230 240 >>CCDS12346.2 SLC35E1 gene_id:79939|Hs108|chr19 (410 aa) initn: 423 init1: 245 opt: 422 Z-score: 530.5 bits: 107.1 E(32554): 3.2e-23 Smith-Waterman score: 425; 30.1% identity (61.0% similar) in 356 aa overlap (34-385:9-351) 10 20 30 40 50 60 pF1KA0 SVKTPALEELVPGSEEKPKGRSPLSWGSLFGHRSEKIVFAKSDGGTDENVLTVTITETTV :: . :.:.::. :.. .... CCDS12 MAAAAVGAGHGAGGPGAASSSGGAREGARVAALCLLWY 10 20 30 70 80 90 100 110 120 pF1KA0 IESDLGVWSSRALLY-LTLWFFFSFCTLFLNKYILSLLGGEPSMLGAVQML-STTVIGCV : : ....: . . :.: .::.: .: : .: : .. . : : CCDS12 ALSAGGNVVNKVILSAFPFPVTVSLC------HILALCAGLPPLLRAWRVPPAPPVSGPG 40 50 60 70 80 90 130 140 150 160 170 180 pF1KA0 KTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATVVLGLVSLKNVAVSFAETVKSSAPI . : : . : ... . : : ::.: . ::. .: ::.:.:::.. :: CCDS12 PSPHPSSGPLLPPR--FYPRYVLPLAF-G-KYFASVS-AHVSIWKVPVSYAHTVKATMPI 100 110 120 130 140 190 200 210 220 230 240 pF1KA0 FTVIMSRMILGEYTGLLVNLSLIPVMGGLALCTATEISFNVLGFSAALSTNIMDCLQNVF ..:..::.:. : . : :::::...:. : :.::.::.. :. .::.... :::.: CCDS12 WVVLLSRIIMKEKQSTKVYLSLIPIISGVLLATVTELSFDMWGLVSALAATLCFSLQNIF 150 160 170 180 190 200 250 260 270 280 290 300 pF1KA0 SKKLLSGDKYRFSAPELQFYTSAAAVAMLVPARVFFTDVPVIGRSGKSFSYNQDVVLLLL :::.: . :. .: . :: ...:. :. . : .. :. .:::: CCDS12 SKKVLRDS--RIHHLRLLNILGCHAVFFMIPTWVLVDLSAFLVSSDLTYVYQWPWTLLLL 210 220 230 240 250 260 310 320 330 340 350 360 pF1KA0 T-DGVLFHLQSITAYALMGKISPVTFSVASTVKHALSIWLSVIVFGNKITSLSAVGTALV . .: :.. :..... .::...:::...:. . : .:.:.. : .:: ...: . CCDS12 AVSGFCNFAQNVIAFSILNLVSPLSYSVANATKRIMVITVSLIMLRNPVTSTNVLGMMTA 270 280 290 300 310 320 370 380 390 400 pF1KA0 TVGVLLYNKARQH-QQEALQSLAAATGRAPDDTVEPLLPQDPRQHP .::.::::.. .:.: . : .: CCDS12 ILGVFLYNKTKYDANQQARKHLLPVTTADLSSKERHRSPLEKPHNGLLFPQHGDYQYGRN 330 340 350 360 370 380 >>CCDS13396.1 SLC35C2 gene_id:51006|Hs108|chr20 (365 aa) initn: 135 init1: 111 opt: 270 Z-score: 340.1 bits: 71.7 E(32554): 1.3e-12 Smith-Waterman score: 270; 25.9% identity (58.2% similar) in 347 aa overlap (70-403:11-349) 40 50 60 70 80 90 pF1KA0 IVFAKSDGGTDENVLTVTITETTVIESDLGVWSSRALLYLTLWFF-FSFCTLFLNKYILS .:.. : :.: .. ::. : ::.. . CCDS13 MGRWALDVAFLWKAVLTLGLVLLYYCFSIGITFYNKWLTK 10 20 30 40 100 110 120 130 140 150 pF1KA0 LLGGEPSMLGAVQMLSTTVIGCV-KTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATV . : .. ... ... . ..:: : .. .. ::. ..: . ..: : CCDS13 SFH-FPLFMTMLHLAVIFLFSALSRALVQCSSHRARVVLSWA-DYLRRVAPTALATALDV 50 60 70 80 90 160 170 180 190 200 210 pF1KA0 VLGLVSLKNVAVSFAETVKSSAPIFTVIMSRMI-LGEYTGLLVNLSLIPVMGGLALCTAT :. :. :.::. .:::: .: .:.: .. : : . :: . :. . ::: . : CCDS13 GLSNWSFLYVTVSLYTMTKSSAVLFILIFSLIFKLEELRAALVLVVLL-IAGGLFMFTYK 100 110 120 130 140 150 220 230 240 250 260 270 pF1KA0 EISFNVLGFSAALSTNIMDCLQNVFSKKLLSGDKYRFSAP-ELQFYTSAAAVAMLVPARV .::: ::. .:..... .. .... ::. . .. : . .:. . : : . CCDS13 STQFNVEGFALVLGASFIGGIRWTLTQMLLQKAELGLQNPIDTMFHLQPLMFLGLFPLFA 160 170 180 190 200 210 280 290 300 310 320 pF1KA0 FFTDVPVIGRSGKSFSYNQDVVLLLLTDGVLFHLQSITAYAL-------MGKISPVTFSV : . .. : : : . ::. ::: . : :: : .: :..: ... : .:.:. CCDS13 VFEGLH-LSTSEKIFRF-QDTGLLLRVLGSLF-LGGILAFGLGFSEFLLVSRTSSLTLSI 220 230 240 250 260 270 330 340 350 360 370 380 pF1KA0 ASTVKHALSIWLSVIVFGNKITSLSAVGTALVTVGVLLYN--KARQHQQEALQSLAAATG :. :.. .. :.. ..:..:. :. .: :: :. :. :: . . .. . . : CCDS13 AGIFKEVCTLLLAAHLLGDQISLLNWLGFALCLSGISLHVALKALHSRGDGGPKALKGLG 280 290 300 310 320 330 390 400 pF1KA0 RAPDDTVEPLLPQDPRQHP .:: .: :: .. :. CCDS13 SSPD--LELLLRSSQREEGDNEEEEYFVAQGQQ 340 350 360 >>CCDS63292.1 SLC35C2 gene_id:51006|Hs108|chr20 (394 aa) initn: 163 init1: 111 opt: 270 Z-score: 339.7 bits: 71.7 E(32554): 1.3e-12 Smith-Waterman score: 270; 25.9% identity (58.2% similar) in 347 aa overlap (70-403:40-378) 40 50 60 70 80 90 pF1KA0 IVFAKSDGGTDENVLTVTITETTVIESDLGVWSSRALLYLTLWFF-FSFCTLFLNKYILS .:.. : :.: .. ::. : ::.. . CCDS63 PLRGVPAPADSGAPVLQPPRMGRWALDVAFLWKAVLTLGLVLLYYCFSIGITFYNKWLTK 10 20 30 40 50 60 100 110 120 130 140 150 pF1KA0 LLGGEPSMLGAVQMLSTTVIGCV-KTLVPCCLYQHKARLSYPPNFLMTMLFVGLMRFATV . : .. ... ... . ..:: : .. .. ::. ..: . ..: : CCDS63 SFH-FPLFMTMLHLAVIFLFSALSRALVQCSSHRARVVLSWA-DYLRRVAPTALATALDV 70 80 90 100 110 120 160 170 180 190 200 210 pF1KA0 VLGLVSLKNVAVSFAETVKSSAPIFTVIMSRMI-LGEYTGLLVNLSLIPVMGGLALCTAT :. :. :.::. .:::: .: .:.: .. : : . :: . :. . ::: . : CCDS63 GLSNWSFLYVTVSLYTMTKSSAVLFILIFSLIFKLEELRAALVLVVLL-IAGGLFMFTYK 130 140 150 160 170 180 220 230 240 250 260 270 pF1KA0 EISFNVLGFSAALSTNIMDCLQNVFSKKLLSGDKYRFSAP-ELQFYTSAAAVAMLVPARV .::: ::. .:..... .. .... ::. . .. : . .:. . : : . CCDS63 STQFNVEGFALVLGASFIGGIRWTLTQMLLQKAELGLQNPIDTMFHLQPLMFLGLFPLFA 190 200 210 220 230 240 280 290 300 310 320 pF1KA0 FFTDVPVIGRSGKSFSYNQDVVLLLLTDGVLFHLQSITAYAL-------MGKISPVTFSV : . .. : : : . ::. ::: . : :: : .: :..: ... : .:.:. CCDS63 VFEGLH-LSTSEKIFRF-QDTGLLLRVLGSLF-LGGILAFGLGFSEFLLVSRTSSLTLSI 250 260 270 280 290 300 330 340 350 360 370 380 pF1KA0 ASTVKHALSIWLSVIVFGNKITSLSAVGTALVTVGVLLYN--KARQHQQEALQSLAAATG :. :.. .. :.. ..:..:. :. .: :: :. :. :: . . .. . . : CCDS63 AGIFKEVCTLLLAAHLLGDQISLLNWLGFALCLSGISLHVALKALHSRGDGGPKALKGLG 310 320 330 340 350 360 390 400 pF1KA0 RAPDDTVEPLLPQDPRQHP .:: .: :: .. :. CCDS63 SSPD--LELLLRSSQREEGDNEEEEYFVAQGQQ 370 380 390 >>CCDS41808.1 SLC35E3 gene_id:55508|Hs108|chr12 (313 aa) initn: 241 init1: 150 opt: 268 Z-score: 338.5 bits: 71.2 E(32554): 1.6e-12 Smith-Waterman score: 319; 25.3% identity (59.2% similar) in 316 aa overlap (69-380:10-307) 40 50 60 70 80 90 pF1KA0 KIVFAKSDGGTDENVLTVTITETTVIESDLGVWSSRALLYLTLWFFFSFCTLFLNKYILS : : : : ..: . :.: .::::.: CCDS41 MALLVDRVRGHWRIAAGLLFNL--LVSICIVFLNKWIY- 10 20 30 100 110 120 130 140 150 pF1KA0 LLGGEPSMLGAVQMLSTTVIGCVKTLVPCCLYQHKARLSYPPN--FLMTMLFVGLMRFAT . : :.: .. . .: .: : : . : : ::. .:... : :.. :.. CCDS41 VYHGFPNMSLTLVHFVVTWLG----LYICQKLDIFAPKSLPPSRLLLLALSFCGFVVFTN 40 50 60 70 80 90 160 170 180 190 200 210 pF1KA0 VVLGLVSLKNVAVSFAETVKS-SAPIFTVIMSRMILGEYTGLLVNLSLIPVMGGLALCTA . ::.: ... . .:. ..:.. .:.. .. ..:.:::. :. : . CCDS41 L-----SLQNNTIGTYQLAKAMTTPVIIAIQTFCYQKTFS-TRIQLTLIPITLGVILNSY 100 110 120 130 140 220 230 240 250 260 270 pF1KA0 TEISFNVLGFS-AALSTNIMDCLQNVFSKKLLSGDKYRFSAPELQFYTSAAAVAMLVPAR ...:: ::. :::.. . . : . : . . .. .: .: . . :::. : CCDS41 YDVKFNFLGMVFAALGVLVTSLYQVWVGAKQ---HELQVNSMQLLYYQAPMSSAMLLVAV 150 160 170 180 190 200 280 290 300 310 320 330 pF1KA0 VFFTDVPVIGRSGKSFSYNQDVVLLLLTDGVLFHLQSITAYALMGKISPVTFSVASTVKH :: ::.:..: .. ...:..: .::. . ... : ..:. ::::... . : CCDS41 PFFE--PVFGEGGIFGPWSVSALLMVLLSGVIAFMVNLSIYWIIGNTSPVTYNMFGHFKF 210 220 230 240 250 260 340 350 360 370 380 390 pF1KA0 ALSIWLSVIVFGNKITSLSAVGTALVTVGVLLYNKARQHQQEALQSLAAATGRAPDDTVE .... . ..: . .. .:.: . :.: :.. . .::. .: CCDS41 CITLFGGYVLFKDPLSINQALGILCTLFGILAYTHFKLSEQEGSRSKLAQRP 270 280 290 300 310 400 pF1KA0 PLLPQDPRQHP 405 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 18:57:56 2016 done: Wed Nov 2 18:57:56 2016 Total Scan time: 2.570 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]