FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5030, 284 aa 1>>>pF1KB5030 284 - 284 aa - 284 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7937+/-0.000801; mu= 12.5326+/- 0.048 mean_var=64.5425+/-13.022, 0's: 0 Z-trim(107.4): 22 B-trim: 118 in 1/50 Lambda= 0.159644 statistics sampled from 9515 (9535) to 9515 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.68), E-opt: 0.2 (0.293), width: 16 Scan time: 2.410 The best scores are: opt bits E(32554) CCDS14051.1 SULT4A1 gene_id:25830|Hs108|chr22 ( 284) 1968 461.7 2.6e-130 CCDS10674.1 SULT1A3 gene_id:6818|Hs108|chr16 ( 295) 523 128.9 4.2e-30 CCDS32427.1 SULT1A4 gene_id:445329|Hs108|chr16 ( 295) 523 128.9 4.2e-30 CCDS10636.1 SULT1A2 gene_id:6799|Hs108|chr16 ( 295) 501 123.9 1.4e-28 CCDS2075.1 SULT1C2 gene_id:6819|Hs108|chr2 ( 296) 499 123.4 1.9e-28 CCDS2077.1 SULT1C4 gene_id:27233|Hs108|chr2 ( 302) 493 122.0 5.1e-28 CCDS32420.1 SULT1A1 gene_id:6817|Hs108|chr16 ( 295) 489 121.1 9.5e-28 CCDS3530.1 SULT1B1 gene_id:27284|Hs108|chr4 ( 296) 487 120.6 1.3e-27 CCDS3531.1 SULT1E1 gene_id:6783|Hs108|chr4 ( 294) 473 117.4 1.2e-26 CCDS33267.1 SULT1C3 gene_id:442038|Hs108|chr2 ( 304) 470 116.7 2e-26 CCDS12724.1 SULT2B1 gene_id:6820|Hs108|chr19 ( 350) 436 108.9 5.3e-24 CCDS12723.1 SULT2B1 gene_id:6820|Hs108|chr19 ( 365) 436 108.9 5.5e-24 CCDS12707.1 SULT2A1 gene_id:6822|Hs108|chr19 ( 285) 423 105.9 3.5e-23 CCDS33182.1 SULT6B1 gene_id:391365|Hs108|chr2 ( 265) 380 96.0 3.1e-20 CCDS2076.1 SULT1C2 gene_id:6819|Hs108|chr2 ( 307) 295 76.4 2.8e-14 CCDS10637.1 SULT1A1 gene_id:6817|Hs108|chr16 ( 217) 269 70.4 1.3e-12 >>CCDS14051.1 SULT4A1 gene_id:25830|Hs108|chr22 (284 aa) initn: 1968 init1: 1968 opt: 1968 Z-score: 2452.9 bits: 461.7 E(32554): 2.6e-130 Smith-Waterman score: 1968; 100.0% identity (100.0% similar) in 284 aa overlap (1-284:1-284) 10 20 30 40 50 60 pF1KB5 MAESEAETPSTPGEFESKYFEFHGVRLPPFCRGKMEEIANFPVRPSDVWIVTYPKSGTSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MAESEAETPSTPGEFESKYFEFHGVRLPPFCRGKMEEIANFPVRPSDVWIVTYPKSGTSL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 LQEVVYLVSQGADPDEIGLMNIDEQLPVLEYPQPGLDIIKELTSPRLIKSHLPYRFLPSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LQEVVYLVSQGADPDEIGLMNIDEQLPVLEYPQPGLDIIKELTSPRLIKSHLPYRFLPSD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 LHNGDSKVIYMARNPKDLVVSYYQFHRSLRTMSYRGTFQEFCRRFMNDKLGYGSWFEHVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LHNGDSKVIYMARNPKDLVVSYYQFHRSLRTMSYRGTFQEFCRRFMNDKLGYGSWFEHVQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 EFWEHRMDSNVLFLKYEDMHRDLVTMVEQLARFLGVSCDKAQLEALTEHCHQLVDQCCNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 EFWEHRMDSNVLFLKYEDMHRDLVTMVEQLARFLGVSCDKAQLEALTEHCHQLVDQCCNA 190 200 210 220 230 240 250 260 270 280 pF1KB5 EALPVGRGRVGLWKDIFTVSMNEKFDLVYKQKMGKCDLTFDFYL :::::::::::::::::::::::::::::::::::::::::::: CCDS14 EALPVGRGRVGLWKDIFTVSMNEKFDLVYKQKMGKCDLTFDFYL 250 260 270 280 >>CCDS10674.1 SULT1A3 gene_id:6818|Hs108|chr16 (295 aa) initn: 603 init1: 371 opt: 523 Z-score: 654.0 bits: 128.9 E(32554): 4.2e-30 Smith-Waterman score: 604; 36.7% identity (63.3% similar) in 275 aa overlap (24-280:17-291) 10 20 30 40 50 60 pF1KB5 MAESEAETPSTPGEFESKYFEFHGVRLPPFCRGKMEEIANFPVRPSDVWIVTYPKSGTSL :: : . . . .: .::.:. : :::::::. CCDS10 MELIQDTSRPPLEYVKGVPLIKYFAEALGPLQSFQARPDDLLINTYPKSGTTW 10 20 30 40 50 70 80 90 100 110 pF1KB5 LQEVVYLVSQGADPDEIGLMNIDEQLPVLEYPQPG----LDIIKELTSPRLIKSHLPYRF ..... .. ::.: .. . : ..: :: .:: :. .:. ::::::::: . CCDS10 VSQILDMIYQGGDLEKCNRAPIYVRVPFLEVNDPGEPSGLETLKDTPPPRLIKSHLPLAL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 LPSDLHNGDSKVIYMARNPKDLVVSYYQFHRSLRTMSYRGTFQEFCRRFMNDKLGYGSWF ::. : . ::.:.::::::..::::.::: .. ::.. : ..:: ...::::. CCDS10 LPQTLLDQKVKVVYVARNPKDVAVSYYHFHRMEKAHPEPGTWDSFLEKFMAGEVSYGSWY 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 EHVQEFWEHRMDSNVLFLKYEDMHRDLVTMVEQLARFLGVSCDKAQLEALTEHC------ .::::.:: ::.: ::::... .... .:.: : . .. ...: CCDS10 QHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEETMDFMVQHTSFKEMK 180 190 200 210 220 230 240 250 260 270 280 pF1KB5 ------HQLVDQCCNAEAL-PVGR-GRVGLWKDIFTVSMNEKFDLVYKQKMGKCDLTFDF . : : ... : : : .: :: :::..::.:: : .::. :.:.: CCDS10 KNPMTNYTTVPQELMDHSISPFMRKGMAGDWKTTFTVAQNERFDADYAEKMAGCSLSFRS 240 250 260 270 280 290 pF1KB5 YL CCDS10 EL >>CCDS32427.1 SULT1A4 gene_id:445329|Hs108|chr16 (295 aa) initn: 603 init1: 371 opt: 523 Z-score: 654.0 bits: 128.9 E(32554): 4.2e-30 Smith-Waterman score: 604; 36.7% identity (63.3% similar) in 275 aa overlap (24-280:17-291) 10 20 30 40 50 60 pF1KB5 MAESEAETPSTPGEFESKYFEFHGVRLPPFCRGKMEEIANFPVRPSDVWIVTYPKSGTSL :: : . . . .: .::.:. : :::::::. CCDS32 MELIQDTSRPPLEYVKGVPLIKYFAEALGPLQSFQARPDDLLINTYPKSGTTW 10 20 30 40 50 70 80 90 100 110 pF1KB5 LQEVVYLVSQGADPDEIGLMNIDEQLPVLEYPQPG----LDIIKELTSPRLIKSHLPYRF ..... .. ::.: .. . : ..: :: .:: :. .:. ::::::::: . CCDS32 VSQILDMIYQGGDLEKCNRAPIYVRVPFLEVNDPGEPSGLETLKDTPPPRLIKSHLPLAL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 LPSDLHNGDSKVIYMARNPKDLVVSYYQFHRSLRTMSYRGTFQEFCRRFMNDKLGYGSWF ::. : . ::.:.::::::..::::.::: .. ::.. : ..:: ...::::. CCDS32 LPQTLLDQKVKVVYVARNPKDVAVSYYHFHRMEKAHPEPGTWDSFLEKFMAGEVSYGSWY 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 EHVQEFWEHRMDSNVLFLKYEDMHRDLVTMVEQLARFLGVSCDKAQLEALTEHC------ .::::.:: ::.: ::::... .... .:.: : . .. ...: CCDS32 QHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEETMDFMVQHTSFKEMK 180 190 200 210 220 230 240 250 260 270 280 pF1KB5 ------HQLVDQCCNAEAL-PVGR-GRVGLWKDIFTVSMNEKFDLVYKQKMGKCDLTFDF . : : ... : : : .: :: :::..::.:: : .::. :.:.: CCDS32 KNPMTNYTTVPQELMDHSISPFMRKGMAGDWKTTFTVAQNERFDADYAEKMAGCSLSFRS 240 250 260 270 280 290 pF1KB5 YL CCDS32 EL >>CCDS10636.1 SULT1A2 gene_id:6799|Hs108|chr16 (295 aa) initn: 476 init1: 378 opt: 501 Z-score: 626.6 bits: 123.9 E(32554): 1.4e-28 Smith-Waterman score: 575; 34.2% identity (63.6% similar) in 275 aa overlap (24-280:17-291) 10 20 30 40 50 60 pF1KB5 MAESEAETPSTPGEFESKYFEFHGVRLPPFCRGKMEEIANFPVRPSDVWIVTYPKSGTSL :: : . . . .: .::.:. : :::::::. CCDS10 MELIQDISRPPLEYVKGVPLIKYFAEALGPLQSFQARPDDLLISTYPKSGTTW 10 20 30 40 50 70 80 90 100 110 pF1KB5 LQEVVYLVSQGADPDEIGLMNIDEQLPVLEYPQPG----LDIIKELTSPRLIKSHLPYRF ..... .. ::.: .. : ..: ::. :: .. .:. .:::.:.::: . CCDS10 VSQILDMIYQGGDLEKCHRAPIFMRVPFLEFKVPGIPSGMETLKNTPAPRLLKTHLPLAL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 LPSDLHNGDSKVIYMARNPKDLVVSYYQFHRSLRTMSYRGTFQEFCRRFMNDKLGYGSWF ::. : . ::.:.::: ::..::::.:.. ... . ::.. : ..:: ...::::. CCDS10 LPQTLLDQKVKVVYVARNAKDVAVSYYHFYHMAKVYPHPGTWESFLEKFMAGEVSYGSWY 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 EHVQEFWEHRMDSNVLFLKYEDMHRDLVTMVEQLARFLGVSCDKAQLEALTEHC------ .::::.:: ::.: ::::... .... .:.: : . .. ..:: CCDS10 QHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEETVDLMVEHTSFKEMK 180 190 200 210 220 230 240 250 260 270 280 pF1KB5 -HQLVD------QCCNAEALPVGR-GRVGLWKDIFTVSMNEKFDLVYKQKMGKCDLTFDF . ... . . : : : .: :: :::..::.:: : .::. :.:.: CCDS10 KNPMTNYTTVRREFMDHSISPFMRKGMAGDWKTTFTVAQNERFDADYAKKMAGCSLSFRS 240 250 260 270 280 290 pF1KB5 YL CCDS10 EL >>CCDS2075.1 SULT1C2 gene_id:6819|Hs108|chr2 (296 aa) initn: 496 init1: 324 opt: 499 Z-score: 624.1 bits: 123.4 E(32554): 1.9e-28 Smith-Waterman score: 569; 32.7% identity (66.2% similar) in 281 aa overlap (18-280:12-292) 10 20 30 40 50 60 pF1KB5 MAESEAETPSTPGEFESKYFEFHGVRLPPFCRGKMEEIANFPVRPSDVWIVTYPKSGTSL : : .:. : : . .: .: ..:.:. : ::::.::. CCDS20 MALTSDLGKQIKLKEVEGTLLQPATVDNWSQIQSFEAKPDDLLICTYPKAGTTW 10 20 30 40 50 70 80 90 100 110 pF1KB5 LQEVVYLVSQGADPDEIGLMNIDEQLPVLEY---PQP-GLDIIKELTSPRLIKSHLPYRF .::.: .. :..: .. :... : .:. ::: :.. : . :::..:.:: .. CCDS20 IQEIVDMIEQNGDVEKCQRAIIQHRHPFIEWARPPQPSGVEKAKAMPSPRILKTHLSTQL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 LPSDLHNGDSKVIYMARNPKDLVVSYYQFHRSLRTMSYRGTFQEFCRRFMNDKLGYGSWF :: .. ... : .:.::: :: .::::.:.: . . ::..:. . :.: :. .:::: CCDS20 LPPSFWENNCKFLYVARNAKDCMVSYYHFQRMNHMLPDPGTWEEYFETFINGKVVWGSWF 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 EHVQEFWEHRMDSNVLFLKYEDMHRDLVTMVEQLARFLGVSCDKAQLEALTEHC------ .::. .:: . ..::: :::..:: .... .:.: . :.. :. .... CCDS20 DHVKGWWEMKDRHQILFLFYEDIKRDPKHEIRKVMQFMGKKVDETVLDKIVQETSFEKMK 180 190 200 210 220 230 240 250 260 270 280 pF1KB5 -HQLVDQCCNAEALP-------VGRGRVGLWKDIFTVSMNEKFDLVYKQKMGKCDLTFDF . .... .... . .: :: ::. :::..::.:: .:..:: ...: CCDS20 ENPMTNRSTVSKSILDQSISSFMRKGTVGDWKNHFTVAQNERFDEIYRRKMEGTSINFCM 240 250 260 270 280 290 pF1KB5 YL CCDS20 EL >>CCDS2077.1 SULT1C4 gene_id:27233|Hs108|chr2 (302 aa) initn: 608 init1: 366 opt: 493 Z-score: 616.4 bits: 122.0 E(32554): 5.1e-28 Smith-Waterman score: 579; 34.0% identity (61.3% similar) in 300 aa overlap (1-282:1-300) 10 20 30 40 50 60 pF1KB5 MAESEAETPSTPGEFESKYFEFHGVRLPPFCRGKMEEIANFPVRPSDVWIVTYPKSGTSL :: . : . : . . .:. : ..: :: ..:.:. : ::::.::. CCDS20 MALHDMEDFTFDGTKRLSVNYVKGILQPTDTCDIWDKIWNFQAKPDDLLISTYPKAGTTW 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 LQEVVYLVSQGADPDEIGLMNIDEQLPVLEYPQP----GLDIIKELTSPRLIKSHLPYRF ::.: :... .: .. ...: ::. : ::. . . :::..:.:::... CCDS20 TQEIVELIQNEGDVEKSKRAPTHQRFPFLEMKIPSLGSGLEQAHAMPSPRILKTHLPFHL 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB5 LPSDLHNGDSKVIYMARNPKDLVVSYYQFHRSLRTMSYRGTFQEFCRRFMNDKLGYGSWF :: .: . . :.::.:::::: .::::.:.: ... ::..:. . :. :. .::: CCDS20 LPPSLLEKNCKIIYVARNPKDNMVSYYHFQRMNKALPAPGTWEEYFETFLAGKVCWGSWH 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB5 EHVQEFWEHRMDSNVLFLKYEDMHRDLVTMVEQLARFLGVSCDKAQLEALTEHCH-QLVD :::. .:: . .:.: ::::... ...::.:.: . : :. .... ... CCDS20 EHVKGWWEAKDKHRILYLFYEDMKKNPKHEIQKLAEFIGKKLDDKVLDKIVHYTSFDVMK 190 200 210 220 230 240 240 250 260 270 280 pF1KB5 QC--CNAEALP-----------VGRGRVGLWKDIFTVSMNEKFDLVYKQKMGKCDLTFDF : : ..: . .: :: :: :::..::.:: ::.:: ::: : CCDS20 QNPMANYSSIPAEIMDHSISPFMRKGAVGDWKKHFTVAQNERFDEDYKKKMTDTRLTFHF 250 260 270 280 290 300 pF1KB5 YL CCDS20 QF >>CCDS32420.1 SULT1A1 gene_id:6817|Hs108|chr16 (295 aa) initn: 554 init1: 317 opt: 489 Z-score: 611.6 bits: 121.1 E(32554): 9.5e-28 Smith-Waterman score: 570; 34.5% identity (62.9% similar) in 275 aa overlap (24-280:17-291) 10 20 30 40 50 60 pF1KB5 MAESEAETPSTPGEFESKYFEFHGVRLPPFCRGKMEEIANFPVRPSDVWIVTYPKSGTSL :: : . . . .: .::.:. : :::::::. CCDS32 MELIQDTSRPPLEYVKGVPLIKYFAEALGPLQSFQARPDDLLISTYPKSGTTW 10 20 30 40 50 70 80 90 100 110 pF1KB5 LQEVVYLVSQGADPDEIGLMNIDEQLPVLEYPQPG----LDIIKELTSPRLIKSHLPYRF ..... .. ::.: .. : ..: ::. :: .. .:. .:::.:.::: . CCDS32 VSQILDMIYQGGDLEKCHRAPIFMRVPFLEFKAPGIPSGMETLKDTPAPRLLKTHLPLAL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 LPSDLHNGDSKVIYMARNPKDLVVSYYQFHRSLRTMSYRGTFQEFCRRFMNDKLGYGSWF ::. : . ::.:.::: ::..::::.:.. .. ::.. : ..:: ...::::. CCDS32 LPQTLLDQKVKVVYVARNAKDVAVSYYHFYHMAKVHPEPGTWDSFLEKFMVGEVSYGSWY 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 EHVQEFWEHRMDSNVLFLKYEDMHRDLVTMVEQLARFLGVSCDKAQLEALTEHC------ .::::.:: ::.: ::::... .... .:.: : . .. ...: CCDS32 QHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEETVDFVVQHTSFKEMK 180 190 200 210 220 230 240 250 260 270 280 pF1KB5 ------HQLVDQCCNAEAL-PVGR-GRVGLWKDIFTVSMNEKFDLVYKQKMGKCDLTFDF . : : ... : : : .: :: :::..::.:: : .::. :.:.: CCDS32 KNPMTNYTTVPQEFMDHSISPFMRKGMAGDWKTTFTVAQNERFDADYAEKMAGCSLSFRS 240 250 260 270 280 290 pF1KB5 YL CCDS32 EL >>CCDS3530.1 SULT1B1 gene_id:27284|Hs108|chr4 (296 aa) initn: 581 init1: 339 opt: 487 Z-score: 609.1 bits: 120.6 E(32554): 1.3e-27 Smith-Waterman score: 571; 34.2% identity (63.7% similar) in 292 aa overlap (11-280:3-292) 10 20 30 40 50 pF1KB5 MAESEAETPSTPGEFESKYFEF-HGVRLPPFCR--GKMEEIANFPVRPSDVWIVTYPKSG .: .. : ... :: : : .. :.: .: ::.:. :.:::::: CCDS35 MLSPKDILRKDLKLVHG--YPMTCAFASNWEKIEQFHSRPDDIVIATYPKSG 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 TSLLQEVVYLVSQGADPDEIGLMNIDEQLPVLEYPQPGLDI--IKELT---SPRLIKSHL :. ..:.. .. . .: .. : :..:.::. ::: :..: :::..:.:: CCDS35 TTWVSEIIDMILNDGDIEKCKRGFITEKVPMLEMTLPGLRTSGIEQLEKNPSPRIVKTHL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 PYRFLPSDLHNGDSKVIYMARNPKDLVVSYYQFHRSLRTMSYRGTFQEFCRRFMNDKLGY : .::... ... :.::.::: ::. ::::.: . . ::..:. ..:.. :..: CCDS35 PTDLLPKSFWENNCKMIYLARNAKDVSVSYYHFDLMNNLQPFPGTWEEYLEKFLTGKVAY 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 GSWFEHVQEFWEHRMDSNVLFLKYEDMHRDLVTMVEQLARFLGVSCDKAQLEALTEHCHQ :::: ::...:... . .::: ::::... .... ::: . . :. . .: CCDS35 GSWFTHVKNWWKKKEEHPILFLYYEDMKENPKEEIKKIIRFLEKNLNDEILDRIIHHTSF 180 190 200 210 220 230 240 250 260 270 pF1KB5 LV---DQCCNAEALPVG-----------RGRVGLWKDIFTVSMNEKFDLVYKQKMGKCDL : . : ::. .: .: ::. :::..::::: .:. .:.: : CCDS35 EVMKDNPLVNYTHLPTTVMDHSKSPFMRKGTAGDWKNYFTVAQNEKFDAIYETEMSKTAL 240 250 260 270 280 290 280 pF1KB5 TFDFYL : CCDS35 QFRTEI >>CCDS3531.1 SULT1E1 gene_id:6783|Hs108|chr4 (294 aa) initn: 555 init1: 347 opt: 473 Z-score: 591.7 bits: 117.4 E(32554): 1.2e-26 Smith-Waterman score: 556; 33.7% identity (61.4% similar) in 285 aa overlap (14-280:6-290) 10 20 30 40 50 60 pF1KB5 MAESEAETPSTPGEFESKYFEFHGVRLPPFCRGKMEEIANFPVRPSDVWIVTYPKSGTSL .. :. : ::. . ... : .::.:. :.:::::::. CCDS35 MNSELDYYEKFEEVHGILMYKDFVKYWDNVEAFQARPDDLVIATYPKSGTTW 10 20 30 40 50 70 80 90 100 110 pF1KB5 LQEVVYLVSQGADPDEIGLMNIDEQLPVLEYPQP----GLDIIKELTSPRLIKSHLPYRF ..:.::.. . .: .. : ...: :: . :. . :..:::..:.::: .. CCDS35 VSEIVYMIYKEGDVEKCKEDVIFNRIPFLECRKENLMNGVKQLDEMNSPRIVKTHLPPEL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 LPSDLHNGDSKVIYMARNPKDLVVSYYQFHRSLRTMSYRGTFQEFCRRFMNDKLGYGSWF ::... . : :.::. :: ::..::.: : . :.: :: ..::. .. ::::. CCDS35 LPASFWEKDCKIIYLCRNAKDVAVSFYYFFLMVAGHPNPGSFPEFVEKFMQGQVPYGSWY 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 EHVQEFWEHRMDSNVLFLKYEDMHRDLVTMVEQLARFLGVSCDKAQLEALTEHCH----- .::. .::. . :::: :::...:. : .: .:: . .. .. . .: CCDS35 KHVKSWWEKGKSPRVLFLFYEDLKEDIRKEVIKLIHFLERKPSEELVDRIIHHTSFQEMK 180 190 200 210 220 230 240 250 260 270 280 pF1KB5 --------QLVDQCCNAEALPVGR-GRVGLWKDIFTVSMNEKFDLVYKQKMGKCDLTFDF : :. : . : : : .: ::. :::..::::: :.:.: . : : CCDS35 NNPSTNYTTLPDEIMNQKLSPFMRKGITGDWKNHFTVALNEKFDKHYEQQMKESTLKFRT 240 250 260 270 280 290 pF1KB5 YL CCDS35 EI >>CCDS33267.1 SULT1C3 gene_id:442038|Hs108|chr2 (304 aa) initn: 555 init1: 361 opt: 470 Z-score: 587.8 bits: 116.7 E(32554): 2e-26 Smith-Waterman score: 547; 32.3% identity (62.7% similar) in 300 aa overlap (1-280:1-300) 10 20 30 40 50 pF1KB5 MAESEAETPSTPGEFES-KYFEFHGVRLPPFCRGKMEEIANFPVRPSDVWIVTYPKSGTS ::. : ..:. . : . .: :: . . :.. :: ..:.:. ..:::::::. CCDS33 MAKIEKNAPTMEKKPELFNIMEVDGVPTLILSKEWWEKVCNFQAKPDDLILATYPKSGTT 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 LLQEVVYLVSQGADPDEIGLMNIDEQLPVLE--YP---QPGLDIIKELTSPRLIKSHLPY ..:.. .. . .: .. . .. :: .: .: :... :..::.:::.::: CCDS33 WMHEILDMILNDGDVEKCKRAQTLDRHAFLELKFPHKEKPDLEFVLEMSSPQLIKTHLPS 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB5 RFLPSDLHNGDSKVIYMARNPKDLVVSYYQFHRSLRTMSYRGTFQEFCRRFMNDKLGYGS ...: .. . . :..:.:::::: .::::.::: : ...:: ..::. :. :: CCDS33 HLIPPSIWKENCKIVYVARNPKDCLVSYYHFHRMASFMPDPQNLEEFYEKFMSGKVVGGS 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB5 WFEHVQEFWEHRMDSNVLFLKYEDMHRDLVTMVEQLARFLGVSCDKAQLEALTEHCH-QL ::.::. .: . .:.: :::...: .:.. .:: . .. :. . : .. CCDS33 WFDHVKGWWAAKDMHRILYLFYEDIKKDPKREIEKILKFLEKDISEEILNKIIYHTSFDV 190 200 210 220 230 240 240 250 260 270 280 pF1KB5 VDQC--CNAEALPVG-----------RGRVGLWKDIFTVSMNEKFDLVYKQKMGKCDLTF . : : .::.. .: : ::. :::..::.:: :..::. ::: CCDS33 MKQNPMTNYTTLPTSIMDHSISPFMRKGMPGDWKNYFTVAQNEEFDKDYQKKMAGSTLTF 250 260 270 280 290 300 pF1KB5 DFYL CCDS33 RTEI 284 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 21:44:35 2016 done: Sat Nov 5 21:44:35 2016 Total Scan time: 2.410 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]