FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0229, 304 aa 1>>>pF1KE0229 304 - 304 aa - 304 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9620+/-0.000875; mu= 12.0342+/- 0.053 mean_var=69.1262+/-14.013, 0's: 0 Z-trim(106.3): 30 B-trim: 34 in 1/48 Lambda= 0.154260 statistics sampled from 8895 (8916) to 8895 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.656), E-opt: 0.2 (0.274), width: 16 Scan time: 2.390 The best scores are: opt bits E(32554) CCDS33267.1 SULT1C3 gene_id:442038|Hs108|chr2 ( 304) 2101 476.5 1.1e-134 CCDS2077.1 SULT1C4 gene_id:27233|Hs108|chr2 ( 302) 1201 276.2 2.1e-74 CCDS3530.1 SULT1B1 gene_id:27284|Hs108|chr4 ( 296) 1164 268.0 6.3e-72 CCDS2075.1 SULT1C2 gene_id:6819|Hs108|chr2 ( 296) 1157 266.4 1.8e-71 CCDS32427.1 SULT1A4 gene_id:445329|Hs108|chr16 ( 295) 1084 250.2 1.4e-66 CCDS10674.1 SULT1A3 gene_id:6818|Hs108|chr16 ( 295) 1084 250.2 1.4e-66 CCDS32420.1 SULT1A1 gene_id:6817|Hs108|chr16 ( 295) 1065 245.9 2.7e-65 CCDS10636.1 SULT1A2 gene_id:6799|Hs108|chr16 ( 295) 1060 244.8 5.8e-65 CCDS3531.1 SULT1E1 gene_id:6783|Hs108|chr4 ( 294) 1043 241.0 8e-64 CCDS2076.1 SULT1C2 gene_id:6819|Hs108|chr2 ( 307) 861 200.5 1.3e-51 CCDS10637.1 SULT1A1 gene_id:6817|Hs108|chr16 ( 217) 749 175.6 3e-44 CCDS12724.1 SULT2B1 gene_id:6820|Hs108|chr19 ( 350) 716 168.3 7.5e-42 CCDS12723.1 SULT2B1 gene_id:6820|Hs108|chr19 ( 365) 716 168.3 7.8e-42 CCDS12707.1 SULT2A1 gene_id:6822|Hs108|chr19 ( 285) 698 164.3 1e-40 CCDS82492.1 SULT1C4 gene_id:27233|Hs108|chr2 ( 227) 631 149.3 2.5e-36 CCDS14051.1 SULT4A1 gene_id:25830|Hs108|chr22 ( 284) 470 113.5 1.9e-25 CCDS33182.1 SULT6B1 gene_id:391365|Hs108|chr2 ( 265) 459 111.1 9.6e-25 >>CCDS33267.1 SULT1C3 gene_id:442038|Hs108|chr2 (304 aa) initn: 2101 init1: 2101 opt: 2101 Z-score: 2531.6 bits: 476.5 E(32554): 1.1e-134 Smith-Waterman score: 2101; 100.0% identity (100.0% similar) in 304 aa overlap (1-304:1-304) 10 20 30 40 50 60 pF1KE0 MAKIEKNAPTMEKKPELFNIMEVDGVPTLILSKEWWEKVCNFQAKPDDLILATYPKSGTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MAKIEKNAPTMEKKPELFNIMEVDGVPTLILSKEWWEKVCNFQAKPDDLILATYPKSGTT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 WMHEILDMILNDGDVEKCKRAQTLDRHAFLELKFPHKEKPDLEFVLEMSSPQLIKTHLPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 WMHEILDMILNDGDVEKCKRAQTLDRHAFLELKFPHKEKPDLEFVLEMSSPQLIKTHLPS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 HLIPPSIWKENCKIVYVARNPKDCLVSYYHFHRMASFMPDPQNLEEFYEKFMSGKVVGGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 HLIPPSIWKENCKIVYVARNPKDCLVSYYHFHRMASFMPDPQNLEEFYEKFMSGKVVGGS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 WFDHVKGWWAAKDMHRILYLFYEDIKKDPKREIEKILKFLEKDISEEILNKIIYHTSFDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 WFDHVKGWWAAKDMHRILYLFYEDIKKDPKREIEKILKFLEKDISEEILNKIIYHTSFDV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 MKQNPMTNYTTLPTSIMDHSISPFMRKGMPGDWKNYFTVAQNEEFDKDYQKKMAGSTLTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MKQNPMTNYTTLPTSIMDHSISPFMRKGMPGDWKNYFTVAQNEEFDKDYQKKMAGSTLTF 250 260 270 280 290 300 pF1KE0 RTEI :::: CCDS33 RTEI >>CCDS2077.1 SULT1C4 gene_id:27233|Hs108|chr2 (302 aa) initn: 1182 init1: 941 opt: 1201 Z-score: 1449.2 bits: 276.2 E(32554): 2.1e-74 Smith-Waterman score: 1201; 58.7% identity (82.7% similar) in 283 aa overlap (18-300:17-298) 10 20 30 40 50 60 pF1KE0 MAKIEKNAPTMEKKPELFNIMEVDGVPTLILSKEWWEKVCNFQAKPDDLILATYPKSGTT ... : :. . . :.:. :::::::::...::::.::: CCDS20 MALHDMEDFTFDGTKRLSVNYVKGILQPTDTCDIWDKIWNFQAKPDDLLISTYPKAGTT 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 WMHEILDMILNDGDVEKCKRAQTLDRHAFLELKFPHKEKPDLEFVLEMSSPQLIKTHLPS : .::...: :.::::: ::: : .: :::.:.: . :: . : ::...::::: CCDS20 WTQEIVELIQNEGDVEKSKRAPTHQRFPFLEMKIP-SLGSGLEQAHAMPSPRILKTHLPF 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 HLIPPSIWKENCKIVYVARNPKDCLVSYYHFHRMASFMPDPQNLEEFYEKFMSGKVVGGS ::.:::. ..::::.:::::::: .::::::.:: . .: : . ::..: :..::: :: CCDS20 HLLPPSLLEKNCKIIYVARNPKDNMVSYYHFQRMNKALPAPGTWEEYFETFLAGKVCWGS 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE0 WFDHVKGWWAAKDMHRILYLFYEDIKKDPKREIEKILKFLEKDISEEILNKIIYHTSFDV : .:::::: ::: ::::::::::.::.::.::.:. .:. : .....:.::...::::: CCDS20 WHEHVKGWWEAKDKHRILYLFYEDMKKNPKHEIQKLAEFIGKKLDDKVLDKIVHYTSFDV 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE0 MKQNPMTNYTTLPTSIMDHSISPFMRKGMPGDWKNYFTVAQNEEFDKDYQKKMAGSTLTF ::::::.::...:. ::::::::::::: ::::..:::::::.::.::.:::. . ::: CCDS20 MKQNPMANYSSIPAEIMDHSISPFMRKGAVGDWKKHFTVAQNERFDEDYKKKMTDTRLTF 240 250 260 270 280 290 pF1KE0 RTEI CCDS20 HFQF 300 >>CCDS3530.1 SULT1B1 gene_id:27284|Hs108|chr4 (296 aa) initn: 1158 init1: 1158 opt: 1164 Z-score: 1404.8 bits: 268.0 E(32554): 6.3e-72 Smith-Waterman score: 1164; 56.0% identity (80.9% similar) in 282 aa overlap (23-304:15-296) 10 20 30 40 50 60 pF1KE0 MAKIEKNAPTMEKKPELFNIMEVDGVPTLILSKEWWEKVCNFQAKPDDLILATYPKSGTT : : : :::. .:...:::...::::::::: CCDS35 MLSPKDILRKDLKLVHGYPMTCAFASNWEKIEQFHSRPDDIVIATYPKSGTT 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 WMHEILDMILNDGDVEKCKRAQTLDRHAFLELKFPHKEKPDLEFVLEMSSPQLIKTHLPS :. ::.::::::::.:::::. .. .::. .: . .: . . ::...:::::. CCDS35 WVSEIIDMILNDGDIEKCKRGFITEKVPMLEMTLPGLRTSGIEQLEKNPSPRIVKTHLPT 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 HLIPPSIWKENCKIVYVARNPKDCLVSYYHFHRMASFMPDPQNLEEFYEKFMSGKVVGGS :.: :.:..:::..:.::: :: :::::: : ...: : . ::. :::..:::. :: CCDS35 DLLPKSFWENNCKMIYLARNAKDVSVSYYHFDLMNNLQPFPGTWEEYLEKFLTGKVAYGS 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE0 WFDHVKGWWAAKDMHRILYLFYEDIKKDPKREIEKILKFLEKDISEEILNKIIYHTSFDV :: :::.:: :. : ::.:.:::.:..::.::.::..::::....:::..::.::::.: CCDS35 WFTHVKNWWKKKEEHPILFLYYEDMKENPKEEIKKIIRFLEKNLNDEILDRIIHHTSFEV 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE0 MKQNPMTNYTTLPTSIMDHSISPFMRKGMPGDWKNYFTVAQNEEFDKDYQKKMAGSTLTF ::.::..::: :::..:::: ::::::: :::::::::::::.:: :. .:. ..: : CCDS35 MKDNPLVNYTHLPTTVMDHSKSPFMRKGTAGDWKNYFTVAQNEKFDAIYETEMSKTALQF 240 250 260 270 280 290 pF1KE0 RTEI :::: CCDS35 RTEI >>CCDS2075.1 SULT1C2 gene_id:6819|Hs108|chr2 (296 aa) initn: 1180 init1: 898 opt: 1157 Z-score: 1396.4 bits: 266.4 E(32554): 1.8e-71 Smith-Waterman score: 1157; 55.5% identity (81.3% similar) in 283 aa overlap (22-304:15-296) 10 20 30 40 50 60 pF1KE0 MAKIEKNAPTMEKKPELFNIMEVDGVPTLILSKEWWEKVCNFQAKPDDLILATYPKSGTT ::.:. . . : .. .:.::::::.. ::::.::: CCDS20 MALTSDLGKQIKLKEVEGTLLQPATVDNWSQIQSFEAKPDDLLICTYPKAGTT 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 WMHEILDMILNDGDVEKCKRAQTLDRHAFLELKFPHKEKPDLEFVLEMSSPQLIKTHLPS :..::.::: ..::::::.:: :: :.: : . . .: . : ::...:::: . CCDS20 WIQEIVDMIEQNGDVEKCQRAIIQHRHPFIEWARPPQPS-GVEKAKAMPSPRILKTHLST 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 HLIPPSIWKENCKIVYVARNPKDCLVSYYHFHRMASFMPDPQNLEEFYEKFMSGKVVGGS .:.:::.:..:::..::::: :::.::::::.:: ..::: . ::..: :..:::: :: CCDS20 QLLPPSFWENNCKFLYVARNAKDCMVSYYHFQRMNHMLPDPGTWEEYFETFINGKVVWGS 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE0 WFDHVKGWWAAKDMHRILYLFYEDIKKDPKREIEKILKFLEKDISEEILNKIIYHTSFDV ::::::::: :: :.::.:::::::.:::.::.:...:. : ..: .:.::. .:::. CCDS20 WFDHVKGWWEMKDRHQILFLFYEDIKRDPKHEIRKVMQFMGKKVDETVLDKIVQETSFEK 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE0 MKQNPMTNYTTLPTSIMDHSISPFMRKGMPGDWKNYFTVAQNEEFDKDYQKKMAGSTLTF ::.::::: .:. ::.:.::: ::::: :::::.:::::::.::. :..:: :....: CCDS20 MKENPMTNRSTVSKSILDQSISSFMRKGTVGDWKNHFTVAQNERFDEIYRRKMEGTSINF 240 250 260 270 280 290 pF1KE0 RTEI :. CCDS20 CMEL >>CCDS32427.1 SULT1A4 gene_id:445329|Hs108|chr16 (295 aa) initn: 1093 init1: 851 opt: 1084 Z-score: 1308.6 bits: 250.2 E(32554): 1.4e-66 Smith-Waterman score: 1084; 55.3% identity (75.5% similar) in 282 aa overlap (23-304:15-295) 10 20 30 40 50 60 pF1KE0 MAKIEKNAPTMEKKPELFNIMEVDGVPTLILSKEWWEKVCNFQAKPDDLILATYPKSGTT : ::: . : . .:::.::::.. :::::::: CCDS32 MELIQDTSRPPLEYVKGVPLIKYFAEALGPLQSFQARPDDLLINTYPKSGTT 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 WMHEILDMILNDGDVEKCKRAQTLDRHAFLELKFPHKEKPDLEFVLEMSSPQLIKTHLPS :. .::::: . ::.:::.:: : :::.. : : :: . . :.:::.::: CCDS32 WVSQILDMIYQGGDLEKCNRAPIYVRVPFLEVNDPG-EPSGLETLKDTPPPRLIKSHLPL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 HLIPPSIWKENCKIVYVARNPKDCLVSYYHFHRMASFMPDPQNLEEFYEKFMSGKVVGGS :.: .. .. :.::::::::: ::::::::: . :.: . . : ::::.:.: :: CCDS32 ALLPQTLLDQKVKVVYVARNPKDVAVSYYHFHRMEKAHPEPGTWDSFLEKFMAGEVSYGS 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE0 WFDHVKGWWAAKDMHRILYLFYEDIKKDPKREIEKILKFLEKDISEEILNKIIYHTSFDV :..::. :: . : .:::::::.:..:::::.:::.:. ... :: .. .. :::: CCDS32 WYQHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEETMDFMVQHTSFKE 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE0 MKQNPMTNYTTLPTSIMDHSISPFMRKGMPGDWKNYFTVAQNEEFDKDYQKKMAGSTLTF ::.::::::::.: .::::::::::::: ::::. :::::::.:: :: .:::: .:.: CCDS32 MKKNPMTNYTTVPQELMDHSISPFMRKGMAGDWKTTFTVAQNERFDADYAEKMAGCSLSF 240 250 260 270 280 290 pF1KE0 RTEI :.:. CCDS32 RSEL >>CCDS10674.1 SULT1A3 gene_id:6818|Hs108|chr16 (295 aa) initn: 1093 init1: 851 opt: 1084 Z-score: 1308.6 bits: 250.2 E(32554): 1.4e-66 Smith-Waterman score: 1084; 55.3% identity (75.5% similar) in 282 aa overlap (23-304:15-295) 10 20 30 40 50 60 pF1KE0 MAKIEKNAPTMEKKPELFNIMEVDGVPTLILSKEWWEKVCNFQAKPDDLILATYPKSGTT : ::: . : . .:::.::::.. :::::::: CCDS10 MELIQDTSRPPLEYVKGVPLIKYFAEALGPLQSFQARPDDLLINTYPKSGTT 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 WMHEILDMILNDGDVEKCKRAQTLDRHAFLELKFPHKEKPDLEFVLEMSSPQLIKTHLPS :. .::::: . ::.:::.:: : :::.. : : :: . . :.:::.::: CCDS10 WVSQILDMIYQGGDLEKCNRAPIYVRVPFLEVNDPG-EPSGLETLKDTPPPRLIKSHLPL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 HLIPPSIWKENCKIVYVARNPKDCLVSYYHFHRMASFMPDPQNLEEFYEKFMSGKVVGGS :.: .. .. :.::::::::: ::::::::: . :.: . . : ::::.:.: :: CCDS10 ALLPQTLLDQKVKVVYVARNPKDVAVSYYHFHRMEKAHPEPGTWDSFLEKFMAGEVSYGS 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE0 WFDHVKGWWAAKDMHRILYLFYEDIKKDPKREIEKILKFLEKDISEEILNKIIYHTSFDV :..::. :: . : .:::::::.:..:::::.:::.:. ... :: .. .. :::: CCDS10 WYQHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEETMDFMVQHTSFKE 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE0 MKQNPMTNYTTLPTSIMDHSISPFMRKGMPGDWKNYFTVAQNEEFDKDYQKKMAGSTLTF ::.::::::::.: .::::::::::::: ::::. :::::::.:: :: .:::: .:.: CCDS10 MKKNPMTNYTTVPQELMDHSISPFMRKGMAGDWKTTFTVAQNERFDADYAEKMAGCSLSF 240 250 260 270 280 290 pF1KE0 RTEI :.:. CCDS10 RSEL >>CCDS32420.1 SULT1A1 gene_id:6817|Hs108|chr16 (295 aa) initn: 1063 init1: 804 opt: 1065 Z-score: 1285.8 bits: 245.9 E(32554): 2.7e-65 Smith-Waterman score: 1065; 54.3% identity (76.2% similar) in 282 aa overlap (23-304:15-295) 10 20 30 40 50 60 pF1KE0 MAKIEKNAPTMEKKPELFNIMEVDGVPTLILSKEWWEKVCNFQAKPDDLILATYPKSGTT : ::: . : . .:::.::::...:::::::: CCDS32 MELIQDTSRPPLEYVKGVPLIKYFAEALGPLQSFQARPDDLLISTYPKSGTT 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 WMHEILDMILNDGDVEKCKRAQTLDRHAFLELKFPHKEKPDLEFVLEMSSPQLIKTHLPS :. .::::: . ::.:::.:: . : :::.: : . .: . . .:.:.::::: CCDS32 WVSQILDMIYQGGDLEKCHRAPIFMRVPFLEFKAPGIPS-GMETLKDTPAPRLLKTHLPL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 HLIPPSIWKENCKIVYVARNPKDCLVSYYHFHRMASFMPDPQNLEEFYEKFMSGKVVGGS :.: .. .. :.:::::: :: ::::::..::. :.: . . : :::: :.: :: CCDS32 ALLPQTLLDQKVKVVYVARNAKDVAVSYYHFYHMAKVHPEPGTWDSFLEKFMVGEVSYGS 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE0 WFDHVKGWWAAKDMHRILYLFYEDIKKDPKREIEKILKFLEKDISEEILNKIIYHTSFDV :..::. :: . : .:::::::.:..:::::.:::.:. ... :: .. .. :::: CCDS32 WYQHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEETVDFVVQHTSFKE 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE0 MKQNPMTNYTTLPTSIMDHSISPFMRKGMPGDWKNYFTVAQNEEFDKDYQKKMAGSTLTF ::.::::::::.: .::::::::::::: ::::. :::::::.:: :: .:::: .:.: CCDS32 MKKNPMTNYTTVPQEFMDHSISPFMRKGMAGDWKTTFTVAQNERFDADYAEKMAGCSLSF 240 250 260 270 280 290 pF1KE0 RTEI :.:. CCDS32 RSEL >>CCDS10636.1 SULT1A2 gene_id:6799|Hs108|chr16 (295 aa) initn: 1060 init1: 799 opt: 1060 Z-score: 1279.8 bits: 244.8 E(32554): 5.8e-65 Smith-Waterman score: 1060; 54.6% identity (76.2% similar) in 282 aa overlap (23-304:15-295) 10 20 30 40 50 60 pF1KE0 MAKIEKNAPTMEKKPELFNIMEVDGVPTLILSKEWWEKVCNFQAKPDDLILATYPKSGTT : ::: . : . .:::.::::...:::::::: CCDS10 MELIQDISRPPLEYVKGVPLIKYFAEALGPLQSFQARPDDLLISTYPKSGTT 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 WMHEILDMILNDGDVEKCKRAQTLDRHAFLELKFPHKEKPDLEFVLEMSSPQLIKTHLPS :. .::::: . ::.:::.:: . : :::.: : . .: . . .:.:.::::: CCDS10 WVSQILDMIYQGGDLEKCHRAPIFMRVPFLEFKVPGIPS-GMETLKNTPAPRLLKTHLPL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 HLIPPSIWKENCKIVYVARNPKDCLVSYYHFHRMASFMPDPQNLEEFYEKFMSGKVVGGS :.: .. .. :.:::::: :: ::::::..::. .: : . : : ::::.:.: :: CCDS10 ALLPQTLLDQKVKVVYVARNAKDVAVSYYHFYHMAKVYPHPGTWESFLEKFMAGEVSYGS 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE0 WFDHVKGWWAAKDMHRILYLFYEDIKKDPKREIEKILKFLEKDISEEILNKIIYHTSFDV :..::. :: . : .:::::::.:..:::::.:::.:. ... :: .. .. :::: CCDS10 WYQHVQEWWELSRTHPVLYLFYEDMKENPKREIQKILEFVGRSLPEETVDLMVEHTSFKE 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE0 MKQNPMTNYTTLPTSIMDHSISPFMRKGMPGDWKNYFTVAQNEEFDKDYQKKMAGSTLTF ::.::::::::. .::::::::::::: ::::. :::::::.:: :: ::::: .:.: CCDS10 MKKNPMTNYTTVRREFMDHSISPFMRKGMAGDWKTTFTVAQNERFDADYAKKMAGCSLSF 240 250 260 270 280 290 pF1KE0 RTEI :.:. CCDS10 RSEL >>CCDS3531.1 SULT1E1 gene_id:6783|Hs108|chr4 (294 aa) initn: 1055 init1: 820 opt: 1043 Z-score: 1259.3 bits: 241.0 E(32554): 8e-64 Smith-Waterman score: 1043; 52.6% identity (77.5% similar) in 285 aa overlap (22-304:13-294) 10 20 30 40 50 60 pF1KE0 MAKIEKNAPTMEKKPELFNIMEVDGVPTLILSKEWWEKVCNFQAKPDDLILATYPKSGTT :: :. ..:..: :::.::::..::::::::: CCDS35 MNSELDYYEKFEEVHGILMYKDFVKYWDNVEAFQARPDDLVIATYPKSGTT 10 20 30 40 50 70 80 90 100 110 pF1KE0 WMHEILDMILNDGDVEKCKRAQTLDRHAFLELKFPHKEK--PDLEFVLEMSSPQLIKTHL :. ::. :: ..:::::::. ..: ::: . ::. .. . ::.::...:::: CCDS35 WVSEIVYMIYKEGDVEKCKEDVIFNRIPFLECR---KENLMNGVKQLDEMNSPRIVKTHL 60 70 80 90 100 120 130 140 150 160 170 pF1KE0 PSHLIPPSIWKENCKIVYVARNPKDCLVSYYHFHRMASFMPDPQNLEEFYEKFMSGKVVG : .:.: :.:...:::.:. :: :: ::.:.: :.. :.: .. :: ::::.:.: CCDS35 PPELLPASFWEKDCKIIYLCRNAKDVAVSFYYFFLMVAGHPNPGSFPEFVEKFMQGQVPY 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE0 GSWFDHVKGWWAAKDMHRILYLFYEDIKKDPKREIEKILKFLEKDISEEILNKIIYHTSF :::. :::.:: :.:.:::::.:.: ..:. :...:::. :::....::.:::: CCDS35 GSWYKHVKSWWEKGKSPRVLFLFYEDLKEDIRKEVIKLIHFLERKPSEELVDRIIHHTSF 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE0 DVMKQNPMTNYTTLPTSIMDHSISPFMRKGMPGDWKNYFTVAQNEEFDKDYQKKMAGSTL . ::.:: ::::::: ::....:::::::. :::::.:::: ::.::: :...: ::: CCDS35 QEMKNNPSTNYTTLPDEIMNQKLSPFMRKGITGDWKNHFTVALNEKFDKHYEQQMKESTL 230 240 250 260 270 280 300 pF1KE0 TFRTEI ::::: CCDS35 KFRTEI 290 >>CCDS2076.1 SULT1C2 gene_id:6819|Hs108|chr2 (307 aa) initn: 1125 init1: 843 opt: 861 Z-score: 1040.1 bits: 200.5 E(32554): 1.3e-51 Smith-Waterman score: 1089; 51.9% identity (77.5% similar) in 293 aa overlap (22-304:15-307) 10 20 30 40 50 60 pF1KE0 MAKIEKNAPTMEKKPELFNIMEVDGVPTLILSKEWWEKVCNFQAKPDDLILATYPKSGTT ::.:. . . : .. .:.::::::.. ::::.::: CCDS20 MALTSDLGKQIKLKEVEGTLLQPATVDNWSQIQSFEAKPDDLLICTYPKAGTT 10 20 30 40 50 70 80 90 100 110 pF1KE0 WMHEILDMILNDGDVEKCKRAQTLDRHAFLEL-KFPHKEKPDLEFVLEMSSPQLIKTHLP :..::.::: ..::::::.:: :: :.: . :. . .. : . . : ... : CCDS20 WIQEIVDMIEQNGDVEKCQRAIIQHRHPFIEWARPPQPSETGFHHVAQAGLKLLSSSNPP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 ---------SHLIPPSIWKENCKIVYVARNPKDCLVSYYHFHRMASFMPDPQNLEEFYEK . :.:::.:..:::..::::: :::.::::::.:: ..::: . ::..: CCDS20 ASTSQSAKITDLLPPSFWENNCKFLYVARNAKDCMVSYYHFQRMNHMLPDPGTWEEYFET 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 FMSGKVVGGSWFDHVKGWWAAKDMHRILYLFYEDIKKDPKREIEKILKFLEKDISEEILN :..:::: ::::::::::: :: :.::.:::::::.:::.::.:...:. : ..: .:. CCDS20 FINGKVVWGSWFDHVKGWWEMKDRHQILFLFYEDIKRDPKHEIRKVMQFMGKKVDETVLD 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 KIIYHTSFDVMKQNPMTNYTTLPTSIMDHSISPFMRKGMPGDWKNYFTVAQNEEFDKDYQ ::. .:::. ::.::::: .:. ::.:.::: ::::: :::::.:::::::.::. :. CCDS20 KIVQETSFEKMKENPMTNRSTVSKSILDQSISSFMRKGTVGDWKNHFTVAQNERFDEIYR 240 250 260 270 280 290 300 pF1KE0 KKMAGSTLTFRTEI .:: :....: :. CCDS20 RKMEGTSINFCMEL 300 304 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 20:27:18 2016 done: Thu Nov 3 20:27:18 2016 Total Scan time: 2.390 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]