FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7713, 423 aa 1>>>pF1KB7713 423 - 423 aa - 423 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.7002+/-0.000735; mu= 13.1644+/- 0.045 mean_var=125.5054+/-24.722, 0's: 0 Z-trim(114.1): 122 B-trim: 0 in 0/51 Lambda= 0.114484 statistics sampled from 14603 (14726) to 14603 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.778), E-opt: 0.2 (0.452), width: 16 Scan time: 2.900 The best scores are: opt bits E(32554) CCDS41667.1 ESRRA gene_id:2101|Hs108|chr11 ( 423) 2816 475.7 3.8e-134 CCDS60830.1 ESRRA gene_id:2101|Hs108|chr11 ( 422) 2799 472.9 2.6e-133 CCDS58061.1 ESRRG gene_id:2104|Hs108|chr1 ( 470) 1591 273.4 3.3e-73 CCDS1517.1 ESRRG gene_id:2104|Hs108|chr1 ( 435) 981 172.6 6.6e-43 CCDS41468.1 ESRRG gene_id:2104|Hs108|chr1 ( 458) 981 172.6 6.9e-43 CCDS58060.1 ESRRG gene_id:2104|Hs108|chr1 ( 396) 969 170.6 2.4e-42 CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14 ( 508) 956 168.5 1.3e-41 CCDS9762.1 ESR2 gene_id:2100|Hs108|chr14 ( 530) 787 140.6 3.4e-33 CCDS61470.1 ESR2 gene_id:2100|Hs108|chr14 ( 474) 718 129.2 8.4e-30 CCDS55920.1 ESR2 gene_id:2100|Hs108|chr14 ( 481) 718 129.2 8.5e-30 CCDS32096.1 ESR2 gene_id:2100|Hs108|chr14 ( 495) 718 129.2 8.7e-30 CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19 ( 404) 653 118.4 1.3e-26 CCDS8310.1 PGR gene_id:5241|Hs108|chr11 ( 933) 601 110.1 9.3e-24 CCDS4278.1 NR3C1 gene_id:2908|Hs108|chr5 ( 777) 589 108.0 3.2e-23 CCDS47298.1 NR3C1 gene_id:2908|Hs108|chr5 ( 742) 580 106.5 8.6e-23 CCDS34258.1 NR3C1 gene_id:2908|Hs108|chr5 ( 778) 577 106.1 1.3e-22 CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 ( 598) 564 103.8 4.6e-22 CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 ( 626) 549 101.4 2.6e-21 CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 ( 637) 549 101.4 2.7e-21 CCDS43965.1 AR gene_id:367|Hs108|chrX ( 388) 525 97.2 2.9e-20 CCDS14387.1 AR gene_id:367|Hs108|chrX ( 920) 525 97.5 5.5e-20 CCDS61469.1 ESR2 gene_id:2100|Hs108|chr14 ( 439) 479 89.7 6.1e-18 CCDS1228.1 NR1I3 gene_id:9970|Hs108|chr1 ( 348) 464 87.1 2.8e-17 CCDS41430.1 NR1I3 gene_id:9970|Hs108|chr1 ( 352) 456 85.8 7.1e-17 CCDS5234.1 ESR1 gene_id:2099|Hs108|chr6 ( 595) 451 85.2 1.9e-16 CCDS44260.1 NR1I3 gene_id:9970|Hs108|chr1 ( 339) 445 84.0 2.4e-16 CCDS44261.1 NR1I3 gene_id:9970|Hs108|chr1 ( 340) 436 82.5 6.9e-16 CCDS41429.1 NR1I3 gene_id:9970|Hs108|chr1 ( 357) 436 82.5 7.1e-16 CCDS59229.1 PGR gene_id:5241|Hs108|chr11 ( 339) 421 80.0 3.8e-15 CCDS6856.1 NR5A1 gene_id:2516|Hs108|chr9 ( 461) 393 75.5 1.2e-13 CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 382 73.7 4.1e-13 CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 380 73.4 6.4e-13 CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 ( 611) 380 73.4 6.5e-13 CCDS60383.1 NR5A2 gene_id:2494|Hs108|chr1 ( 469) 378 73.0 6.7e-13 CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 ( 652) 380 73.5 6.9e-13 CCDS1400.1 NR5A2 gene_id:2494|Hs108|chr1 ( 495) 378 73.0 7e-13 CCDS1401.1 NR5A2 gene_id:2494|Hs108|chr1 ( 541) 378 73.1 7.5e-13 CCDS41428.1 NR1I3 gene_id:9970|Hs108|chr1 ( 314) 371 71.7 1.1e-12 CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 367 71.2 2.3e-12 CCDS53405.1 NR1I3 gene_id:9970|Hs108|chr1 ( 296) 363 70.4 2.6e-12 CCDS44262.1 NR1I3 gene_id:9970|Hs108|chr1 ( 309) 363 70.4 2.7e-12 CCDS45359.1 NR2F2 gene_id:7026|Hs108|chr15 ( 261) 358 69.5 4.2e-12 CCDS45358.1 NR2F2 gene_id:7026|Hs108|chr15 ( 281) 358 69.6 4.5e-12 CCDS3772.1 NR3C2 gene_id:4306|Hs108|chr4 ( 984) 365 71.1 5.2e-12 CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 ( 340) 357 69.5 5.8e-12 CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 359 69.9 5.8e-12 CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 352 68.8 1.5e-11 CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 352 68.8 1.5e-11 CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 ( 414) 343 67.2 3.4e-11 CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 ( 614) 339 66.7 7.2e-11 >>CCDS41667.1 ESRRA gene_id:2101|Hs108|chr11 (423 aa) initn: 2816 init1: 2816 opt: 2816 Z-score: 2521.9 bits: 475.7 E(32554): 3.8e-134 Smith-Waterman score: 2816; 100.0% identity (100.0% similar) in 423 aa overlap (1-423:1-423) 10 20 30 40 50 60 pF1KB7 MSSQVVGIEPLYIKAEPASPDSPKGSSETETEPPVALAPGPAPTRCLPGHKEEEDGEGAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 MSSQVVGIEPLYIKAEPASPDSPKGSSETETEPPVALAPGPAPTRCLPGHKEEEDGEGAG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 PGEQGGGKLVLSSLPKRLCLVCGDVASGYHYGVASCEACKAFFKRTIQGSIEYSCPASNE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 PGEQGGGKLVLSSLPKRLCLVCGDVASGYHYGVASCEACKAFFKRTIQGSIEYSCPASNE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 CEITKRRRKACQACRFTKCLRVGMLKEGVRLDRVRGGRQKYKRRPEVDPLPFPGPFPAGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 CEITKRRRKACQACRFTKCLRVGMLKEGVRLDRVRGGRQKYKRRPEVDPLPFPGPFPAGP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 LAVAGGPRKTAAPVNALVSHLLVVEPEKLYAMPDPAGPDGHLPAVATLCDLFDREIVVTI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 LAVAGGPRKTAAPVNALVSHLLVVEPEKLYAMPDPAGPDGHLPAVATLCDLFDREIVVTI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 SWAKSIPGFSSLSLSDQMSVLQSVWMEVLVLGVAQRSLPLQDELAFAEDLVLDEEGARAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SWAKSIPGFSSLSLSDQMSVLQSVWMEVLVLGVAQRSLPLQDELAFAEDLVLDEEGARAA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 GLGELGAALLQLVRRLQALRLEREEYVLLKALALANSDSVHIEDAEAVEQLREALHEALL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 GLGELGAALLQLVRRLQALRLEREEYVLLKALALANSDSVHIEDAEAVEQLREALHEALL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 EYEAGRAGPGGGAERRRAGRLLLTLPLLRQTAGKVLAHFYGVKLEGKVPMHKLFLEMLEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 EYEAGRAGPGGGAERRRAGRLLLTLPLLRQTAGKVLAHFYGVKLEGKVPMHKLFLEMLEA 370 380 390 400 410 420 pF1KB7 MMD ::: CCDS41 MMD >>CCDS60830.1 ESRRA gene_id:2101|Hs108|chr11 (422 aa) initn: 1478 init1: 1478 opt: 2799 Z-score: 2506.7 bits: 472.9 E(32554): 2.6e-133 Smith-Waterman score: 2799; 99.8% identity (99.8% similar) in 423 aa overlap (1-423:1-422) 10 20 30 40 50 60 pF1KB7 MSSQVVGIEPLYIKAEPASPDSPKGSSETETEPPVALAPGPAPTRCLPGHKEEEDGEGAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 MSSQVVGIEPLYIKAEPASPDSPKGSSETETEPPVALAPGPAPTRCLPGHKEEEDGEGAG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 PGEQGGGKLVLSSLPKRLCLVCGDVASGYHYGVASCEACKAFFKRTIQGSIEYSCPASNE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 PGEQGGGKLVLSSLPKRLCLVCGDVASGYHYGVASCEACKAFFKRTIQGSIEYSCPASNE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 CEITKRRRKACQACRFTKCLRVGMLKEGVRLDRVRGGRQKYKRRPEVDPLPFPGPFPAGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 CEITKRRRKACQACRFTKCLRVGMLKEGVRLDRVRGGRQKYKRRPEVDPLPFPGPFPAGP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 LAVAGGPRKTAAPVNALVSHLLVVEPEKLYAMPDPAGPDGHLPAVATLCDLFDREIVVTI ::::::::::: :::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 LAVAGGPRKTA-PVNALVSHLLVVEPEKLYAMPDPAGPDGHLPAVATLCDLFDREIVVTI 190 200 210 220 230 250 260 270 280 290 300 pF1KB7 SWAKSIPGFSSLSLSDQMSVLQSVWMEVLVLGVAQRSLPLQDELAFAEDLVLDEEGARAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 SWAKSIPGFSSLSLSDQMSVLQSVWMEVLVLGVAQRSLPLQDELAFAEDLVLDEEGARAA 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB7 GLGELGAALLQLVRRLQALRLEREEYVLLKALALANSDSVHIEDAEAVEQLREALHEALL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 GLGELGAALLQLVRRLQALRLEREEYVLLKALALANSDSVHIEDAEAVEQLREALHEALL 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB7 EYEAGRAGPGGGAERRRAGRLLLTLPLLRQTAGKVLAHFYGVKLEGKVPMHKLFLEMLEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS60 EYEAGRAGPGGGAERRRAGRLLLTLPLLRQTAGKVLAHFYGVKLEGKVPMHKLFLEMLEA 360 370 380 390 400 410 pF1KB7 MMD ::: CCDS60 MMD 420 >>CCDS58061.1 ESRRG gene_id:2104|Hs108|chr1 (470 aa) initn: 1632 init1: 736 opt: 1591 Z-score: 1427.8 bits: 273.4 E(32554): 3.3e-73 Smith-Waterman score: 1604; 57.8% identity (78.1% similar) in 434 aa overlap (12-420:43-468) 10 20 30 40 pF1KB7 MSSQVVGIEPLYIKAEPASPDSPKGSSETETEPPVALAPGP .::.::.:: : : . .. . : : CCDS58 KSDLACVPSAKRLLCRMSNKDRHIDSSCSSFIKTEPSSPASLTDSVNHHSPGGSSDASG- 20 30 40 50 60 70 50 60 70 pF1KB7 APTRCLPGHKEEEDGE----------GAGP--------------GEQGGGKLVLSSLPKR . . . ::.. :. :.:: : . .:.:.::: CCDS58 SYSSTMNGHQNGLDSPPLYPSAPILGGSGPVRKLYDDCSSTIVEDPQTKCEYMLNSMPKR 80 90 100 110 120 130 80 90 100 110 120 130 pF1KB7 LCLVCGDVASGYHYGVASCEACKAFFKRTIQGSIEYSCPASNECEITKRRRKACQACRFT :::::::.::::::::::::::::::::::::.:::::::.:::::::::::.:::::: CCDS58 LCLVCGDIASGYHYGVASCEACKAFFKRTIQGNIEYSCPATNECEITKRRRKSCQACRFM 140 150 160 170 180 190 140 150 160 170 180 190 pF1KB7 KCLRVGMLKEGVRLDRVRGGRQKYKRRPEVDPLPFPGPFPAGPLAVAGGPRKTAAPV-NA :::.::::::::::::::::::::::: ... :. .: . : : : . :. : CCDS58 KCLKVGMLKEGVRLDRVRGGRQKYKRRIDAENSPYLNPQLVQP---AKKPLLWSDPADNK 200 210 220 230 240 200 210 220 230 240 250 pF1KB7 LVSHLLVVEPEKLYAMPDPAGPDGHLPAVATLCDLFDREIVVTISWAKSIPGFSSLSLSD .::::::.::::.::::::. ::. . :..::::: :::.:: :.::: :::::.:::.: CCDS58 IVSHLLVAEPEKIYAMPDPTVPDSDIKALTTLCDLADRELVVIIGWAKHIPGFSTLSLAD 250 260 270 280 290 300 260 270 280 290 300 310 pF1KB7 QMSVLQSVWMEVLVLGVAQRSLPLQDELAFAEDLVLDEEGARAAGLGELGAALLQLVRRL :::.:::.:::.:.:::. ::: ..:::..:.: ..::. .. ::: .:. :.::::.. CCDS58 QMSLLQSAWMEILILGVVYRSLSFEDELVYADDYIMDEDQSKLAGLLDLNNAILQLVKKY 310 320 330 340 350 360 320 330 340 350 360 370 pF1KB7 QALRLEREEYVLLKALALANSDSVHIEDAEAVEQLREALHEALLEYEAGRAGPGGGAERR ....::.::.: :::.:::::::.::::.:::..:...::::: .::::. . : CCDS58 KSMKLEKEEFVTLKAIALANSDSMHIEDVEAVQKLQDVLHEALQDYEAGQHME----DPR 370 380 390 400 410 420 380 390 400 410 420 pF1KB7 RAGRLLLTLPLLRQTAGKVLAHFYGVKLEGKVPMHKLFLEMLEAMMD :::..:.::::::::. :.. :::..:::::::::::::::::: CCDS58 RAGKMLMTLPLLRQTSTKAVQHFYNIKLEGKVPMHKLFLEMLEAKV 430 440 450 460 470 >>CCDS1517.1 ESRRG gene_id:2104|Hs108|chr1 (435 aa) initn: 1632 init1: 736 opt: 981 Z-score: 883.8 bits: 172.6 E(32554): 6.6e-43 Smith-Waterman score: 1600; 57.7% identity (77.8% similar) in 433 aa overlap (12-420:15-433) 10 20 30 40 50 pF1KB7 MSSQVVGIEPLYIKAEPASPDSPKGSSETETEPPVALAPGPAPTRCLPGHKEEEDGE .::.::.:: : : . .. . : : . . . ::.. :. CCDS15 MSNKDRHIDSSCSSFIKTEPSSPASLTDSVNHHSPGGSSDASG-SYSSTMNGHQNGLDSP 10 20 30 40 50 60 70 80 90 pF1KB7 ----------GAGP--------------GEQGGGKLVLSSLPKRLCLVCGDVASGYHYGV :.:: : . .:.:.::::::::::.:::::::: CCDS15 PLYPSAPILGGSGPVRKLYDDCSSTIVEDPQTKCEYMLNSMPKRLCLVCGDIASGYHYGV 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB7 ASCEACKAFFKRTIQGSIEYSCPASNECEITKRRRKACQACRFTKCLRVGMLKEGVRLDR ::::::::::::::::.:::::::.:::::::::::.:::::: :::.:::::::::::: CCDS15 ASCEACKAFFKRTIQGNIEYSCPATNECEITKRRRKSCQACRFMKCLKVGMLKEGVRLDR 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB7 VRGGRQKYKRRPEVDPLPFPGPFPAGPLAVAGGPRKTAAPVNALVSHLLVVEPEKLYAMP ::::::::::: ... :. .: . : .: : : .::::::.::::.:::: CCDS15 VRGGRQKYKRRIDAENSPYLNPQLVQP------AKK---PYNKIVSHLLVAEPEKIYAMP 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB7 DPAGPDGHLPAVATLCDLFDREIVVTISWAKSIPGFSSLSLSDQMSVLQSVWMEVLVLGV ::. ::. . :..::::: :::.:: :.::: :::::.:::.::::.:::.:::.:.::: CCDS15 DPTVPDSDIKALTTLCDLADRELVVIIGWAKHIPGFSTLSLADQMSLLQSAWMEILILGV 240 250 260 270 280 290 280 290 300 310 320 330 pF1KB7 AQRSLPLQDELAFAEDLVLDEEGARAAGLGELGAALLQLVRRLQALRLEREEYVLLKALA . ::: ..:::..:.: ..::. .. ::: .:. :.::::.. ....::.::.: :::.: CCDS15 VYRSLSFEDELVYADDYIMDEDQSKLAGLLDLNNAILQLVKKYKSMKLEKEEFVTLKAIA 300 310 320 330 340 350 340 350 360 370 380 390 pF1KB7 LANSDSVHIEDAEAVEQLREALHEALLEYEAGRAGPGGGAERRRAGRLLLTLPLLRQTAG ::::::.::::.:::..:...::::: .::::. . ::::..:.::::::::. CCDS15 LANSDSMHIEDVEAVQKLQDVLHEALQDYEAGQHME----DPRRAGKMLMTLPLLRQTST 360 370 380 390 400 400 410 420 pF1KB7 KVLAHFYGVKLEGKVPMHKLFLEMLEAMMD :.. :::..:::::::::::::::::: CCDS15 KAVQHFYNIKLEGKVPMHKLFLEMLEAKV 410 420 430 >>CCDS41468.1 ESRRG gene_id:2104|Hs108|chr1 (458 aa) initn: 1632 init1: 736 opt: 981 Z-score: 883.5 bits: 172.6 E(32554): 6.9e-43 Smith-Waterman score: 1600; 57.7% identity (77.8% similar) in 433 aa overlap (12-420:38-456) 10 20 30 40 pF1KB7 MSSQVVGIEPLYIKAEPASPDSPKGSSETETEPPVALAPGP .::.::.:: : : . .. . : : CCDS41 LPESFSLHYEEELLCRMSNKDRHIDSSCSSFIKTEPSSPASLTDSVNHHSPGGSSDASG- 10 20 30 40 50 60 50 60 70 pF1KB7 APTRCLPGHKEEEDGE----------GAGP--------------GEQGGGKLVLSSLPKR . . . ::.. :. :.:: : . .:.:.::: CCDS41 SYSSTMNGHQNGLDSPPLYPSAPILGGSGPVRKLYDDCSSTIVEDPQTKCEYMLNSMPKR 70 80 90 100 110 120 80 90 100 110 120 130 pF1KB7 LCLVCGDVASGYHYGVASCEACKAFFKRTIQGSIEYSCPASNECEITKRRRKACQACRFT :::::::.::::::::::::::::::::::::.:::::::.:::::::::::.:::::: CCDS41 LCLVCGDIASGYHYGVASCEACKAFFKRTIQGNIEYSCPATNECEITKRRRKSCQACRFM 130 140 150 160 170 180 140 150 160 170 180 190 pF1KB7 KCLRVGMLKEGVRLDRVRGGRQKYKRRPEVDPLPFPGPFPAGPLAVAGGPRKTAAPVNAL :::.::::::::::::::::::::::: ... :. .: . : .: : : . CCDS41 KCLKVGMLKEGVRLDRVRGGRQKYKRRIDAENSPYLNPQLVQP------AKK---PYNKI 190 200 210 220 230 200 210 220 230 240 250 pF1KB7 VSHLLVVEPEKLYAMPDPAGPDGHLPAVATLCDLFDREIVVTISWAKSIPGFSSLSLSDQ ::::::.::::.::::::. ::. . :..::::: :::.:: :.::: :::::.:::.:: CCDS41 VSHLLVAEPEKIYAMPDPTVPDSDIKALTTLCDLADRELVVIIGWAKHIPGFSTLSLADQ 240 250 260 270 280 290 260 270 280 290 300 310 pF1KB7 MSVLQSVWMEVLVLGVAQRSLPLQDELAFAEDLVLDEEGARAAGLGELGAALLQLVRRLQ ::.:::.:::.:.:::. ::: ..:::..:.: ..::. .. ::: .:. :.::::.. . CCDS41 MSLLQSAWMEILILGVVYRSLSFEDELVYADDYIMDEDQSKLAGLLDLNNAILQLVKKYK 300 310 320 330 340 350 320 330 340 350 360 370 pF1KB7 ALRLEREEYVLLKALALANSDSVHIEDAEAVEQLREALHEALLEYEAGRAGPGGGAERRR ...::.::.: :::.:::::::.::::.:::..:...::::: .::::. . :: CCDS41 SMKLEKEEFVTLKAIALANSDSMHIEDVEAVQKLQDVLHEALQDYEAGQHME----DPRR 360 370 380 390 400 410 380 390 400 410 420 pF1KB7 AGRLLLTLPLLRQTAGKVLAHFYGVKLEGKVPMHKLFLEMLEAMMD ::..:.::::::::. :.. :::..:::::::::::::::::: CCDS41 AGKMLMTLPLLRQTSTKAVQHFYNIKLEGKVPMHKLFLEMLEAKV 420 430 440 450 >>CCDS58060.1 ESRRG gene_id:2104|Hs108|chr1 (396 aa) initn: 1356 init1: 736 opt: 969 Z-score: 873.6 bits: 170.6 E(32554): 2.4e-42 Smith-Waterman score: 1257; 49.9% identity (69.1% similar) in 433 aa overlap (12-420:15-394) 10 20 30 40 50 pF1KB7 MSSQVVGIEPLYIKAEPASPDSPKGSSETETEPPVALAPGPAPTRCLPGHKEEEDGE .::.::.:: : : . .. . : : . . . ::.. :. CCDS58 MSNKDRHIDSSCSSFIKTEPSSPASLTDSVNHHSPGGSSDASG-SYSSTMNGHQNGLDSP 10 20 30 40 50 60 70 80 90 pF1KB7 ----------GAGP--------------GEQGGGKLVLSSLPKRLCLVCGDVASGYHYGV :.:: : . .:.:.::::::::::.:::::::: CCDS58 PLYPSAPILGGSGPVRKLYDDCSSTIVEDPQTKCEYMLNSMPKRLCLVCGDIASGYHYGV 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB7 ASCEACKAFFKRTIQGSIEYSCPASNECEITKRRRKACQACRFTKCLRVGMLKEGVRLDR :::::::::::::::: ::::: CCDS58 ASCEACKAFFKRTIQG---------------------------------------VRLDR 120 130 140 160 170 180 190 200 210 pF1KB7 VRGGRQKYKRRPEVDPLPFPGPFPAGPLAVAGGPRKTAAPVNALVSHLLVVEPEKLYAMP ::::::::::: ... :. .: . : .: : : .::::::.::::.:::: CCDS58 VRGGRQKYKRRIDAENSPYLNPQLVQP------AKK---PYNKIVSHLLVAEPEKIYAMP 150 160 170 180 190 220 230 240 250 260 270 pF1KB7 DPAGPDGHLPAVATLCDLFDREIVVTISWAKSIPGFSSLSLSDQMSVLQSVWMEVLVLGV ::. ::. . :..::::: :::.:: :.::: :::::.:::.::::.:::.:::.:.::: CCDS58 DPTVPDSDIKALTTLCDLADRELVVIIGWAKHIPGFSTLSLADQMSLLQSAWMEILILGV 200 210 220 230 240 250 280 290 300 310 320 330 pF1KB7 AQRSLPLQDELAFAEDLVLDEEGARAAGLGELGAALLQLVRRLQALRLEREEYVLLKALA . ::: ..:::..:.: ..::. .. ::: .:. :.::::.. ....::.::.: :::.: CCDS58 VYRSLSFEDELVYADDYIMDEDQSKLAGLLDLNNAILQLVKKYKSMKLEKEEFVTLKAIA 260 270 280 290 300 310 340 350 360 370 380 390 pF1KB7 LANSDSVHIEDAEAVEQLREALHEALLEYEAGRAGPGGGAERRRAGRLLLTLPLLRQTAG ::::::.::::.:::..:...::::: .::::. . ::::..:.::::::::. CCDS58 LANSDSMHIEDVEAVQKLQDVLHEALQDYEAGQHME----DPRRAGKMLMTLPLLRQTST 320 330 340 350 360 400 410 420 pF1KB7 KVLAHFYGVKLEGKVPMHKLFLEMLEAMMD :.. :::..:::::::::::::::::: CCDS58 KAVQHFYNIKLEGKVPMHKLFLEMLEAKV 370 380 390 >>CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14 (508 aa) initn: 1609 init1: 729 opt: 956 Z-score: 860.5 bits: 168.5 E(32554): 1.3e-41 Smith-Waterman score: 1573; 59.0% identity (77.6% similar) in 434 aa overlap (12-420:15-431) 10 20 30 pF1KB7 MSSQVVGIEPLYIKAEPASPDS---------PKGSSETE--------------TEPP .::.::.::.: :.:::.. :: CCDS98 MSSDDRHLGSSCGSFIKTEPSSPSSGIDALSHHSPSGSSDASGGFGLALGTHANGLDSPP 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB7 VALAPGPAPTRCLPGHKEEEDGEGAGPGEQGGGK--LVLSSLPKRLCLVCGDVASGYHYG . . : . : : .: :: ..: :... : .:...::::::::::.::::::: CCDS98 MFAGAGLGGTPC---RKSYEDC-ASGIMEDSAIKCEYMLNAIPKRLCLVCGDIASGYHYG 70 80 90 100 110 100 110 120 130 140 150 pF1KB7 VASCEACKAFFKRTIQGSIEYSCPASNECEITKRRRKACQACRFTKCLRVGMLKEGVRLD :::::::::::::::::.:::::::.:::::::::::.:::::: :::.::::::::::: CCDS98 VASCEACKAFFKRTIQGNIEYSCPATNECEITKRRRKSCQACRFMKCLKVGMLKEGVRLD 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB7 RVRGGRQKYKRRPEVDPLPFPGPFPAGPLAVAGGPRKTAAPVNALVSHLLVVEPEKLYAM :::::::::::: . . :. . : .. .: :.. .::.:::.::.::::: CCDS98 RVRGGRQKYKRRLDSESSPYLS------LQISPPAKK---PLTKIVSYLLVAEPDKLYAM 180 190 200 210 220 220 230 240 250 260 270 pF1KB7 PDPAGPDGHLPAVATLCDLFDREIVVTISWAKSIPGFSSLSLSDQMSVLQSVWMEVLVLG : :. :.: . :..::::: :::.:: :.::: :::::::::.::::.:::.:::.:.:: CCDS98 PPPGMPEGDIKALTTLCDLADRELVVIIGWAKHIPGFSSLSLGDQMSLLQSAWMEILILG 230 240 250 260 270 280 280 290 300 310 320 330 pF1KB7 VAQRSLPLQDELAFAEDLVLDEEGARAAGLGELGAALLQLVRRLQALRLEREEYVLLKAL .. :::: .:.:..::: ..::: .: ::: :: :.:::::: . :..:.::.: :::: CCDS98 IVYRSLPYDDKLVYAEDYIMDEEHSRLAGLLELYRAILQLVRRYKKLKVEKEEFVTLKAL 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB7 ALANSDSVHIEDAEAVEQLREALHEALLEYEAGRAGPGGGAERRRAGRLLLTLPLLRQTA :::::::..::: :::..:.. ::::: .:: .. : :.:.:::::::::::: CCDS98 ALANSDSMYIEDLEAVQKLQDLLHEALQDYELSQRHE----EPWRTGKLLLTLPLLRQTA 350 360 370 380 390 400 400 410 420 pF1KB7 GKVLAHFYGVKLEGKVPMHKLFLEMLEAMMD .:.. :::.:::.::::::::::::::: CCDS98 AKAVQHFYSVKLQGKVPMHKLFLEMLEAKVGQEQLRGSPKDERMSSHDGKCPFQSAAFTS 410 420 430 440 450 460 >>CCDS9762.1 ESR2 gene_id:2100|Hs108|chr14 (530 aa) initn: 597 init1: 560 opt: 787 Z-score: 709.4 bits: 140.6 E(32554): 3.4e-33 Smith-Waterman score: 787; 40.3% identity (64.4% similar) in 357 aa overlap (78-420:148-497) 50 60 70 80 90 100 pF1KB7 PGHKEEEDGEGAGPGEQGGGKLVLSSLPKRLCLVCGDVASGYHYGVASCEACKAFFKRTI .: ::.: :::::::: :::.:::::::.: CCDS97 PVNRETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSI 120 130 140 150 160 170 110 120 130 140 150 160 pF1KB7 QGSIEYSCPASNECEITKRRRKACQACRFTKCLRVGMLKEGVRLDRVRGGRQKYKRRPEV :: .: :::.:.: : : :::.:::::. :: .:::.: : : .: : : ..: CCDS97 QGHNDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSRRERC-GYRLVRRQRSAD 180 190 200 210 220 230 170 180 190 200 210 220 pF1KB7 DPLPFPGPFPAGPLAVAGG--PRKTAAPVNAL-----VSHLLVVEPEKLYAMPDPAGPDG . : :: .:: :: ..:: : :: .:: .. . :..: CCDS97 EQLHC-----AGKAKRSGGHAPRVRELLLDALSPEQLVLTLLEAEPPHVL-ISRPSAPFT 240 250 260 270 280 290 230 240 250 260 270 280 pF1KB7 HLPAVATLCDLFDREIVVTISWAKSIPGFSSLSLSDQMSVLQSVWMEVLVLGVAQRSLPL . . .: : :.:.: :::::.:::: ::: ::. .:.: :::::..:. ::. CCDS97 EASMMMSLTKLADKELVHMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDH 300 310 320 330 340 350 290 300 310 320 330 pF1KB7 QDELAFAEDLVLD-EEGARAAGLGELGAALLQLVRRLQALRLEREEYVLLKALALANSDS .: :: ::::: .:: . :. :. :: . :.. :.:...::. .::. : ::. CCDS97 PGKLIFAPDLVLDRDEGKCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSM 360 370 380 390 400 410 340 350 360 370 380 390 pF1KB7 VHI----EDAEAVEQLREALHEAL--LEYEAGRAGPGGGAERRRAGRLLLTLPLLRQTAG . .::.. ..: . :. . : . ...: .. . : . ::. : .:.... CCDS97 YPLVTATQDADSSRKLAHLLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHASN 420 430 440 450 460 470 400 410 420 pF1KB7 KVLAHFYGVKLEGKVPMHKLFLEMLEAMMD : . :. ..: .. ::.. :.::::.: CCDS97 KGMEHLLNMKCKNVVPVYDLLLEMLNAHVLRGCKSSITGSECSPAEDSKSKEGSQNPQSQ 480 490 500 510 520 530 >>CCDS61470.1 ESR2 gene_id:2100|Hs108|chr14 (474 aa) initn: 560 init1: 560 opt: 718 Z-score: 648.5 bits: 129.2 E(32554): 8.4e-30 Smith-Waterman score: 718; 40.7% identity (63.0% similar) in 327 aa overlap (78-390:148-467) 50 60 70 80 90 100 pF1KB7 PGHKEEEDGEGAGPGEQGGGKLVLSSLPKRLCLVCGDVASGYHYGVASCEACKAFFKRTI .: ::.: :::::::: :::.:::::::.: CCDS61 PVNRETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSI 120 130 140 150 160 170 110 120 130 140 150 160 pF1KB7 QGSIEYSCPASNECEITKRRRKACQACRFTKCLRVGMLKEGVRLDRVRGGRQKYKRRPEV :: .: :::.:.: : : :::.:::::. :: .:::.: : : .: : : ..: CCDS61 QGHNDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSRRERC-GYRLVRRQRSAD 180 190 200 210 220 230 170 180 190 200 210 220 pF1KB7 DPLPFPGPFPAGPLAVAGG--PRKTAAPVNAL-----VSHLLVVEPEKLYAMPDPAGPDG . : :: .:: :: ..:: : :: .:: .. . :..: CCDS61 EQLHC-----AGKAKRSGGHAPRVRELLLDALSPEQLVLTLLEAEPPHVL-ISRPSAPFT 240 250 260 270 280 290 230 240 250 260 270 280 pF1KB7 HLPAVATLCDLFDREIVVTISWAKSIPGFSSLSLSDQMSVLQSVWMEVLVLGVAQRSLPL . . .: : :.:.: :::::.:::: ::: ::. .:.: :::::..:. ::. CCDS61 EASMMMSLTKLADKELVHMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDH 300 310 320 330 340 350 290 300 310 320 330 pF1KB7 QDELAFAEDLVLD-EEGARAAGLGELGAALLQLVRRLQALRLEREEYVLLKALALANSDS .: :: ::::: .:: . :. :. :: . :.. :.:...::. .::. : ::. CCDS61 PGKLIFAPDLVLDRDEGKCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSM 360 370 380 390 400 410 340 350 360 370 380 390 pF1KB7 VHI----EDAEAVEQLREALHEAL--LEYEAGRAGPGGGAERRRAGRLLLTLPLLRQTAG . .::.. ..: . :. . : . ...: .. . : . ::. : .:. CCDS61 YPLVTATQDADSSRKLAHLLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHARS 420 430 440 450 460 470 400 410 420 pF1KB7 KVLAHFYGVKLEGKVPMHKLFLEMLEAMMD CCDS61 CVYK >>CCDS55920.1 ESR2 gene_id:2100|Hs108|chr14 (481 aa) initn: 560 init1: 560 opt: 718 Z-score: 648.4 bits: 129.2 E(32554): 8.5e-30 Smith-Waterman score: 718; 40.7% identity (63.0% similar) in 327 aa overlap (78-390:148-467) 50 60 70 80 90 100 pF1KB7 PGHKEEEDGEGAGPGEQGGGKLVLSSLPKRLCLVCGDVASGYHYGVASCEACKAFFKRTI .: ::.: :::::::: :::.:::::::.: CCDS55 PVNRETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSI 120 130 140 150 160 170 110 120 130 140 150 160 pF1KB7 QGSIEYSCPASNECEITKRRRKACQACRFTKCLRVGMLKEGVRLDRVRGGRQKYKRRPEV :: .: :::.:.: : : :::.:::::. :: .:::.: : : .: : : ..: CCDS55 QGHNDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSRRERC-GYRLVRRQRSAD 180 190 200 210 220 230 170 180 190 200 210 220 pF1KB7 DPLPFPGPFPAGPLAVAGG--PRKTAAPVNAL-----VSHLLVVEPEKLYAMPDPAGPDG . : :: .:: :: ..:: : :: .:: .. . :..: CCDS55 EQLHC-----AGKAKRSGGHAPRVRELLLDALSPEQLVLTLLEAEPPHVL-ISRPSAPFT 240 250 260 270 280 290 230 240 250 260 270 280 pF1KB7 HLPAVATLCDLFDREIVVTISWAKSIPGFSSLSLSDQMSVLQSVWMEVLVLGVAQRSLPL . . .: : :.:.: :::::.:::: ::: ::. .:.: :::::..:. ::. CCDS55 EASMMMSLTKLADKELVHMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDH 300 310 320 330 340 350 290 300 310 320 330 pF1KB7 QDELAFAEDLVLD-EEGARAAGLGELGAALLQLVRRLQALRLEREEYVLLKALALANSDS .: :: ::::: .:: . :. :. :: . :.. :.:...::. .::. : ::. CCDS55 PGKLIFAPDLVLDRDEGKCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSM 360 370 380 390 400 410 340 350 360 370 380 390 pF1KB7 VHI----EDAEAVEQLREALHEAL--LEYEAGRAGPGGGAERRRAGRLLLTLPLLRQTAG . .::.. ..: . :. . : . ...: .. . : . ::. : .:. CCDS55 YPLVTATQDADSSRKLAHLLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHARW 420 430 440 450 460 470 400 410 420 pF1KB7 KVLAHFYGVKLEGKVPMHKLFLEMLEAMMD CCDS55 GEKQFIHLKLS 480 423 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 22:06:50 2016 done: Fri Nov 4 22:06:50 2016 Total Scan time: 2.900 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]