FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5914, 530 aa 1>>>pF1KB5914 530 - 530 aa - 530 aa Library: human.CCDS.faa 18921897 residues in 33420 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.3474+/-0.000907; mu= 13.7411+/- 0.055 mean_var=97.1809+/-19.640, 0's: 0 Z-trim(108.1): 128 B-trim: 46 in 1/49 Lambda= 0.130102 statistics sampled from 10017 (10147) to 10017 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.68), E-opt: 0.2 (0.304), width: 16 Scan time: 1.710 The best scores are: opt bits E(33420) CCDS9762.1 ESR2 gene_id:2100|Hs109|chr14 ( 530) 3612 688.6 4.9e-198 CCDS32096.1 ESR2 gene_id:2100|Hs109|chr14 ( 495) 3206 612.3 4.1e-175 CCDS55920.1 ESR2 gene_id:2100|Hs109|chr14 ( 481) 3202 611.6 6.7e-175 CCDS61470.1 ESR2 gene_id:2100|Hs109|chr14 ( 474) 3197 610.6 1.3e-174 CCDS61469.1 ESR2 gene_id:2100|Hs109|chr14 ( 439) 2226 428.4 8.7e-120 CCDS5234.1 ESR1 gene_id:2099|Hs109|chr6 ( 595) 1013 200.8 3.9e-51 CCDS41667.1 ESRRA gene_id:2101|Hs109|chr11 ( 423) 787 158.3 1.7e-38 CCDS60830.1 ESRRA gene_id:2101|Hs109|chr11 ( 422) 782 157.3 3.3e-38 CCDS58061.1 ESRRG gene_id:2104|Hs109|chr1 ( 470) 763 153.8 4.2e-37 CCDS87457.1 ESR1 gene_id:2099|Hs109|chr6 ( 310) 676 137.3 2.5e-32 CCDS8310.1 PGR gene_id:5241|Hs109|chr11 ( 933) 605 124.3 6.3e-28 CCDS47298.1 NR3C1 gene_id:2908|Hs109|chr5 ( 742) 569 117.5 5.7e-26 CCDS4278.1 NR3C1 gene_id:2908|Hs109|chr5 ( 777) 569 117.5 5.9e-26 CCDS34258.1 NR3C1 gene_id:2908|Hs109|chr5 ( 778) 567 117.1 7.6e-26 CCDS43965.1 AR gene_id:367|Hs109|chrX ( 388) 541 112.1 1.3e-24 CCDS14387.1 AR gene_id:367|Hs109|chrX ( 920) 541 112.3 2.6e-24 CCDS86887.1 NR4A2 gene_id:4929|Hs109|chr2 ( 535) 500 104.5 3.4e-22 CCDS2201.1 NR4A2 gene_id:4929|Hs109|chr2 ( 598) 500 104.5 3.7e-22 CCDS59229.1 PGR gene_id:5241|Hs109|chr11 ( 339) 466 98.0 2e-20 CCDS6743.1 NR4A3 gene_id:8013|Hs109|chr9 ( 626) 459 96.8 8.1e-20 CCDS6742.1 NR4A3 gene_id:8013|Hs109|chr9 ( 637) 459 96.8 8.2e-20 CCDS12352.1 NR2F6 gene_id:2063|Hs109|chr19 ( 404) 443 93.7 4.5e-19 CCDS58060.1 ESRRG gene_id:2104|Hs109|chr1 ( 396) 414 88.2 1.9e-17 CCDS1517.1 ESRRG gene_id:2104|Hs109|chr1 ( 435) 395 84.7 2.5e-16 CCDS41468.1 ESRRG gene_id:2104|Hs109|chr1 ( 458) 395 84.7 2.6e-16 CCDS9850.2 ESRRB gene_id:2103|Hs109|chr14 ( 508) 394 84.5 3.2e-16 CCDS44261.1 NR1I3 gene_id:9970|Hs109|chr1 ( 340) 384 82.6 8.4e-16 CCDS1228.1 NR1I3 gene_id:9970|Hs109|chr1 ( 348) 383 82.4 9.8e-16 CCDS41429.1 NR1I3 gene_id:9970|Hs109|chr1 ( 357) 382 82.2 1.1e-15 CCDS41430.1 NR1I3 gene_id:9970|Hs109|chr1 ( 352) 377 81.3 2.2e-15 CCDS44260.1 NR1I3 gene_id:9970|Hs109|chr1 ( 339) 374 80.7 3.1e-15 CCDS86200.1 NR1H3 gene_id:10062|Hs109|chr11 ( 342) 353 76.7 4.8e-14 CCDS44584.1 NR1H3 gene_id:10062|Hs109|chr11 ( 387) 353 76.8 5.3e-14 CCDS44585.1 NR1H3 gene_id:10062|Hs109|chr11 ( 402) 353 76.8 5.5e-14 CCDS7929.1 NR1H3 gene_id:10062|Hs109|chr11 ( 447) 353 76.8 6e-14 CCDS73285.1 NR1H3 gene_id:10062|Hs109|chr11 ( 453) 353 76.8 6e-14 CCDS11366.1 RARA gene_id:5914|Hs109|chr17 ( 462) 342 74.8 2.6e-13 CCDS4768.1 RXRB gene_id:6257|Hs109|chr6 ( 533) 340 74.4 3.7e-13 CCDS59007.1 RXRB gene_id:6257|Hs109|chr6 ( 537) 340 74.4 3.8e-13 CCDS3772.1 NR3C2 gene_id:4306|Hs109|chr4 ( 984) 343 75.1 4.2e-13 CCDS42317.1 RARA gene_id:5914|Hs109|chr17 ( 457) 334 73.3 7.2e-13 CCDS8818.1 NR4A1 gene_id:3164|Hs109|chr12 ( 598) 334 73.3 9e-13 CCDS55828.1 NR4A1 gene_id:3164|Hs109|chr12 ( 611) 334 73.3 9.1e-13 CCDS54811.1 NR3C2 gene_id:4306|Hs109|chr4 ( 867) 336 73.8 9.4e-13 CCDS73471.1 NR4A1 gene_id:3164|Hs109|chr12 ( 652) 334 73.3 9.6e-13 CCDS69165.1 NR2E1 gene_id:7101|Hs109|chr6 ( 422) 330 72.5 1.1e-12 CCDS72970.1 RXRG gene_id:6258|Hs109|chr1 ( 340) 328 72.1 1.2e-12 CCDS58236.1 RARG gene_id:5916|Hs109|chr12 ( 382) 328 72.1 1.4e-12 CCDS41790.1 RARG gene_id:5916|Hs109|chr12 ( 443) 328 72.1 1.5e-12 CCDS8850.1 RARG gene_id:5916|Hs109|chr12 ( 454) 328 72.1 1.6e-12 >>CCDS9762.1 ESR2 gene_id:2100|Hs109|chr14 (530 aa) initn: 3612 init1: 3612 opt: 3612 Z-score: 3669.0 bits: 688.6 E(33420): 4.9e-198 Smith-Waterman score: 3612; 100.0% identity (100.0% similar) in 530 aa overlap (1-530:1-530) 10 20 30 40 50 60 pF1KB5 MDIKNSPSSLNSPSSYNCSQSILPLEHGSIYIPSSYVDSHHEYPAMTFYSPAVMNYSIPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 MDIKNSPSSLNSPSSYNCSQSILPLEHGSIYIPSSYVDSHHEYPAMTFYSPAVMNYSIPS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 NVTNLEGGPGRQTTSPNVLWPTPGHLSPLVVHRQLSHLYAEPQKSPWCEARSLEHTLPVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 NVTNLEGGPGRQTTSPNVLWPTPGHLSPLVVHRQLSHLYAEPQKSPWCEARSLEHTLPVN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 RETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSIQGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 RETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSIQGH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 NDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSRRERCGYRLVRRQRSADEQLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 NDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSRRERCGYRLVRRQRSADEQLH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 CAGKAKRSGGHAPRVRELLLDALSPEQLVLTLLEAEPPHVLISRPSAPFTEASMMMSLTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 CAGKAKRSGGHAPRVRELLLDALSPEQLVLTLLEAEPPHVLISRPSAPFTEASMMMSLTK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 LADKELVHMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDHPGKLIFAPDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 LADKELVHMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDHPGKLIFAPDL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 VLDRDEGKCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSMYPLVTATQDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 VLDRDEGKCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSMYPLVTATQDA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 DSSRKLAHLLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHASNKGMEHLLNMK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 DSSRKLAHLLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHASNKGMEHLLNMK 430 440 450 460 470 480 490 500 510 520 530 pF1KB5 CKNVVPVYDLLLEMLNAHVLRGCKSSITGSECSPAEDSKSKEGSQNPQSQ :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 CKNVVPVYDLLLEMLNAHVLRGCKSSITGSECSPAEDSKSKEGSQNPQSQ 490 500 510 520 530 >>CCDS32096.1 ESR2 gene_id:2100|Hs109|chr14 (495 aa) initn: 3197 init1: 3197 opt: 3206 Z-score: 3257.6 bits: 612.3 E(33420): 4.1e-175 Smith-Waterman score: 3206; 96.7% identity (98.8% similar) in 489 aa overlap (1-486:1-489) 10 20 30 40 50 60 pF1KB5 MDIKNSPSSLNSPSSYNCSQSILPLEHGSIYIPSSYVDSHHEYPAMTFYSPAVMNYSIPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MDIKNSPSSLNSPSSYNCSQSILPLEHGSIYIPSSYVDSHHEYPAMTFYSPAVMNYSIPS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 NVTNLEGGPGRQTTSPNVLWPTPGHLSPLVVHRQLSHLYAEPQKSPWCEARSLEHTLPVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 NVTNLEGGPGRQTTSPNVLWPTPGHLSPLVVHRQLSHLYAEPQKSPWCEARSLEHTLPVN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 RETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSIQGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 RETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSIQGH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 NDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSRRERCGYRLVRRQRSADEQLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 NDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSRRERCGYRLVRRQRSADEQLH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 CAGKAKRSGGHAPRVRELLLDALSPEQLVLTLLEAEPPHVLISRPSAPFTEASMMMSLTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 CAGKAKRSGGHAPRVRELLLDALSPEQLVLTLLEAEPPHVLISRPSAPFTEASMMMSLTK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 LADKELVHMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDHPGKLIFAPDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LADKELVHMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDHPGKLIFAPDL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 VLDRDEGKCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSMYPLVTATQDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 VLDRDEGKCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSMYPLVTATQDA 370 380 390 400 410 420 430 440 450 460 470 pF1KB5 DSSRKLAHLLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHA-SNKGMEHL--L :::::::::::::::::::::::::::::::::::::::::::::::: ..:. . : . CCDS32 DSSRKLAHLLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHARAEKASQTLTSF 430 440 450 460 470 480 480 490 500 510 520 530 pF1KB5 NMKCKNVVPVYDLLLEMLNAHVLRGCKSSITGSECSPAEDSKSKEGSQNPQSQ .:: ....: CCDS32 GMKMETLLPEATMEQ 490 >>CCDS55920.1 ESR2 gene_id:2100|Hs109|chr14 (481 aa) initn: 3197 init1: 3197 opt: 3202 Z-score: 3253.7 bits: 611.6 E(33420): 6.7e-175 Smith-Waterman score: 3202; 97.9% identity (99.2% similar) in 480 aa overlap (1-480:1-479) 10 20 30 40 50 60 pF1KB5 MDIKNSPSSLNSPSSYNCSQSILPLEHGSIYIPSSYVDSHHEYPAMTFYSPAVMNYSIPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MDIKNSPSSLNSPSSYNCSQSILPLEHGSIYIPSSYVDSHHEYPAMTFYSPAVMNYSIPS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 NVTNLEGGPGRQTTSPNVLWPTPGHLSPLVVHRQLSHLYAEPQKSPWCEARSLEHTLPVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NVTNLEGGPGRQTTSPNVLWPTPGHLSPLVVHRQLSHLYAEPQKSPWCEARSLEHTLPVN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 RETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSIQGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSIQGH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 NDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSRRERCGYRLVRRQRSADEQLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSRRERCGYRLVRRQRSADEQLH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 CAGKAKRSGGHAPRVRELLLDALSPEQLVLTLLEAEPPHVLISRPSAPFTEASMMMSLTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 CAGKAKRSGGHAPRVRELLLDALSPEQLVLTLLEAEPPHVLISRPSAPFTEASMMMSLTK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 LADKELVHMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDHPGKLIFAPDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LADKELVHMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDHPGKLIFAPDL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 VLDRDEGKCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSMYPLVTATQDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VLDRDEGKCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSMYPLVTATQDA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 DSSRKLAHLLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHASNKGMEHLLNMK :::::::::::::::::::::::::::::::::::::::::::::::: : ......: CCDS55 DSSRKLAHLLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHAR-WGEKQFIHLK 430 440 450 460 470 490 500 510 520 530 pF1KB5 CKNVVPVYDLLLEMLNAHVLRGCKSSITGSECSPAEDSKSKEGSQNPQSQ CCDS55 LS 480 >>CCDS61470.1 ESR2 gene_id:2100|Hs109|chr14 (474 aa) initn: 3197 init1: 3197 opt: 3197 Z-score: 3248.7 bits: 610.6 E(33420): 1.3e-174 Smith-Waterman score: 3197; 100.0% identity (100.0% similar) in 468 aa overlap (1-468:1-468) 10 20 30 40 50 60 pF1KB5 MDIKNSPSSLNSPSSYNCSQSILPLEHGSIYIPSSYVDSHHEYPAMTFYSPAVMNYSIPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MDIKNSPSSLNSPSSYNCSQSILPLEHGSIYIPSSYVDSHHEYPAMTFYSPAVMNYSIPS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 NVTNLEGGPGRQTTSPNVLWPTPGHLSPLVVHRQLSHLYAEPQKSPWCEARSLEHTLPVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 NVTNLEGGPGRQTTSPNVLWPTPGHLSPLVVHRQLSHLYAEPQKSPWCEARSLEHTLPVN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 RETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSIQGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 RETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSIQGH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 NDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSRRERCGYRLVRRQRSADEQLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 NDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSRRERCGYRLVRRQRSADEQLH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 CAGKAKRSGGHAPRVRELLLDALSPEQLVLTLLEAEPPHVLISRPSAPFTEASMMMSLTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 CAGKAKRSGGHAPRVRELLLDALSPEQLVLTLLEAEPPHVLISRPSAPFTEASMMMSLTK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 LADKELVHMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDHPGKLIFAPDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 LADKELVHMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDHPGKLIFAPDL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 VLDRDEGKCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSMYPLVTATQDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 VLDRDEGKCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSMYPLVTATQDA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 DSSRKLAHLLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHASNKGMEHLLNMK :::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 DSSRKLAHLLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHARSCVYK 430 440 450 460 470 490 500 510 520 530 pF1KB5 CKNVVPVYDLLLEMLNAHVLRGCKSSITGSECSPAEDSKSKEGSQNPQSQ >>CCDS61469.1 ESR2 gene_id:2100|Hs109|chr14 (439 aa) initn: 2253 init1: 2226 opt: 2226 Z-score: 2264.2 bits: 428.4 E(33420): 8.7e-120 Smith-Waterman score: 2812; 82.8% identity (82.8% similar) in 530 aa overlap (1-530:1-439) 10 20 30 40 50 60 pF1KB5 MDIKNSPSSLNSPSSYNCSQSILPLEHGSIYIPSSYVDSHHEYPAMTFYSPAVMNYSIPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MDIKNSPSSLNSPSSYNCSQSILPLEHGSIYIPSSYVDSHHEYPAMTFYSPAVMNYSIPS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 NVTNLEGGPGRQTTSPNVLWPTPGHLSPLVVHRQLSHLYAEPQKSPWCEARSLEHTLPVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 NVTNLEGGPGRQTTSPNVLWPTPGHLSPLVVHRQLSHLYAEPQKSPWCEARSLEHTLPVN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 RETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSIQGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 RETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSIQGH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 NDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSRRERCGYRLVRRQRSADEQLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 NDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSRRERCGYRLVRRQRSADEQLH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 CAGKAKRSGGHAPRVRELLLDALSPEQLVLTLLEAEPPHVLISRPSAPFTEASMMMSLTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 CAGKAKRSGGHAPRVRELLLDALSPEQLVLTLLEAEPPHVLISRPSAPFTEASMMMSLTK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 LADKELVHMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDHPGKLIFAPDL :::::::::::::::::: CCDS61 LADKELVHMISWAKKIPG------------------------------------------ 310 370 380 390 400 410 420 pF1KB5 VLDRDEGKCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSMYPLVTATQDA ::::::::::: CCDS61 -------------------------------------------------MYPLVTATQDA 320 430 440 450 460 470 480 pF1KB5 DSSRKLAHLLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHASNKGMEHLLNMK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 DSSRKLAHLLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHASNKGMEHLLNMK 330 340 350 360 370 380 490 500 510 520 530 pF1KB5 CKNVVPVYDLLLEMLNAHVLRGCKSSITGSECSPAEDSKSKEGSQNPQSQ :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 CKNVVPVYDLLLEMLNAHVLRGCKSSITGSECSPAEDSKSKEGSQNPQSQ 390 400 410 420 430 >>CCDS5234.1 ESR1 gene_id:2099|Hs109|chr6 (595 aa) initn: 1276 init1: 641 opt: 1013 Z-score: 1031.8 bits: 200.8 E(33420): 3.9e-51 Smith-Waterman score: 1593; 48.2% identity (72.0% similar) in 558 aa overlap (17-529:27-578) 10 20 30 40 pF1KB5 MDIKNSPSSLNSPSSYNCSQSILPLEH--GSIYIPSSY--VDSHHEYPAM : : .:::. : .:. :: : .. : :. CCDS52 MTMTLHTKASGMALLHQIQGNELEPLNRPQLKIPLERPLGEVYLDSSKPAVYNYPEGAAY 10 20 30 40 50 60 50 60 70 80 pF1KB5 TFYSPAVMNYSIPSNVTNLEGGPGRQ------------------TTSPNVLWPTPGHLSP : . :. : .. .. :.: ::: . . :: .: : .::: CCDS52 EFNAAAAANAQVYGQ-TGLPYGPGSEAAAFGSNGLGGFPPLNSVSPSPLMLLHPPPQLSP 70 80 90 100 110 90 100 110 120 130 140 pF1KB5 LVV-HRQLSHLYAEPQKSPWC--EARSLEHTLPVNRETLKRKVSGNRCASPVTGPGS--- .. : : : : . : . :: : : .. .:. . .: :: .. :: CCDS52 FLQPHGQQVPYYLENEPSGYTVREAGPPAFYRP-NSDN-RRQGGRERLAS-TNDKGSMAM 120 130 140 150 160 170 150 160 170 180 190 200 pF1KB5 --KRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSIQGHNDYICPATNQCTIDKNRRKS .....::::.::::::::::::::::::::::::::::::.:::::::::::::::: CCDS52 ESAKETRYCAVCNDYASGYHYGVWSCEGCKAFFKRSIQGHNDYMCPATNQCTIDKNRRKS 180 190 200 210 220 230 210 220 230 240 250 pF1KB5 CQACRLRKCYEVGMVKCGSRRERCGYRLVRRQRSADE-----QLHCAGKAKRSG-GHAPR ::::::::::::::.: : :..: : :.....:. :. .. :: . .. .: CCDS52 CQACRLRKCYEVGMMKGGIRKDRRGGRMLKHKRQRDDGEGRGEVGSAGDMRAANLWPSPL 240 250 260 270 280 290 260 270 280 290 300 pF1KB5 V-----RELLLDALSPEQLVLTLLEAEPPHVLISR--PSAPFTEASMMMSLTKLADKELV . .. : .:. .:.: .::.:::: .: :. :. ::.::::: ::.:::.::: CCDS52 MIKRSKKNSLALSLTADQMVSALLDAEPP-ILYSEYDPTRPFSEASMMGLLTNLADRELV 300 310 320 330 340 350 310 320 330 340 350 360 pF1KB5 HMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDHPGKLIFAPDLVLDRDEG :::.:::..::::.:.: :::.::: :.:.::.::.:::..:::::.:::.:.:::..: CCDS52 HMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPGKLLFAPNLLLDRNQG 360 370 380 390 400 410 370 380 390 400 410 420 pF1KB5 KCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSMYPLVTATQDADSSRKLA :::::..:::::::::.:::: ..:: .:..:.:..:::::..: ....: . . CCDS52 KCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHI 420 430 440 450 460 470 430 440 450 460 470 480 pF1KB5 H-LLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHASNKGMEHLLNMKCKNVVP : .:. .::.:. ..::.:.. ::: .:::.::..:::.:: :::::::: .:::::::: CCDS52 HRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVP 480 490 500 510 520 530 490 500 510 520 530 pF1KB5 VYDLLLEMLNAHVLRGCKSSITGSECSPAEDSK-SKEGSQNPQSQ .::::::::.:: :.. .: :. ...:. . :: . .: CCDS52 LYDLLLEMLDAHRLHA-PTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPAT 540 550 560 570 580 590 CCDS52 V >>CCDS41667.1 ESRRA gene_id:2101|Hs109|chr11 (423 aa) initn: 597 init1: 560 opt: 787 Z-score: 804.8 bits: 158.3 E(33420): 1.7e-38 Smith-Waterman score: 787; 40.3% identity (64.4% similar) in 357 aa overlap (148-497:78-420) 120 130 140 150 160 170 pF1KB5 PVNRETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSI .: ::.: :::::::: :::.:::::::.: CCDS41 PGHKEEEDGEGAGPGEQGGGKLVLSSLPKRLCLVCGDVASGYHYGVASCEACKAFFKRTI 50 60 70 80 90 100 180 190 200 210 220 230 pF1KB5 QGHNDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSRRERC-GYRLVRRQRSAD :: .: :::.:.: : : :::.:::::. :: .:::.: : : .: : : ..: CCDS41 QGSIEYSCPASNECEITKRRRKACQACRFTKCLRVGMLKEGVRLDRVRGGRQKYKRRPEV 110 120 130 140 150 160 240 250 260 270 280 290 pF1KB5 EQLHC-----AGKAKRSGGHAPRVRELLLDALSPEQLVLTLLEAEPPHVL-ISRPSAPFT . : :: .:: :: ..: :: :: .:: .. . :..: CCDS41 DPLPFPGPFPAGPLAVAGG--PRKTAAPVNA-----LVSHLLVVEPEKLYAMPDPAGPDG 170 180 190 200 210 220 300 310 320 330 340 350 pF1KB5 EASMMMSLTKLADKELVHMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDH . . .: : :.:.: :::::.:::: ::: ::. .:.: :::::..:. ::. CCDS41 HLPAVATLCDLFDREIVVTISWAKSIPGFSSLSLSDQMSVLQSVWMEVLVLGVAQRSLPL 230 240 250 260 270 280 360 370 380 390 400 410 pF1KB5 PGKLIFAPDLVLDRDEGKCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSM .: :: ::::: .:: . :. :. :: . :.. :.:...::. .::. : ::. CCDS41 QDELAFAEDLVLD-EEGARAAGLGELGAALLQLVRRLQALRLEREEYVLLKALALANSDS 290 300 310 320 330 420 430 440 450 460 470 pF1KB5 YPLVTATQDADSSRKLAHLLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHASN . .::.. ..: . :. . : . ...: .. . : . ::. : .:.... CCDS41 VHI----EDAEAVEQLREALHEAL--LEYEAGRAGPGGGAERRRAGRLLLTLPLLRQTAG 340 350 360 370 380 390 480 490 500 510 520 530 pF1KB5 KGMEHLLNMKCKNVVPVYDLLLEMLNAHVLRGCKSSITGSECSPAEDSKSKEGSQNPQSQ : . :. ..: .. ::.. :.::::.: CCDS41 KVLAHFYGVKLEGKVPMHKLFLEMLEAMMD 400 410 420 >>CCDS60830.1 ESRRA gene_id:2101|Hs109|chr11 (422 aa) initn: 628 init1: 368 opt: 782 Z-score: 799.7 bits: 157.3 E(33420): 3.3e-38 Smith-Waterman score: 782; 40.3% identity (64.7% similar) in 357 aa overlap (148-497:78-419) 120 130 140 150 160 170 pF1KB5 PVNRETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSI .: ::.: :::::::: :::.:::::::.: CCDS60 PGHKEEEDGEGAGPGEQGGGKLVLSSLPKRLCLVCGDVASGYHYGVASCEACKAFFKRTI 50 60 70 80 90 100 180 190 200 210 220 230 pF1KB5 QGHNDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSRRERC-GYRLVRRQRSAD :: .: :::.:.: : : :::.:::::. :: .:::.: : : .: : : ..: CCDS60 QGSIEYSCPASNECEITKRRRKACQACRFTKCLRVGMLKEGVRLDRVRGGRQKYKRRPEV 110 120 130 140 150 160 240 250 260 270 280 290 pF1KB5 EQLHC-----AGKAKRSGGHAPRVRELLLDALSPEQLVLTLLEAEPPHVL-ISRPSAPFT . : :: .:: :: . ..: :: :: .:: .. . :..: CCDS60 DPLPFPGPFPAGPLAVAGG--PR-KTAPVNA-----LVSHLLVVEPEKLYAMPDPAGPDG 170 180 190 200 210 300 310 320 330 340 350 pF1KB5 EASMMMSLTKLADKELVHMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDH . . .: : :.:.: :::::.:::: ::: ::. .:.: :::::..:. ::. CCDS60 HLPAVATLCDLFDREIVVTISWAKSIPGFSSLSLSDQMSVLQSVWMEVLVLGVAQRSLPL 220 230 240 250 260 270 360 370 380 390 400 410 pF1KB5 PGKLIFAPDLVLDRDEGKCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNSSM .: :: ::::: .:: . :. :. :: . :.. :.:...::. .::. : ::. CCDS60 QDELAFAEDLVLD-EEGARAAGLGELGAALLQLVRRLQALRLEREEYVLLKALALANSDS 280 290 300 310 320 330 420 430 440 450 460 470 pF1KB5 YPLVTATQDADSSRKLAHLLNAVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHASN . .::.. ..: . :. . : . ...: .. . : . ::. : .:.... CCDS60 VHI----EDAEAVEQLREALHEAL--LEYEAGRAGPGGGAERRRAGRLLLTLPLLRQTAG 340 350 360 370 380 390 480 490 500 510 520 530 pF1KB5 KGMEHLLNMKCKNVVPVYDLLLEMLNAHVLRGCKSSITGSECSPAEDSKSKEGSQNPQSQ : . :. ..: .. ::.. :.::::.: CCDS60 KVLAHFYGVKLEGKVPMHKLFLEMLEAMMD 400 410 420 >>CCDS58061.1 ESRRG gene_id:2104|Hs109|chr1 (470 aa) initn: 785 init1: 377 opt: 763 Z-score: 779.7 bits: 153.8 E(33420): 4.2e-37 Smith-Waterman score: 855; 39.8% identity (70.9% similar) in 357 aa overlap (148-499:132-470) 120 130 140 150 160 170 pF1KB5 PVNRETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKAFFKRSI .: ::.: :::::::: :::.:::::::.: CCDS58 VRKLYDDCSSTIVEDPQTKCEYMLNSMPKRLCLVCGDIASGYHYGVASCEACKAFFKRTI 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB5 QGHNDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSR--RERCGYRLVRRQRSA ::. .: :::::.: : : :::::::::. :: .:::.: : : : : : . .:. .: CCDS58 QGNIEYSCPATNECEITKRRRKSCQACRFMKCLKVGMLKEGVRLDRVRGGRQKYKRRIDA 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 DEQLHCAGKAKRSGGHAPRVRELLLDALSPEQLVLTLLEAEPPHVL-ISRPSAPFTEASM ... . . . : . :: . . ...: :: ::: .. . :..: .. . CCDS58 ENSPYLNPQLVQ-----PAKKPLLWSDPADNKIVSHLLVAEPEKIYAMPDPTVPDSDIKA 230 240 250 260 270 300 310 320 330 340 350 pF1KB5 MMSLTKLADKELVHMISWAKKIPGFVELSLFDQVRLLESCWMEVLMMGLMWRSIDHPGKL . .: :::.::: .:.:::.:::: ::: ::. ::.: :::.:..:...::.. .: CCDS58 LTTLCDLADRELVVIIGWAKHIPGFSTLSLADQMSLLQSAWMEILILGVVYRSLSFEDEL 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB5 IFAPDLVLDRDEGKCVEGILEIFDMLLATTSRFRELKLQHKEYLCVKAMILLNS-SMYPL ..: : ..:.:..: . :.:.. . .: ..... .::...:.. .::. : :: ::. CCDS58 VYADDYIMDEDQSK-LAGLLDLNNAILQLVKKYKSMKLEKEEFVTLKAIALANSDSMH-- 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB5 VTATQDADSSRKLAHLLN-AVTDALVWVIAKSGISSQQQSMRLANLLMLLSHVRHASNKG .:... .:: .:. :. : ..: . ... : ...:: : .:..:.:. CCDS58 ---IEDVEAVQKLQDVLHEALQDY------EAG-QHMEDPRRAGKMLMTLPLLRQTSTKA 400 410 420 430 440 480 490 500 510 520 530 pF1KB5 MEHLLNMKCKNVVPVYDLLLEMLNAHVLRGCKSSITGSECSPAEDSKSKEGSQNPQSQ ..:. :.: .. ::.. :.::::.:.: CCDS58 VQHFYNIKLEGKVPMHKLFLEMLEAKV 450 460 470 >>CCDS87457.1 ESR1 gene_id:2099|Hs109|chr6 (310 aa) initn: 1207 init1: 615 opt: 676 Z-score: 694.2 bits: 137.3 E(33420): 2.5e-32 Smith-Waterman score: 1209; 61.0% identity (85.1% similar) in 282 aa overlap (142-410:5-285) 120 130 140 150 160 170 pF1KB5 SLEHTLPVNRETLKRKVSGNRCASPVTGPGSKRDAHFCAVCSDYASGYHYGVWSCEGCKA : .....::::.:::::::::::::::::: CCDS87 MAMESAKETRYCAVCNDYASGYHYGVWSCEGCKA 10 20 30 180 190 200 210 220 230 pF1KB5 FFKRSIQGHNDYICPATNQCTIDKNRRKSCQACRLRKCYEVGMVKCGSRRERCGYRLVRR ::::::::::::.::::::::::::::::::::::::::::::.: : :..: : :.... CCDS87 FFKRSIQGHNDYMCPATNQCTIDKNRRKSCQACRLRKCYEVGMMKGGIRKDRRGGRMLKH 40 50 60 70 80 90 240 250 260 270 280 pF1KB5 QRSADE-----QLHCAGKAKRSG-GHAPRV-----RELLLDALSPEQLVLTLLEAEPPHV .:. :. .. :: . .. .: . .. : .:. .:.: .::.:::: . CCDS87 KRQRDDGEGRGEVGSAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPP-I 100 110 120 130 140 150 290 300 310 320 330 pF1KB5 LISR--PSAPFTEASMMMSLTKLADKELVHMISWAKKIPGFVELSLFDQVRLLESCWMEV : :. :. ::.::::: ::.:::.::::::.:::..::::.:.: :::.::: :.:. CCDS87 LYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEI 160 170 180 190 200 210 340 350 360 370 380 390 pF1KB5 LMMGLMWRSIDHPGKLIFAPDLVLDRDEGKCVEGILEIFDMLLATTSRFRELKLQHKEYL ::.::.:::..:::::.:::.:.:::..::::::..:::::::::.:::: ..:: .:.. CCDS87 LMIGLVWRSMEHPGKLLFAPNLLLDRNQGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFV 220 230 240 250 260 270 400 410 420 430 440 450 pF1KB5 CVKAMILLNSSMYPLVTATQDADSSRKLAHLLNAVTDALVWVIAKSGISSQQQSMRLANL :.:..:::::.. CCDS87 CLKSIILLNSGISHVEAKKRILNLHPKIFGNKWFPRV 280 290 300 310 530 residues in 1 query sequences 18921897 residues in 33420 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Oct 24 21:34:12 2019 done: Thu Oct 24 21:34:12 2019 Total Scan time: 1.710 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]