FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3637, 518 aa 1>>>pF1KE3637 518 - 518 aa - 518 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.5402+/-0.000936; mu= 9.2535+/- 0.057 mean_var=148.5123+/-28.618, 0's: 0 Z-trim(111.2): 121 B-trim: 0 in 0/51 Lambda= 0.105243 statistics sampled from 12108 (12230) to 12108 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.73), E-opt: 0.2 (0.376), width: 16 Scan time: 3.120 The best scores are: opt bits E(32554) CCDS1004.1 RORC gene_id:6097|Hs108|chr1 ( 518) 3535 548.4 6.9e-156 CCDS30856.1 RORC gene_id:6097|Hs108|chr1 ( 497) 3382 525.2 6.6e-149 CCDS45271.1 RORA gene_id:6095|Hs108|chr15 ( 468) 950 155.9 9.1e-38 CCDS10177.1 RORA gene_id:6095|Hs108|chr15 ( 523) 950 156.0 9.9e-38 CCDS10178.1 RORA gene_id:6095|Hs108|chr15 ( 548) 950 156.0 1e-37 CCDS10179.1 RORA gene_id:6095|Hs108|chr15 ( 556) 950 156.0 1e-37 CCDS6646.1 RORB gene_id:6096|Hs108|chr9 ( 459) 877 144.8 1.9e-34 CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 ( 614) 434 77.7 4.3e-14 CCDS33718.1 NR1D2 gene_id:9975|Hs108|chr3 ( 579) 421 75.7 1.6e-13 CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 410 73.9 4.2e-13 CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 410 73.9 4.3e-13 CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 403 72.8 7.7e-13 CCDS2610.2 PPARG gene_id:5468|Hs108|chr3 ( 477) 403 72.9 9.2e-13 CCDS2609.1 PPARG gene_id:5468|Hs108|chr3 ( 505) 403 72.9 9.7e-13 CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 398 72.1 1.5e-12 CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 393 71.4 2.9e-12 CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 393 71.4 2.9e-12 CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 391 71.1 3.2e-12 CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12 ( 603) 393 71.4 3.2e-12 CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 ( 414) 389 70.7 3.6e-12 CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 388 70.6 4.3e-12 CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 388 70.6 4.4e-12 CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 386 70.3 5e-12 CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 386 70.3 5.2e-12 CCDS33669.1 PPARA gene_id:5465|Hs108|chr22 ( 468) 384 70.0 6.7e-12 CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 ( 626) 386 70.4 6.9e-12 CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 ( 637) 386 70.4 7e-12 CCDS4804.1 PPARD gene_id:5467|Hs108|chr6 ( 361) 377 68.9 1.1e-11 CCDS54994.1 PPARD gene_id:5467|Hs108|chr6 ( 402) 377 68.9 1.2e-11 CCDS4803.1 PPARD gene_id:5467|Hs108|chr6 ( 441) 377 68.9 1.3e-11 CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 ( 340) 375 68.5 1.3e-11 CCDS6856.1 NR5A1 gene_id:2516|Hs108|chr9 ( 461) 377 68.9 1.4e-11 CCDS5063.1 NR2E1 gene_id:7101|Hs108|chr6 ( 385) 375 68.6 1.5e-11 CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 376 68.8 1.6e-11 CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 376 68.8 1.6e-11 CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 375 68.6 1.7e-11 CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3 ( 596) 372 68.2 2.9e-11 CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3 ( 615) 372 68.3 3e-11 CCDS55340.1 NR6A1 gene_id:2649|Hs108|chr9 ( 475) 369 67.7 3.3e-11 CCDS65127.1 NR6A1 gene_id:2649|Hs108|chr9 ( 476) 369 67.7 3.3e-11 CCDS60383.1 NR5A2 gene_id:2494|Hs108|chr1 ( 469) 368 67.6 3.6e-11 CCDS1400.1 NR5A2 gene_id:2494|Hs108|chr1 ( 495) 368 67.6 3.8e-11 CCDS1401.1 NR5A2 gene_id:2494|Hs108|chr1 ( 541) 368 67.6 4.1e-11 CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6 ( 422) 366 67.2 4.1e-11 CCDS35137.1 NR6A1 gene_id:2649|Hs108|chr9 ( 480) 363 66.8 6.3e-11 CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19 ( 404) 361 66.5 6.7e-11 >>CCDS1004.1 RORC gene_id:6097|Hs108|chr1 (518 aa) initn: 3535 init1: 3535 opt: 3535 Z-score: 2912.1 bits: 548.4 E(32554): 6.9e-156 Smith-Waterman score: 3535; 100.0% identity (100.0% similar) in 518 aa overlap (1-518:1-518) 10 20 30 40 50 60 pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 CNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHAEVQK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 CNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHAEVQK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 QLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLPDGQLPLGSSPDLPEASACPPGLLKAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 QLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLPDGQLPLGSSPDLPEASACPPGLLKAS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 GSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGSQLTPDRCGLRFEEHRHPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGSQLTPDRCGLRFEEHRHPG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 LGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCKSYRETCQLRLEDLLRQRSNIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCKSYRETCQLRLEDLLRQRSNIF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 SREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIVLLKAGAMEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIVLLKAGAMEV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 VLVRMCRAYNADNRTVFFEGKYGGMELFRALGCSELISSIFDFSHSLSALHFSEDEIALY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 VLVRMCRAYNADNRTVFFEGKYGGMELFRALGCSELISSIFDFSHSLSALHFSEDEIALY 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 TALVLINAHRPGLQEKRKVEQLQYNLELAFHHHLCKTHRQSILAKLPPKGKLRSLCSQHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TALVLINAHRPGLQEKRKVEQLQYNLELAFHHHLCKTHRQSILAKLPPKGKLRSLCSQHV 430 440 450 460 470 480 490 500 510 pF1KE3 ERLQIFQHLHPIVVQAAFPPLYKELFSTETESPVGLSK :::::::::::::::::::::::::::::::::::::: CCDS10 ERLQIFQHLHPIVVQAAFPPLYKELFSTETESPVGLSK 490 500 510 >>CCDS30856.1 RORC gene_id:6097|Hs108|chr1 (497 aa) initn: 3382 init1: 3382 opt: 3382 Z-score: 2786.8 bits: 525.2 E(32554): 6.6e-149 Smith-Waterman score: 3382; 99.8% identity (100.0% similar) in 495 aa overlap (24-518:3-497) 10 20 30 40 50 60 pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQR .:::::::::::::::::::::::::::::::::::: CCDS30 MRTQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQR 10 20 30 70 80 90 100 110 120 pF1KE3 CNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHAEVQK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 CNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHAEVQK 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE3 QLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLPDGQLPLGSSPDLPEASACPPGLLKAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 QLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLPDGQLPLGSSPDLPEASACPPGLLKAS 100 110 120 130 140 150 190 200 210 220 230 240 pF1KE3 GSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGSQLTPDRCGLRFEEHRHPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 GSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGSQLTPDRCGLRFEEHRHPG 160 170 180 190 200 210 250 260 270 280 290 300 pF1KE3 LGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCKSYRETCQLRLEDLLRQRSNIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 LGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCKSYRETCQLRLEDLLRQRSNIF 220 230 240 250 260 270 310 320 330 340 350 360 pF1KE3 SREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIVLLKAGAMEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 SREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIVLLKAGAMEV 280 290 300 310 320 330 370 380 390 400 410 420 pF1KE3 VLVRMCRAYNADNRTVFFEGKYGGMELFRALGCSELISSIFDFSHSLSALHFSEDEIALY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 VLVRMCRAYNADNRTVFFEGKYGGMELFRALGCSELISSIFDFSHSLSALHFSEDEIALY 340 350 360 370 380 390 430 440 450 460 470 480 pF1KE3 TALVLINAHRPGLQEKRKVEQLQYNLELAFHHHLCKTHRQSILAKLPPKGKLRSLCSQHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 TALVLINAHRPGLQEKRKVEQLQYNLELAFHHHLCKTHRQSILAKLPPKGKLRSLCSQHV 400 410 420 430 440 450 490 500 510 pF1KE3 ERLQIFQHLHPIVVQAAFPPLYKELFSTETESPVGLSK :::::::::::::::::::::::::::::::::::::: CCDS30 ERLQIFQHLHPIVVQAAFPPLYKELFSTETESPVGLSK 460 470 480 490 >>CCDS45271.1 RORA gene_id:6095|Hs108|chr15 (468 aa) initn: 1625 init1: 785 opt: 950 Z-score: 791.5 bits: 155.9 E(32554): 9.1e-38 Smith-Waterman score: 1531; 49.3% identity (72.5% similar) in 499 aa overlap (15-511:5-461) 10 20 30 40 50 60 pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQR ..:: : .:::.:::::::::::::::::::::::::::::::. CCDS45 MMYFVIAAMK---AQIEIIPCKICGDKSSGIHYGVITCEGCKGFFRRSQQ 10 20 30 40 70 80 90 100 110 120 pF1KE3 CNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHAEVQK ::.::: ::.:: :::::::::::::::::::.::::::::::::::::::::.::::: CCDS45 SNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQRDSLYAEVQK 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE3 QLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLPDGQLPLGSSPDLPEASACPPGLLKAS . .:.::.... : : . : : . :: . CCDS45 HRMQQQQRDHQ-------------------------QQPGEAEPLTPTYNISANGLTELH 110 120 130 140 190 200 210 220 230 240 pF1KE3 GSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGSQLTPDRCGLRFEEHRHPG . .: ..: ..:: .::.. : . : .::. :: .. . CCDS45 DDLSNY--------IDG------HTPEGSKADSAVSSFYLDIQPSPDQSGLDINGIKPEP 150 160 170 180 250 260 270 280 290 300 pF1KE3 LGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCKSYRETCQLRLEDLLRQRSNIF . . . . :: . .: .:..:.:::.:.. ::. :::: :.: . . : CCDS45 ICDYTPASGFFPYCSFTNGETSPTVSMAELEHLAQNISKSHLETCQYLREELQQITWQTF 190 200 210 220 230 240 310 320 330 340 350 360 pF1KE3 SREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIVLLKAGAMEV .::. .:: :. ::. :: ..:::::::::::::..:::::::::::::::::..:: CCDS45 LQEEIENYQNKQREVMWQLCAIKITEAIQYVVEFAKRIDGFMELCQNDQIVLLKAGSLEV 250 260 270 280 290 300 370 380 390 400 410 420 pF1KE3 VLVRMCRAYNADNRTVFFEGKYGGMELFRALGCSELISSIFDFSHSLSALHFSEDEIALY :..:::::....: ::.:.:::.. ..:..::: ..:: .:.:..:: ..:..::::::. CCDS45 VFIRMCRAFDSQNNTVYFDGKYASPDVFKSLGCEDFISFVFEFGKSLCSMHLTEDEIALF 310 320 330 340 350 360 430 440 450 460 470 pF1KE3 TALVLINAHRPGLQEKRKVEQLQYNLELAFHHHLCKTHRQS-ILAKLPPK-GKLRSLCSQ .:.::..: : :::: :.:.:: ...::..: : :.::.. ::.:: : . ::.::.. CCDS45 SAFVLMSADRSWLQEKVKIEKLQQKIQLALQHVLQKNHREDGILTKLICKVSTLRALCGR 370 380 390 400 410 420 480 490 500 510 pF1KE3 HVERLQIFQHLHPIVVQAAFPPLYKELFSTETESPVGLSK :.:.:. :. ..: .:. :::::::::..: : CCDS45 HTEKLMAFKAIYPDIVRLHFPPLYKELFTSEFEPAMQIDG 430 440 450 460 >>CCDS10177.1 RORA gene_id:6095|Hs108|chr15 (523 aa) initn: 1672 init1: 785 opt: 950 Z-score: 790.9 bits: 156.0 E(32554): 9.9e-38 Smith-Waterman score: 1578; 49.5% identity (72.7% similar) in 513 aa overlap (4-511:43-516) 10 20 30 pF1KE3 MDRAPQRQHR---ASRELLAAKKTHTSQIEVIP :: :.. .:: . ..:::::::::.:: CCDS10 SEPGSSGADAAAGSRETPLNQESARKSEPPAPVRRQSYSSTSRGISVTKKTHTSQIEIIP 20 30 40 50 60 70 40 50 60 70 80 90 pF1KE3 CKICGDKSSGIHYGVITCEGCKGFFRRSQRCNAAYSCTRQQNCPIDRTSRNRCQHCRLQK :::::::::::::::::::::::::::::. ::.::: ::.:: :::::::::::::::: CCDS10 CKICGDKSSGIHYGVITCEGCKGFFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQK 80 90 100 110 120 130 100 110 120 130 140 150 pF1KE3 CLALGMSRDAVKFGRMSKKQRDSLHAEVQKQLQQRQQQQQEPVVKTPPAGAQGADTLTYT :::.::::::::::::::::::::.:::::. .:.::.... CCDS10 CLAVGMSRDAVKFGRMSKKQRDSLYAEVQKHRMQQQQRDHQ------------------- 140 150 160 170 160 170 180 190 200 210 pF1KE3 LGLPDGQLPLGSSPDLPEASACPPGLLKASGSGPSYSNNLAKAGLNGASCHLEYSPERGK : : . : : . :: . . .: ..: ..:: .: CCDS10 ------QQPGEAEPLTPTYNISANGLTELHDDLSNY--------IDG------HTPEGSK 180 190 200 210 220 230 240 250 260 270 pF1KE3 AEGRESFYSTGSQLTPDRCGLRFEEHRHPGLGELGQGPDSYGSPSFRSTPEAPYASLTEI :.. : . : .::. :: .. . . . . . :: . .: .:..:. CCDS10 ADSAVSSFYLDIQPSPDQSGLDINGIKPEPICDYTPASGFFPYCSFTNGETSPTVSMAEL 220 230 240 250 260 270 280 290 300 310 320 330 pF1KE3 EHLVQSVCKSYRETCQLRLEDLLRQRSNIFSREEVTGYQRKSMWEMWERCAHHLTEAIQY :::.:.. ::. :::: :.: . . : .::. .:: :. ::. :: ..:::::: CCDS10 EHLAQNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQY 280 290 300 310 320 330 340 350 360 370 380 390 pF1KE3 VVEFAKRLSGFMELCQNDQIVLLKAGAMEVVLVRMCRAYNADNRTVFFEGKYGGMELFRA :::::::..:::::::::::::::::..:::..:::::....: ::.:.:::.. ..:.. CCDS10 VVEFAKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYASPDVFKS 340 350 360 370 380 390 400 410 420 430 440 450 pF1KE3 LGCSELISSIFDFSHSLSALHFSEDEIALYTALVLINAHRPGLQEKRKVEQLQYNLELAF ::: ..:: .:.:..:: ..:..::::::..:.::..: : :::: :.:.:: ...::. CCDS10 LGCEDFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLAL 400 410 420 430 440 450 460 470 480 490 500 pF1KE3 HHHLCKTHRQS-ILAKLPPK-GKLRSLCSQHVERLQIFQHLHPIVVQAAFPPLYKELFST .: : :.::.. ::.:: : . ::.::..:.:.:. :. ..: .:. :::::::::.. CCDS10 QHVLQKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTS 460 470 480 490 500 510 510 pF1KE3 ETESPVGLSK : : CCDS10 EFEPAMQIDG 520 >>CCDS10178.1 RORA gene_id:6095|Hs108|chr15 (548 aa) initn: 1625 init1: 785 opt: 950 Z-score: 790.6 bits: 156.0 E(32554): 1e-37 Smith-Waterman score: 1530; 49.6% identity (72.9% similar) in 490 aa overlap (24-511:91-541) 10 20 30 40 50 pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKG .:::.::::::::::::::::::::::::: CCDS10 LEHINWDGATAKNFINLREFFSFLLPALRKAQIEIIPCKICGDKSSGIHYGVITCEGCKG 70 80 90 100 110 120 60 70 80 90 100 110 pF1KE3 FFRRSQRCNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDS ::::::. ::.::: ::.:: :::::::::::::::::::.::::::::::::::::::: CCDS10 FFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAVGMSRDAVKFGRMSKKQRDS 130 140 150 160 170 180 120 130 140 150 160 170 pF1KE3 LHAEVQKQLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLPDGQLPLGSSPDLPEASACP :.:::::. .:.::.... : : . : : . CCDS10 LYAEVQKHRMQQQQRDHQ-------------------------QQPGEAEPLTPTYNISA 190 200 210 180 190 200 210 220 230 pF1KE3 PGLLKASGSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGSQLTPDRCGLRF :: . . .: ..: ..:: .::.. : . : .::. :: . CCDS10 NGLTELHDDLSNY--------IDG------HTPEGSKADSAVSSFYLDIQPSPDQSGLDI 220 230 240 250 260 240 250 260 270 280 290 pF1KE3 EEHRHPGLGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCKSYRETCQLRLEDLL . . . . . . :: . .: .:..:.:::.:.. ::. :::: :.: CCDS10 NGIKPEPICDYTPASGFFPYCSFTNGETSPTVSMAELEHLAQNISKSHLETCQYLREELQ 270 280 290 300 310 320 300 310 320 330 340 350 pF1KE3 RQRSNIFSREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIVLL . . : .::. .:: :. ::. :: ..:::::::::::::..:::::::::::::: CCDS10 QITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQYVVEFAKRIDGFMELCQNDQIVLL 330 340 350 360 370 380 360 370 380 390 400 410 pF1KE3 KAGAMEVVLVRMCRAYNADNRTVFFEGKYGGMELFRALGCSELISSIFDFSHSLSALHFS :::..:::..:::::....: ::.:.:::.. ..:..::: ..:: .:.:..:: ..:.. CCDS10 KAGSLEVVFIRMCRAFDSQNNTVYFDGKYASPDVFKSLGCEDFISFVFEFGKSLCSMHLT 390 400 410 420 430 440 420 430 440 450 460 470 pF1KE3 EDEIALYTALVLINAHRPGLQEKRKVEQLQYNLELAFHHHLCKTHRQS-ILAKLPPK-GK ::::::..:.::..: : :::: :.:.:: ...::..: : :.::.. ::.:: : . CCDS10 EDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLALQHVLQKNHREDGILTKLICKVST 450 460 470 480 490 500 480 490 500 510 pF1KE3 LRSLCSQHVERLQIFQHLHPIVVQAAFPPLYKELFSTETESPVGLSK ::.::..:.:.:. :. ..: .:. :::::::::..: : CCDS10 LRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTSEFEPAMQIDG 510 520 530 540 >>CCDS10179.1 RORA gene_id:6095|Hs108|chr15 (556 aa) initn: 1625 init1: 785 opt: 950 Z-score: 790.5 bits: 156.0 E(32554): 1e-37 Smith-Waterman score: 1532; 48.1% identity (72.3% similar) in 509 aa overlap (5-511:82-549) 10 20 30 pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKIC : ... ..:. .. ..:::.:::::: CCDS10 ILQILHQCILSSGDAFVLTGVCCSWRQNGKPPYSQKEDKEVQTGY--MNAQIEIIPCKIC 60 70 80 90 100 40 50 60 70 80 90 pF1KE3 GDKSSGIHYGVITCEGCKGFFRRSQRCNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLAL :::::::::::::::::::::::::. ::.::: ::.:: :::::::::::::::::::. CCDS10 GDKSSGIHYGVITCEGCKGFFRRSQQSNATYSCPRQKNCLIDRTSRNRCQHCRLQKCLAV 110 120 130 140 150 160 100 110 120 130 140 150 pF1KE3 GMSRDAVKFGRMSKKQRDSLHAEVQKQLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLP ::::::::::::::::::::.:::::. .:.::.... CCDS10 GMSRDAVKFGRMSKKQRDSLYAEVQKHRMQQQQRDHQ----------------------- 170 180 190 200 160 170 180 190 200 210 pF1KE3 DGQLPLGSSPDLPEASACPPGLLKASGSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGR : : . : : . :: . . .: ..: ..:: .::.. CCDS10 --QQPGEAEPLTPTYNISANGLTELHDDLSNY--------IDG------HTPEGSKADSA 210 220 230 240 250 220 230 240 250 260 270 pF1KE3 ESFYSTGSQLTPDRCGLRFEEHRHPGLGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLV : . : .::. :: .. . . . . . :: . .: .:..:.:::. CCDS10 VSSFYLDIQPSPDQSGLDINGIKPEPICDYTPASGFFPYCSFTNGETSPTVSMAELEHLA 260 270 280 290 300 310 280 290 300 310 320 330 pF1KE3 QSVCKSYRETCQLRLEDLLRQRSNIFSREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEF :.. ::. :::: :.: . . : .::. .:: :. ::. :: ..:::::::::: CCDS10 QNISKSHLETCQYLREELQQITWQTFLQEEIENYQNKQREVMWQLCAIKITEAIQYVVEF 320 330 340 350 360 370 340 350 360 370 380 390 pF1KE3 AKRLSGFMELCQNDQIVLLKAGAMEVVLVRMCRAYNADNRTVFFEGKYGGMELFRALGCS :::..:::::::::::::::::..:::..:::::....: ::.:.:::.. ..:..::: CCDS10 AKRIDGFMELCQNDQIVLLKAGSLEVVFIRMCRAFDSQNNTVYFDGKYASPDVFKSLGCE 380 390 400 410 420 430 400 410 420 430 440 450 pF1KE3 ELISSIFDFSHSLSALHFSEDEIALYTALVLINAHRPGLQEKRKVEQLQYNLELAFHHHL ..:: .:.:..:: ..:..::::::..:.::..: : :::: :.:.:: ...::..: : CCDS10 DFISFVFEFGKSLCSMHLTEDEIALFSAFVLMSADRSWLQEKVKIEKLQQKIQLALQHVL 440 450 460 470 480 490 460 470 480 490 500 510 pF1KE3 CKTHRQS-ILAKLPPK-GKLRSLCSQHVERLQIFQHLHPIVVQAAFPPLYKELFSTETES :.::.. ::.:: : . ::.::..:.:.:. :. ..: .:. :::::::::..: : CCDS10 QKNHREDGILTKLICKVSTLRALCGRHTEKLMAFKAIYPDIVRLHFPPLYKELFTSEFEP 500 510 520 530 540 550 pF1KE3 PVGLSK CCDS10 AMQIDG >>CCDS6646.1 RORB gene_id:6096|Hs108|chr9 (459 aa) initn: 1471 init1: 692 opt: 877 Z-score: 731.8 bits: 144.8 E(32554): 1.9e-34 Smith-Waterman score: 1471; 49.2% identity (72.6% similar) in 492 aa overlap (24-509:3-453) 10 20 30 40 50 60 pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQR .:::::::::::::::::::::::::::::::::::. CCDS66 MRAQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRRSQQ 10 20 30 70 80 90 100 110 120 pF1KE3 CNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHAEVQK ::.::: ::.:: ::::.:::::::::::::::::::::::::::::::::::.::::: CCDS66 NNASYSCPRQRNCLIDRTNRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLYAEVQK 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE3 QLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLPDGQLPLGSSPDLPEASACPPGLLKAS . :. :.:.:. .: : . .:. .. .: :.. ..: CCDS66 HQQRLQEQRQQQ------SGEAEALARVYSSSISNGLSNLNN---------------ETS 100 110 120 130 190 200 210 220 230 pF1KE3 GSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGS-QLTPDRCGLRF---EEH :. :.:. :. : :.:: .:.. : : .::. :: . .. CCDS66 GT---YANG-----------HVIDLP---KSEG---YYNVDSGQPSPDQSGLDMTGIKQI 140 150 160 170 240 250 260 270 280 290 pF1KE3 RHPGLGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCKSYRETCQLRLEDLLRQR .. . .: . :. . :: . :: ..:::....:.. ::. :::: .:.: . CCDS66 KQEPIYDLTSVPNLFTYSSFNNGQLAPGITMTEIDRIAQNIIKSHLETCQYTMEELHQLA 180 190 200 210 220 230 300 310 320 330 340 350 pF1KE3 SNIFSREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEFAKRLSGFMELCQNDQIVLLKAG . . ::. .:: :: .:..:: ..:.:::::::::::..:::::::::::.:::.: CCDS66 WQTHTYEEIKAYQSKSREALWQQCAIQITHAIQYVVEFAKRITGFMELCQNDQILLLKSG 240 250 260 270 280 290 360 370 380 390 400 410 pF1KE3 AMEVVLVRMCRAYNADNRTVFFEGKYGGMELFRALGCSELISSIFDFSHSLSALHFSEDE .::::::::::.: : ::.::::::::..:.::: ..:.. :::...: .:...:.: CCDS66 CLEVVLVRMCRAFNPLNNTVLFEGKYGGMQMFKALGSDDLVNEAFDFAKNLCSLQLTEEE 300 310 320 330 340 350 420 430 440 450 460 470 pF1KE3 IALYTALVLINAHRPGLQEKRKVEQLQYNLELAFHHHLCKTHRQS-ILAKLPPK-GKLRS :::... :::. : : : :::..:: .. .:..: . :.: .. :::: : . . CCDS66 IALFSSAVLISPDRAWLIEPRKVQKLQEKIYFALQHVIQKNHLDDETLAKLIAKIPTITA 360 370 380 390 400 410 480 490 500 510 pF1KE3 LCSQHVERLQIFQHLHPIVVQAAFPPLYKELFSTETESPVGLSK .:. : :.::.:.. :: .:.. :::::::::. . CCDS66 VCNLHGEKLQVFKQSHPEIVNTLFPPLYKELFNPDCATGCK 420 430 440 450 >>CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 (614 aa) initn: 757 init1: 244 opt: 434 Z-score: 366.4 bits: 77.7 E(32554): 4.3e-14 Smith-Waterman score: 804; 34.2% identity (64.0% similar) in 494 aa overlap (28-487:129-610) 10 20 30 40 50 pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRR :. ::.::: .::.:::: .:::::::::: CCDS11 PPGSLQVAMEDSSRVSPSKSTSNITKLNGMVLLCKVCGDVASGFHYGVHACEGCKGFFRR 100 110 120 130 140 150 60 70 80 90 100 110 pF1KE3 SQRCNAAYS-CTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHA : . : :. : ...:: : : .:::::.::..:::..:::::::.:::. :.... . : CCDS11 SIQQNIQYKRCLKNENCSIVRINRNRCQQCRFKKCLSVGMSRDAVRFGRIPKREKQRMLA 160 170 180 190 200 210 120 130 140 150 160 pF1KE3 EVQK--QLQQRQQQQQEPVVKTP---PA-GAQG-----ADTLTYTLGLPD--GQL--PLG :.:. .: . : ..: :. .: :. : .: : . . .:. . :: : . CCDS11 EMQSAMNLANNQLSSQCPLETSPTQHPTPGPMGPSPPPAPVPSPLVGFSQFPQQLTPPRS 220 230 240 250 260 270 170 180 190 200 210 220 pF1KE3 SSPDLPEASACPPGLLKASGSGPSYSNN-LAKAGLNGASCHLEYSPERGKAEGRESFYST ::. : . . .: .:... :... : . : :: : . . . CCDS11 PSPE-PTVEDVISQVARAHREIFTYAHDKLGSSPGNFNANHASGSPP---ATTPHRWENQ 280 290 300 310 320 330 230 240 250 260 270 pF1KE3 GSQLTPDRCGLRFEEHRHPGLGELGQGPDSYGSPSFRSTPEAP-YASLTEIEHLVQSVCK : .:. . .... .:. : :.:.:: :.. : .: . : . . . .: CCDS11 GCPPAPNDNNTLAAQRHNEALNGLRQAPSSY-PPTW---PPGPAHHSCHQSNSNGHRLCP 340 350 360 370 380 390 280 290 300 310 320 330 pF1KE3 S--YRETCQLRLEDLLRQ--RSNIFSREEVTGYQR----KSMWEMWERCAHHLTEAIQYV . : . :: .:.. .. : . ... :.:: . .: :.. : CCDS11 THVYAAPEGKAPANSPRQGNSKNVLLACPMNMYPHGRSGRTVQEIWEDFSMSFTPAVREV 400 410 420 430 440 450 340 350 360 370 380 pF1KE3 VEFAKRLSGFMELCQNDQIVLLKAGAMEVVLVRMCRAYNADNRTVFFEGK--YGGMELFR :::::.. :: .: :.::..:::::..::..::. .:. ..::.: .. :. .:: CCDS11 VEFAKHIPGFRDLSQHDQVTLLKAGTFEVLMVRFASLFNVKDQTVMFLSRTTYSLQEL-G 460 470 480 490 500 390 400 410 420 430 440 pF1KE3 ALGCSELISSIFDFSHSLSALHFSEDEIALYTALVLINAHRPGLQEKRKVEQLQYNL--- :.: ..:.:..::::..:..: ..:.:..:.::.::..: : :.... .::::: .: CCDS11 AMGMGDLLSAMFDFSEKLNSLALTEEELGLFTAVVLVSADRSGMENSASVEQLQETLLRA 510 520 530 540 550 560 450 460 470 480 490 500 pF1KE3 --ELAFHHHLCKTHR-QSILAKLPPKGKLRSLCSQHVERLQIFQHLHPIVVQAAFPPLYK :..... .: : ..: ::: ::.: ..: :.: :. CCDS11 LRALVLKNRPLETSRFTKLLLKLPD---LRTLNNMHSEKLLSFRVDAQ 570 580 590 600 610 510 pF1KE3 ELFSTETESPVGLSK >>CCDS33718.1 NR1D2 gene_id:9975|Hs108|chr3 (579 aa) initn: 603 init1: 224 opt: 421 Z-score: 356.1 bits: 75.7 E(32554): 1.6e-13 Smith-Waterman score: 800; 34.4% identity (61.9% similar) in 491 aa overlap (28-491:100-579) 10 20 30 40 50 pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVIPCKICGDKSSGIHYGVITCEGCKGFFRR :. ::.::: .::.:::: .:::::::::: CCDS33 DRIDCSMKTSKSSAPGMTKSHSGVTKFSGMVLLCKVCGDVASGFHYGVHACEGCKGFFRR 70 80 90 100 110 120 60 70 80 90 100 110 pF1KE3 SQRCNAAYS-CTRQQNCPIDRTSRNRCQHCRLQKCLALGMSRDAVKFGRMSKKQRDSLHA : . : :. : ...:: : : .:::::.::..:::..:::::::.:::. :.... . CCDS33 SIQQNIQYKKCLKNENCSIMRMNRNRCQQCRFKKCLSVGMSRDAVRFGRIPKREKQRMLI 130 140 150 160 170 180 120 130 140 150 160 170 pF1KE3 EVQKQLQQRQQQQQEPVVKTPPAGAQGADTLTY---TLGLPDGQLPLGSSPDLPEA---S :.:. .. ...: .: :::. .:: .: : .:.: . : CCDS33 EMQSAMKTMMNSQF--------SGHLQNDTLVEHHEQTALP-AQEQLRPKPQLEQENIKS 190 200 210 220 230 240 180 190 200 210 220 pF1KE3 ACPPGLLKASGSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGRESFYSTGSQ--LTPDR . ::. :. .. . : . . . : : : . . : . .. : :. :. CCDS33 SSPPSSDFAKEEVIGMVTRAHKDTFMYNQEQQENSAESMQPQRGERIPKNMEQYNLNHDH 250 260 270 280 290 300 230 240 250 260 270 pF1KE3 CGLRFEEH-----RHPGLGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLVQSVCK---- :: . : . :. .: . . :. .. : .. . .: :: CCDS33 CGNGLSSHFPCSESQQHLNGQFKGRNIMHYPNGHAICIANGHCMNFSNAYTQRVCDRVPI 310 320 330 340 350 360 280 290 300 310 320 330 pF1KE3 ---SYRETCQLRLEDLLRQRSNIFSREEVTGY--QRKSMWEMWERCAHHLTEAIQYVVEF : :. . : . : .. . : .:: :.::. . .: :.. :::: CCDS33 DGFSQNENKNSYLCNT-GGRMHLVCPMSKSPYVDPHKSGHEIWEEFSMSFTPAVKEVVEF 370 380 390 400 410 340 350 360 370 380 390 pF1KE3 AKRLSGFMELCQNDQIVLLKAGAMEVVLVRMCRAYNADNRTV-FFEGKYGGMELFRALGC :::. :: .: :.::. :::::..::..::. ..: .::: :. :: ... ....: CCDS33 AKRIPGFRDLSQHDQVNLLKAGTFEVLMVRFASLFDAKERTVTFLSGKKYSVDDLHSMGA 420 430 440 450 460 470 400 410 420 430 440 450 pF1KE3 SELISSIFDFSHSLSALHFSEDEIALYTALVLINAHRPGLQEKRKVEQLQYNLELAFHHH ..:..:.:.::..:.::..:..:..:.::.::..: : :... .:: :: .: :.. CCDS33 GDLLNSMFEFSEKLNALQLSDEEMSLFTAVVLVSADRSGIENVNSVEALQETLIRALRTL 480 490 500 510 520 530 460 470 480 490 500 510 pF1KE3 LCKTH--RQSILAKLPPK-GKLRSLCSQHVERLQIFQHLHPIVVQAAFPPLYKELFSTET . :.: . ::..:: : :::: ..: :.: :. .:: CCDS33 IMKNHPNEASIFTKLLLKLPDLRSLNNMHSEELLAFK-VHP 540 550 560 570 pF1KE3 ESPVGLSK >>CCDS41790.1 RARG gene_id:5916|Hs108|chr12 (443 aa) initn: 528 init1: 393 opt: 410 Z-score: 348.8 bits: 73.9 E(32554): 4.2e-13 Smith-Waterman score: 430; 27.2% identity (48.3% similar) in 507 aa overlap (6-506:53-405) 10 20 30 pF1KE3 MDRAPQRQHRASRELLAAKKTHTSQIEVI-PCKIC . : .:.:.. .. . .: :: .: CCDS41 AGLLRRATGGSCFAGLESFAWPQPASLQSVETQSTSSEEMVPSSPSPPPPPRVYKPCFVC 30 40 50 60 70 80 40 50 60 70 80 90 pF1KE3 GDKSSGIHYGVITCEGCKGFFRRSQRCNAAYSCTRQQNCPIDRTSRNRCQHCRLQKCLAL .::::: :::: .::::::::::: . : .:.: :..:: :....:::::.::::::. . CCDS41 NDKSSGYHYGVSSCEGCKGFFRRSIQKNMVYTCHRDKNCIINKVTRNRCQYCRLQKCFEV 90 100 110 120 130 140 100 110 120 130 140 150 pF1KE3 GMSRDAVKFGRMSKKQRDSLHAEVQKQLQQRQQQQQEPVVKTPPAGAQGADTLTYTLGLP :::..::. : .::. ::... : : CCDS41 GMSKEAVRNDRNKKKK------EVKEE------------------------------GSP 150 160 160 170 180 190 200 210 pF1KE3 DGQLPLGSSPDLPEASACPPGLLKASGSGPSYSNNLAKAGLNGASCHLEYSPERGKAEGR :. ::.: : . :.: :: : . CCDS41 DSYE---LSPQLEEL------ITKVS-----------KA-------H------------Q 170 180 220 230 240 250 260 270 pF1KE3 ESFYSTGSQLTPDRCGLRFEEHRHPGLGELGQGPDSYGSPSFRSTPEAPYASLTEIEHLV :.: :.: .::. :.. . .: : CCDS41 ETF---------------------PSLCQLGK-----------------YTTNSSADHRV 190 200 280 290 300 310 320 330 pF1KE3 QSVCKSYRETCQLRLEDLLRQRSNIFSREEVTGYQRKSMWEMWERCAHHLTEAIQYVVEF : :: : .:.. .. :. : .::: CCDS41 QL--------------DL--------------G--------LWDKFSELATKCIIKIVEF 210 220 230 340 350 360 370 380 390 pF1KE3 AKRLSGFMELCQNDQIVLLKAGAMEVVLVRMCRAYNADNRTVFF-EGKYGGMELFRALGC :::: :: : :::.::::. ......:.: :. .. :. : .: . .. : CCDS41 AKRLPGFTGLSIADQITLLKAACLDILMLRICTRYTPEQDTMTFSDGLTLNRTQMHNAGF 240 250 260 270 280 290 400 410 420 430 440 450 pF1KE3 SELISSIFDFSHSLSALHFSEDEIALYTALVLINAHRPGLQEKRKVEQLQYNLELAFHHH . : . .: :. .: :.... : .: .:. :: . : :.: .::..:: : :.. . CCDS41 GPLTDLVFAFAGQLLPLEMDDTETGLLSAICLICGDRMDLEEPEKVDKLQEPLLEALRLY 300 310 320 330 340 350 460 470 480 490 500 pF1KE3 LCKTHRQS---ILAKLPPK-GKLRSLCSQHVERLQIFQHLHPIVVQAAFPPLYKELFSTE . .: : .. .. : ::.. .. .:: .. : . .::: .:.. CCDS41 -ARRRRPSQPYMFPRMLMKITDLRGISTKGAERAITLKMEIP----GPMPPLIREMLENP 360 370 380 390 400 510 pF1KE3 TESPVGLSK CCDS41 EMFEDDSSQPGPHPNASSEDEVPGGQGKGGLKSPA 410 420 430 440 518 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 17:36:45 2016 done: Tue Nov 8 17:36:46 2016 Total Scan time: 3.120 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]