FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3311, 626 aa 1>>>pF1KB3311 626 - 626 aa - 626 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.1505+/-0.00101; mu= 0.3586+/- 0.061 mean_var=384.2439+/-78.615, 0's: 0 Z-trim(115.5): 132 B-trim: 113 in 1/54 Lambda= 0.065429 statistics sampled from 15959 (16092) to 15959 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.782), E-opt: 0.2 (0.494), width: 16 Scan time: 3.100 The best scores are: opt bits E(32554) CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 ( 626) 4298 419.9 4.9e-117 CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 ( 637) 4298 419.9 5e-117 CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 2942 291.8 1.3e-78 CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 ( 598) 1830 186.9 6.5e-47 CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 1545 160.0 8.1e-39 CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 ( 611) 1545 160.1 8.2e-39 CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 ( 652) 1545 160.1 8.6e-39 CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 680 78.3 2.6e-14 CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 674 77.7 3.8e-14 CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 663 76.6 7.7e-14 CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 657 76.1 1.1e-13 CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 654 75.8 1.4e-13 CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 644 74.8 2.4e-13 CCDS1517.1 ESRRG gene_id:2104|Hs108|chr1 ( 435) 643 74.7 2.8e-13 CCDS41468.1 ESRRG gene_id:2104|Hs108|chr1 ( 458) 643 74.8 2.9e-13 CCDS58061.1 ESRRG gene_id:2104|Hs108|chr1 ( 470) 637 74.2 4.4e-13 CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14 ( 508) 589 69.7 1.1e-11 >>CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 (626 aa) initn: 4298 init1: 4298 opt: 4298 Z-score: 2214.6 bits: 419.9 E(32554): 4.9e-117 Smith-Waterman score: 4298; 99.8% identity (100.0% similar) in 626 aa overlap (1-626:1-626) 10 20 30 40 50 60 pF1KB3 MPCVQAQYSPSPPGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITATATTSLPSIST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 MPCVQAQYSPSPPGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITATATTSLPSIST 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 FVEGYSSNYELKPSCVYQMQRPLIKVEEGRAPSYHHHHHHHHHHHHHHQQQHQQPSIPPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 FVEGYSSNYELKPSCVYQMQRPLIKVEEGRAPSYHHHHHHHHHHHHHHQQQHQQPSIPPA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 SSPEDEVLPSTSMYFKQSPPSTPTTPAFPPQAGALWDEALPSAPGCIAPGPLLDPPMKAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 SSPEDEVLPSTSMYFKQSPPSTPTTPAFPPQAGALWDEALPSAPGCIAPGPLLDPPMKAV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 PTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAAAAGSQAAALEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::. CCDS67 PTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAAAAGSQAAALES 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 HPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGEGTCAVCGDNAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 HPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGEGTCAVCGDNAA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 CQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQKCLSVGMVKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 CQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQKCLSVGMVKE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 VVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALTDSTPRDLDYSRYC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 VVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALTDSTPRDLDYSRYC 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB3 PTDQAAAGTDAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQTLLIESAFLELFVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 PTDQAAAGTDAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQTLLIESAFLELFVL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB3 RLSIRSNTAEDKFVFCNGLVLHRLQCLRGFGEWLDSIKDFSLNLQSLNLDIQALACLSAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 RLSIRSNTAEDKFVFCNGLVLHRLQCLRGFGEWLDSIKDFSLNLQSLNLDIQALACLSAL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB3 SMITERHGLKEPKRVEELCNKITSSLKDHQSKGQALEPTESKVLGALVELRKICTLGLQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 SMITERHGLKEPKRVEELCNKITSSLKDHQSKGQALEPTESKVLGALVELRKICTLGLQR 550 560 570 580 590 600 610 620 pF1KB3 IFYLKLEDLVSPPSIIDKLFLDTLPF :::::::::::::::::::::::::: CCDS67 IFYLKLEDLVSPPSIIDKLFLDTLPF 610 620 >>CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 (637 aa) initn: 4298 init1: 4298 opt: 4298 Z-score: 2214.5 bits: 419.9 E(32554): 5e-117 Smith-Waterman score: 4298; 99.8% identity (100.0% similar) in 626 aa overlap (1-626:12-637) 10 20 30 40 pF1KB3 MPCVQAQYSPSPPGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITA ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 MHDSIRFGNVDMPCVQAQYSPSPPGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITA 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB3 TATTSLPSISTFVEGYSSNYELKPSCVYQMQRPLIKVEEGRAPSYHHHHHHHHHHHHHHQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 TATTSLPSISTFVEGYSSNYELKPSCVYQMQRPLIKVEEGRAPSYHHHHHHHHHHHHHHQ 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB3 QQHQQPSIPPASSPEDEVLPSTSMYFKQSPPSTPTTPAFPPQAGALWDEALPSAPGCIAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 QQHQQPSIPPASSPEDEVLPSTSMYFKQSPPSTPTTPAFPPQAGALWDEALPSAPGCIAP 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB3 GPLLDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 GPLLDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAA 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB3 AAGSQAAALEGHPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGE ::::::::::.::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 AAGSQAAALESHPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGE 250 260 270 280 290 300 290 300 310 320 330 340 pF1KB3 GTCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 GTCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRF 310 320 330 340 350 360 350 360 370 380 390 400 pF1KB3 QKCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALTDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 QKCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALTDS 370 380 390 400 410 420 410 420 430 440 450 460 pF1KB3 TPRDLDYSRYCPTDQAAAGTDAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQTLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 TPRDLDYSRYCPTDQAAAGTDAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQTLL 430 440 450 460 470 480 470 480 490 500 510 520 pF1KB3 IESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLRGFGEWLDSIKDFSLNLQSLNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 IESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLRGFGEWLDSIKDFSLNLQSLNL 490 500 510 520 530 540 530 540 550 560 570 580 pF1KB3 DIQALACLSALSMITERHGLKEPKRVEELCNKITSSLKDHQSKGQALEPTESKVLGALVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 DIQALACLSALSMITERHGLKEPKRVEELCNKITSSLKDHQSKGQALEPTESKVLGALVE 550 560 570 580 590 600 590 600 610 620 pF1KB3 LRKICTLGLQRIFYLKLEDLVSPPSIIDKLFLDTLPF ::::::::::::::::::::::::::::::::::::: CCDS67 LRKICTLGLQRIFYLKLEDLVSPPSIIDKLFLDTLPF 610 620 630 >>CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 (443 aa) initn: 2942 init1: 2942 opt: 2942 Z-score: 1524.6 bits: 291.8 E(32554): 1.3e-78 Smith-Waterman score: 2942; 99.8% identity (100.0% similar) in 418 aa overlap (1-418:1-418) 10 20 30 40 50 60 pF1KB3 MPCVQAQYSPSPPGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITATATTSLPSIST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 MPCVQAQYSPSPPGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITATATTSLPSIST 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 FVEGYSSNYELKPSCVYQMQRPLIKVEEGRAPSYHHHHHHHHHHHHHHQQQHQQPSIPPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 FVEGYSSNYELKPSCVYQMQRPLIKVEEGRAPSYHHHHHHHHHHHHHHQQQHQQPSIPPA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 SSPEDEVLPSTSMYFKQSPPSTPTTPAFPPQAGALWDEALPSAPGCIAPGPLLDPPMKAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 SSPEDEVLPSTSMYFKQSPPSTPTTPAFPPQAGALWDEALPSAPGCIAPGPLLDPPMKAV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 PTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAAAAGSQAAALEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::. CCDS67 PTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAAAAGSQAAALES 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 HPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGEGTCAVCGDNAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 HPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGEGTCAVCGDNAA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 CQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQKCLSVGMVKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 CQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQKCLSVGMVKE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 VVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALTDSTPRDLDYSRYC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 VVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALTDSTPRDLDYSRVS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB3 PTDQAAAGTDAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQTLLIESAFLELFVL CCDS67 FMISCFQMNDQGLYLWLLVIRVD 430 440 >>CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 (598 aa) initn: 1363 init1: 741 opt: 1830 Z-score: 955.8 bits: 186.9 E(32554): 6.5e-47 Smith-Waterman score: 2254; 56.7% identity (76.3% similar) in 642 aa overlap (1-626:1-598) 10 20 30 40 50 pF1KB3 MPCVQAQYSPSPPGSSYAAQTYS----SEYTTEIMNPDYTKLTMDLGSTEITATATTSLP ::::::::. :: :.: :.:.:: .::......:...:..::: .:::::: :::: CCDS22 MPCVQAQYGSSPQGASPASQSYSYHSSGEYSSDFLTPEFVKFSMDLTNTEITAT--TSLP 10 20 30 40 50 60 70 80 90 100 110 pF1KB3 SISTFVEGYSSNYELKPSCVYQM----QRPLIKVEEGRAPSYHHHHHHHHHHHHHHQQQH :.:::...::..:..:: :.::: :. ::::. . .:..: : CCDS22 SFSTFMDNYSTGYDVKPPCLYQMPLSGQQSSIKVEDIQMHNYQQHSH------------- 60 70 80 90 100 120 130 140 150 160 170 pF1KB3 QQPSIPPASSPEDEVLP-STSMYFKQSPPSTPTTPAFPPQAGALWDEALPSAPGCIAPGP .:: : .:..: : :.:.: : : :::::.: : . .::. :.. . . CCDS22 ----LPPQS---EEMMPHSGSVYYKPSSPPTPTTPGFQVQHSPMWDD--PGSLHNFHQNY 110 120 130 140 150 180 190 200 210 220 230 pF1KB3 LLDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAAAA . : . .:. :: :: ::: :. : .. .: . : .:.. : CCDS22 VATTHMIEQRKTPVSRLSLFSFKQSPPGTPVSS----CQMRFD----GPLHVPMNPEPA- 160 170 180 190 200 240 250 260 270 280 290 pF1KB3 GSQAAALEGHPYGLPLA-KRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGEG ::. . ..:. ...: .. : ..:: : . ::.:: . ..::::::.: :.:: CCDS22 GSHHV-VDGQTFAVPNPIRKPASMGFPGLQIGH---ASQLL--DTQVPSPPSRGSPSNEG 210 220 230 240 250 260 300 310 320 330 340 350 pF1KB3 TCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQ ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 LCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQ 270 280 290 300 310 320 360 370 380 390 400 410 pF1KB3 KCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALTDST :::.::::::::::::::::::::::::::: :::: :::::. ...::::: .::. CCDS22 KCLAVGMVKEVVRTDSLKGRRGRLPSKPKSP--QEPS---PPSPPVSLISALVRAHVDSN 330 340 350 360 370 420 430 440 450 460 pF1KB3 P--RDLDYSRYCPT-DQAAAGTDAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQT : .:::::. . : .: :..:.::::.:::.:... :.::::::::.:::: :: CCDS22 PAMTSLDYSRFQANPDYQMSGDDTQHIQQFYDLLTGSMEIIRGWAEKIPGFADLPKADQD 380 390 400 410 420 430 470 480 490 500 510 520 pF1KB3 LLIESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLRGFGEWLDSIKDFSLNLQSL ::.::::::::::::. ::: .: :..::::.:::::::.::::::.::: .:: :::.. CCDS22 LLFESAFLELFVLRLAYRSNPVEGKLIFCNGVVLHRLQCVRGFGEWIDSIVEFSSNLQNM 440 450 460 470 480 490 530 540 550 560 570 580 pF1KB3 NLDIQALACLSALSMITERHGLKEPKRVEELCNKITSSLKDHQS--KGQALEPTE-SKVL :.::.:..:..::.:.::::::::::::::: :::.. :::: . .: .:. ::.: CCDS22 NIDISAFSCIAALAMVTERHGLKEPKRVEELQNKIVNCLKDHVTFNNGGLNRPNYLSKLL 500 510 520 530 540 550 590 600 610 620 pF1KB3 GALVELRKICTLGLQRIFYLKLEDLVSPPSIIDKLFLDTLPF : : ::: .:: :::::::::::::: ::.:::::::::::: CCDS22 GKLPELRTLCTQGLQRIFYLKLEDLVPPPAIIDKLFLDTLPF 560 570 580 590 >>CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 (598 aa) initn: 1721 init1: 655 opt: 1545 Z-score: 810.4 bits: 160.0 E(32554): 8.1e-39 Smith-Waterman score: 1806; 48.8% identity (67.6% similar) in 646 aa overlap (1-626:1-598) 10 20 30 40 50 pF1KB3 MPCVQAQY-SPSP-PGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGSTEITATATTSLPSI :::.:::: .:.: :: .. ... ..:.. : ::::.: : . .: :.:::. CCDS88 MPCIQAQYGTPAPSPGPR-------DHLASDPLTPEFIKPTMDLASPEAAPAAPTALPSF 10 20 30 40 50 60 70 80 90 100 110 pF1KB3 STFVEGYSSNYELKPSCVYQMQ---RPLIKVEEGRAPSYHHHHHHHHHHHHHHQQQHQQP :::..::..... . .::. .: .. . . . . .. . CCDS88 STFMDGYTGEFD---TFLYQLPGTVQPCSSASSSASSTSSSSATSPASASFKFEDFQVYG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB3 SIP-PASSPEDEVLPSTSMYFKQSPPS--TPTTPAFPPQAGALWDEALPS-APGCIAPGP : : :.: ::.: :.. . :: : .:.::.: : . :: .. .:. : CCDS88 CYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSPWDGSFGHFSPSQTYEG- 120 130 140 150 160 180 190 200 210 220 230 pF1KB3 LLDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLPLGAAAAA : . .: ..: : :. ::: :.:: :. .: .: :. CCDS88 -LRAWTEQLPKASGPPQPPAFFSFSPPTGPSPS------LAQSPLKL----FPSQATHQL 170 180 190 200 210 240 250 260 270 280 pF1KB3 GSQAAALEGHPYGLPLAKRAAPLAFPPLGLTP-SP-TASSLLGESPSLPSPPSRSSSSG- : ::. :..: ::: ::.: :: .: . ..: . : .::.. : CCDS88 G------EGESYSMPT-------AFP--GLAPTSPHLEGSGILDTP-VTSTKARSGAPGG 220 230 240 250 260 290 300 310 320 330 340 pF1KB3 -EGTCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYC :: ::::::::.::::::::::::::::::::::::::.:::::.::::::::::::.: CCDS88 SEGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDCPVDKRRRNRCQFC 270 280 290 300 310 320 350 360 370 380 390 400 pF1KB3 RFQKCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVRALT ::::::.:::::::::::::::::::::::::.: : . : ....:::: CCDS88 RFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQP---------PDASPANLLTSLVRAHL 330 340 350 360 370 410 420 430 440 450 460 pF1KB3 DSTPRD--LDYSRYCPTDQAAAGT-DAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKE :: : ::::.. : :: :::::.::..:..: :.::::::::..: CCDS88 DSGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKWAEKIPGFAELSPA 380 390 400 410 420 430 470 480 490 500 510 520 pF1KB3 DQTLLIESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLRGFGEWLDSIKDFSLNL :: ::.::::::::.:::. ::. .: :..::.::::::::: ::::.:.::: :: .: CCDS88 DQDLLLESAFLELFILRLAYRSKPGEGKLIFCSGLVLHRLQCARGFGDWIDSILAFSRSL 440 450 460 470 480 490 530 540 550 560 570 580 pF1KB3 QSLNLDIQALACLSALSMITERHGLKEPKRVEELCNKITSSLKDHQSKGQALEPTE---- .:: .:. :.:::::: .::.::::.::.::::: :.:.: ::.: . . : :: CCDS88 HSLLVDVPAFACLSALVLITDRHGLQEPRRVEELQNRIASCLKEHVA-AVAGEPQPASCL 500 510 520 530 540 550 590 600 610 620 pF1KB3 SKVLGALVELRKICTLGLQRIFYLKLEDLVSPPSIIDKLFLDTLPF :..:: : ::: .:: :::::::::::::: :: ::::.:.::::: CCDS88 SRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPIIDKIFMDTLPF 560 570 580 590 >>CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 (611 aa) initn: 1721 init1: 655 opt: 1545 Z-score: 810.3 bits: 160.1 E(32554): 8.2e-39 Smith-Waterman score: 1806; 48.8% identity (67.6% similar) in 646 aa overlap (1-626:14-611) 10 20 30 40 pF1KB3 MPCVQAQY-SPSP-PGSSYAAQTYSSEYTTEIMNPDYTKLTMDLGST :::.:::: .:.: :: .. ... ..:.. : ::::.: CCDS55 MWLAKACWSIQSEMPCIQAQYGTPAPSPGPR-------DHLASDPLTPEFIKPTMDLASP 10 20 30 40 50 50 60 70 80 90 100 pF1KB3 EITATATTSLPSISTFVEGYSSNYELKPSCVYQMQ---RPLIKVEEGRAPSYHHHHHHHH : . .: :.:::.:::..::..... . .::. .: .. . . . CCDS55 EAAPAAPTALPSFSTFMDGYTGEFD---TFLYQLPGTVQPCSSASSSASSTSSSSATSPA 60 70 80 90 100 110 110 120 130 140 150 pF1KB3 HHHHHHQQQHQQPSIP-PASSPEDEVLPSTSMYFKQSPPS--TPTTPAFPPQAGALWDEA . .. . : : :.: ::.: :.. . :: : .:.::.: : . :: . CCDS55 SASFKFEDFQVYGCYPGPLSGPVDEALSSSGSDYYGSPCSAPSPSTPSFQPPQLSPWDGS 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB3 LPS-APGCIAPGPLLDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAA . .:. : : . .: ..: : :. ::: :.:: :. .: CCDS55 FGHFSPSQTYEG--LRAWTEQLPKASGPPQPPAFFSFSPPTGPSPS------LAQSPLKL 180 190 200 210 220 220 230 240 250 260 270 pF1KB3 AALSLPLGAAAAAGSQAAALEGHPYGLPLAKRAAPLAFPPLGLTP-SP-TASSLLGESPS .: :. : ::. :..: ::: ::.: :: .: . ..: CCDS55 ----FPSQATHQLG------EGESYSMPT-------AFP--GLAPTSPHLEGSGILDTP- 230 240 250 260 280 290 300 310 320 330 pF1KB3 LPSPPSRSSSSG--EGTCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNC . : .::.. : :: ::::::::.::::::::::::::::::::::::::.:::::.: CCDS55 VTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGCKGFFKRTVQKNAKYICLANKDC 270 280 290 300 310 320 340 350 360 370 380 390 pF1KB3 PVDKRRRNRCQYCRFQKCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSP :::::::::::.:::::::.:::::::::::::::::::::::::.: : . CCDS55 PVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSKPKQP---------PDAS 330 340 350 360 370 400 410 420 430 440 450 pF1KB3 PICMMNALVRALTDSTPRD--LDYSRYCPTDQAAAGT-DAEHVQQFYNLLTASIDVSRSW : ....:::: :: : ::::.. : :: :::::.::..:..: :.: CCDS55 PANLLTSLVRAHLDSGPSTAKLDYSKFQELVLPHFGKEDAGDVQQFYDLLSGSLEVIRKW 380 390 400 410 420 430 460 470 480 490 500 510 pF1KB3 AEKIPGFTDLPKEDQTLLIESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLRGFG :::::::..: :: ::.::::::::.:::. ::. .: :..::.::::::::: :::: CCDS55 AEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLIFCSGLVLHRLQCARGFG 440 450 460 470 480 490 520 530 540 550 560 570 pF1KB3 EWLDSIKDFSLNLQSLNLDIQALACLSALSMITERHGLKEPKRVEELCNKITSSLKDHQS .:.::: :: .:.:: .:. :.:::::: .::.::::.::.::::: :.:.: ::.: . CCDS55 DWIDSILAFSRSLHSLLVDVPAFACLSALVLITDRHGLQEPRRVEELQNRIASCLKEHVA 500 510 520 530 540 550 580 590 600 610 620 pF1KB3 KGQALEPTE----SKVLGALVELRKICTLGLQRIFYLKLEDLVSPPSIIDKLFLDTLPF . : :: :..:: : ::: .:: :::::::::::::: :: ::::.:.::::: CCDS55 -AVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLVPPPPIIDKIFMDTLPF 560 570 580 590 600 610 >>CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 (652 aa) initn: 1721 init1: 655 opt: 1545 Z-score: 809.9 bits: 160.1 E(32554): 8.6e-39 Smith-Waterman score: 1806; 48.8% identity (67.6% similar) in 646 aa overlap (1-626:55-652) 10 20 pF1KB3 MPCVQAQY-SPSP-PGSSYAAQTYSSEYTT :::.:::: .:.: :: .. .. CCDS73 PPRQPGSFCWALKADGIMWLAKACWSIQSEMPCIQAQYGTPAPSPGPR-------DHLAS 30 40 50 60 70 30 40 50 60 70 80 pF1KB3 EIMNPDYTKLTMDLGSTEITATATTSLPSISTFVEGYSSNYELKPSCVYQMQ---RPLIK . ..:.. : ::::.: : . .: :.:::.:::..::..... . .::. .: . CCDS73 DPLTPEFIKPTMDLASPEAAPAAPTALPSFSTFMDGYTGEFD---TFLYQLPGTVQPCSS 80 90 100 110 120 130 90 100 110 120 130 140 pF1KB3 VEEGRAPSYHHHHHHHHHHHHHHQQQHQQPSIP-PASSPEDEVLPSTSMYFKQSPPS--T . . . . . .. . : : :.: ::.: :.. . :: : . CCDS73 ASSSASSTSSSSATSPASASFKFEDFQVYGCYPGPLSGPVDEALSSSGSDYYGSPCSAPS 140 150 160 170 180 190 150 160 170 180 190 200 pF1KB3 PTTPAFPPQAGALWDEALPS-APGCIAPGPLLDPPMKAVPTVAGARFPLFHFKPSPPHPP :.::.: : . :: .. .:. : : . .: ..: : :. ::: : CCDS73 PSTPSFQPPQLSPWDGSFGHFSPSQTYEG--LRAWTEQLPKASGPPQPPAFFSFSPPTGP 200 210 220 230 240 250 210 220 230 240 250 260 pF1KB3 APSPAGGHHLGYDPTAAAALSLPLGAAAAAGSQAAALEGHPYGLPLAKRAAPLAFPPLGL .:: :. .: .: :. : ::. :..: ::: :: CCDS73 SPS------LAQSPLKL----FPSQATHQLG------EGESYSMPT-------AFP--GL 260 270 280 270 280 290 300 310 pF1KB3 TP-SP-TASSLLGESPSLPSPPSRSSSSG--EGTCAVCGDNAACQHYGVRTCEGCKGFFK .: :: .: . ..: . : .::.. : :: ::::::::.::::::::::::::::: CCDS73 APTSPHLEGSGILDTP-VTSTKARSGAPGGSEGRCAVCGDNASCQHYGVRTCEGCKGFFK 290 300 310 320 330 340 320 330 340 350 360 370 pF1KB3 RTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQKCLSVGMVKEVVRTDSLKGRRGRLPSK :::::::::.:::::.::::::::::::.:::::::.::::::::::::::::::::::: CCDS73 RTVQKNAKYICLANKDCPVDKRRRNRCQFCRFQKCLAVGMVKEVVRTDSLKGRRGRLPSK 350 360 370 380 390 400 380 390 400 410 420 430 pF1KB3 PKSPLQQEPSQPSPPSPPICMMNALVRALTDSTPRD--LDYSRYCPTDQAAAGT-DAEHV ::.: : . : ....:::: :: : ::::.. : :: : CCDS73 PKQP---------PDASPANLLTSLVRAHLDSGPSTAKLDYSKFQELVLPHFGKEDAGDV 410 420 430 440 450 440 450 460 470 480 490 pF1KB3 QQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQTLLIESAFLELFVLRLSIRSNTAEDKFV ::::.::..:..: :.::::::::..: :: ::.::::::::.:::. ::. .: :.. CCDS73 QQFYDLLSGSLEVIRKWAEKIPGFAELSPADQDLLLESAFLELFILRLAYRSKPGEGKLI 460 470 480 490 500 510 500 510 520 530 540 550 pF1KB3 FCNGLVLHRLQCLRGFGEWLDSIKDFSLNLQSLNLDIQALACLSALSMITERHGLKEPKR ::.::::::::: ::::.:.::: :: .:.:: .:. :.:::::: .::.::::.::.: CCDS73 FCSGLVLHRLQCARGFGDWIDSILAFSRSLHSLLVDVPAFACLSALVLITDRHGLQEPRR 520 530 540 550 560 570 560 570 580 590 600 610 pF1KB3 VEELCNKITSSLKDHQSKGQALEPTE----SKVLGALVELRKICTLGLQRIFYLKLEDLV :::: :.:.: ::.: . . : :: :..:: : ::: .:: :::::::::::::: CCDS73 VEELQNRIASCLKEHVA-AVAGEPQPASCLSRLLGKLPELRTLCTQGLQRIFYLKLEDLV 580 590 600 610 620 630 620 pF1KB3 SPPSIIDKLFLDTLPF :: ::::.:.::::: CCDS73 PPPPIIDKIFMDTLPF 640 650 >>CCDS11366.1 RARA gene_id:5914|Hs108|chr17 (462 aa) initn: 522 init1: 362 opt: 680 Z-score: 370.4 bits: 78.3 E(32554): 2.6e-14 Smith-Waterman score: 728; 34.3% identity (58.9% similar) in 435 aa overlap (203-624:9-423) 180 190 200 210 220 230 pF1KB3 LDPPMKAVPTVAGARFPLFHFKPSPPHPPAPSPAGGHHLGYDPTAAAALSLP--LGAAAA :.:.::: :: :. :. .: ::. . CCDS11 MASNSSSCPTPGGGHLNGY-PVPPYAFFFPPMLGGLSP 10 20 30 240 250 260 270 280 290 pF1KB3 AGSQAAALEGHPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGEG : :: . ::.. ..: : : : .. .. :: :::: CCDS11 PG----ALTTLQHQLPVSGYSTPS--PATIETQSSSSEEIV---PSPPSPPPLPRIYKP- 40 50 60 70 80 300 310 320 330 340 350 pF1KB3 TCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQ : :: :... :::: .::::::::.:..::: :.: .::: ..: ::::::::.: CCDS11 -CFVCQDKSSGYHYGVSACEGCKGFFRRSIQKNMVYTCHRDKNCIINKVTRNRCQYCRLQ 90 100 110 120 130 140 360 370 380 390 400 pF1KB3 KCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVR-ALTDS ::. ::: :: ::.: : .. ..: :: : :. .: . . :: : .. CCDS11 KCFEVGMSKESVRNDRNK-KKKEVP-KP------ECSESYTLTPEVGELIEKVRKAHQET 150 160 170 180 190 410 420 430 440 450 460 pF1KB3 TPRDLDYSRYCPTDQAA--AGTDAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQT : . ..: .... .. : . ..: .: : : . .:...:::: : :: CCDS11 FPALCQLGKYTTNNSSEQRVSLDIDLWDKFSELSTKCIIKTVEFAKQLPGFTTLTIADQI 200 210 220 230 240 250 470 480 490 500 510 520 pF1KB3 LLIESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLR-GFGEWLDSIKDFSLNLQS :...: :....::. : . .: ..: .::.:.: : ::: : . :. .: CCDS11 TLLKAACLDILILRICTRYTPEQDTMTFSDGLTLNRTQMHNAGFGPLTDLVFAFANQLLP 260 270 280 290 300 310 530 540 550 560 570 580 pF1KB3 LNLDIQALACLSALSMIT-ERHGLKEPKRVEELCNKITSSLKDHQSKGQALEPTE-SKVL :..: . :::. .: .:. :..: ::. : . . .:: . : . .: :.: CCDS11 LEMDDAETGLLSAICLICGDRQDLEQPDRVDMLQEPLLEALKVYVRKRRPSRPHMFPKML 320 330 340 350 360 370 590 600 610 620 pF1KB3 GALVELRKICTLGLQRIFYLKLEDLVSPPSIIDKLF-----LDTLPF ...::.: . : .:.. ::.: : : .:.... :::: CCDS11 MKITDLRSISAKGAERVITLKMEIPGSMPPLIQEMLENSEGLDTLSGQPGGGGRDGGGLA 380 390 400 410 420 430 CCDS11 PPPGSCSPSLSPSSNRSSPATHSP 440 450 460 >>CCDS42317.1 RARA gene_id:5914|Hs108|chr17 (457 aa) initn: 482 init1: 362 opt: 674 Z-score: 367.4 bits: 77.7 E(32554): 3.8e-14 Smith-Waterman score: 674; 34.8% identity (59.6% similar) in 396 aa overlap (244-624:33-418) 220 230 240 250 260 270 pF1KB3 DPTAAAALSLPLGAAAAAGSQAAALEGHPYGLPL-AKRAAPLAFPPL-GLTPSPTASSLL ::: . ..:: : : . : ..: CCDS42 ESVEVGGPTPNPFLVVDFYNQNRACLLPEKGLPAPGPYSTPLRTPLWNGSNHSIETQSSS 10 20 30 40 50 60 280 290 300 310 320 pF1KB3 GES--PSLPSPPSRSSSSGEGTCAVCGDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCL .: :: :::: : :: :... :::: .::::::::.:..::: :.: CCDS42 SEEIVPSPPSPPPLPRIYK--PCFVCQDKSSGYHYGVSACEGCKGFFRRSIQKNMVYTCH 70 80 90 100 110 120 330 340 350 360 370 380 pF1KB3 ANKNCPVDKRRRNRCQYCRFQKCLSVGMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQP .::: ..: ::::::::.:::. ::: :: ::.: : .. ..: :: : :. CCDS42 RDKNCIINKVTRNRCQYCRLQKCFEVGMSKESVRNDRNK-KKKEVP-KP------ECSES 130 140 150 160 170 390 400 410 420 430 440 pF1KB3 SPPSPPICMMNALVR-ALTDSTPRDLDYSRYCPTDQAA--AGTDAEHVQQFYNLLTASID .: . . :: : .. : . ..: .... .. : . ..: .: : : CCDS42 YTLTPEVGELIEKVRKAHQETFPALCQLGKYTTNNSSEQRVSLDIDLWDKFSELSTKCII 180 190 200 210 220 230 450 460 470 480 490 500 pF1KB3 VSRSWAEKIPGFTDLPKEDQTLLIESAFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQC . .:...:::: : :: :...: :....::. : . .: ..: .::.:.: : CCDS42 KTVEFAKQLPGFTTLTIADQITLLKAACLDILILRICTRYTPEQDTMTFSDGLTLNRTQM 240 250 260 270 280 290 510 520 530 540 550 560 pF1KB3 LR-GFGEWLDSIKDFSLNLQSLNLDIQALACLSALSMIT-ERHGLKEPKRVEELCNKITS ::: : . :. .: :..: . :::. .: .:. :..: ::. : . . CCDS42 HNAGFGPLTDLVFAFANQLLPLEMDDAETGLLSAICLICGDRQDLEQPDRVDMLQEPLLE 300 310 320 330 340 350 570 580 590 600 610 620 pF1KB3 SLKDHQSKGQALEPTE-SKVLGALVELRKICTLGLQRIFYLKLEDLVSPPSIIDKLF--- .:: . : . .: :.: ...::.: . : .:.. ::.: : : .:.... CCDS42 ALKVYVRKRRPSRPHMFPKMLMKITDLRSISAKGAERVITLKMEIPGSMPPLIQEMLENS 360 370 380 390 400 410 pF1KB3 --LDTLPF :::: CCDS42 EGLDTLSGQPGGGGRDGGGLAPPPGSCSPSLSPSSNRSSPATHSP 420 430 440 450 >>CCDS2642.1 RARB gene_id:5915|Hs108|chr3 (448 aa) initn: 494 init1: 347 opt: 663 Z-score: 361.9 bits: 76.6 E(32554): 7.7e-14 Smith-Waterman score: 663; 34.3% identity (59.6% similar) in 364 aa overlap (266-623:59-410) 240 250 260 270 280 290 pF1KB3 AALEGHPYGLPLAKRAAPLAFPPLGLTPSPTASSLLGESPSLPSPPSRSSSSGEGTCAVC :.: : :: : :: : . : :: CCDS26 QEKALKACFSGLTQTEWQHRHTAQSIETQSTSSEELVPSPPSPLPPPRVYKP----CFVC 30 40 50 60 70 80 300 310 320 330 340 350 pF1KB3 GDNAACQHYGVRTCEGCKGFFKRTVQKNAKYVCLANKNCPVDKRRRNRCQYCRFQKCLSV :... :::: .::::::::.:..::: :.: .::: ..: ::::::::.:::. : CCDS26 QDKSSGYHYGVSACEGCKGFFRRSIQKNMIYTCHRDKNCVINKVTRNRCQYCRLQKCFEV 90 100 110 120 130 140 360 370 380 390 400 410 pF1KB3 GMVKEVVRTDSLKGRRGRLPSKPKSPLQQEPSQPSPPSPPICMMNALVR-ALTDSTPRDL :: :: ::.: : : : .:: .. . . .. .: : .. : CCDS26 GMSKESVRNDRNK--------KKKETSKQECTESYEMTAELDDLTEKIRKAHQETFPSLC 150 160 170 180 190 420 430 440 450 460 470 pF1KB3 DYSRYCPTDQAA--AGTDAEHVQQFYNLLTASIDVSRSWAEKIPGFTDLPKEDQTLLIES . ..: ...: . : ..: .: : : .:...:::: : :: :... CCDS26 QLGKYTTNSSADHRVRLDLGLWDKFSELATKCIIKIVEFAKRLPGFTGLTIADQITLLKA 200 210 220 230 240 250 480 490 500 510 520 530 pF1KB3 AFLELFVLRLSIRSNTAEDKFVFCNGLVLHRLQCLR-GFGEWLDSIKDFSLNLQSLNLDI : :....::. : . .: ..: .::.:.: : ::: : . :. .: :..: CCDS26 ACLDILILRICTRYTPEQDTMTFSDGLTLNRTQMHNAGFGPLTDLVFTFANQLLPLEMDD 260 270 280 290 300 310 540 550 560 570 580 pF1KB3 QALACLSALSMIT-ERHGLKEPKRVEELCNKITSSLKDHQSKGQALEPTE-SKVLGALVE . :::. .: .:. :.:: .:..: . . .:: . : . .: :.: ... CCDS26 TETGLLSAICLICGDRQDLEEPTKVDKLQEPLLEALKIYIRKRRPSKPHMFPKILMKITD 320 330 340 350 360 370 590 600 610 620 pF1KB3 LRKICTLGLQRIFYLKLEDLVSPPSIIDKLFLDTLPF ::.: . : .:.. ::.: : : .:.... .. CCDS26 LRSISAKGAERVITLKMEIPGSMPPLIQEMLENSEGHEPLTPSSSGNTAEHSPSISPSSV 380 390 400 410 420 430 CCDS26 ENSGVSQSPLVQ 440 626 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 12:47:34 2016 done: Thu Nov 3 12:47:34 2016 Total Scan time: 3.100 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]