FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5869, 463 aa 1>>>pF1KB5869 463 - 463 aa - 463 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.4156+/-0.000893; mu= 4.1307+/- 0.054 mean_var=165.3627+/-33.545, 0's: 0 Z-trim(111.8): 125 B-trim: 0 in 0/52 Lambda= 0.099737 statistics sampled from 12541 (12666) to 12541 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.737), E-opt: 0.2 (0.389), width: 16 Scan time: 3.440 The best scores are: opt bits E(32554) CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 3107 458.9 4.9e-129 CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 ( 340) 2280 339.9 2.5e-93 CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 2162 323.0 4.2e-88 CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 1942 291.3 1.6e-78 CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 1785 268.8 1e-71 CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 ( 414) 976 152.3 9e-37 CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 976 152.3 9.1e-37 CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20 ( 417) 903 141.8 1.3e-33 CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20 ( 464) 903 141.8 1.4e-33 CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20 ( 474) 903 141.8 1.5e-33 CCDS6220.2 HNF4G gene_id:3174|Hs108|chr8 ( 445) 902 141.7 1.5e-33 CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20 ( 395) 898 141.1 2.1e-33 CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 ( 442) 898 141.1 2.3e-33 CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20 ( 449) 898 141.1 2.3e-33 CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20 ( 452) 898 141.1 2.3e-33 CCDS83303.1 HNF4G gene_id:3174|Hs108|chr8 ( 408) 897 140.9 2.3e-33 CCDS45359.1 NR2F2 gene_id:7026|Hs108|chr15 ( 261) 571 93.9 2.1e-19 CCDS45358.1 NR2F2 gene_id:7026|Hs108|chr15 ( 281) 571 93.9 2.3e-19 CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 524 87.3 4.6e-17 CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 ( 611) 524 87.3 4.7e-17 CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 ( 652) 524 87.4 5e-17 CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3 ( 596) 486 81.9 2e-15 CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3 ( 615) 486 81.9 2.1e-15 CCDS58060.1 ESRRG gene_id:2104|Hs108|chr1 ( 396) 472 79.8 5.8e-15 CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 470 79.5 8.2e-15 CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 470 79.5 8.4e-15 CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12 ( 603) 470 79.6 1e-14 CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15 ( 410) 444 75.7 9.8e-14 CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 438 74.9 2e-13 CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 430 73.7 4.2e-13 CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 430 73.7 4.3e-13 CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19 ( 404) 427 73.3 5.3e-13 CCDS6743.1 NR4A3 gene_id:8013|Hs108|chr9 ( 626) 430 73.8 5.7e-13 CCDS6742.1 NR4A3 gene_id:8013|Hs108|chr9 ( 637) 430 73.8 5.7e-13 CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 425 73.0 7e-13 CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 424 72.9 7.9e-13 CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 422 72.6 8.3e-13 CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 422 72.6 9.4e-13 CCDS10177.1 RORA gene_id:6095|Hs108|chr15 ( 523) 395 68.7 1.6e-11 CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 ( 598) 395 68.8 1.8e-11 CCDS69165.1 NR2E1 gene_id:7101|Hs108|chr6 ( 422) 391 68.1 2e-11 CCDS35137.1 NR6A1 gene_id:2649|Hs108|chr9 ( 480) 392 68.3 2e-11 CCDS33669.1 PPARA gene_id:5465|Hs108|chr22 ( 468) 388 67.7 2.9e-11 CCDS55340.1 NR6A1 gene_id:2649|Hs108|chr9 ( 475) 388 67.7 3e-11 CCDS65127.1 NR6A1 gene_id:2649|Hs108|chr9 ( 476) 388 67.7 3e-11 CCDS11361.1 NR1D1 gene_id:9572|Hs108|chr17 ( 614) 390 68.1 3e-11 CCDS6646.1 RORB gene_id:6096|Hs108|chr9 ( 459) 387 67.6 3.2e-11 CCDS73751.1 NR2E3 gene_id:10002|Hs108|chr15 ( 367) 385 67.2 3.2e-11 CCDS1401.1 NR5A2 gene_id:2494|Hs108|chr1 ( 541) 388 67.7 3.3e-11 CCDS45271.1 RORA gene_id:6095|Hs108|chr15 ( 468) 385 67.3 3.9e-11 >>CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 (463 aa) initn: 3107 init1: 3107 opt: 3107 Z-score: 2430.1 bits: 458.9 E(32554): 4.9e-129 Smith-Waterman score: 3107; 100.0% identity (100.0% similar) in 463 aa overlap (1-463:1-463) 10 20 30 40 50 60 pF1KB5 MYGNYSHFMKFPAGYGGSPGHTGSTSMSPSAALSTGKPMDSHPSYTDTPVSAPRTLSAVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MYGNYSHFMKFPAGYGGSPGHTGSTSMSPSAALSTGKPMDSHPSYTDTPVSAPRTLSAVG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 TPLNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TPLNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 IGNMNYPSTSPGSLVKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCRDNKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 IGNMNYPSTSPGSLVKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCRDNKD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 CLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMPVERIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 CLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMPVERIL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 EAELAVEPKTESYGDMNMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLEDQVI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 EAELAVEPKTESYGDMNMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLEDQVI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 LLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVSKMKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVSKMKD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 MQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRFAKLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRFAKLL 370 380 390 400 410 420 430 440 450 460 pF1KB5 LRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT ::::::::::::::::::::::::::::::::::::::::::: CCDS12 LRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT 430 440 450 460 >>CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 (340 aa) initn: 2280 init1: 2280 opt: 2280 Z-score: 1789.0 bits: 339.9 E(32554): 2.5e-93 Smith-Waterman score: 2280; 100.0% identity (100.0% similar) in 340 aa overlap (124-463:1-340) 100 110 120 130 140 150 pF1KB5 APPSSQLNVVNSVSSSEDIKPLPGLPGIGNMNYPSTSPGSLVKHICAICGDRSSGKHYGV :::::::::::::::::::::::::::::: CCDS72 MNYPSTSPGSLVKHICAICGDRSSGKHYGV 10 20 30 160 170 180 190 200 210 pF1KB5 YSCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 YSCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEER 40 50 60 70 80 90 220 230 240 250 260 270 pF1KB5 QRSRERAESEAECATSGHEDMPVERILEAELAVEPKTESYGDMNMENSTNDPVTNICHAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 QRSRERAESEAECATSGHEDMPVERILEAELAVEPKTESYGDMNMENSTNDPVTNICHAA 100 110 120 130 140 150 280 290 300 310 320 330 pF1KB5 DKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 DKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHV 160 170 180 190 200 210 340 350 360 370 380 390 pF1KB5 HRSSAHSAGVGSIFDRVLTELVSKMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 HRSSAHSAGVGSIFDRVLTELVSKMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETL 220 230 240 250 260 270 400 410 420 430 440 450 pF1KB5 REKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS72 REKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLM 280 290 300 310 320 330 460 pF1KB5 EMLETPLQIT :::::::::: CCDS72 EMLETPLQIT 340 >>CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 (462 aa) initn: 2139 init1: 1217 opt: 2162 Z-score: 1695.3 bits: 323.0 E(32554): 4.2e-88 Smith-Waterman score: 2162; 74.1% identity (87.2% similar) in 452 aa overlap (18-463:21-462) 10 20 30 40 50 pF1KB5 MYGNYSHFMKFPAGYGGSPGHTGSTSMS-PSAALSTGKPMDSHPSYTDTPVSAPRTL :: :: ::. :: : : . : :. .:.: :: CCDS35 MDTKHFLPLDFSTQVNSSLTSP--TGRGSMAAPSLHPSLGPGIGS-PGQLHSPIS---TL 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 SAVGTPLNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNV-VNSVSSSEDIKPL : .:.:..: :. ::.: ::: : .. . : ... . : ::. .: ::::::::: CCDS35 S---SPINGMGPPFSVISSPMGPHSMSVPTTPTLGF-STGSPQLSSPMNPVSSSEDIKPP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 PGLPGIGNM-NYPSTSPGSLVKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYT :: :. .. .:: . .:..:::::::::::::::::::::::::::::::.:::: :: CCDS35 LGLNGVLKVPAHPSGNMASFTKHICAICGDRSSGKHYGVYSCEGCKGFFKRTVRKDLTYT 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 CRDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDM ::::::::::::::::::::::::::.::::::::::::::...: :.:.: ..:..::: CCDS35 CRDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVESTSSANEDM 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB5 PVERILEAELAVEPKTESYGDMNM---ENSTNDPVTNICHAADKQLFTLVEWAKRIPHFS :::::::::::::::::.: . :: .: ::::::::.:::::::::::::::::::: CCDS35 PVERILEAELAVEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLVEWAKRIPHFS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB5 DLTLEDQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVL .: :.::::::::::::::::::::::..:.:::::::::::::.::::::::.:::::: CCDS35 ELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLATGLHVHRNSAHSAGVGAIFDRVL 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB5 TELVSKMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPE :::::::.::::::.::::::::::::::.::::::.:::.:::::::.:::: :.:::: CCDS35 TELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAYCKHKYPE 360 370 380 390 400 410 420 430 440 450 460 pF1KB5 QPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT ::::::::::::::::::::::::::::::::::::::::::::::.: :.: CCDS35 QPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQMT 420 430 440 450 460 >>CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 (533 aa) initn: 1926 init1: 1199 opt: 1942 Z-score: 1523.2 bits: 291.3 E(32554): 1.6e-78 Smith-Waterman score: 1984; 67.4% identity (81.8% similar) in 473 aa overlap (13-462:68-532) 10 20 30 pF1KB5 MYGNYSHFMKFPAGYGGSPGHTGSTSMSPSAA----LSTGKP :: : : .: : ::... : : : CCDS47 RRRPWLDPAAAAAAAVAGGEQQTPEPEPGEAGRDGM-GDSGRDSRSPDSSSPNPLPQGVP 40 50 60 70 80 90 40 50 60 70 80 90 pF1KB5 MDSHPSYTDTPVSAPRTLSAVGTPLNA------LGSPYRVITSAMGPPSGALAAPPGINL : :. : .:: .:.. :.: ::::. ::.:.:: :. ::::.. CCDS47 PPSPPGPPLPPSTAP-SLGGSGAPPPPPMPPPPLGSPFPVISSSMGSPGLPPPAPPGFS- 100 110 120 130 140 150 100 110 120 130 140 pF1KB5 VAPPSS-QLNVVNSVSSS-----EDIKPLPGLPGIGNMNYPST--SPGSLVKHICAICGD .: :: :.: . :. .. ::.:: : : :. ... : .::. :..:::::: CCDS47 -GPVSSPQINSTVSLPGGGSGPPEDVKP-PVL-GVRGLHCPPPPGGPGAG-KRLCAICGD 160 170 180 190 200 210 150 160 170 180 190 200 pF1KB5 RSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGM ::::::::::::::::::::::::::: :.::::::: .:::::::::::::::::. :: CCDS47 RSSGKHYGVYSCEGCKGFFKRTIRKDLTYSCRDNKDCTVDKRQRNRCQYCRYQKCLATGM 220 230 240 250 260 270 210 220 230 240 250 pF1KB5 KREAVQEERQRSRERAESEAECATSGHEDMPVERILEAELAVEPKTESY-----GDMNME :::::::::::.... ....: : .. :.:::.:::::::::: :... : . CCDS47 KREAVQEERQRGKDK-DGDGEGAGGAPEEMPVDRILEAELAVEQKSDQGVEGPGGTGGSG 280 290 300 310 320 260 270 280 290 300 310 pF1KB5 NSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSV .: ::::::::.::::::::::::::::::::.: :.::::::::::::::::::::::. CCDS47 SSPNDPVTNICQAADKQLFTLVEWAKRIPHFSSLPLDDQVILLRAGWNELLIASFSHRSI 330 340 350 360 370 380 320 330 340 350 360 370 pF1KB5 SVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVSKMKDMQMDKSELGCLRAIVLFNP .:.:::::::::::::.::::::::.:::::::::::::.::.:::.::::::::.:::: CCDS47 DVRDGILLATGLHVHRNSAHSAGVGAIFDRVLTELVSKMRDMRMDKTELGCLRAIILFNP 390 400 410 420 430 440 380 390 400 410 420 430 pF1KB5 DAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFF ::::::::::::.:::::::.::.: ::::::: :::::::::::::::::::::::::: CCDS47 DAKGLSNPSEVEVLREKVYASLETYCKQKYPEQQGRFAKLLLRLPALRSIGLKCLEHLFF 450 460 470 480 490 500 440 450 460 pF1KB5 FKLIGDTPIDTFLMEMLETPLQIT ::::::::::::::::::.: :. CCDS47 FKLIGDTPIDTFLMEMLEAPHQLA 510 520 530 >>CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 (537 aa) initn: 1938 init1: 678 opt: 1785 Z-score: 1401.1 bits: 268.8 E(32554): 1e-71 Smith-Waterman score: 1966; 66.9% identity (81.1% similar) in 477 aa overlap (13-462:68-536) 10 20 30 pF1KB5 MYGNYSHFMKFPAGYGGSPGHTGSTSMSPSAA----LSTGKP :: : : .: : ::... : : : CCDS59 RRRPWLDPAAAAAAAVAGGEQQTPEPEPGEAGRDGM-GDSGRDSRSPDSSSPNPLPQGVP 40 50 60 70 80 90 40 50 60 70 80 90 pF1KB5 MDSHPSYTDTPVSAPRTLSAVGTPLNA------LGSPYRVITSAMGPPSGALAAPPGINL : :. : .:: .:.. :.: ::::. ::.:.:: :. ::::.. CCDS59 PPSPPGPPLPPSTAP-SLGGSGAPPPPPMPPPPLGSPFPVISSSMGSPGLPPPAPPGFS- 100 110 120 130 140 150 100 110 120 130 140 pF1KB5 VAPPSS-QLNVVNSVSSS-----EDIKPLPGLPGIGNMNYPST--SPGSLVKHICAICGD .: :: :.: . :. .. ::.:: : : :. ... : .::. :..:::::: CCDS59 -GPVSSPQINSTVSLPGGGSGPPEDVKP-PVL-GVRGLHCPPPPGGPGAG-KRLCAICGD 160 170 180 190 200 210 150 160 170 180 190 200 pF1KB5 RSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGM ::::::::::::::::::::::::::: :.::::::: .:::::::::::::::::. :: CCDS59 RSSGKHYGVYSCEGCKGFFKRTIRKDLTYSCRDNKDCTVDKRQRNRCQYCRYQKCLATGM 220 230 240 250 260 270 210 220 230 240 250 pF1KB5 KREAVQEERQRSRERAESEAECATSGHEDMPVERILEAELAVEPKTESY-----GDMNME :::::::::::.... ....: : .. :.:::.:::::::::: :... : . CCDS59 KREAVQEERQRGKDK-DGDGEGAGGAPEEMPVDRILEAELAVEQKSDQGVEGPGGTGGSG 280 290 300 310 320 260 270 280 290 300 310 pF1KB5 NSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSV .: ::::::::.::::::::::::::::::::.: :.::::::::::::::::::::::. CCDS59 SSPNDPVTNICQAADKQLFTLVEWAKRIPHFSSLPLDDQVILLRAGWNELLIASFSHRSI 330 340 350 360 370 380 320 330 340 350 360 370 pF1KB5 SVQDGILLATGLHVHRSSAHSAGVGSIFDR----VLTELVSKMKDMQMDKSELGCLRAIV .:.:::::::::::::.::::::::.:::: :::::::::.::.:::.::::::::. CCDS59 DVRDGILLATGLHVHRNSAHSAGVGAIFDRSLSRVLTELVSKMRDMRMDKTELGCLRAII 390 400 410 420 430 440 380 390 400 410 420 430 pF1KB5 LFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLE ::::::::::::::::.:::::::.::.: ::::::: :::::::::::::::::::::: CCDS59 LFNPDAKGLSNPSEVEVLREKVYASLETYCKQKYPEQQGRFAKLLLRLPALRSIGLKCLE 450 460 470 480 490 500 440 450 460 pF1KB5 HLFFFKLIGDTPIDTFLMEMLETPLQIT ::::::::::::::::::::::.: :. CCDS59 HLFFFKLIGDTPIDTFLMEMLEAPHQLA 510 520 530 >>CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 (414 aa) initn: 822 init1: 389 opt: 976 Z-score: 773.7 bits: 152.3 E(32554): 9e-37 Smith-Waterman score: 976; 40.9% identity (69.6% similar) in 391 aa overlap (75-456:23-400) 50 60 70 80 90 100 pF1KB5 YTDTPVSAPRTLSAVGTPLNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVN ....:: . ::: :: . : . CCDS10 MAMVVSTWRDPQDEVPGSQGSQASQAPPVPG--PPPG----APHTPQTPGQG 10 20 30 40 110 120 130 140 150 160 pF1KB5 SVSSSEDIKPLPGLPGIGNMNYPSTSPGSLVKHI-CAICGDRSSGKHYGVYSCEGCKGFF . .:. : : :. :... . .:: :..:::.::::::: ..:::::.:: CCDS10 GPASTPAQTAAGGQGGPGG---PGSDKQQQQQHIECVVCGDKSSGKHYGQFTCEGCKSFF 50 60 70 80 90 100 170 180 190 200 210 220 pF1KB5 KRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESE ::..:..: :::: :..: ::...::.::::: .::: .::.::::: : : .. CCDS10 KRSVRRNLSYTCRANRNCPIDQHHRNQCQYCRLKKCLKVGMRREAVQ--RGRMPPTQPTH 110 120 130 140 150 160 230 240 250 260 270 pF1KB5 AECATSGHEDMPVERILEAELAV----EP-KTESYGDMNMENSTNDPVTNICHAADKQLF .. : .. . . . : . ... :: : .:.. :. .. . :::. : ..:: CCDS10 GQFALTNGDPLNCHSYLSGYISLLLRAEPYPTSRFGSQCMQPNNIMGIENICELAARMLF 170 180 190 200 210 220 280 290 300 310 320 330 pF1KB5 TLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSVSVQDGILLAT-GLHVHRSS . ::::. :: : :: . ::: ::: :.::.. . .. :. .. . :::. :::. : CCDS10 SAVEWARNIPFFPDLQITDQVALLRLTWSELFVLNAAQCSMPLHVAPLLAAAGLHASPMS 230 240 250 260 270 280 340 350 360 370 380 390 pF1KB5 AHSAGVGSIFD--RVLTELVSKMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLRE : : ...: :.. : : :.: ...:..: .::.:::::. :: :::. ..::.:.: CCDS10 ADR--VVAFMDHIRIFQEQVEKLKALHVDSAEYSCLKAIVLFTSDACGLSDVAHVESLQE 290 300 310 320 330 400 410 420 430 440 450 pF1KB5 KVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEM : .:: :....::.:: ::.:::::::.::... . .:.::: .:.: :::.:.. .: CCDS10 KSQCALEEYVRSQYPNQPTRFGKLLLRLPSLRTVSSSVIEQLFFVRLVGKTPIETLIRDM 340 350 360 370 380 390 460 pF1KB5 LETPLQIT : CCDS10 LLSGSSFNWPYMAIQ 400 410 >>CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 (423 aa) initn: 793 init1: 392 opt: 976 Z-score: 773.6 bits: 152.3 E(32554): 9.1e-37 Smith-Waterman score: 976; 40.0% identity (67.3% similar) in 413 aa overlap (53-456:11-407) 30 40 50 60 70 80 pF1KB5 GSTSMSPSAALSTGKPMDSHPSYTDTPVSAPRTLSAVGTPLNALGSPYRVITSAMGPPSG :. : :.: :.: . .: : .: CCDS40 MAMVVSSWRDPQDDVAGGNP----GGPNPAAQAARGGGGG 10 20 30 90 100 110 120 130 140 pF1KB5 ALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPGIGNMNYPSTSPGSLVKHI-CAI : . :: . : . .. :: : ... :.. :. .:: :.. CCDS40 AGEQQQQAGSGAPHTPQ------TPGQPGAPATPGTAGDKGQGPPGS--GQSQQHIECVV 40 50 60 70 80 150 160 170 180 190 200 pF1KB5 CGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLV :::.::::::: ..:::::.::::..:..: :::: :..: ::...::.::::: .::: CCDS40 CGDKSSGKHYGQFTCEGCKSFFKRSVRRNLTYTCRANRNCPIDQHHRNQCQYCRLKKCLK 90 100 110 120 130 140 210 220 230 240 250 pF1KB5 MGMKREAVQEERQRSRERAESEAECATSGHEDMPVERILEAELAV----EP-KTESYGDM .::.::::: : : . .. : .. . . . : . ... :: : ::.. CCDS40 VGMRREAVQ--RGRMPPTQPNPGQYALTNGDPLNGHCYLSGYISLLLRAEPYPTSRYGSQ 150 160 170 180 190 200 260 270 280 290 300 310 pF1KB5 NMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSH :. .. . :::. : . ::. ::::. :: : :: . ::: ::: :.::.. . .. CCDS40 CMQPNNIMGIENICELAARLLFSAVEWARNIPFFPDLQITDQVSLLRLTWSELFVLNAAQ 210 220 230 240 250 260 320 330 340 350 360 370 pF1KB5 RSVSVQDGILLAT-GLHVHRSSAHSAGVGSIFD--RVLTELVSKMKDMQMDKSELGCLRA :. .. . :::. :::. :: : ...: :.. : : :.: ...:..: .::.: CCDS40 CSMPLHVAPLLAAAGLHASPMSADR--VVAFMDHIRIFQEQVEKLKALHVDSAEYSCLKA 270 280 290 300 310 320 380 390 400 410 420 430 pF1KB5 IVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKC ::::. :: :::. ...:.:.:: .:: :....::.::.::.:::::::.::... . CCDS40 IVLFTSDACGLSDAAHIESLQEKSQCALEEYVRSQYPNQPSRFGKLLLRLPSLRTVSSSV 330 340 350 360 370 380 440 450 460 pF1KB5 LEHLFFFKLIGDTPIDTFLMEMLETPLQIT .:.::: .:.: :::.:.. .:: CCDS40 IEQLFFVRLVGKTPIETLIRDMLLSGSSFNWPYMSIQCS 390 400 410 420 >>CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20 (417 aa) initn: 888 init1: 490 opt: 903 Z-score: 716.9 bits: 141.8 E(32554): 1.3e-33 Smith-Waterman score: 903; 39.2% identity (71.4% similar) in 370 aa overlap (93-456:12-374) 70 80 90 100 110 120 pF1KB5 LNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPGIG .: :. :. . .. :... : .: CCDS13 MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLT----MG 10 20 30 130 140 150 160 170 pF1KB5 NMNYPS-----TSPGSL-VKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCR : . :: ..:.:: :. .:::::::..:::::. ::.::::::.:..::. .:.:: CCDS13 NDTSPSEGTNLNAPNSLGVSALCAICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCR 40 50 60 70 80 90 180 190 200 210 220 230 pF1KB5 DNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMPV ...:..:: .::.:.::: .::. :::.::::.::.: : : . . . . . CCDS13 FSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQ 100 110 120 130 140 150 240 250 260 270 280 290 pF1KB5 ERILEAELAVEPKTESYGDMNMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLE ..: ... : . ::. .. .. ....:.. .::..:::::: :: : .: :. CCDS13 AEVLSRQIT-SPVSGINGDIRAKKIAS--IADVCESMKEQLLVLVEWAKYIPAFCELPLD 160 170 180 190 200 210 300 310 320 330 340 350 pF1KB5 DQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVS ::: :::: .: :. . ..::. .: .::.. : : . : .. . :.: ::: CCDS13 DQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDYIVPRHCPELAEMSRVSIRILDELVL 220 230 240 250 260 270 360 370 380 390 400 410 pF1KB5 KMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRF ....:.: .: . :.::..:.:::::::.:.... :: .: ..:: : ... .. ::: CCDS13 PFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRF 280 290 300 310 320 330 420 430 440 450 460 pF1KB5 AKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT ..::: ::.:.:: . .:.. :.::.: . ::..:.::: CCDS13 GELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNLLQEMLLGGPCQAQEGRGWSGDSPGD 340 350 360 370 380 390 CCDS13 RPHTVSSPLSSLASPLCRFGQVA 400 410 >>CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20 (464 aa) initn: 888 init1: 490 opt: 903 Z-score: 716.2 bits: 141.8 E(32554): 1.4e-33 Smith-Waterman score: 903; 39.2% identity (71.4% similar) in 370 aa overlap (93-456:12-374) 70 80 90 100 110 120 pF1KB5 LNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPGIG .: :. :. . .. :... : .: CCDS46 MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLT----MG 10 20 30 130 140 150 160 170 pF1KB5 NMNYPS-----TSPGSL-VKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCR : . :: ..:.:: :. .:::::::..:::::. ::.::::::.:..::. .:.:: CCDS46 NDTSPSEGTNLNAPNSLGVSALCAICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCR 40 50 60 70 80 90 180 190 200 210 220 230 pF1KB5 DNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMPV ...:..:: .::.:.::: .::. :::.::::.::.: : : . . . . . CCDS46 FSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQ 100 110 120 130 140 150 240 250 260 270 280 290 pF1KB5 ERILEAELAVEPKTESYGDMNMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLE ..: ... : . ::. .. .. ....:.. .::..:::::: :: : .: :. CCDS46 AEVLSRQIT-SPVSGINGDIRAKKIAS--IADVCESMKEQLLVLVEWAKYIPAFCELPLD 160 170 180 190 200 210 300 310 320 330 340 350 pF1KB5 DQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVS ::: :::: .: :. . ..::. .: .::.. : : . : .. . :.: ::: CCDS46 DQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDYIVPRHCPELAEMSRVSIRILDELVL 220 230 240 250 260 270 360 370 380 390 400 410 pF1KB5 KMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRF ....:.: .: . :.::..:.:::::::.:.... :: .: ..:: : ... .. ::: CCDS46 PFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRF 280 290 300 310 320 330 420 430 440 450 460 pF1KB5 AKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT ..::: ::.:.:: . .:.. :.::.: . ::..:.::: CCDS46 GELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNLLQEMLLGGSPSDAPHAHHPLHPHLM 340 350 360 370 380 390 CCDS46 QEHMGTNVIVANTMPTHLSNGQMSTPETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIP 400 410 420 430 440 450 >>CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20 (474 aa) initn: 888 init1: 490 opt: 903 Z-score: 716.0 bits: 141.8 E(32554): 1.5e-33 Smith-Waterman score: 903; 39.2% identity (71.4% similar) in 370 aa overlap (93-456:12-374) 70 80 90 100 110 120 pF1KB5 LNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNVVNSVSSSEDIKPLPGLPGIG .: :. :. . .. :... : .: CCDS13 MRLSKTLVDMDMADYSAALDPAYTTLEFENVQVLT----MG 10 20 30 130 140 150 160 170 pF1KB5 NMNYPS-----TSPGSL-VKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTCR : . :: ..:.:: :. .:::::::..:::::. ::.::::::.:..::. .:.:: CCDS13 NDTSPSEGTNLNAPNSLGVSALCAICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCR 40 50 60 70 80 90 180 190 200 210 220 230 pF1KB5 DNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMPV ...:..:: .::.:.::: .::. :::.::::.::.: : : . . . . . CCDS13 FSRQCVVDKDKRNQCRYCRLKKCFRAGMKKEAVQNERDRISTRRSSYEDSSLPSINALLQ 100 110 120 130 140 150 240 250 260 270 280 290 pF1KB5 ERILEAELAVEPKTESYGDMNMENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSDLTLE ..: ... : . ::. .. .. ....:.. .::..:::::: :: : .: :. CCDS13 AEVLSRQIT-SPVSGINGDIRAKKIAS--IADVCESMKEQLLVLVEWAKYIPAFCELPLD 160 170 180 190 200 210 300 310 320 330 340 350 pF1KB5 DQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLTELVS ::: :::: .: :. . ..::. .: .::.. : : . : .. . :.: ::: CCDS13 DQVALLRAHAGEHLLLGATKRSMVFKDVLLLGNDYIVPRHCPELAEMSRVSIRILDELVL 220 230 240 250 260 270 360 370 380 390 400 410 pF1KB5 KMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQPGRF ....:.: .: . :.::..:.:::::::.:.... :: .: ..:: : ... .. ::: CCDS13 PFQELQIDDNEYAYLKAIIFFDPDAKGLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRF 280 290 300 310 320 330 420 430 440 450 460 pF1KB5 AKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT ..::: ::.:.:: . .:.. :.::.: . ::..:.::: CCDS13 GELLLLLPTLQSITWQMIEQIQFIKLFGMAKIDNLLQEMLLGGSPSDAPHAHHPLHPHLM 340 350 360 370 380 390 CCDS13 QEHMGTNVIVANTMPTHLSNGQMCEWPRPRGQAATPETPQPSPPGGSGSEPYKLLPGAVA 400 410 420 430 440 450 463 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 15:23:31 2016 done: Sat Nov 5 15:23:31 2016 Total Scan time: 3.440 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]