FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9770, 462 aa 1>>>pF1KB9770 462 - 462 aa - 462 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.2861+/-0.00105; mu= -0.0290+/- 0.063 mean_var=206.2611+/-42.013, 0's: 0 Z-trim(111.0): 122 B-trim: 5 in 1/50 Lambda= 0.089303 statistics sampled from 11899 (12025) to 11899 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.721), E-opt: 0.2 (0.369), width: 16 Scan time: 3.440 The best scores are: opt bits E(32554) CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 ( 462) 3123 415.0 8.2e-116 CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 ( 463) 2162 291.2 1.5e-78 CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 ( 533) 2137 288.0 1.6e-77 CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 ( 537) 2119 285.7 8.1e-77 CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 ( 340) 1983 268.0 1e-71 CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 ( 414) 1001 141.6 1.5e-33 CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 ( 423) 972 137.8 2e-32 CCDS83303.1 HNF4G gene_id:3174|Hs108|chr8 ( 408) 916 130.6 2.9e-30 CCDS6220.2 HNF4G gene_id:3174|Hs108|chr8 ( 445) 916 130.6 3.2e-30 CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 ( 442) 907 129.5 7e-30 CCDS74728.1 HNF4A gene_id:3172|Hs108|chr20 ( 449) 907 129.5 7.1e-30 CCDS42876.1 HNF4A gene_id:3172|Hs108|chr20 ( 452) 907 129.5 7.1e-30 CCDS46605.1 HNF4A gene_id:3172|Hs108|chr20 ( 464) 907 129.5 7.3e-30 CCDS13330.1 HNF4A gene_id:3172|Hs108|chr20 ( 474) 907 129.5 7.4e-30 CCDS68131.1 HNF4A gene_id:3172|Hs108|chr20 ( 395) 902 128.8 1e-29 CCDS13331.1 HNF4A gene_id:3172|Hs108|chr20 ( 417) 902 128.8 1e-29 CCDS1517.1 ESRRG gene_id:2104|Hs108|chr1 ( 435) 743 108.3 1.6e-23 CCDS41468.1 ESRRG gene_id:2104|Hs108|chr1 ( 458) 743 108.4 1.7e-23 CCDS8850.1 RARG gene_id:5916|Hs108|chr12 ( 454) 739 107.8 2.3e-23 CCDS9850.2 ESRRB gene_id:2103|Hs108|chr14 ( 508) 731 106.8 5.3e-23 CCDS58236.1 RARG gene_id:5916|Hs108|chr12 ( 382) 728 106.4 5.4e-23 CCDS41790.1 RARG gene_id:5916|Hs108|chr12 ( 443) 728 106.4 6.1e-23 CCDS2642.1 RARB gene_id:5915|Hs108|chr3 ( 448) 719 105.3 1.4e-22 CCDS11366.1 RARA gene_id:5914|Hs108|chr17 ( 462) 713 104.5 2.4e-22 CCDS42317.1 RARA gene_id:5914|Hs108|chr17 ( 457) 706 103.6 4.5e-22 CCDS8818.1 NR4A1 gene_id:3164|Hs108|chr12 ( 598) 678 100.1 6.8e-21 CCDS55828.1 NR4A1 gene_id:3164|Hs108|chr12 ( 611) 678 100.1 7e-21 CCDS73471.1 NR4A1 gene_id:3164|Hs108|chr12 ( 652) 678 100.1 7.4e-21 CCDS58237.1 RARG gene_id:5916|Hs108|chr12 ( 432) 594 89.1 9.5e-18 CCDS45358.1 NR2F2 gene_id:7026|Hs108|chr15 ( 281) 562 84.9 1.2e-16 CCDS45359.1 NR2F2 gene_id:7026|Hs108|chr15 ( 261) 561 84.8 1.2e-16 CCDS46775.1 RARB gene_id:5915|Hs108|chr3 ( 336) 532 81.1 2e-15 CCDS73750.1 NR2E3 gene_id:10002|Hs108|chr15 ( 410) 471 73.3 5.3e-13 CCDS58060.1 ESRRG gene_id:2104|Hs108|chr1 ( 396) 466 72.6 8.1e-13 CCDS2201.1 NR4A2 gene_id:4929|Hs108|chr2 ( 598) 462 72.2 1.6e-12 CCDS74905.1 NR2C2 gene_id:7182|Hs108|chr3 ( 596) 458 71.7 2.3e-12 CCDS2621.1 NR2C2 gene_id:7182|Hs108|chr3 ( 615) 458 71.7 2.4e-12 CCDS41821.1 NR2C1 gene_id:7181|Hs108|chr12 ( 467) 436 68.8 1.4e-11 CCDS44953.1 NR2C1 gene_id:7181|Hs108|chr12 ( 483) 436 68.8 1.4e-11 CCDS9051.1 NR2C1 gene_id:7181|Hs108|chr12 ( 603) 436 68.9 1.7e-11 CCDS12352.1 NR2F6 gene_id:2063|Hs108|chr19 ( 404) 422 67.0 4.2e-11 CCDS6744.1 NR4A3 gene_id:8013|Hs108|chr9 ( 443) 414 66.0 9.3e-11 >>CCDS35172.1 RXRA gene_id:6256|Hs108|chr9 (462 aa) initn: 3123 init1: 3123 opt: 3123 Z-score: 2192.6 bits: 415.0 E(32554): 8.2e-116 Smith-Waterman score: 3123; 100.0% identity (100.0% similar) in 462 aa overlap (1-462:1-462) 10 20 30 40 50 60 pF1KB9 MDTKHFLPLDFSTQVNSSLTSPTGRGSMAAPSLHPSLGPGIGSPGQLHSPISTLSSPING :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MDTKHFLPLDFSTQVNSSLTSPTGRGSMAAPSLHPSLGPGIGSPGQLHSPISTLSSPING 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 MGPPFSVISSPMGPHSMSVPTTPTLGFSTGSPQLSSPMNPVSSSEDIKPPLGLNGVLKVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MGPPFSVISSPMGPHSMSVPTTPTLGFSTGSPQLSSPMNPVSSSEDIKPPLGLNGVLKVP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 AHPSGNMASFTKHICAICGDRSSGKHYGVYSCEGCKGFFKRTVRKDLTYTCRDNKDCLID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 AHPSGNMASFTKHICAICGDRSSGKHYGVYSCEGCKGFFKRTVRKDLTYTCRDNKDCLID 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 KRQRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVESTSSANEDMPVERILEAEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 KRQRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVESTSSANEDMPVERILEAEL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 AVEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLVEWAKRIPHFSELPLDDQVIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 AVEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLVEWAKRIPHFSELPLDDQVIL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 LRAGWNELLIASFSHRSIAVKDGILLATGLHVHRNSAHSAGVGAIFDRVLTELVSKMRDM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 LRAGWNELLIASFSHRSIAVKDGILLATGLHVHRNSAHSAGVGAIFDRVLTELVSKMRDM 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 QMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAYCKHKYPEQPGRFAKLLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 QMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAYCKHKYPEQPGRFAKLLL 370 380 390 400 410 420 430 440 450 460 pF1KB9 RLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQMT :::::::::::::::::::::::::::::::::::::::::: CCDS35 RLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQMT 430 440 450 460 >>CCDS1248.1 RXRG gene_id:6258|Hs108|chr1 (463 aa) initn: 2139 init1: 1217 opt: 2162 Z-score: 1523.5 bits: 291.2 E(32554): 1.5e-78 Smith-Waterman score: 2162; 73.8% identity (87.1% similar) in 451 aa overlap (21-462:18-463) 10 20 30 40 50 pF1KB9 MDTKHFLPLDFSTQVNSSLTSPTGRGSMA-APSLHPSLGPGIGS-PGQLHSPIS---TLS :: :: . .:: : : . : :. .:.: ::: CCDS12 MYGNYSHFMKFPAGYGGSPGHTGSTSMSPSAALSTGKPMDSHPSYTDTPVSAPRTLS 10 20 30 40 50 60 70 80 90 100 110 pF1KB9 ---SPINGMGPPFSVISSPMGPHSMSVPTTPTLGF-STGSPQLSSPMNPVSSSEDIKPPL .:.:..: :. ::.: ::: : .. . : ... . : ::. .: ::::::::: CCDS12 AVGTPLNALGSPYRVITSAMGPPSGALAAPPGINLVAPPSSQLNV-VNSVSSSEDIKPLP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB9 GLNGVLKVPAHPSGNMASFTKHICAICGDRSSGKHYGVYSCEGCKGFFKRTVRKDLTYTC :: :. .. .:: . .:..:::::::::::::::::::::::::::::::.:::: ::: CCDS12 GLPGIGNM-NYPSTSPGSLVKHICAICGDRSSGKHYGVYSCEGCKGFFKRTIRKDLIYTC 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB9 RDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVESTSSANEDMP :::::::::::::::::::::::::.::::::::::::::...: :.:.: ..:..:::: CCDS12 RDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQRSRERAESEAECATSGHEDMP 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB9 VERILEAELAVEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLVEWAKRIPHFSE ::::::::::::::::.: . :: .: ::::::::.::::::::::::::::::::. CCDS12 VERILEAELAVEPKTESYGDMNM---ENSTNDPVTNICHAADKQLFTLVEWAKRIPHFSD 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB9 LPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLATGLHVHRNSAHSAGVGAIFDRVLT : :.::::::::::::::::::::::..:.:::::::::::::.::::::::.::::::: CCDS12 LTLEDQVILLRAGWNELLIASFSHRSVSVQDGILLATGLHVHRSSAHSAGVGSIFDRVLT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB9 ELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAYCKHKYPEQ ::::::.::::::.::::::::::::::.::::::.:::.:::::::.:::: :.::::: CCDS12 ELVSKMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVETLREKVYATLEAYTKQKYPEQ 360 370 380 390 400 410 420 430 440 450 460 pF1KB9 PGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQMT :::::::::::::::::::::::::::::::::::::::::::::.: :.: CCDS12 PGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLETPLQIT 420 430 440 450 460 >>CCDS4768.1 RXRB gene_id:6257|Hs108|chr6 (533 aa) initn: 2092 init1: 1281 opt: 2137 Z-score: 1505.2 bits: 288.0 E(32554): 1.6e-77 Smith-Waterman score: 2137; 72.0% identity (84.6% similar) in 461 aa overlap (12-461:80-532) 10 20 30 pF1KB9 MDTKHFLPLDFSTQVNSSLTSPTGRG----SMAAPSLHPSL : . .:: .: .: : .: : :: CCDS47 AAAVAGGEQQTPEPEPGEAGRDGMGDSGRDSRSPDSSSPNPLPQGVPPPSPPGPPLPPST 50 60 70 80 90 100 40 50 60 70 80 90 pF1KB9 GPGIGSPGQLHSPISTLSSPINGMGPPFSVISSPMGPHSMSVPTTPTLGFSTGSPQLSSP .:..:. : : . : .: :: :::: :: .. :. : .. ..:::..: CCDS47 APSLGGSGA--PPPPPMPPP--PLGSPFPVISSSMGSPGLPPPAPPGFSGPVSSPQINST 110 120 130 140 150 160 100 110 120 130 140 150 pF1KB9 MN-PVSSS---EDIKPP-LGLNGVLKVPAHPSGNMASFTKHICAICGDRSSGKHYGVYSC .. : ..: ::.::: ::. : :. : :.: :. :..:::::::::::::::::: CCDS47 VSLPGGGSGPPEDVKPPVLGVRG-LHCPPPPGGPGAG--KRLCAICGDRSSGKHYGVYSC 170 180 190 200 210 220 160 170 180 190 200 210 pF1KB9 EGCKGFFKRTVRKDLTYTCRDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRG ::::::::::.::::::.::::::: .:::::::::::::::::: :::::::::::::: CCDS47 EGCKGFFKRTIRKDLTYSCRDNKDCTVDKRQRNRCQYCRYQKCLATGMKREAVQEERQRG 230 240 250 260 270 280 220 230 240 250 260 270 pF1KB9 KDRNENEVESTSSANEDMPVERILEAELAVEPKTETYVEA--NMGLNPSSPNDPVTNICQ ::.. .. :....: :.:::.:::::::::: :.. ::. . : . :::::::::::: CCDS47 KDKD-GDGEGAGGAPEEMPVDRILEAELAVEQKSDQGVEGPGGTGGSGSSPNDPVTNICQ 290 300 310 320 330 340 280 290 300 310 320 330 pF1KB9 AADKQLFTLVEWAKRIPHFSELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLATGL :::::::::::::::::::: ::::::::::::::::::::::::::: :.::::::::: CCDS47 AADKQLFTLVEWAKRIPHFSSLPLDDQVILLRAGWNELLIASFSHRSIDVRDGILLATGL 350 360 370 380 390 400 340 350 360 370 380 390 pF1KB9 HVHRNSAHSAGVGAIFDRVLTELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPAEVE ::::::::::::::::::::::::::::::.::::::::::::.:::::.::::::.::: CCDS47 HVHRNSAHSAGVGAIFDRVLTELVSKMRDMRMDKTELGCLRAIILFNPDAKGLSNPSEVE 410 420 430 440 450 460 400 410 420 430 440 450 pF1KB9 ALREKVYASLEAYCKHKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTF .::::::::::.:::.::::: :::::::::::::::::::::::::::::::::::::: CCDS47 VLREKVYASLETYCKQKYPEQQGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTF 470 480 490 500 510 520 460 pF1KB9 LMEMLEAPHQMT ::::::::::. CCDS47 LMEMLEAPHQLA 530 >>CCDS59007.1 RXRB gene_id:6257|Hs108|chr6 (537 aa) initn: 2099 init1: 707 opt: 2119 Z-score: 1492.6 bits: 285.7 E(32554): 8.1e-77 Smith-Waterman score: 2119; 71.4% identity (83.9% similar) in 465 aa overlap (12-461:80-536) 10 20 30 pF1KB9 MDTKHFLPLDFSTQVNSSLTSPTGRG----SMAAPSLHPSL : . .:: .: .: : .: : :: CCDS59 AAAVAGGEQQTPEPEPGEAGRDGMGDSGRDSRSPDSSSPNPLPQGVPPPSPPGPPLPPST 50 60 70 80 90 100 40 50 60 70 80 90 pF1KB9 GPGIGSPGQLHSPISTLSSPINGMGPPFSVISSPMGPHSMSVPTTPTLGFSTGSPQLSSP .:..:. : : . : .: :: :::: :: .. :. : .. ..:::..: CCDS59 APSLGGSGA--PPPPPMPPP--PLGSPFPVISSSMGSPGLPPPAPPGFSGPVSSPQINST 110 120 130 140 150 160 100 110 120 130 140 150 pF1KB9 MN-PVSSS---EDIKPP-LGLNGVLKVPAHPSGNMASFTKHICAICGDRSSGKHYGVYSC .. : ..: ::.::: ::. : :. : :.: :. :..:::::::::::::::::: CCDS59 VSLPGGGSGPPEDVKPPVLGVRG-LHCPPPPGGPGAG--KRLCAICGDRSSGKHYGVYSC 170 180 190 200 210 220 160 170 180 190 200 210 pF1KB9 EGCKGFFKRTVRKDLTYTCRDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRG ::::::::::.::::::.::::::: .:::::::::::::::::: :::::::::::::: CCDS59 EGCKGFFKRTIRKDLTYSCRDNKDCTVDKRQRNRCQYCRYQKCLATGMKREAVQEERQRG 230 240 250 260 270 280 220 230 240 250 260 270 pF1KB9 KDRNENEVESTSSANEDMPVERILEAELAVEPKTETYVEA--NMGLNPSSPNDPVTNICQ ::.. .. :....: :.:::.:::::::::: :.. ::. . : . :::::::::::: CCDS59 KDKD-GDGEGAGGAPEEMPVDRILEAELAVEQKSDQGVEGPGGTGGSGSSPNDPVTNICQ 290 300 310 320 330 340 280 290 300 310 320 330 pF1KB9 AADKQLFTLVEWAKRIPHFSELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLATGL :::::::::::::::::::: ::::::::::::::::::::::::::: :.::::::::: CCDS59 AADKQLFTLVEWAKRIPHFSSLPLDDQVILLRAGWNELLIASFSHRSIDVRDGILLATGL 350 360 370 380 390 400 340 350 360 370 380 pF1KB9 HVHRNSAHSAGVGAIFDR----VLTELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNP :::::::::::::::::: ::::::::::::.::::::::::::.:::::.:::::: CCDS59 HVHRNSAHSAGVGAIFDRSLSRVLTELVSKMRDMRMDKTELGCLRAIILFNPDAKGLSNP 410 420 430 440 450 460 390 400 410 420 430 440 pF1KB9 AEVEALREKVYASLEAYCKHKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTP .:::.::::::::::.:::.::::: :::::::::::::::::::::::::::::::::: CCDS59 SEVEVLREKVYASLETYCKQKYPEQQGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTP 470 480 490 500 510 520 450 460 pF1KB9 IDTFLMEMLEAPHQMT ::::::::::::::. CCDS59 IDTFLMEMLEAPHQLA 530 >>CCDS72970.1 RXRG gene_id:6258|Hs108|chr1 (340 aa) initn: 1985 init1: 1217 opt: 1983 Z-score: 1400.8 bits: 268.0 E(32554): 1e-71 Smith-Waterman score: 1983; 85.0% identity (95.6% similar) in 341 aa overlap (122-462:3-340) 100 110 120 130 140 150 pF1KB9 PQLSSPMNPVSSSEDIKPPLGLNGVLKVPAHPSGNMASFTKHICAICGDRSSGKHYGVYS .:: . .:..:::::::::::::::::::: CCDS72 MNYPSTSPGSLVKHICAICGDRSSGKHYGVYS 10 20 30 160 170 180 190 200 210 pF1KB9 CEGCKGFFKRTVRKDLTYTCRDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQR :::::::::::.:::: ::::::::::::::::::::::::::::.:::::::::::::: CCDS72 CEGCKGFFKRTIRKDLIYTCRDNKDCLIDKRQRNRCQYCRYQKCLVMGMKREAVQEERQR 40 50 60 70 80 90 220 230 240 250 260 270 pF1KB9 GKDRNENEVESTSSANEDMPVERILEAELAVEPKTETYVEANMGLNPSSPNDPVTNICQA ...: :.:.: ..:..::::::::::::::::::::.: . :: .: ::::::::.: CCDS72 SRERAESEAECATSGHEDMPVERILEAELAVEPKTESYGDMNM---ENSTNDPVTNICHA 100 110 120 130 140 280 290 300 310 320 330 pF1KB9 ADKQLFTLVEWAKRIPHFSELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLATGLH :::::::::::::::::::.: :.::::::::::::::::::::::..:.:::::::::: CCDS72 ADKQLFTLVEWAKRIPHFSDLTLEDQVILLRAGWNELLIASFSHRSVSVQDGILLATGLH 150 160 170 180 190 200 340 350 360 370 380 390 pF1KB9 VHRNSAHSAGVGAIFDRVLTELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPAEVEA :::.::::::::.:::::::::::::.::::::.::::::::::::::.::::::.:::. CCDS72 VHRSSAHSAGVGSIFDRVLTELVSKMKDMQMDKSELGCLRAIVLFNPDAKGLSNPSEVET 210 220 230 240 250 260 400 410 420 430 440 450 pF1KB9 LREKVYASLEAYCKHKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFL :::::::.:::: :.::::::::::::::::::::::::::::::::::::::::::::: CCDS72 LREKVYATLEAYTKQKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFL 270 280 290 300 310 320 460 pF1KB9 MEMLEAPHQMT :::::.: :.: CCDS72 MEMLETPLQIT 330 340 >>CCDS10375.1 NR2F2 gene_id:7026|Hs108|chr15 (414 aa) initn: 566 init1: 532 opt: 1001 Z-score: 715.8 bits: 141.6 E(32554): 1.5e-33 Smith-Waterman score: 1001; 39.9% identity (70.1% similar) in 398 aa overlap (64-455:11-400) 40 50 60 70 80 90 pF1KB9 HPSLGPGIGSPGQLHSPISTLSSPINGMGPPFSVISSPMGPHSMSVPTTPTLGFSTGSPQ : . . . .: .. ..: .: : :.:. CCDS10 MAMVVSTWRDPQDEVPGSQGSQASQAPPVP--GPPPGAPH 10 20 30 100 110 120 130 140 150 pF1KB9 LSSPMNPVSSSEDIKPPLGLNGVLKVPAHPSGNMASFTKHI-CAICGDRSSGKHYGVYSC .:..: ... : : :. :... . .:: :..:::.::::::: ..: CCDS10 --TPQTPGQGGPASTPAQTAAGGQGGPGGPGSDKQQQQQHIECVVCGDKSSGKHYGQFTC 40 50 60 70 80 90 160 170 180 190 200 210 pF1KB9 EGCKGFFKRTVRKDLTYTCRDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRG ::::.::::.::..:.:::: :..: ::...::.::::: .::: .::.::::: : : CCDS10 EGCKSFFKRSVRRNLSYTCRANRNCPIDQHHRNQCQYCRLKKCLKVGMRREAVQ--RGRM 100 110 120 130 140 150 220 230 240 250 260 270 pF1KB9 KDRNENEVESTSSANEDMPVERILEAELAVEPKTETYVEANMGLNPSSPND--PVTNICQ . .. . . . .. . . : . ... ..: : . .: . .::. . :::. CCDS10 PPTQPTHGQFALTNGDPLNCHSYLSGYISLLLRAEPYPTSRFGSQCMQPNNIMGIENICE 160 170 180 190 200 210 280 290 300 310 320 pF1KB9 AADKQLFTLVEWAKRIPHFSELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLAT-G : ..::. ::::. :: : .: . ::: ::: :.::.. . .. :. .. . :::. : CCDS10 LAARMLFSAVEWARNIPFFPDLQITDQVALLRLTWSELFVLNAAQCSMPLHVAPLLAAAG 220 230 240 250 260 270 330 340 350 360 370 380 pF1KB9 LHVHRNSAHSAGVGAIFD--RVLTELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPA ::. :: : :..: :.. : : :.. ...:..: .::.:::::. :. :::. : CCDS10 LHASPMSADR--VVAFMDHIRIFQEQVEKLKALHVDSAEYSCLKAIVLFTSDACGLSDVA 280 290 300 310 320 330 390 400 410 420 430 440 pF1KB9 EVEALREKVYASLEAYCKHKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPI .::.:.:: .:: : . .::.:: ::.:::::::.::... . .:.::: .:.: ::: CCDS10 HVESLQEKSQCALEEYVRSQYPNQPTRFGKLLLRLPSLRTVSSSVIEQLFFVRLVGKTPI 340 350 360 370 380 390 450 460 pF1KB9 DTFLMEMLEAPHQMT .:.. .:: CCDS10 ETLIRDMLLSGSSFNWPYMAIQ 400 410 >>CCDS4068.1 NR2F1 gene_id:7025|Hs108|chr5 (423 aa) initn: 584 init1: 538 opt: 972 Z-score: 695.5 bits: 137.8 E(32554): 2e-32 Smith-Waterman score: 972; 42.1% identity (70.2% similar) in 373 aa overlap (89-455:46-407) 60 70 80 90 100 110 pF1KB9 NGMGPPFSVISSPMGPHSMSVPTTPTLGFSTGSPQLSSPMNPVSSSEDIKPPLGLNGVLK .:.:. .:..: . . : : : CCDS40 AGGNPGGPNPAAQAARGGGGGAGEQQQQAGSGAPH--TPQTPGQPGAPATP--GTAG--D 20 30 40 50 60 120 130 140 150 160 170 pF1KB9 VPAHPSGNMASFTKHI-CAICGDRSSGKHYGVYSCEGCKGFFKRTVRKDLTYTCRDNKDC : :. : .:: :..:::.::::::: ..:::::.::::.::..:::::: :..: CCDS40 KGQGPPGSGQS-QQHIECVVCGDKSSGKHYGQFTCEGCKSFFKRSVRRNLTYTCRANRNC 70 80 90 100 110 120 180 190 200 210 220 230 pF1KB9 LIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVESTSSANEDMPVERILE ::...::.::::: .::: .::.::::: : : . : . . . .. . . : CCDS40 PIDQHHRNQCQYCRLKKCLKVGMRREAVQ--RGRMPPTQPNPGQYALTNGDPLNGHCYLS 130 140 150 160 170 180 240 250 260 270 280 290 pF1KB9 AELAVEPKTETYVEANMGLNPSSPND--PVTNICQAADKQLFTLVEWAKRIPHFSELPLD . ... ..: : . .: . .::. . :::. : . ::. ::::. :: : .: . CCDS40 GYISLLLRAEPYPTSRYGSQCMQPNNIMGIENICELAARLLFSAVEWARNIPFFPDLQIT 190 200 210 220 230 240 300 310 320 330 340 350 pF1KB9 DQVILLRAGWNELLIASFSHRSIAVKDGILLAT-GLHVHRNSAHSAGVGAIFD--RVLTE ::: ::: :.::.. . .. :. .. . :::. :::. :: : :..: :.. : CCDS40 DQVSLLRLTWSELFVLNAAQCSMPLHVAPLLAAAGLHASPMSADR--VVAFMDHIRIFQE 250 260 270 280 290 300 360 370 380 390 400 410 pF1KB9 LVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAYCKHKYPEQP : :.. ...:..: .::.:::::. :. :::. :..:.:.:: .:: : . .::.:: CCDS40 QVEKLKALHVDSAEYSCLKAIVLFTSDACGLSDAAHIESLQEKSQCALEEYVRSQYPNQP 310 320 330 340 350 360 420 430 440 450 460 pF1KB9 GRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQMT .::.:::::::.::... . .:.::: .:.: :::.:.. .:: CCDS40 SRFGKLLLRLPSLRTVSSSVIEQLFFVRLVGKTPIETLIRDMLLSGSSFNWPYMSIQCS 370 380 390 400 410 420 >>CCDS83303.1 HNF4G gene_id:3174|Hs108|chr8 (408 aa) initn: 732 init1: 399 opt: 916 Z-score: 656.7 bits: 130.6 E(32554): 2.9e-30 Smith-Waterman score: 916; 42.9% identity (75.5% similar) in 322 aa overlap (134-455:11-325) 110 120 130 140 150 160 pF1KB9 SEDIKPPLGLNGVLKVPAHPSGNMASFTKHICAICGDRSSGKHYGVYSCEGCKGFFKRTV .:::::::..:::::. ::.::::::.:.. CCDS83 MNTTDNGVNCLCAICGDRATGKHYGASSCDGCKGFFRRSI 10 20 30 40 170 180 190 200 210 220 pF1KB9 RKDLTYTCRDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVEST ::. .:.:: ...:..:: .::.:.::: .::. :::.::::.::.: . : .:: CCDS83 RKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQNERDRISTR-----RST 50 60 70 80 90 230 240 250 260 270 280 pF1KB9 SSANEDMPVERILEAELAVEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLVEWA .... .. . .::. . . . .. .: .. . . ..:.. .::..::::: CCDS83 FDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIAS-IGDVCESMKQQLLVLVEWA 100 110 120 130 140 150 290 300 310 320 330 340 pF1KB9 KRIPHFSELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLATGLHVHRNSAHSAGVG : :: : :::::::: :::: .: :. . ..::. :: .::... .:::: . . .. CCDS83 KYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVIHRNSCE-VEIS 160 170 180 190 200 210 350 360 370 380 390 400 pF1KB9 AIFDRVLTELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAY . .::: ::: ....:.: .: .::.:::.:.::.::::.:.... .: .: .:: : CCDS83 RVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMRFQVQIGLEDY 220 230 240 250 260 270 410 420 430 440 450 460 pF1KB9 CKHKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQMT . . .. :::..::: ::.:.:: . .:.. : ::.: . ::..:.::: CCDS83 INDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQEMLLGGASNDG 280 290 300 310 320 330 CCDS83 SHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSGQEQYKIAANQ 340 350 360 370 380 390 >>CCDS6220.2 HNF4G gene_id:3174|Hs108|chr8 (445 aa) initn: 732 init1: 399 opt: 916 Z-score: 656.2 bits: 130.6 E(32554): 3.2e-30 Smith-Waterman score: 916; 42.9% identity (75.5% similar) in 322 aa overlap (134-455:48-362) 110 120 130 140 150 160 pF1KB9 SEDIKPPLGLNGVLKVPAHPSGNMASFTKHICAICGDRSSGKHYGVYSCEGCKGFFKRTV .:::::::..:::::. ::.::::::.:.. CCDS62 EFETMQILYNSSDSSAPETSMNTTDNGVNCLCAICGDRATGKHYGASSCDGCKGFFRRSI 20 30 40 50 60 70 170 180 190 200 210 220 pF1KB9 RKDLTYTCRDNKDCLIDKRQRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVEST ::. .:.:: ...:..:: .::.:.::: .::. :::.::::.::.: . : .:: CCDS62 RKSHVYSCRFSRQCVVDKDKRNQCRYCRLRKCFRAGMKKEAVQNERDRISTR-----RST 80 90 100 110 120 130 230 240 250 260 270 280 pF1KB9 SSANEDMPVERILEAELAVEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLVEWA .... .. . .::. . . . .. .: .. . . ..:.. .::..::::: CCDS62 FDGSNIPSINTLAQAEVRSRQISVSSPGSSTDINVKKIAS-IGDVCESMKQQLLVLVEWA 140 150 160 170 180 190 290 300 310 320 330 340 pF1KB9 KRIPHFSELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLATGLHVHRNSAHSAGVG : :: : :::::::: :::: .: :. . ..::. :: .::... .:::: . . .. CCDS62 KYIPAFCELPLDDQVALLRAHAGEHLLLGATKRSMMYKDILLLGNNYVIHRNSCE-VEIS 200 210 220 230 240 250 350 360 370 380 390 400 pF1KB9 AIFDRVLTELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAY . .::: ::: ....:.: .: .::.:::.:.::.::::.:.... .: .: .:: : CCDS62 RVANRVLDELVRPFQEIQIDDNEYACLKAIVFFDPDAKGLSDPVKIKNMRFQVQIGLEDY 260 270 280 290 300 310 410 420 430 440 450 460 pF1KB9 CKHKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQMT . . .. :::..::: ::.:.:: . .:.. : ::.: . ::..:.::: CCDS62 INDRQYDSRGRFGELLLLLPTLQSITWQMIEQIQFVKLFGMVKIDNLLQEMLLGGASNDG 320 330 340 350 360 370 CCDS62 SHLHHPMHPHLSQDPLTGQTILLGPMSTLVHADQISTPETPLPSPPQGSGQEQYKIAANQ 380 390 400 410 420 430 >>CCDS46604.1 HNF4A gene_id:3172|Hs108|chr20 (442 aa) initn: 910 init1: 515 opt: 907 Z-score: 649.9 bits: 129.5 E(32554): 7e-30 Smith-Waterman score: 934; 41.7% identity (70.3% similar) in 374 aa overlap (94-459:4-362) 70 80 90 100 110 120 pF1KB9 PFSVISSPMGPHSMSVPTTPTLGFSTGSPQLSSPMN-PVSSSEDIKPPLGLNGVLKVPAH ...:.. :: :: : .: : : :..: . CCDS46 MVSVNAPLGAPVESSYDTSPSEGTN--LNAP-N 10 20 30 130 140 150 160 170 180 pF1KB9 PSGNMASFTKHICAICGDRSSGKHYGVYSCEGCKGFFKRTVRKDLTYTCRDNKDCLIDKR : : .:::::::..:::::. ::.::::::.:.:::. :.:: ...:..:: CCDS46 SLGVSA-----LCAICGDRATGKHYGASSCDGCKGFFRRSVRKNHMYSCRFSRQCVVDKD 40 50 60 70 80 190 200 210 220 230 240 pF1KB9 QRNRCQYCRYQKCLAMGMKREAVQEERQRGKDRNENEVESTSSANEDMP-VERILEAELA .::.:.::: .::. :::.::::.::.: . : .: . ..: .. .:.::. CCDS46 KRNQCRYCRLKKCFRAGMKKEAVQNERDRISTRR------SSYEDSSLPSINALLQAEVL 90 100 110 120 130 250 260 270 280 290 300 pF1KB9 VEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLVEWAKRIPHFSELPLDDQVILL . : : : .. ....:.. .::..:::::: :: : :::::::: :: CCDS46 SRQITSPVSGIN-GDIRAKKIASIADVCESMKEQLLVLVEWAKYIPAFCELPLDDQVALL 140 150 160 170 180 190 310 320 330 340 350 360 pF1KB9 RAGWNELLIASFSHRSIAVKDGILLATGLHVHRNSAHSAGVGAIFDRVLTELVSKMRDMQ :: .: :. . ..::.. :: .::.. : :. . : .. . :.: ::: ....: CCDS46 RAHAGEHLLLGATKRSMVFKDVLLLGNDYIVPRHCPELAEMSRVSIRILDELVLPFQELQ 200 210 220 230 240 250 370 380 390 400 410 420 pF1KB9 MDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAYCKHKYPEQPGRFAKLLLR .: .: . :.::..:.::.::::.:.... :: .: .::: : . . .. :::..::: CCDS46 IDDNEYAYLKAIIFFDPDAKGLSDPGKIKRLRSQVQVSLEDYINDRQYDSRGRFGELLLL 260 270 280 290 300 310 430 440 450 460 pF1KB9 LPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEML------EAPHQMT ::.:.:: . .:.. :.::.: . ::..:.::: .::: CCDS46 LPTLQSITWQMIEQIQFIKLFGMAKIDNLLQEMLLGGSPSDAPHAHHPLHPHLMQEHMGT 320 330 340 350 360 370 CCDS46 NVIVANTMPTHLSNGQMSTPETPQPSPPGGSGSEPYKLLPGAVATIVKPLSAIPQPTITK 380 390 400 410 420 430 462 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 18:47:54 2016 done: Fri Nov 4 18:47:55 2016 Total Scan time: 3.440 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]