FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7428, 412 aa 1>>>pF1KB7428 412 - 412 aa - 412 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.3529+/-0.000804; mu= 2.7672+/- 0.049 mean_var=290.3123+/-59.091, 0's: 0 Z-trim(118.3): 28 B-trim: 291 in 2/51 Lambda= 0.075273 statistics sampled from 19241 (19269) to 19241 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.838), E-opt: 0.2 (0.592), width: 16 Scan time: 3.260 The best scores are: opt bits E(32554) CCDS35006.1 ARID3C gene_id:138715|Hs108|chr9 ( 412) 2820 318.8 6e-87 CCDS12050.1 ARID3A gene_id:1820|Hs108|chr19 ( 593) 841 104.0 3.8e-22 CCDS10264.1 ARID3B gene_id:10620|Hs108|chr15 ( 560) 789 98.4 1.8e-20 CCDS76777.1 ARID3B gene_id:10620|Hs108|chr15 ( 561) 789 98.4 1.8e-20 >>CCDS35006.1 ARID3C gene_id:138715|Hs108|chr9 (412 aa) initn: 2820 init1: 2820 opt: 2820 Z-score: 1674.5 bits: 318.8 E(32554): 6e-87 Smith-Waterman score: 2820; 100.0% identity (100.0% similar) in 412 aa overlap (1-412:1-412) 10 20 30 40 50 60 pF1KB7 MEALQKQQAARLAQGVGPLAPACPLLPPQPPLPDHRTLQAPEGALGNVGAEEEEDAEEDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MEALQKQQAARLAQGVGPLAPACPLLPPQPPLPDHRTLQAPEGALGNVGAEEEEDAEEDE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 EKREEAGAEEEAAEESRPGAQGPSSPSSQPPGLHPHEWTYEEQFKQLYELDADPKRKEFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 EKREEAGAEEEAAEESRPGAQGPSSPSSQPPGLHPHEWTYEEQFKQLYELDADPKRKEFL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 DDLFSFMQKRGTPVNRVPIMAKQVLDLYALFRLVTAKGGLVEVINRKVWREVTRGLSLPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 DDLFSFMQKRGTPVNRVPIMAKQVLDLYALFRLVTAKGGLVEVINRKVWREVTRGLSLPT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 TITSAAFTLRTQYMKYLYPYECETRALSSPGELQAAIDSNRREGRRQAYTATPLFGLAGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 TITSAAFTLRTQYMKYLYPYECETRALSSPGELQAAIDSNRREGRRQAYTATPLFGLAGP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 PPRGAQDPALGPGPAPPATQSSPGPAQGSTSGLPAHACAQLSPSPIKKEESGIPNPCLAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 PPRGAQDPALGPGPAPPATQSSPGPAQGSTSGLPAHACAQLSPSPIKKEESGIPNPCLAL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 PVGLALGPTREKLAPEEPPEKRAVLMGPMDPPRPCMPPSFLPRGKVPLREERLDGPLNLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 PVGLALGPTREKLAPEEPPEKRAVLMGPMDPPRPCMPPSFLPRGKVPLREERLDGPLNLA 310 320 330 340 350 360 370 380 390 400 410 pF1KB7 GSGISSINMALEINGVVYTGVLFARRQPVPASQGPTNPAPPPSTGPPSSILP :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 GSGISSINMALEINGVVYTGVLFARRQPVPASQGPTNPAPPPSTGPPSSILP 370 380 390 400 410 >>CCDS12050.1 ARID3A gene_id:1820|Hs108|chr19 (593 aa) initn: 1085 init1: 779 opt: 841 Z-score: 511.0 bits: 104.0 E(32554): 3.8e-22 Smith-Waterman score: 1007; 46.3% identity (63.5% similar) in 447 aa overlap (2-406:145-547) 10 20 30 pF1KB7 MEALQKQQAARLAQGVGPLAPACPLLPPQPP : . .. . .:.:: .:: : CCDS12 EDMASDEDMKPKWEEEEMEEDLGEDEEEEEEDYEDEEEEEDEEGLGPPGPAS--LGTTAL 120 130 140 150 160 170 40 50 60 70 80 90 pF1KB7 LPDHRTLQAPEGALGNVGAEEEEDAEEDEEKREEAGAEEEAAEESRPGAQGPSSPSSQPP .: : : :.. : : : .: :. . ..::. . .:. ::: CCDS12 FP--RKAQPPQAFRG------------DGVPRVLGGQERPGPGPAHPGGAAHVAPQLQPP 180 190 200 210 100 110 120 130 140 150 pF1KB7 GLHPHEWTYEEQFKQLYELDADPKRKEFLDDLFSFMQKRGTPVNRVPIMAKQVLDLYALF : .::::::::::::::.::::::::::::::::::::::::.::::::::::. :. CCDS12 D-HG-DWTYEEQFKQLYELDGDPKRKEFLDDLFSFMQKRGTPVNRIPIMAKQVLDLFMLY 220 230 240 250 260 270 160 170 180 190 200 210 pF1KB7 RLVTAKGGLVEVINRKVWREVTRGLSLPTTITSAAFTLRTQYMKYLYPYECETRALSSPG ::: :::::::::.:.:::.:.::.:::.:::::::::::::::::::::: :.::.:. CCDS12 VLVTEKGGLVEVINKKLWREITKGLNLPTSITSAAFTLRTQYMKYLYPYECEKRGLSNPN 280 290 300 310 320 330 220 230 240 250 260 270 pF1KB7 ELQAAIDSNRREGRRQAYTATPLFGLAGPPPRGAQDPALGPGPAPPATQSSPGPAQGSTS ::::::::::::::::.. .. ::. . : ::. : .: :: : : .::. CCDS12 ELQAAIDSNRREGRRQSFGGS-LFAYS---PGGAH----GMLSSPKLPVSSLGLA-ASTN 340 350 360 370 380 280 290 300 pF1KB7 GLPAHACAQLSPSP-IKKEE-SGIPNPCLA-LPVGLALGPT------------------- : ....:.: ::::: :.:: . :::.:: :. CCDS12 G------SSITPAPKIKKEEDSAIPITVPGRLPVSLAGHPVVAAQAAAVQAAAAQAAVAA 390 400 410 420 430 440 310 320 330 340 350 pF1KB7 --------REKLAPEEPPEKRAVLMGPMDPP--RPCMPPSFLPRG-KVPLR--------E :::: :::::. .:.. . . . .:: . ..:. : CCDS12 QAAALEQLREKLESAEPPEKKMALVADEQQRLMQRALQQNFLAMAAQLPMSIRINSQASE 450 460 470 480 490 500 360 370 380 390 400 pF1KB7 ERLDGPLNLAGS-GISSINMALEINGVVYTGVLFARRQPVPASQGPTNPAPPPSTGPPSS : :. .::.:. : .::.:..::::..::::::: :: ::: :...: CCDS12 SRQDSAVNLTGTNGSNSISMSVEINGIMYTGVLFA--QP---------PAPTPTSAPNKG 510 520 530 540 550 410 pF1KB7 ILP CCDS12 GGGGGGSSSNAGGRGGNTGTSGGQAGPAGLSTPSTSTSNNSLP 560 570 580 590 >>CCDS10264.1 ARID3B gene_id:10620|Hs108|chr15 (560 aa) initn: 938 init1: 699 opt: 789 Z-score: 480.8 bits: 98.4 E(32554): 1.8e-20 Smith-Waterman score: 908; 42.9% identity (63.8% similar) in 431 aa overlap (7-409:125-532) 10 20 30 pF1KB7 MEALQKQQAARLAQGVGPLAPACPLLPPQPPLPDHR :..:: :.:.. : : : :: : CCDS10 DGGLEDEDGDDEVAEVAEKETQAASKYFHVQKVARQDPRVAPMSN----LLPAPGLPPH- 100 110 120 130 140 40 50 60 70 80 90 pF1KB7 TLQAPEGALGNVGAEEEEDAEEDEEKREEAGAEEEAAEESRPGAQGPSSPSSQPPGLHPH :: : .. .:: . . :: . .:. .: . :.. : . . CCDS10 GQQAKE--------DHTKDASKASPSVSTAGQPNWNLDEQLK-QNGGLAWSDDADGGRGR 150 160 170 180 190 200 100 110 120 130 140 150 pF1KB7 EWTYEEQFKQLYELDADPKRKEFLDDLFSFMQKRGTPVNRVPIMAKQVLDLYALFRLVTA : . . : .:::::.::.::::::::: ::::::::.::.::::::.:::: :..::: CCDS10 EISRD--FAKLYELDGDPERKEFLDDLFVFMQKRGTPINRIPIMAKQILDLYMLYKLVTE 210 220 230 240 250 160 170 180 190 200 210 pF1KB7 KGGLVEVINRKVWREVTRGLSLPTTITSAAFTLRTQYMKYLYPYECETRALSSPGELQAA ::::::.::.:.:::.:.::.:::.::::::::::::::::: :::: .:::::.::::: CCDS10 KGGLVEIINKKIWREITKGLNLPTSITSAAFTLRTQYMKYLYAYECEKKALSSPAELQAA 260 270 280 290 300 310 220 230 240 250 260 270 pF1KB7 IDSNRREGRRQAYTATPLFGLAGPPPRGAQDPALGPGPAPPATQSSPGPAQGSTSGLPAH ::.::::::: .:... ::: . : : : .:. : : . ::.:: . CCDS10 IDGNRREGRRPSYSSS-LFGYS-PAAATAAAAAGAPALLSPPKIRFPILGLGSSSGTNT- 320 330 340 350 360 370 280 290 300 310 320 pF1KB7 ACAQLSPSPIKKEESG-----IPNPC-LALPVGLA----------LGPTREKLAPEEPPE . ..::. .. .: .: : ::.:: :: : ::.: :: : CCDS10 SSPRISPATTLRKGDGAPVTTVPVPNRLAVPVTLASQQAGTRTAALEQLRERLESGEPAE 380 390 400 410 420 430 330 340 350 360 pF1KB7 KRAVLMGPMDPP--RPCMPPSFLPRGK-VPL------REERLDGP---LNLAGSGISSIN :.: .. . . . .:. .. .:. ::.: .. :::. :.:.::: CCDS10 KKASRLSEEEQRLVQQAFQRNFFSMARQLPMKIRINGREDRAEASAAALNLTTSSIGSIN 440 450 460 470 480 490 370 380 390 400 410 pF1KB7 MALEINGVVYTGVLFARRQPVPASQGPTNPAPPPSTGPPSSILP :...:.:..:.:::::.. :. . :. :: : : .: CCDS10 MSVDIDGTTYAGVLFAQK---PVVHLITGSAPQ-SLGSSASSSSSSHCSPSPTSSRGTPS 500 510 520 530 540 550 CCDS10 AEPSTSWSL 560 >>CCDS76777.1 ARID3B gene_id:10620|Hs108|chr15 (561 aa) initn: 938 init1: 699 opt: 789 Z-score: 480.8 bits: 98.4 E(32554): 1.8e-20 Smith-Waterman score: 904; 43.1% identity (62.7% similar) in 432 aa overlap (7-409:125-533) 10 20 30 pF1KB7 MEALQKQQAARLAQGVGPLAPACPLLPPQPPLPDHR :..:: :.:.. : : : :: : CCDS76 DGGLEDEDGDDEVAEVAEKETQAASKYFHVQKVARQDPRVAPMSN----LLPAPGLPPH- 100 110 120 130 140 40 50 60 70 80 90 pF1KB7 TLQAPEGALGNVGAEEEEDAEEDEEKREEAGAEEEAAEESRPGAQGPSSPSSQPPGLHPH :: : .. .:: . . :: . .:. .: . :.. : . . CCDS76 GQQAKE--------DHTKDASKASPSVSTAGQPNWNLDEQLK-QNGGLAWSDDADGGRGR 150 160 170 180 190 200 100 110 120 130 140 150 pF1KB7 EWTYEEQFKQLYELDADPKRKEFLDDLFSFMQKRGTPVNRVPIMAKQVLDLYALFRLVTA : . . : .:::::.::.::::::::: ::::::::.::.::::::.:::: :..::: CCDS76 EISRD--FAKLYELDGDPERKEFLDDLFVFMQKRGTPINRIPIMAKQILDLYMLYKLVTE 210 220 230 240 250 160 170 180 190 200 210 pF1KB7 KGGLVEVINRKVWREVTRGLSLPTTITSAAFTLRTQYMKYLYPYECETRALSSPGELQAA ::::::.::.:.:::.:.::.:::.::::::::::::::::: :::: .:::::.::::: CCDS76 KGGLVEIINKKIWREITKGLNLPTSITSAAFTLRTQYMKYLYAYECEKKALSSPAELQAA 260 270 280 290 300 310 220 230 240 250 260 270 pF1KB7 IDSNRREGRRQAYTATPLFGLAGPPPRGAQDPALGPGPAPPATQSSPGPAQGSTSGLPAH ::.::::::: .:... ::: . : : : .:. : : . ::.:: . CCDS76 IDGNRREGRRPSYSSS-LFGYS-PAAATAAAAAGAPALLSPPKIRFPILGLGSSSGTNT- 320 330 340 350 360 370 280 290 300 310 320 pF1KB7 ACAQLSPSPIKKEESG-----IPNPC-LALPVGLA----------LGPTREKLAPEEPPE . ..::. .. .: .: : ::.:: :: : ::.: :: : CCDS76 SSPRISPATTLRKGDGAPVTTVPVPNRLAVPVTLASQQAGTRTAALEQLRERLESGEPAE 380 390 400 410 420 430 330 340 350 360 pF1KB7 KRAVLMGPMDPP--RPCMPPSF------LP-----RGKVPLREERLDGPLNLAGSGISSI :.: .. . . . .: :: :.. : : . :::. :.:.:: CCDS76 KKASRLSEEEQRLVQQAFQRNFFSMARQLPMKIRINGRAEDRAEASAAALNLTTSSIGSI 440 450 460 470 480 490 370 380 390 400 410 pF1KB7 NMALEINGVVYTGVLFARRQPVPASQGPTNPAPPPSTGPPSSILP ::...:.:..:.:::::.. :. . :. :: : : .: CCDS76 NMSVDIDGTTYAGVLFAQK---PVVHLITGSAPQ-SLGSSASSSSSSHCSPSPTSSRGTP 500 510 520 530 540 550 CCDS76 SAEPSTSWSL 560 412 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 07:42:22 2016 done: Fri Nov 4 07:42:23 2016 Total Scan time: 3.260 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]