FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3393, 1188 aa 1>>>pF1KE3393 1188 - 1188 aa - 1188 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.5827+/-0.00125; mu= 3.4843+/- 0.076 mean_var=270.2130+/-52.721, 0's: 0 Z-trim(109.8): 61 B-trim: 9 in 1/54 Lambda= 0.078023 statistics sampled from 11106 (11149) to 11106 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.657), E-opt: 0.2 (0.342), width: 16 Scan time: 5.070 The best scores are: opt bits E(32554) CCDS9733.1 ARID4A gene_id:5926|Hs108|chr14 (1188) 7675 878.7 0 CCDS45114.1 ARID4A gene_id:5926|Hs108|chr14 (1203) 7159 820.6 0 CCDS9732.1 ARID4A gene_id:5926|Hs108|chr14 (1257) 7153 820.0 0 CCDS31061.1 ARID4B gene_id:51742|Hs108|chr1 (1312) 2442 289.7 3.2e-77 CCDS31060.1 ARID4B gene_id:51742|Hs108|chr1 (1226) 1937 232.8 3.9e-60 >>CCDS9733.1 ARID4A gene_id:5926|Hs108|chr14 (1188 aa) initn: 7675 init1: 7675 opt: 7675 Z-score: 4684.0 bits: 878.7 E(32554): 0 Smith-Waterman score: 7675; 100.0% identity (100.0% similar) in 1188 aa overlap (1-1188:1-1188) 10 20 30 40 50 60 pF1KE3 MKAADEPAYLTVGTDVSAKYRGAFCEAKIKTVKRLVKVKVLLKQDNTTQLVQDDQVKGPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 MKAADEPAYLTVGTDVSAKYRGAFCEAKIKTVKRLVKVKVLLKQDNTTQLVQDDQVKGPL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 RVGAIVETRTSDGSFQEAIISKLTDASWYTVVFDDGDERTLRRTSLCLKGERHFAESETL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 RVGAIVETRTSDGSFQEAIISKLTDASWYTVVFDDGDERTLRRTSLCLKGERHFAESETL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 DQLPLTNPEHFGTPVIAKKTNRGRRSSLPVTEDEKEEESSEEEDEDKRRLNDELLGKVVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 DQLPLTNPEHFGTPVIAKKTNRGRRSSLPVTEDEKEEESSEEEDEDKRRLNDELLGKVVS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 VVSATERTEWYPALVISPSCNDDITVKKDQCLVRSFIDSKFYSIARKDIKEVDILNLPES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 VVSATERTEWYPALVISPSCNDDITVKKDQCLVRSFIDSKFYSIARKDIKEVDILNLPES 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 ELSTKPGLQKASIFLKTRVVPDNWKMDISEILESSSSDDEDGPAEENDEEKEKEAKKTEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 ELSTKPGLQKASIFLKTRVVPDNWKMDISEILESSSSDDEDGPAEENDEEKEKEAKKTEE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 EVPEEELDPEERDNFLQQLYKFMEDRGTPINKPPVLGYKDLNLFKLFRLVYHQGGCDNID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 EVPEEELDPEERDNFLQQLYKFMEDRGTPINKPPVLGYKDLNLFKLFRLVYHQGGCDNID 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 SGAVWKQIYMDLGIPILNSAASYNVKTAYRKYLYGFEEYCRSANIQFRTVHHHEPKVKEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 SGAVWKQIYMDLGIPILNSAASYNVKTAYRKYLYGFEEYCRSANIQFRTVHHHEPKVKEE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 KKDLEESMEEALKLDQEMPLTEVKSEPEENIDSNSESEREEIELKSPRGRRRIARDVNSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 KKDLEESMEEALKLDQEMPLTEVKSEPEENIDSNSESEREEIELKSPRGRRRIARDVNSI 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 KKEIEEEKTEDKLKDNDTENKDVDDDYETAEKKENELLLGRKNTPKQKEKKIKKQEDSDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 KKEIEEEKTEDKLKDNDTENKDVDDDYETAEKKENELLLGRKNTPKQKEKKIKKQEDSDK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 DSDEEEEKSQEREETESKCDSEGEEDEEDMEPCLTGTKVKVKYGRGKTQKIYEASIKSTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 DSDEEEEKSQEREETESKCDSEGEEDEEDMEPCLTGTKVKVKYGRGKTQKIYEASIKSTE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 IDDGEVLYLVHYYGWNVRYDEWVKADRIIWPLDKGGPKKKQKKKAKNKEDSEKDEKRDEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 IDDGEVLYLVHYYGWNVRYDEWVKADRIIWPLDKGGPKKKQKKKAKNKEDSEKDEKRDEE 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE3 RQKSKRGRPPLKSTLSSNMPYGLSKTANSEGKSDSCSSDSETEDALEKNLINEELSLKDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 RQKSKRGRPPLKSTLSSNMPYGLSKTANSEGKSDSCSSDSETEDALEKNLINEELSLKDE 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE3 LEKNENLNDDKLDEENPKISAHILKENDRTQMQPLETLKLEVGENEQIVQIFGNKMEKTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 LEKNENLNDDKLDEENPKISAHILKENDRTQMQPLETLKLEVGENEQIVQIFGNKMEKTE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE3 EVKKEAEKSPKGKGRRSKTKDLSLEIIKISSFGQNEAGSEPHIEAHSLELSSLDNKNFSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 EVKKEAEKSPKGKGRRSKTKDLSLEIIKISSFGQNEAGSEPHIEAHSLELSSLDNKNFSS 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE3 ATEDEIDQCVKEKKLKRKILGQSSPEKKIRIENGMEMTNTVSQERTSDCIGSEGMKNLNF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 ATEDEIDQCVKEKKLKRKILGQSSPEKKIRIENGMEMTNTVSQERTSDCIGSEGMKNLNF 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE3 EQHFERENEGMPSLIAESNQCIQQLTSERFDSPAEETVNIPLKEDEDAMPLIGPETLVCH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 EQHFERENEGMPSLIAESNQCIQQLTSERFDSPAEETVNIPLKEDEDAMPLIGPETLVCH 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE3 EVDLDDLDEKDKTSIEDVAVESSESNSLVSIPPALPPVVQHNFSVASPLTLSQDESRSVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 EVDLDDLDEKDKTSIEDVAVESSESNSLVSIPPALPPVVQHNFSVASPLTLSQDESRSVK 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE3 SESDITIEVDSIAEESQEGLCERESANGFETNVASGTCSIIVQERESREKGQKRPSDGNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 SESDITIEVDSIAEESQEGLCERESANGFETNVASGTCSIIVQERESREKGQKRPSDGNS 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE3 GLMAKKQKRTPKRTSAAAKNEKNGTDELDNMNSTERISFLQEKLQEIRKYYMSLKSEVAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 GLMAKKQKRTPKRTSAAAKNEKNGTDELDNMNSTERISFLQEKLQEIRKYYMSLKSEVAT 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 pF1KE3 IDRRRKRLKKKDREVSHAGASMSSASSDTGMSPSSSSPPQNVLAVECR :::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 IDRRRKRLKKKDREVSHAGASMSSASSDTGMSPSSSSPPQNVLAVECR 1150 1160 1170 1180 >>CCDS45114.1 ARID4A gene_id:5926|Hs108|chr14 (1203 aa) initn: 7245 init1: 7153 opt: 7159 Z-score: 4370.0 bits: 820.6 E(32554): 0 Smith-Waterman score: 7629; 98.7% identity (98.8% similar) in 1203 aa overlap (1-1188:1-1203) 10 20 30 40 50 60 pF1KE3 MKAADEPAYLTVGTDVSAKYRGAFCEAKIKTVKRLVKVKVLLKQDNTTQLVQDDQVKGPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 MKAADEPAYLTVGTDVSAKYRGAFCEAKIKTVKRLVKVKVLLKQDNTTQLVQDDQVKGPL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 RVGAIVETRTSDGSFQEAIISKLTDASWYTVVFDDGDERTLRRTSLCLKGERHFAESETL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RVGAIVETRTSDGSFQEAIISKLTDASWYTVVFDDGDERTLRRTSLCLKGERHFAESETL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 DQLPLTNPEHFGTPVIAKKTNRGRRSSLPVTEDEKEEESSEEEDEDKRRLNDELLGKVVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 DQLPLTNPEHFGTPVIAKKTNRGRRSSLPVTEDEKEEESSEEEDEDKRRLNDELLGKVVS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 VVSATERTEWYPALVISPSCNDDITVKKDQCLVRSFIDSKFYSIARKDIKEVDILNLPES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 VVSATERTEWYPALVISPSCNDDITVKKDQCLVRSFIDSKFYSIARKDIKEVDILNLPES 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 ELSTKPGLQKASIFLKTRVVPDNWKMDISEILESSSSDDEDGPAEENDEEKEKEAKKTEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 ELSTKPGLQKASIFLKTRVVPDNWKMDISEILESSSSDDEDGPAEENDEEKEKEAKKTEE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 EVPEEELDPEERDNFLQQLYKFMEDRGTPINKPPVLGYKDLNLFKLFRLVYHQGGCDNID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 EVPEEELDPEERDNFLQQLYKFMEDRGTPINKPPVLGYKDLNLFKLFRLVYHQGGCDNID 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 SGAVWKQIYMDLGIPILNSAASYNVKTAYRKYLYGFEEYCRSANIQFRTVHHHEPKVKEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 SGAVWKQIYMDLGIPILNSAASYNVKTAYRKYLYGFEEYCRSANIQFRTVHHHEPKVKEE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 KKDLEESMEEALKLDQEMPLTEVKSEPEENIDSNSESEREEIELKSPRGRRRIARDVNSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 KKDLEESMEEALKLDQEMPLTEVKSEPEENIDSNSESEREEIELKSPRGRRRIARDVNSI 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 KKEIEEEKTEDKLKDNDTENKDVDDDYETAEKKENELLLGRKNTPKQKEKKIKKQEDSDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 KKEIEEEKTEDKLKDNDTENKDVDDDYETAEKKENELLLGRKNTPKQKEKKIKKQEDSDK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 DSDEEEEKSQEREETESKCDSEGEEDEEDMEPCLTGTKVKVKYGRGKTQKIYEASIKSTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 DSDEEEEKSQEREETESKCDSEGEEDEEDMEPCLTGTKVKVKYGRGKTQKIYEASIKSTE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 IDDGEVLYLVHYYGWNVRYDEWVKADRIIWPLDKGGPKKKQKKKAKNKEDSEKDEKRDEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 IDDGEVLYLVHYYGWNVRYDEWVKADRIIWPLDKGGPKKKQKKKAKNKEDSEKDEKRDEE 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE3 RQKSKRGRPPLKSTLSSNMPYGLSKTANSEGKSDSCSSDSETEDALEKNLINEELSLKDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RQKSKRGRPPLKSTLSSNMPYGLSKTANSEGKSDSCSSDSETEDALEKNLINEELSLKDE 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE3 LEKNENLNDDKLDEENPKISAHILKENDRTQMQPLETLKLEVGENEQIVQIFGNKMEKTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LEKNENLNDDKLDEENPKISAHILKENDRTQMQPLETLKLEVGENEQIVQIFGNKMEKTE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE3 EVKKEAEKSPKGKGRRSKTKDLSLEIIKISSFGQNEAGSEPHIEAHSLELSSLDNKNFSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 EVKKEAEKSPKGKGRRSKTKDLSLEIIKISSFGQNEAGSEPHIEAHSLELSSLDNKNFSS 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE3 ATEDEIDQCVKEKKLKRKILGQSSPEKKIRIENGMEMTNTVSQERTSDCIGSEGMKNLNF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 ATEDEIDQCVKEKKLKRKILGQSSPEKKIRIENGMEMTNTVSQERTSDCIGSEGMKNLNF 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE3 EQHFERENEGMPSLIAESNQCIQQLTSERFDSPAEETVNIPLKEDEDAMPLIGPETLVCH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 EQHFERENEGMPSLIAESNQCIQQLTSERFDSPAEETVNIPLKEDEDAMPLIGPETLVCH 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE3 EVDLDDLDEKDKTSIEDVAVESSESNSLVSIPPALPPVVQHNFSVASPLTLSQDESRSVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 EVDLDDLDEKDKTSIEDVAVESSESNSLVSIPPALPPVVQHNFSVASPLTLSQDESRSVK 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE3 SESDITIEVDSIAEESQEGLCERESANGFETNVASGTCSIIVQERESREKGQKRPSDGNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 SESDITIEVDSIAEESQEGLCERESANGFETNVASGTCSIIVQERESREKGQKRPSDGNS 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 pF1KE3 GLMAKKQKRTPKRTSAAAKNEKNGT---------------DELDNMNSTERISFLQEKLQ ::::::::::::::::::::::::: .::::::::::::::::::: CCDS45 GLMAKKQKRTPKRTSAAAKNEKNGTGQSSDSEDLPVLDNSNELDNMNSTERISFLQEKLQ 1090 1100 1110 1120 1130 1140 1130 1140 1150 1160 1170 1180 pF1KE3 EIRKYYMSLKSEVATIDRRRKRLKKKDREVSHAGASMSSASSDTGMSPSSSSPPQNVLAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 EIRKYYMSLKSEVATIDRRRKRLKKKDREVSHAGASMSSASSDTGMSPSSSSPPQNVLAV 1150 1160 1170 1180 1190 1200 pF1KE3 ECR ::: CCDS45 ECR >>CCDS9732.1 ARID4A gene_id:5926|Hs108|chr14 (1257 aa) initn: 7153 init1: 7153 opt: 7153 Z-score: 4366.1 bits: 820.0 E(32554): 0 Smith-Waterman score: 7282; 94.3% identity (94.3% similar) in 1220 aa overlap (1-1151:1-1220) 10 20 30 40 50 60 pF1KE3 MKAADEPAYLTVGTDVSAKYRGAFCEAKIKTVKRLVKVKVLLKQDNTTQLVQDDQVKGPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 MKAADEPAYLTVGTDVSAKYRGAFCEAKIKTVKRLVKVKVLLKQDNTTQLVQDDQVKGPL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 RVGAIVETRTSDGSFQEAIISKLTDASWYTVVFDDGDERTLRRTSLCLKGERHFAESETL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 RVGAIVETRTSDGSFQEAIISKLTDASWYTVVFDDGDERTLRRTSLCLKGERHFAESETL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 DQLPLTNPEHFGTPVIAKKTNRGRRSSLPVTEDEKEEESSEEEDEDKRRLNDELLGKVVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 DQLPLTNPEHFGTPVIAKKTNRGRRSSLPVTEDEKEEESSEEEDEDKRRLNDELLGKVVS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 VVSATERTEWYPALVISPSCNDDITVKKDQCLVRSFIDSKFYSIARKDIKEVDILNLPES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 VVSATERTEWYPALVISPSCNDDITVKKDQCLVRSFIDSKFYSIARKDIKEVDILNLPES 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 ELSTKPGLQKASIFLKTRVVPDNWKMDISEILESSSSDDEDGPAEENDEEKEKEAKKTEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 ELSTKPGLQKASIFLKTRVVPDNWKMDISEILESSSSDDEDGPAEENDEEKEKEAKKTEE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 EVPEEELDPEERDNFLQQLYKFMEDRGTPINKPPVLGYKDLNLFKLFRLVYHQGGCDNID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 EVPEEELDPEERDNFLQQLYKFMEDRGTPINKPPVLGYKDLNLFKLFRLVYHQGGCDNID 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 SGAVWKQIYMDLGIPILNSAASYNVKTAYRKYLYGFEEYCRSANIQFRTVHHHEPKVKEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 SGAVWKQIYMDLGIPILNSAASYNVKTAYRKYLYGFEEYCRSANIQFRTVHHHEPKVKEE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 KKDLEESMEEALKLDQEMPLTEVKSEPEENIDSNSESEREEIELKSPRGRRRIARDVNSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 KKDLEESMEEALKLDQEMPLTEVKSEPEENIDSNSESEREEIELKSPRGRRRIARDVNSI 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 KKEIEEEKTEDKLKDNDTENKDVDDDYETAEKKENELLLGRKNTPKQKEKKIKKQEDSDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 KKEIEEEKTEDKLKDNDTENKDVDDDYETAEKKENELLLGRKNTPKQKEKKIKKQEDSDK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 DSDEEEEKSQEREETESKCDSEGEEDEEDMEPCLTGTKVKVKYGRGKTQKIYEASIKSTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 DSDEEEEKSQEREETESKCDSEGEEDEEDMEPCLTGTKVKVKYGRGKTQKIYEASIKSTE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 IDDGEVLYLVHYYGWNVRYDEWVKADRIIWPLDKGGPKKKQKKKAKNKEDSEKDEKRDEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 IDDGEVLYLVHYYGWNVRYDEWVKADRIIWPLDKGGPKKKQKKKAKNKEDSEKDEKRDEE 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE3 RQKSKRGRPPLKSTLSSNMPYGLSKTANSEGKSDSCSSDSETEDALEKNLINEELSLKDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 RQKSKRGRPPLKSTLSSNMPYGLSKTANSEGKSDSCSSDSETEDALEKNLINEELSLKDE 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE3 LEKNENLNDDKLDEENPKISAHILKENDRTQMQPLETLKLEVGENEQIVQIFGNKMEKTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 LEKNENLNDDKLDEENPKISAHILKENDRTQMQPLETLKLEVGENEQIVQIFGNKMEKTE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE3 EVKKEAEKSPKGKGRRSKTKDLSLEIIKISSFGQNEAGSEPHIEAHSLELSSLDNKNFSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 EVKKEAEKSPKGKGRRSKTKDLSLEIIKISSFGQNEAGSEPHIEAHSLELSSLDNKNFSS 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE3 ATEDEIDQCVKEKKLKRKILGQSSPEKKIRIENGMEMTNTVSQERTSDCIGSEGMKNLNF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 ATEDEIDQCVKEKKLKRKILGQSSPEKKIRIENGMEMTNTVSQERTSDCIGSEGMKNLNF 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE3 EQHFERENEGMPSLIAESNQCIQQLTSERFDSPAEETVNIPLKEDEDAMPLIGPETLVCH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 EQHFERENEGMPSLIAESNQCIQQLTSERFDSPAEETVNIPLKEDEDAMPLIGPETLVCH 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE3 EVDLDDLDEKDKTSIEDVAVESSESNSLVSIPPALPPVVQHNFSVASPLTLSQDESRSVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 EVDLDDLDEKDKTSIEDVAVESSESNSLVSIPPALPPVVQHNFSVASPLTLSQDESRSVK 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE3 SESDITIEVDSIAEESQEGLCERESANGFETNVASGTCSIIVQERESREKGQKRPSDGNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 SESDITIEVDSIAEESQEGLCERESANGFETNVASGTCSIIVQERESREKGQKRPSDGNS 1030 1040 1050 1060 1070 1080 1090 1100 pF1KE3 GLMAKKQKRTPKRTSAAAKNEKNGT----------------------------------- ::::::::::::::::::::::::: CCDS97 GLMAKKQKRTPKRTSAAAKNEKNGTGQSSDSEDLPVLDNSSKCTPVKHLNVSKPQKLARS 1090 1100 1110 1120 1130 1140 1110 1120 1130 pF1KE3 ----------------------------------DELDNMNSTERISFLQEKLQEIRKYY .::::::::::::::::::::::::: CCDS97 PARISPHIKDGEKDKHREKHPNSSPRTYKWSFQLNELDNMNSTERISFLQEKLQEIRKYY 1150 1160 1170 1180 1190 1200 1140 1150 1160 1170 1180 pF1KE3 MSLKSEVATIDRRRKRLKKKDREVSHAGASMSSASSDTGMSPSSSSPPQNVLAVECR :::::::::::::::::::: CCDS97 MSLKSEVATIDRRRKRLKKKDREVSHAGASMSSASSDTGMSPSSSSPPQNVLAVECR 1210 1220 1230 1240 1250 >>CCDS31061.1 ARID4B gene_id:51742|Hs108|chr1 (1312 aa) initn: 1999 init1: 846 opt: 2442 Z-score: 1500.0 bits: 289.7 E(32554): 3.2e-77 Smith-Waterman score: 2681; 43.7% identity (67.2% similar) in 1216 aa overlap (1-1136:1-1179) 10 20 30 40 50 60 pF1KE3 MKAADEPAYLTVGTDVSAKYRGAFCEAKIKTVKRLVKVKVLLKQDNTTQLVQDDQVKGPL ::: ::: :::::::::::::::::::::::.:::::::: ...:..: ::::..:::: CCDS31 MKALDEPPYLTVGTDVSAKYRGAFCEAKIKTAKRLVKVKVTFRHDSSTVEVQDDHIKGPL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 RVGAIVETRTSDGSFQEAIISKLTDASWYTVVFDDGDERTLRRTSLCLKGERHFAESETL .::::::... ::..:::.:.:::::::::::::::::.::::.:::::::::::::::: CCDS31 KVGAIVEVKNLDGAYQEAVINKLTDASWYTVVFDDGDEKTLRRSSLCLKGERHFAESETL 70 80 90 100 110 120 130 140 150 160 170 pF1KE3 DQLPLTNPEHFGTPVIAKKTNRGRRSS-LPVTEDEKEEESSEEEDEDKRRLNDELLGKVV ::::::::::::::::.:::::::::. .: .:. :: .:::: :. :::::::: CCDS31 DQLPLTNPEHFGTPVIGKKTNRGRRSNHIP---EEESSSSSSDEDEDDRKQIDELLGKVV 130 140 150 160 170 180 190 200 210 220 230 pF1KE3 SV--VSATERTE-WYPALVISPSCNDDITVKKDQCLVRSFIDSKFYSIARKDIKEVDILN : .: .. :.::::. :.:.:.:.::::. ::::: :.:: :. :::..:. . CCDS31 CVDYISLDKKKALWFPALVVCPDCSDEIAVKKDNILVRSFKDGKFTSVPRKDVHEITSDT 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE3 LPESELSTKPGLQKASIFLKTRVVPDNWKMDISEILESSSSDDEDGPAEENDEEKEKEAK :. . : ....: : :.:..: ::: ...: .::::. :. ::.:.::::: . CCDS31 APKPDAVLKQAFEQALEFHKSRTIPANWKTELKE--DSSSSEAEE-EEEEEDDEKEKEDN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE3 KTEEEVPEEELDP--EERDNFLQQLYKFMEDRGTPINKPPVLGYKDLNLFKLFRLVYHQG ..::: ::..: :::.::::::::::::::::::: :::::..::::::::::.. : CCDS31 SSEEE---EEIEPFPEERENFLQQLYKFMEDRGTPINKRPVLGYRNLNLFKLFRLVHKLG 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE3 GCDNIDSGAVWKQIYMDLGIPILNSAASYNVKTAYRKYLYGFEEYCRSANIQFRTVHHHE : :::.:::::::.:.:::::.:::::.:::: ::.:::::::::::::::.:. . : CCDS31 GFDNIESGAVWKQVYQDLGIPVLNSAAGYNVKCAYKKYLYGFEEYCRSANIEFQMALP-E 360 370 380 390 400 410 420 430 440 450 460 pF1KE3 PKVKEEKKDLEESMEEALKLDQEMPLTEVKSEPEENIDSNSESERE-EIE----LKSPRG :... :. :. : .: ..: . :.: : :.:: :. : ::: .: : CCDS31 KVVNKQCKECENVKEIKVKEENETEIKEIKMEEERNIIPREEKPIEDEIERKENIKPSLG 420 430 440 450 460 470 470 480 490 500 510 520 pF1KE3 RRRIARDVNSIKKEIEEEKTEDKLKDNDTEN-KDVDDDYETAEKKENELLLGRKNTPKQK .. ..:: . ..:: . : .:.:: : ::: .... : . .... :. CCDS31 SKKNL--LESIPTHSDQEKEVNIKKPEDNENLDDKDDDTTRVDESLNIKVEAEEEKAKSG 480 490 500 510 520 530 540 550 560 570 580 pF1KE3 EKKIKKQEDSDKDSDEEEEKSQEREETESKCDSEGEEDEEDMEPCLTGTKVKVKYGRGKT .. .:.:: : . ::::. .:.:: :. :.. ::. : . : : ::.:.:::::. CCDS31 DET-NKEEDEDDEEAEEEEEEEEEEEDEDDDDNNEEEEFECYPP---GMKVQVRYGRGKN 530 540 550 560 570 580 590 600 610 620 630 640 pF1KE3 QKIYEASIKSTEIDDGEVLYLVHYYGWNVRYDEWVKADRIIWPLDKGGPKKKQKKKAKNK ::.::::::..... ::::::::: :::::::::.:::.:. : ::. :: :..:: ::: CCDS31 QKMYEASIKDSDVEGGEVLYLVHYCGWNVRYDEWIKADKIVRPADKNVPKIKHRKKIKNK 590 600 610 620 630 640 650 660 670 680 690 pF1KE3 EDSEKD--EKRDEERQKSKR-GRPPLKSTLSSNM--PYGLSKTANSEGK----------- :.::: :: . . : .: ..::.... : .: :. . ::. CCDS31 LDKEKDKDEKYSPKNCKLRRLSKPPFQTNPSPEMVSKLDLTDAKNSDTAHIKSIEITSIL 650 660 670 680 690 700 700 710 720 730 pF1KE3 -----SDSCSSDSETED---ALEKNLINEELSLKDELEKNEN-------LNDDKLDEENP :.: . ::: :: : . . ..: : :.: .:.: :...: ::: CCDS31 NGLQASESSAEDSEQEDERGAQDMDNNGKEESKIDHLTNNRNDLISKEEQNSSSLLEENK 710 720 730 740 750 760 740 750 760 770 780 790 pF1KE3 K-----ISAHILKENDRTQMQPLETLKLEVGENEQIVQIFGNKMEKTEEVKKEA-EKSPK :: . : .: . . .:.:. .. .:. : .: ..:::.. .:: : CCDS31 VHADLVISKPVSKSPERLR-KDIEVLSEDTDYEEDEVT------KKRKDVKKDTTDKSSK 770 780 790 800 810 800 810 820 830 840 850 pF1KE3 GKGRRSKTKDLSLE-IIKISSFGQNEAGSEPHIEAHSLELSSLDNKNFSSATEDEIDQCV . .:.: . . : .: .: :..: .:.. : ..:.. ::. ::: . . CCDS31 PQIKRGKRRYCNTEECLKTGSPGKKEE------KAKNKESLCMENSSNSSSDEDEEETKA 820 830 840 850 860 870 860 870 880 890 900 910 pF1KE3 KEKKLKRKILGQSSPEKKIRIENGMEMTNTVSQERTSDCIGSEGMKNLNFEQHFERENEG : : : : .:..: . . . :...: . .:. . :. . .:.. CCDS31 KMTPTK-KYNGLEEKRKSLRTTGFYSGFSEVAEKRIKLLNNSD--ERLQNSRAKDRKDVW 880 890 900 910 920 920 930 940 950 960 pF1KE3 MPSLIAESNQCIQQLTSERFDSPAEETVNIPLKED---EDAMPLIGPETLVCHEVDLD-- .. ...: :. :. : . : :. :... .. : :.:. CCDS31 SSIQGQWPKKTLKELFSDS-DTEAAASPPHPAPEEGVAEESLQTVAEEESCSPSVELEKP 930 940 950 960 970 980 970 980 990 1000 pF1KE3 ---DLDEK---DKT-SIEDVAVE--SSESNSLVSIPPALP--PVV---------QHNFSV ..: : .:: ..: .: :: :::... ::. : : : . .: CCDS31 PPVNVDSKPIEEKTVEVNDRKAEFPSSGSNSVLNTPPTTPESPSSVTVTEGSRQQSSVTV 990 1000 1010 1020 1030 1040 1010 1020 1030 1040 1050 1060 pF1KE3 ASPLTLSQDESRSVKSESDITIEVDSIAEESQEGLCERESA-NGFETNVASGTCSIIVQE . ::. .:.: ::.:::.: ::::::.: : :. : .:. ::...:.:.. . : CCDS31 SEPLAPNQEEVRSIKSETDSTIEVDSVAGELQDLQSEGNSSPAGFDASVSSSSSNQPEPE 1050 1060 1070 1080 1090 1100 1070 1080 1090 1100 1110 1120 pF1KE3 R-ESREKGQKRPSDGNSG-LMAKKQKRTPKRTSAAAKNEKNGTDELDN--MNSTERISFL . :. :::: .:...: .:::::. : : . :.. .::. :. ... : :. CCDS31 HPEKACTGQKRVKDAQGGGSSSKKQKRSHKATVVNNKKKGKGTNSSDSEELSAGESIT-- 1110 1120 1130 1140 1150 1160 1130 1140 1150 1160 1170 1180 pF1KE3 QEKLQEIRKYYMSLKSEVATIDRRRKRLKKKDREVSHAGASMSSASSDTGMSPSSSSPPQ : : ... ..:: CCDS31 --KSQPVKSVSTGMKSHSTKSPARTQSPGKCGKNGDKDPDLKEPSNRLPKVYKWSFQMSD 1170 1180 1190 1200 1210 1220 >>CCDS31060.1 ARID4B gene_id:51742|Hs108|chr1 (1226 aa) initn: 2010 init1: 846 opt: 1937 Z-score: 1193.1 bits: 232.8 E(32554): 3.9e-60 Smith-Waterman score: 2380; 40.0% identity (61.0% similar) in 1326 aa overlap (1-1183:1-1205) 10 20 30 40 50 60 pF1KE3 MKAADEPAYLTVGTDVSAKYRGAFCEAKIKTVKRLVKVKVLLKQDNTTQLVQDDQVKGPL ::: ::: :::::::::::::::::::::::.:::::::: ...:..: ::::..:::: CCDS31 MKALDEPPYLTVGTDVSAKYRGAFCEAKIKTAKRLVKVKVTFRHDSSTVEVQDDHIKGPL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 RVGAIVETRTSDGSFQEAIISKLTDASWYTVVFDDGDERTLRRTSLCLKGERHFAESETL .::::::... ::..:::.:.:::::::::::::::::.::::.:::::::::::::::: CCDS31 KVGAIVEVKNLDGAYQEAVINKLTDASWYTVVFDDGDEKTLRRSSLCLKGERHFAESETL 70 80 90 100 110 120 130 140 150 160 170 pF1KE3 DQLPLTNPEHFGTPVIAKKTNRGRRSS-LPVTEDEKEEESSEEEDEDKRRLNDELLGKVV ::::::::::::::::.:::::::::. .: .:. :: .:::: :. :::::::: CCDS31 DQLPLTNPEHFGTPVIGKKTNRGRRSNHIP---EEESSSSSSDEDEDDRKQIDELLGKVV 130 140 150 160 170 180 190 200 210 220 230 pF1KE3 SV--VSATERTE-WYPALVISPSCNDDITVKKDQCLVRSFIDSKFYSIARKDIKEVDILN : .: .. :.::::. :.:.:.:.::::. ::::: :.:: :. :::..:. . CCDS31 CVDYISLDKKKALWFPALVVCPDCSDEIAVKKDNILVRSFKDGKFTSVPRKDVHEITSDT 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE3 LPESELSTKPGLQKASIFLKTRVVPDNWKMDISEILESSSSDDEDGPAEENDEEKEKEAK :. . : ....: : :.:..: ::: ...: .::::. :. ::.:.::::: . CCDS31 APKPDAVLKQAFEQALEFHKSRTIPANWKTELKE--DSSSSEAEE-EEEEEDDEKEKEDN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE3 KTEEEVPEEELDP--EERDNFLQQLYKFMEDRGTPINKPPVLGYKDLNLFKLFRLVYHQG ..::: ::..: :::.::::::::::::::::::: :::::..::::::::::.. : CCDS31 SSEEE---EEIEPFPEERENFLQQLYKFMEDRGTPINKRPVLGYRNLNLFKLFRLVHKLG 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE3 GCDNIDSGAVWKQIYMDLGIPILNSAASYNVKTAYRKYLYGFEEYCRSANIQFRTVHHHE : :::.:::::::.:.:::::.:::::.:::: ::.:::::::::::::::.:. . : CCDS31 GFDNIESGAVWKQVYQDLGIPVLNSAAGYNVKCAYKKYLYGFEEYCRSANIEFQ-MALPE 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE3 PKVKEEKKDLEESMEEALKLDQEMPLTEVKSEPEENIDSNSESEREEIELKSPRGRRRIA :... :. :. : .: ..: . :.: : :.:: : CCDS31 KVVNKQCKECENVKEIKVKEENETEIKEIKMEEERNI---------------------IP 420 430 440 480 490 500 510 520 530 pF1KE3 RDVNSIKKEIEEEKTEDKLKDNDTENKDVDDDYETAEKKENELLLGRKNTPKQKEKKIKK :. . :. :::.. ...: . .:.. .. : .. ..:: .::: CCDS31 REEKPIEDEIERK---ENIKPSLGSKKNLLESIPT-------------HSDQEKEVNIKK 450 460 470 480 490 540 550 560 570 580 590 pF1KE3 QEDSDKDSDEEEEKSQEREETESKCDSEGEEDEEDMEPCLTGTKVKVKYGRGKTQKIYEA ::... .:.... .. : . : ..: : :.: : CCDS31 PEDNENLDDKDDDTTRVDESLNIKVEAEEE---------------KAKSG---------- 500 510 520 600 610 620 630 640 650 pF1KE3 SIKSTEIDDGEVLYLVHYYGWNVRYDEWVKADRIIWPLDKGGPKKKQKKKAKNKEDSEKD ::::.:::.:. : ::. :: :..:: ::: :.::: CCDS31 ------------------------YDEWIKADKIVRPADKNVPKIKHRKKIKNKLDKEKD 530 540 550 560 660 670 680 690 pF1KE3 --EKRDEERQKSKR-GRPPLKSTLSSNMPYGL-------SKTA-----------NSEGKS :: . . : .: ..::.... : .: : : :: :. : CCDS31 KDEKYSPKNCKLRRLSKPPFQTNPSPEMVSKLDLTDAKNSDTAHIKSIEITSILNGLQAS 570 580 590 600 610 620 700 710 720 730 pF1KE3 DSCSSDSETED---ALEKNLINEELSLKDELEKNEN-------LNDDKLDEENPK----- .: . ::: :: : . . ..: : :.: .:.: :...: ::: CCDS31 ESSAEDSEQEDERGAQDMDNNGKEESKIDHLTNNRNDLISKEEQNSSSLLEENKVHADLV 630 640 650 660 670 680 740 750 760 770 780 790 pF1KE3 ISAHILKENDRTQMQPLETLKLEVGENEQIVQIFGNKMEKTEEVKKEA-EKSPKGKGRRS :: . : .: . . .:.:. .. .:. : .: ..:::.. .:: : . .:. CCDS31 ISKPVSKSPERLR-KDIEVLSEDTDYEEDEVT------KKRKDVKKDTTDKSSKPQIKRG 690 700 710 720 730 800 810 820 830 840 850 pF1KE3 KTKDLSLE-IIKISSFGQNEAGSEPHIEAHSLELSSLDNKNFSSATEDEIDQCVKEKKLK : . . : .: .: :..: .:.. : ..:.. ::. ::: . .: : CCDS31 KRRYCNTEECLKTGSPGKKEE------KAKNKESLCMENSSNSSSDEDEEETKAKMTPTK 740 750 760 770 780 790 860 870 880 890 900 910 pF1KE3 RKILGQSSPEKKIRIENGMEMTNTVSQERTSDCIGSEGMKNLNFEQHFERENEGMPSLIA : : .:..: . . . :...: . .:. . :. . .:.. CCDS31 -KYNGLEEKRKSLRTTGFYSGFSEVAEKRIKLLNNSD--ERLQNSRAKDRKDVWSSIQGQ 800 810 820 830 840 920 930 940 950 960 pF1KE3 ESNQCIQQLTSERFDSPAEETVNIPLKED---EDAMPLIGPETLVCHEVDLD-----DLD .. ...: :. :. : . : :. :... .. : :.:. ..: CCDS31 WPKKTLKELFSDS-DTEAAASPPHPAPEEGVAEESLQTVAEEESCSPSVELEKPPPVNVD 850 860 870 880 890 900 970 980 990 1000 1010 pF1KE3 EK---DKT-SIEDVAVE--SSESNSLVSIPPALP--PVV---------QHNFSVASPLTL : .:: ..: .: :: :::... ::. : : : . .:. ::. CCDS31 SKPIEEKTVEVNDRKAEFPSSGSNSVLNTPPTTPESPSSVTVTEGSRQQSSVTVSEPLAP 910 920 930 940 950 960 1020 1030 1040 1050 1060 pF1KE3 SQDESRSVKSESDITIEVDSIAEESQEGLCERESA-NGFETNVASGTCSIIVQER-ESRE .:.: ::.:::.: ::::::.: : :. : .:. ::...:.:.. . :. :. CCDS31 NQEEVRSIKSETDSTIEVDSVAGELQDLQSEGNSSPAGFDASVSSSSSNQPEPEHPEKAC 970 980 990 1000 1010 1020 1070 1080 1090 pF1KE3 KGQKRPSDGNSG-LMAKKQKRT-------------------------------------- :::: .:...: .:::::. CCDS31 TGQKRVKDAQGGGSSSKKQKRSHKATVVNNKKKGKGTNSSDSEELSAGESITKSQPVKSV 1030 1040 1050 1060 1070 1080 1100 1110 pF1KE3 -----------PKRTSAAAKNEKNGT----------------------DELDNMNSTERI : ::.. .: ::: ..:.::.:.::: CCDS31 STGMKSHSTKSPARTQSPGKCGKNGDKDPDLKEPSNRLPKVYKWSFQMSDLENMTSAERI 1090 1100 1110 1120 1130 1140 1120 1130 1140 1150 1160 1170 pF1KE3 SFLQEKLQEIRKYYMSLKSEVATIDRRRKRLKKKDREVSHAGASMSSASSDTGMSPSSSS ..::::::::::.:.:::::::.:::::::::::.:: :.:.:... :::::: CCDS31 TILQEKLQEIRKHYLSLKSEVASIDRRRKRLKKKERE--------SAATSSSSSSPSSSS 1150 1160 1170 1180 1190 1180 pF1KE3 PPQNVLAVECR :. CCDS31 ITAAVMLTLAEPSMSSASQNGMSVECR 1200 1210 1220 1188 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Sep 21 11:29:37 2017 done: Thu Sep 21 11:29:38 2017 Total Scan time: 5.070 Total Display time: 0.290 Function used was FASTA [36.3.4 Apr, 2011]