FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3393, 1188 aa
1>>>pF1KE3393 1188 - 1188 aa - 1188 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.5827+/-0.00125; mu= 3.4843+/- 0.076
mean_var=270.2130+/-52.721, 0's: 0 Z-trim(109.8): 61 B-trim: 9 in 1/54
Lambda= 0.078023
statistics sampled from 11106 (11149) to 11106 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.657), E-opt: 0.2 (0.342), width: 16
Scan time: 5.070
The best scores are: opt bits E(32554)
CCDS9733.1 ARID4A gene_id:5926|Hs108|chr14 (1188) 7675 878.7 0
CCDS45114.1 ARID4A gene_id:5926|Hs108|chr14 (1203) 7159 820.6 0
CCDS9732.1 ARID4A gene_id:5926|Hs108|chr14 (1257) 7153 820.0 0
CCDS31061.1 ARID4B gene_id:51742|Hs108|chr1 (1312) 2442 289.7 3.2e-77
CCDS31060.1 ARID4B gene_id:51742|Hs108|chr1 (1226) 1937 232.8 3.9e-60
>>CCDS9733.1 ARID4A gene_id:5926|Hs108|chr14 (1188 aa)
initn: 7675 init1: 7675 opt: 7675 Z-score: 4684.0 bits: 878.7 E(32554): 0
Smith-Waterman score: 7675; 100.0% identity (100.0% similar) in 1188 aa overlap (1-1188:1-1188)
10 20 30 40 50 60
pF1KE3 MKAADEPAYLTVGTDVSAKYRGAFCEAKIKTVKRLVKVKVLLKQDNTTQLVQDDQVKGPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 MKAADEPAYLTVGTDVSAKYRGAFCEAKIKTVKRLVKVKVLLKQDNTTQLVQDDQVKGPL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 RVGAIVETRTSDGSFQEAIISKLTDASWYTVVFDDGDERTLRRTSLCLKGERHFAESETL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 RVGAIVETRTSDGSFQEAIISKLTDASWYTVVFDDGDERTLRRTSLCLKGERHFAESETL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 DQLPLTNPEHFGTPVIAKKTNRGRRSSLPVTEDEKEEESSEEEDEDKRRLNDELLGKVVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 DQLPLTNPEHFGTPVIAKKTNRGRRSSLPVTEDEKEEESSEEEDEDKRRLNDELLGKVVS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 VVSATERTEWYPALVISPSCNDDITVKKDQCLVRSFIDSKFYSIARKDIKEVDILNLPES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 VVSATERTEWYPALVISPSCNDDITVKKDQCLVRSFIDSKFYSIARKDIKEVDILNLPES
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 ELSTKPGLQKASIFLKTRVVPDNWKMDISEILESSSSDDEDGPAEENDEEKEKEAKKTEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 ELSTKPGLQKASIFLKTRVVPDNWKMDISEILESSSSDDEDGPAEENDEEKEKEAKKTEE
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 EVPEEELDPEERDNFLQQLYKFMEDRGTPINKPPVLGYKDLNLFKLFRLVYHQGGCDNID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 EVPEEELDPEERDNFLQQLYKFMEDRGTPINKPPVLGYKDLNLFKLFRLVYHQGGCDNID
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 SGAVWKQIYMDLGIPILNSAASYNVKTAYRKYLYGFEEYCRSANIQFRTVHHHEPKVKEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 SGAVWKQIYMDLGIPILNSAASYNVKTAYRKYLYGFEEYCRSANIQFRTVHHHEPKVKEE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 KKDLEESMEEALKLDQEMPLTEVKSEPEENIDSNSESEREEIELKSPRGRRRIARDVNSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 KKDLEESMEEALKLDQEMPLTEVKSEPEENIDSNSESEREEIELKSPRGRRRIARDVNSI
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 KKEIEEEKTEDKLKDNDTENKDVDDDYETAEKKENELLLGRKNTPKQKEKKIKKQEDSDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 KKEIEEEKTEDKLKDNDTENKDVDDDYETAEKKENELLLGRKNTPKQKEKKIKKQEDSDK
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 DSDEEEEKSQEREETESKCDSEGEEDEEDMEPCLTGTKVKVKYGRGKTQKIYEASIKSTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 DSDEEEEKSQEREETESKCDSEGEEDEEDMEPCLTGTKVKVKYGRGKTQKIYEASIKSTE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 IDDGEVLYLVHYYGWNVRYDEWVKADRIIWPLDKGGPKKKQKKKAKNKEDSEKDEKRDEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 IDDGEVLYLVHYYGWNVRYDEWVKADRIIWPLDKGGPKKKQKKKAKNKEDSEKDEKRDEE
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 RQKSKRGRPPLKSTLSSNMPYGLSKTANSEGKSDSCSSDSETEDALEKNLINEELSLKDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 RQKSKRGRPPLKSTLSSNMPYGLSKTANSEGKSDSCSSDSETEDALEKNLINEELSLKDE
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 LEKNENLNDDKLDEENPKISAHILKENDRTQMQPLETLKLEVGENEQIVQIFGNKMEKTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 LEKNENLNDDKLDEENPKISAHILKENDRTQMQPLETLKLEVGENEQIVQIFGNKMEKTE
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 EVKKEAEKSPKGKGRRSKTKDLSLEIIKISSFGQNEAGSEPHIEAHSLELSSLDNKNFSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 EVKKEAEKSPKGKGRRSKTKDLSLEIIKISSFGQNEAGSEPHIEAHSLELSSLDNKNFSS
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 ATEDEIDQCVKEKKLKRKILGQSSPEKKIRIENGMEMTNTVSQERTSDCIGSEGMKNLNF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 ATEDEIDQCVKEKKLKRKILGQSSPEKKIRIENGMEMTNTVSQERTSDCIGSEGMKNLNF
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE3 EQHFERENEGMPSLIAESNQCIQQLTSERFDSPAEETVNIPLKEDEDAMPLIGPETLVCH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 EQHFERENEGMPSLIAESNQCIQQLTSERFDSPAEETVNIPLKEDEDAMPLIGPETLVCH
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 EVDLDDLDEKDKTSIEDVAVESSESNSLVSIPPALPPVVQHNFSVASPLTLSQDESRSVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 EVDLDDLDEKDKTSIEDVAVESSESNSLVSIPPALPPVVQHNFSVASPLTLSQDESRSVK
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE3 SESDITIEVDSIAEESQEGLCERESANGFETNVASGTCSIIVQERESREKGQKRPSDGNS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 SESDITIEVDSIAEESQEGLCERESANGFETNVASGTCSIIVQERESREKGQKRPSDGNS
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE3 GLMAKKQKRTPKRTSAAAKNEKNGTDELDNMNSTERISFLQEKLQEIRKYYMSLKSEVAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 GLMAKKQKRTPKRTSAAAKNEKNGTDELDNMNSTERISFLQEKLQEIRKYYMSLKSEVAT
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180
pF1KE3 IDRRRKRLKKKDREVSHAGASMSSASSDTGMSPSSSSPPQNVLAVECR
::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 IDRRRKRLKKKDREVSHAGASMSSASSDTGMSPSSSSPPQNVLAVECR
1150 1160 1170 1180
>>CCDS45114.1 ARID4A gene_id:5926|Hs108|chr14 (1203 aa)
initn: 7245 init1: 7153 opt: 7159 Z-score: 4370.0 bits: 820.6 E(32554): 0
Smith-Waterman score: 7629; 98.7% identity (98.8% similar) in 1203 aa overlap (1-1188:1-1203)
10 20 30 40 50 60
pF1KE3 MKAADEPAYLTVGTDVSAKYRGAFCEAKIKTVKRLVKVKVLLKQDNTTQLVQDDQVKGPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 MKAADEPAYLTVGTDVSAKYRGAFCEAKIKTVKRLVKVKVLLKQDNTTQLVQDDQVKGPL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 RVGAIVETRTSDGSFQEAIISKLTDASWYTVVFDDGDERTLRRTSLCLKGERHFAESETL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 RVGAIVETRTSDGSFQEAIISKLTDASWYTVVFDDGDERTLRRTSLCLKGERHFAESETL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 DQLPLTNPEHFGTPVIAKKTNRGRRSSLPVTEDEKEEESSEEEDEDKRRLNDELLGKVVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 DQLPLTNPEHFGTPVIAKKTNRGRRSSLPVTEDEKEEESSEEEDEDKRRLNDELLGKVVS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 VVSATERTEWYPALVISPSCNDDITVKKDQCLVRSFIDSKFYSIARKDIKEVDILNLPES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 VVSATERTEWYPALVISPSCNDDITVKKDQCLVRSFIDSKFYSIARKDIKEVDILNLPES
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 ELSTKPGLQKASIFLKTRVVPDNWKMDISEILESSSSDDEDGPAEENDEEKEKEAKKTEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 ELSTKPGLQKASIFLKTRVVPDNWKMDISEILESSSSDDEDGPAEENDEEKEKEAKKTEE
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 EVPEEELDPEERDNFLQQLYKFMEDRGTPINKPPVLGYKDLNLFKLFRLVYHQGGCDNID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 EVPEEELDPEERDNFLQQLYKFMEDRGTPINKPPVLGYKDLNLFKLFRLVYHQGGCDNID
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 SGAVWKQIYMDLGIPILNSAASYNVKTAYRKYLYGFEEYCRSANIQFRTVHHHEPKVKEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 SGAVWKQIYMDLGIPILNSAASYNVKTAYRKYLYGFEEYCRSANIQFRTVHHHEPKVKEE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 KKDLEESMEEALKLDQEMPLTEVKSEPEENIDSNSESEREEIELKSPRGRRRIARDVNSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 KKDLEESMEEALKLDQEMPLTEVKSEPEENIDSNSESEREEIELKSPRGRRRIARDVNSI
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 KKEIEEEKTEDKLKDNDTENKDVDDDYETAEKKENELLLGRKNTPKQKEKKIKKQEDSDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 KKEIEEEKTEDKLKDNDTENKDVDDDYETAEKKENELLLGRKNTPKQKEKKIKKQEDSDK
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 DSDEEEEKSQEREETESKCDSEGEEDEEDMEPCLTGTKVKVKYGRGKTQKIYEASIKSTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 DSDEEEEKSQEREETESKCDSEGEEDEEDMEPCLTGTKVKVKYGRGKTQKIYEASIKSTE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 IDDGEVLYLVHYYGWNVRYDEWVKADRIIWPLDKGGPKKKQKKKAKNKEDSEKDEKRDEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 IDDGEVLYLVHYYGWNVRYDEWVKADRIIWPLDKGGPKKKQKKKAKNKEDSEKDEKRDEE
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 RQKSKRGRPPLKSTLSSNMPYGLSKTANSEGKSDSCSSDSETEDALEKNLINEELSLKDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 RQKSKRGRPPLKSTLSSNMPYGLSKTANSEGKSDSCSSDSETEDALEKNLINEELSLKDE
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 LEKNENLNDDKLDEENPKISAHILKENDRTQMQPLETLKLEVGENEQIVQIFGNKMEKTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 LEKNENLNDDKLDEENPKISAHILKENDRTQMQPLETLKLEVGENEQIVQIFGNKMEKTE
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 EVKKEAEKSPKGKGRRSKTKDLSLEIIKISSFGQNEAGSEPHIEAHSLELSSLDNKNFSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 EVKKEAEKSPKGKGRRSKTKDLSLEIIKISSFGQNEAGSEPHIEAHSLELSSLDNKNFSS
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 ATEDEIDQCVKEKKLKRKILGQSSPEKKIRIENGMEMTNTVSQERTSDCIGSEGMKNLNF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 ATEDEIDQCVKEKKLKRKILGQSSPEKKIRIENGMEMTNTVSQERTSDCIGSEGMKNLNF
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE3 EQHFERENEGMPSLIAESNQCIQQLTSERFDSPAEETVNIPLKEDEDAMPLIGPETLVCH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 EQHFERENEGMPSLIAESNQCIQQLTSERFDSPAEETVNIPLKEDEDAMPLIGPETLVCH
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 EVDLDDLDEKDKTSIEDVAVESSESNSLVSIPPALPPVVQHNFSVASPLTLSQDESRSVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 EVDLDDLDEKDKTSIEDVAVESSESNSLVSIPPALPPVVQHNFSVASPLTLSQDESRSVK
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE3 SESDITIEVDSIAEESQEGLCERESANGFETNVASGTCSIIVQERESREKGQKRPSDGNS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 SESDITIEVDSIAEESQEGLCERESANGFETNVASGTCSIIVQERESREKGQKRPSDGNS
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120
pF1KE3 GLMAKKQKRTPKRTSAAAKNEKNGT---------------DELDNMNSTERISFLQEKLQ
::::::::::::::::::::::::: .:::::::::::::::::::
CCDS45 GLMAKKQKRTPKRTSAAAKNEKNGTGQSSDSEDLPVLDNSNELDNMNSTERISFLQEKLQ
1090 1100 1110 1120 1130 1140
1130 1140 1150 1160 1170 1180
pF1KE3 EIRKYYMSLKSEVATIDRRRKRLKKKDREVSHAGASMSSASSDTGMSPSSSSPPQNVLAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 EIRKYYMSLKSEVATIDRRRKRLKKKDREVSHAGASMSSASSDTGMSPSSSSPPQNVLAV
1150 1160 1170 1180 1190 1200
pF1KE3 ECR
:::
CCDS45 ECR
>>CCDS9732.1 ARID4A gene_id:5926|Hs108|chr14 (1257 aa)
initn: 7153 init1: 7153 opt: 7153 Z-score: 4366.1 bits: 820.0 E(32554): 0
Smith-Waterman score: 7282; 94.3% identity (94.3% similar) in 1220 aa overlap (1-1151:1-1220)
10 20 30 40 50 60
pF1KE3 MKAADEPAYLTVGTDVSAKYRGAFCEAKIKTVKRLVKVKVLLKQDNTTQLVQDDQVKGPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 MKAADEPAYLTVGTDVSAKYRGAFCEAKIKTVKRLVKVKVLLKQDNTTQLVQDDQVKGPL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 RVGAIVETRTSDGSFQEAIISKLTDASWYTVVFDDGDERTLRRTSLCLKGERHFAESETL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 RVGAIVETRTSDGSFQEAIISKLTDASWYTVVFDDGDERTLRRTSLCLKGERHFAESETL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 DQLPLTNPEHFGTPVIAKKTNRGRRSSLPVTEDEKEEESSEEEDEDKRRLNDELLGKVVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 DQLPLTNPEHFGTPVIAKKTNRGRRSSLPVTEDEKEEESSEEEDEDKRRLNDELLGKVVS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 VVSATERTEWYPALVISPSCNDDITVKKDQCLVRSFIDSKFYSIARKDIKEVDILNLPES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 VVSATERTEWYPALVISPSCNDDITVKKDQCLVRSFIDSKFYSIARKDIKEVDILNLPES
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 ELSTKPGLQKASIFLKTRVVPDNWKMDISEILESSSSDDEDGPAEENDEEKEKEAKKTEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 ELSTKPGLQKASIFLKTRVVPDNWKMDISEILESSSSDDEDGPAEENDEEKEKEAKKTEE
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 EVPEEELDPEERDNFLQQLYKFMEDRGTPINKPPVLGYKDLNLFKLFRLVYHQGGCDNID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 EVPEEELDPEERDNFLQQLYKFMEDRGTPINKPPVLGYKDLNLFKLFRLVYHQGGCDNID
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 SGAVWKQIYMDLGIPILNSAASYNVKTAYRKYLYGFEEYCRSANIQFRTVHHHEPKVKEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 SGAVWKQIYMDLGIPILNSAASYNVKTAYRKYLYGFEEYCRSANIQFRTVHHHEPKVKEE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 KKDLEESMEEALKLDQEMPLTEVKSEPEENIDSNSESEREEIELKSPRGRRRIARDVNSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 KKDLEESMEEALKLDQEMPLTEVKSEPEENIDSNSESEREEIELKSPRGRRRIARDVNSI
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 KKEIEEEKTEDKLKDNDTENKDVDDDYETAEKKENELLLGRKNTPKQKEKKIKKQEDSDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 KKEIEEEKTEDKLKDNDTENKDVDDDYETAEKKENELLLGRKNTPKQKEKKIKKQEDSDK
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 DSDEEEEKSQEREETESKCDSEGEEDEEDMEPCLTGTKVKVKYGRGKTQKIYEASIKSTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 DSDEEEEKSQEREETESKCDSEGEEDEEDMEPCLTGTKVKVKYGRGKTQKIYEASIKSTE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 IDDGEVLYLVHYYGWNVRYDEWVKADRIIWPLDKGGPKKKQKKKAKNKEDSEKDEKRDEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 IDDGEVLYLVHYYGWNVRYDEWVKADRIIWPLDKGGPKKKQKKKAKNKEDSEKDEKRDEE
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 RQKSKRGRPPLKSTLSSNMPYGLSKTANSEGKSDSCSSDSETEDALEKNLINEELSLKDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 RQKSKRGRPPLKSTLSSNMPYGLSKTANSEGKSDSCSSDSETEDALEKNLINEELSLKDE
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 LEKNENLNDDKLDEENPKISAHILKENDRTQMQPLETLKLEVGENEQIVQIFGNKMEKTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 LEKNENLNDDKLDEENPKISAHILKENDRTQMQPLETLKLEVGENEQIVQIFGNKMEKTE
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 EVKKEAEKSPKGKGRRSKTKDLSLEIIKISSFGQNEAGSEPHIEAHSLELSSLDNKNFSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 EVKKEAEKSPKGKGRRSKTKDLSLEIIKISSFGQNEAGSEPHIEAHSLELSSLDNKNFSS
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 ATEDEIDQCVKEKKLKRKILGQSSPEKKIRIENGMEMTNTVSQERTSDCIGSEGMKNLNF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 ATEDEIDQCVKEKKLKRKILGQSSPEKKIRIENGMEMTNTVSQERTSDCIGSEGMKNLNF
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE3 EQHFERENEGMPSLIAESNQCIQQLTSERFDSPAEETVNIPLKEDEDAMPLIGPETLVCH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 EQHFERENEGMPSLIAESNQCIQQLTSERFDSPAEETVNIPLKEDEDAMPLIGPETLVCH
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 EVDLDDLDEKDKTSIEDVAVESSESNSLVSIPPALPPVVQHNFSVASPLTLSQDESRSVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 EVDLDDLDEKDKTSIEDVAVESSESNSLVSIPPALPPVVQHNFSVASPLTLSQDESRSVK
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE3 SESDITIEVDSIAEESQEGLCERESANGFETNVASGTCSIIVQERESREKGQKRPSDGNS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 SESDITIEVDSIAEESQEGLCERESANGFETNVASGTCSIIVQERESREKGQKRPSDGNS
1030 1040 1050 1060 1070 1080
1090 1100
pF1KE3 GLMAKKQKRTPKRTSAAAKNEKNGT-----------------------------------
:::::::::::::::::::::::::
CCDS97 GLMAKKQKRTPKRTSAAAKNEKNGTGQSSDSEDLPVLDNSSKCTPVKHLNVSKPQKLARS
1090 1100 1110 1120 1130 1140
1110 1120 1130
pF1KE3 ----------------------------------DELDNMNSTERISFLQEKLQEIRKYY
.:::::::::::::::::::::::::
CCDS97 PARISPHIKDGEKDKHREKHPNSSPRTYKWSFQLNELDNMNSTERISFLQEKLQEIRKYY
1150 1160 1170 1180 1190 1200
1140 1150 1160 1170 1180
pF1KE3 MSLKSEVATIDRRRKRLKKKDREVSHAGASMSSASSDTGMSPSSSSPPQNVLAVECR
::::::::::::::::::::
CCDS97 MSLKSEVATIDRRRKRLKKKDREVSHAGASMSSASSDTGMSPSSSSPPQNVLAVECR
1210 1220 1230 1240 1250
>>CCDS31061.1 ARID4B gene_id:51742|Hs108|chr1 (1312 aa)
initn: 1999 init1: 846 opt: 2442 Z-score: 1500.0 bits: 289.7 E(32554): 3.2e-77
Smith-Waterman score: 2681; 43.7% identity (67.2% similar) in 1216 aa overlap (1-1136:1-1179)
10 20 30 40 50 60
pF1KE3 MKAADEPAYLTVGTDVSAKYRGAFCEAKIKTVKRLVKVKVLLKQDNTTQLVQDDQVKGPL
::: ::: :::::::::::::::::::::::.:::::::: ...:..: ::::..::::
CCDS31 MKALDEPPYLTVGTDVSAKYRGAFCEAKIKTAKRLVKVKVTFRHDSSTVEVQDDHIKGPL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 RVGAIVETRTSDGSFQEAIISKLTDASWYTVVFDDGDERTLRRTSLCLKGERHFAESETL
.::::::... ::..:::.:.:::::::::::::::::.::::.::::::::::::::::
CCDS31 KVGAIVEVKNLDGAYQEAVINKLTDASWYTVVFDDGDEKTLRRSSLCLKGERHFAESETL
70 80 90 100 110 120
130 140 150 160 170
pF1KE3 DQLPLTNPEHFGTPVIAKKTNRGRRSS-LPVTEDEKEEESSEEEDEDKRRLNDELLGKVV
::::::::::::::::.:::::::::. .: .:. :: .:::: :. ::::::::
CCDS31 DQLPLTNPEHFGTPVIGKKTNRGRRSNHIP---EEESSSSSSDEDEDDRKQIDELLGKVV
130 140 150 160 170
180 190 200 210 220 230
pF1KE3 SV--VSATERTE-WYPALVISPSCNDDITVKKDQCLVRSFIDSKFYSIARKDIKEVDILN
: .: .. :.::::. :.:.:.:.::::. ::::: :.:: :. :::..:. .
CCDS31 CVDYISLDKKKALWFPALVVCPDCSDEIAVKKDNILVRSFKDGKFTSVPRKDVHEITSDT
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE3 LPESELSTKPGLQKASIFLKTRVVPDNWKMDISEILESSSSDDEDGPAEENDEEKEKEAK
:. . : ....: : :.:..: ::: ...: .::::. :. ::.:.::::: .
CCDS31 APKPDAVLKQAFEQALEFHKSRTIPANWKTELKE--DSSSSEAEE-EEEEEDDEKEKEDN
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE3 KTEEEVPEEELDP--EERDNFLQQLYKFMEDRGTPINKPPVLGYKDLNLFKLFRLVYHQG
..::: ::..: :::.::::::::::::::::::: :::::..::::::::::.. :
CCDS31 SSEEE---EEIEPFPEERENFLQQLYKFMEDRGTPINKRPVLGYRNLNLFKLFRLVHKLG
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE3 GCDNIDSGAVWKQIYMDLGIPILNSAASYNVKTAYRKYLYGFEEYCRSANIQFRTVHHHE
: :::.:::::::.:.:::::.:::::.:::: ::.:::::::::::::::.:. . :
CCDS31 GFDNIESGAVWKQVYQDLGIPVLNSAAGYNVKCAYKKYLYGFEEYCRSANIEFQMALP-E
360 370 380 390 400 410
420 430 440 450 460
pF1KE3 PKVKEEKKDLEESMEEALKLDQEMPLTEVKSEPEENIDSNSESERE-EIE----LKSPRG
:... :. :. : .: ..: . :.: : :.:: :. : ::: .: :
CCDS31 KVVNKQCKECENVKEIKVKEENETEIKEIKMEEERNIIPREEKPIEDEIERKENIKPSLG
420 430 440 450 460 470
470 480 490 500 510 520
pF1KE3 RRRIARDVNSIKKEIEEEKTEDKLKDNDTEN-KDVDDDYETAEKKENELLLGRKNTPKQK
.. ..:: . ..:: . : .:.:: : ::: .... : . .... :.
CCDS31 SKKNL--LESIPTHSDQEKEVNIKKPEDNENLDDKDDDTTRVDESLNIKVEAEEEKAKSG
480 490 500 510 520
530 540 550 560 570 580
pF1KE3 EKKIKKQEDSDKDSDEEEEKSQEREETESKCDSEGEEDEEDMEPCLTGTKVKVKYGRGKT
.. .:.:: : . ::::. .:.:: :. :.. ::. : . : : ::.:.:::::.
CCDS31 DET-NKEEDEDDEEAEEEEEEEEEEEDEDDDDNNEEEEFECYPP---GMKVQVRYGRGKN
530 540 550 560 570 580
590 600 610 620 630 640
pF1KE3 QKIYEASIKSTEIDDGEVLYLVHYYGWNVRYDEWVKADRIIWPLDKGGPKKKQKKKAKNK
::.::::::..... ::::::::: :::::::::.:::.:. : ::. :: :..:: :::
CCDS31 QKMYEASIKDSDVEGGEVLYLVHYCGWNVRYDEWIKADKIVRPADKNVPKIKHRKKIKNK
590 600 610 620 630 640
650 660 670 680 690
pF1KE3 EDSEKD--EKRDEERQKSKR-GRPPLKSTLSSNM--PYGLSKTANSEGK-----------
:.::: :: . . : .: ..::.... : .: :. . ::.
CCDS31 LDKEKDKDEKYSPKNCKLRRLSKPPFQTNPSPEMVSKLDLTDAKNSDTAHIKSIEITSIL
650 660 670 680 690 700
700 710 720 730
pF1KE3 -----SDSCSSDSETED---ALEKNLINEELSLKDELEKNEN-------LNDDKLDEENP
:.: . ::: :: : . . ..: : :.: .:.: :...: :::
CCDS31 NGLQASESSAEDSEQEDERGAQDMDNNGKEESKIDHLTNNRNDLISKEEQNSSSLLEENK
710 720 730 740 750 760
740 750 760 770 780 790
pF1KE3 K-----ISAHILKENDRTQMQPLETLKLEVGENEQIVQIFGNKMEKTEEVKKEA-EKSPK
:: . : .: . . .:.:. .. .:. : .: ..:::.. .:: :
CCDS31 VHADLVISKPVSKSPERLR-KDIEVLSEDTDYEEDEVT------KKRKDVKKDTTDKSSK
770 780 790 800 810
800 810 820 830 840 850
pF1KE3 GKGRRSKTKDLSLE-IIKISSFGQNEAGSEPHIEAHSLELSSLDNKNFSSATEDEIDQCV
. .:.: . . : .: .: :..: .:.. : ..:.. ::. ::: . .
CCDS31 PQIKRGKRRYCNTEECLKTGSPGKKEE------KAKNKESLCMENSSNSSSDEDEEETKA
820 830 840 850 860 870
860 870 880 890 900 910
pF1KE3 KEKKLKRKILGQSSPEKKIRIENGMEMTNTVSQERTSDCIGSEGMKNLNFEQHFERENEG
: : : : .:..: . . . :...: . .:. . :. . .:..
CCDS31 KMTPTK-KYNGLEEKRKSLRTTGFYSGFSEVAEKRIKLLNNSD--ERLQNSRAKDRKDVW
880 890 900 910 920
920 930 940 950 960
pF1KE3 MPSLIAESNQCIQQLTSERFDSPAEETVNIPLKED---EDAMPLIGPETLVCHEVDLD--
.. ...: :. :. : . : :. :... .. : :.:.
CCDS31 SSIQGQWPKKTLKELFSDS-DTEAAASPPHPAPEEGVAEESLQTVAEEESCSPSVELEKP
930 940 950 960 970 980
970 980 990 1000
pF1KE3 ---DLDEK---DKT-SIEDVAVE--SSESNSLVSIPPALP--PVV---------QHNFSV
..: : .:: ..: .: :: :::... ::. : : : . .:
CCDS31 PPVNVDSKPIEEKTVEVNDRKAEFPSSGSNSVLNTPPTTPESPSSVTVTEGSRQQSSVTV
990 1000 1010 1020 1030 1040
1010 1020 1030 1040 1050 1060
pF1KE3 ASPLTLSQDESRSVKSESDITIEVDSIAEESQEGLCERESA-NGFETNVASGTCSIIVQE
. ::. .:.: ::.:::.: ::::::.: : :. : .:. ::...:.:.. . :
CCDS31 SEPLAPNQEEVRSIKSETDSTIEVDSVAGELQDLQSEGNSSPAGFDASVSSSSSNQPEPE
1050 1060 1070 1080 1090 1100
1070 1080 1090 1100 1110 1120
pF1KE3 R-ESREKGQKRPSDGNSG-LMAKKQKRTPKRTSAAAKNEKNGTDELDN--MNSTERISFL
. :. :::: .:...: .:::::. : : . :.. .::. :. ... : :.
CCDS31 HPEKACTGQKRVKDAQGGGSSSKKQKRSHKATVVNNKKKGKGTNSSDSEELSAGESIT--
1110 1120 1130 1140 1150 1160
1130 1140 1150 1160 1170 1180
pF1KE3 QEKLQEIRKYYMSLKSEVATIDRRRKRLKKKDREVSHAGASMSSASSDTGMSPSSSSPPQ
: : ... ..::
CCDS31 --KSQPVKSVSTGMKSHSTKSPARTQSPGKCGKNGDKDPDLKEPSNRLPKVYKWSFQMSD
1170 1180 1190 1200 1210 1220
>>CCDS31060.1 ARID4B gene_id:51742|Hs108|chr1 (1226 aa)
initn: 2010 init1: 846 opt: 1937 Z-score: 1193.1 bits: 232.8 E(32554): 3.9e-60
Smith-Waterman score: 2380; 40.0% identity (61.0% similar) in 1326 aa overlap (1-1183:1-1205)
10 20 30 40 50 60
pF1KE3 MKAADEPAYLTVGTDVSAKYRGAFCEAKIKTVKRLVKVKVLLKQDNTTQLVQDDQVKGPL
::: ::: :::::::::::::::::::::::.:::::::: ...:..: ::::..::::
CCDS31 MKALDEPPYLTVGTDVSAKYRGAFCEAKIKTAKRLVKVKVTFRHDSSTVEVQDDHIKGPL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 RVGAIVETRTSDGSFQEAIISKLTDASWYTVVFDDGDERTLRRTSLCLKGERHFAESETL
.::::::... ::..:::.:.:::::::::::::::::.::::.::::::::::::::::
CCDS31 KVGAIVEVKNLDGAYQEAVINKLTDASWYTVVFDDGDEKTLRRSSLCLKGERHFAESETL
70 80 90 100 110 120
130 140 150 160 170
pF1KE3 DQLPLTNPEHFGTPVIAKKTNRGRRSS-LPVTEDEKEEESSEEEDEDKRRLNDELLGKVV
::::::::::::::::.:::::::::. .: .:. :: .:::: :. ::::::::
CCDS31 DQLPLTNPEHFGTPVIGKKTNRGRRSNHIP---EEESSSSSSDEDEDDRKQIDELLGKVV
130 140 150 160 170
180 190 200 210 220 230
pF1KE3 SV--VSATERTE-WYPALVISPSCNDDITVKKDQCLVRSFIDSKFYSIARKDIKEVDILN
: .: .. :.::::. :.:.:.:.::::. ::::: :.:: :. :::..:. .
CCDS31 CVDYISLDKKKALWFPALVVCPDCSDEIAVKKDNILVRSFKDGKFTSVPRKDVHEITSDT
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE3 LPESELSTKPGLQKASIFLKTRVVPDNWKMDISEILESSSSDDEDGPAEENDEEKEKEAK
:. . : ....: : :.:..: ::: ...: .::::. :. ::.:.::::: .
CCDS31 APKPDAVLKQAFEQALEFHKSRTIPANWKTELKE--DSSSSEAEE-EEEEEDDEKEKEDN
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE3 KTEEEVPEEELDP--EERDNFLQQLYKFMEDRGTPINKPPVLGYKDLNLFKLFRLVYHQG
..::: ::..: :::.::::::::::::::::::: :::::..::::::::::.. :
CCDS31 SSEEE---EEIEPFPEERENFLQQLYKFMEDRGTPINKRPVLGYRNLNLFKLFRLVHKLG
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE3 GCDNIDSGAVWKQIYMDLGIPILNSAASYNVKTAYRKYLYGFEEYCRSANIQFRTVHHHE
: :::.:::::::.:.:::::.:::::.:::: ::.:::::::::::::::.:. . :
CCDS31 GFDNIESGAVWKQVYQDLGIPVLNSAAGYNVKCAYKKYLYGFEEYCRSANIEFQ-MALPE
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE3 PKVKEEKKDLEESMEEALKLDQEMPLTEVKSEPEENIDSNSESEREEIELKSPRGRRRIA
:... :. :. : .: ..: . :.: : :.:: :
CCDS31 KVVNKQCKECENVKEIKVKEENETEIKEIKMEEERNI---------------------IP
420 430 440
480 490 500 510 520 530
pF1KE3 RDVNSIKKEIEEEKTEDKLKDNDTENKDVDDDYETAEKKENELLLGRKNTPKQKEKKIKK
:. . :. :::.. ...: . .:.. .. : .. ..:: .:::
CCDS31 REEKPIEDEIERK---ENIKPSLGSKKNLLESIPT-------------HSDQEKEVNIKK
450 460 470 480 490
540 550 560 570 580 590
pF1KE3 QEDSDKDSDEEEEKSQEREETESKCDSEGEEDEEDMEPCLTGTKVKVKYGRGKTQKIYEA
::... .:.... .. : . : ..: : :.: :
CCDS31 PEDNENLDDKDDDTTRVDESLNIKVEAEEE---------------KAKSG----------
500 510 520
600 610 620 630 640 650
pF1KE3 SIKSTEIDDGEVLYLVHYYGWNVRYDEWVKADRIIWPLDKGGPKKKQKKKAKNKEDSEKD
::::.:::.:. : ::. :: :..:: ::: :.:::
CCDS31 ------------------------YDEWIKADKIVRPADKNVPKIKHRKKIKNKLDKEKD
530 540 550 560
660 670 680 690
pF1KE3 --EKRDEERQKSKR-GRPPLKSTLSSNMPYGL-------SKTA-----------NSEGKS
:: . . : .: ..::.... : .: : : :: :. :
CCDS31 KDEKYSPKNCKLRRLSKPPFQTNPSPEMVSKLDLTDAKNSDTAHIKSIEITSILNGLQAS
570 580 590 600 610 620
700 710 720 730
pF1KE3 DSCSSDSETED---ALEKNLINEELSLKDELEKNEN-------LNDDKLDEENPK-----
.: . ::: :: : . . ..: : :.: .:.: :...: :::
CCDS31 ESSAEDSEQEDERGAQDMDNNGKEESKIDHLTNNRNDLISKEEQNSSSLLEENKVHADLV
630 640 650 660 670 680
740 750 760 770 780 790
pF1KE3 ISAHILKENDRTQMQPLETLKLEVGENEQIVQIFGNKMEKTEEVKKEA-EKSPKGKGRRS
:: . : .: . . .:.:. .. .:. : .: ..:::.. .:: : . .:.
CCDS31 ISKPVSKSPERLR-KDIEVLSEDTDYEEDEVT------KKRKDVKKDTTDKSSKPQIKRG
690 700 710 720 730
800 810 820 830 840 850
pF1KE3 KTKDLSLE-IIKISSFGQNEAGSEPHIEAHSLELSSLDNKNFSSATEDEIDQCVKEKKLK
: . . : .: .: :..: .:.. : ..:.. ::. ::: . .: :
CCDS31 KRRYCNTEECLKTGSPGKKEE------KAKNKESLCMENSSNSSSDEDEEETKAKMTPTK
740 750 760 770 780 790
860 870 880 890 900 910
pF1KE3 RKILGQSSPEKKIRIENGMEMTNTVSQERTSDCIGSEGMKNLNFEQHFERENEGMPSLIA
: : .:..: . . . :...: . .:. . :. . .:..
CCDS31 -KYNGLEEKRKSLRTTGFYSGFSEVAEKRIKLLNNSD--ERLQNSRAKDRKDVWSSIQGQ
800 810 820 830 840
920 930 940 950 960
pF1KE3 ESNQCIQQLTSERFDSPAEETVNIPLKED---EDAMPLIGPETLVCHEVDLD-----DLD
.. ...: :. :. : . : :. :... .. : :.:. ..:
CCDS31 WPKKTLKELFSDS-DTEAAASPPHPAPEEGVAEESLQTVAEEESCSPSVELEKPPPVNVD
850 860 870 880 890 900
970 980 990 1000 1010
pF1KE3 EK---DKT-SIEDVAVE--SSESNSLVSIPPALP--PVV---------QHNFSVASPLTL
: .:: ..: .: :: :::... ::. : : : . .:. ::.
CCDS31 SKPIEEKTVEVNDRKAEFPSSGSNSVLNTPPTTPESPSSVTVTEGSRQQSSVTVSEPLAP
910 920 930 940 950 960
1020 1030 1040 1050 1060
pF1KE3 SQDESRSVKSESDITIEVDSIAEESQEGLCERESA-NGFETNVASGTCSIIVQER-ESRE
.:.: ::.:::.: ::::::.: : :. : .:. ::...:.:.. . :. :.
CCDS31 NQEEVRSIKSETDSTIEVDSVAGELQDLQSEGNSSPAGFDASVSSSSSNQPEPEHPEKAC
970 980 990 1000 1010 1020
1070 1080 1090
pF1KE3 KGQKRPSDGNSG-LMAKKQKRT--------------------------------------
:::: .:...: .:::::.
CCDS31 TGQKRVKDAQGGGSSSKKQKRSHKATVVNNKKKGKGTNSSDSEELSAGESITKSQPVKSV
1030 1040 1050 1060 1070 1080
1100 1110
pF1KE3 -----------PKRTSAAAKNEKNGT----------------------DELDNMNSTERI
: ::.. .: ::: ..:.::.:.:::
CCDS31 STGMKSHSTKSPARTQSPGKCGKNGDKDPDLKEPSNRLPKVYKWSFQMSDLENMTSAERI
1090 1100 1110 1120 1130 1140
1120 1130 1140 1150 1160 1170
pF1KE3 SFLQEKLQEIRKYYMSLKSEVATIDRRRKRLKKKDREVSHAGASMSSASSDTGMSPSSSS
..::::::::::.:.:::::::.:::::::::::.:: :.:.:... ::::::
CCDS31 TILQEKLQEIRKHYLSLKSEVASIDRRRKRLKKKERE--------SAATSSSSSSPSSSS
1150 1160 1170 1180 1190
1180
pF1KE3 PPQNVLAVECR
:.
CCDS31 ITAAVMLTLAEPSMSSASQNGMSVECR
1200 1210 1220
1188 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Sep 21 11:29:37 2017 done: Thu Sep 21 11:29:38 2017
Total Scan time: 5.070 Total Display time: 0.290
Function used was FASTA [36.3.4 Apr, 2011]