FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7428, 412 aa
1>>>pF1KB7428 412 - 412 aa - 412 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.3529+/-0.000804; mu= 2.7672+/- 0.049
mean_var=290.3123+/-59.091, 0's: 0 Z-trim(118.3): 28 B-trim: 291 in 2/51
Lambda= 0.075273
statistics sampled from 19241 (19269) to 19241 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.838), E-opt: 0.2 (0.592), width: 16
Scan time: 3.260
The best scores are: opt bits E(32554)
CCDS35006.1 ARID3C gene_id:138715|Hs108|chr9 ( 412) 2820 318.8 6e-87
CCDS12050.1 ARID3A gene_id:1820|Hs108|chr19 ( 593) 841 104.0 3.8e-22
CCDS10264.1 ARID3B gene_id:10620|Hs108|chr15 ( 560) 789 98.4 1.8e-20
CCDS76777.1 ARID3B gene_id:10620|Hs108|chr15 ( 561) 789 98.4 1.8e-20
>>CCDS35006.1 ARID3C gene_id:138715|Hs108|chr9 (412 aa)
initn: 2820 init1: 2820 opt: 2820 Z-score: 1674.5 bits: 318.8 E(32554): 6e-87
Smith-Waterman score: 2820; 100.0% identity (100.0% similar) in 412 aa overlap (1-412:1-412)
10 20 30 40 50 60
pF1KB7 MEALQKQQAARLAQGVGPLAPACPLLPPQPPLPDHRTLQAPEGALGNVGAEEEEDAEEDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 MEALQKQQAARLAQGVGPLAPACPLLPPQPPLPDHRTLQAPEGALGNVGAEEEEDAEEDE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 EKREEAGAEEEAAEESRPGAQGPSSPSSQPPGLHPHEWTYEEQFKQLYELDADPKRKEFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 EKREEAGAEEEAAEESRPGAQGPSSPSSQPPGLHPHEWTYEEQFKQLYELDADPKRKEFL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 DDLFSFMQKRGTPVNRVPIMAKQVLDLYALFRLVTAKGGLVEVINRKVWREVTRGLSLPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 DDLFSFMQKRGTPVNRVPIMAKQVLDLYALFRLVTAKGGLVEVINRKVWREVTRGLSLPT
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 TITSAAFTLRTQYMKYLYPYECETRALSSPGELQAAIDSNRREGRRQAYTATPLFGLAGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 TITSAAFTLRTQYMKYLYPYECETRALSSPGELQAAIDSNRREGRRQAYTATPLFGLAGP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 PPRGAQDPALGPGPAPPATQSSPGPAQGSTSGLPAHACAQLSPSPIKKEESGIPNPCLAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 PPRGAQDPALGPGPAPPATQSSPGPAQGSTSGLPAHACAQLSPSPIKKEESGIPNPCLAL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 PVGLALGPTREKLAPEEPPEKRAVLMGPMDPPRPCMPPSFLPRGKVPLREERLDGPLNLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 PVGLALGPTREKLAPEEPPEKRAVLMGPMDPPRPCMPPSFLPRGKVPLREERLDGPLNLA
310 320 330 340 350 360
370 380 390 400 410
pF1KB7 GSGISSINMALEINGVVYTGVLFARRQPVPASQGPTNPAPPPSTGPPSSILP
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 GSGISSINMALEINGVVYTGVLFARRQPVPASQGPTNPAPPPSTGPPSSILP
370 380 390 400 410
>>CCDS12050.1 ARID3A gene_id:1820|Hs108|chr19 (593 aa)
initn: 1085 init1: 779 opt: 841 Z-score: 511.0 bits: 104.0 E(32554): 3.8e-22
Smith-Waterman score: 1007; 46.3% identity (63.5% similar) in 447 aa overlap (2-406:145-547)
10 20 30
pF1KB7 MEALQKQQAARLAQGVGPLAPACPLLPPQPP
: . .. . .:.:: .:: :
CCDS12 EDMASDEDMKPKWEEEEMEEDLGEDEEEEEEDYEDEEEEEDEEGLGPPGPAS--LGTTAL
120 130 140 150 160 170
40 50 60 70 80 90
pF1KB7 LPDHRTLQAPEGALGNVGAEEEEDAEEDEEKREEAGAEEEAAEESRPGAQGPSSPSSQPP
.: : : :.. : : : .: :. . ..::. . .:. :::
CCDS12 FP--RKAQPPQAFRG------------DGVPRVLGGQERPGPGPAHPGGAAHVAPQLQPP
180 190 200 210
100 110 120 130 140 150
pF1KB7 GLHPHEWTYEEQFKQLYELDADPKRKEFLDDLFSFMQKRGTPVNRVPIMAKQVLDLYALF
: .::::::::::::::.::::::::::::::::::::::::.::::::::::. :.
CCDS12 D-HG-DWTYEEQFKQLYELDGDPKRKEFLDDLFSFMQKRGTPVNRIPIMAKQVLDLFMLY
220 230 240 250 260 270
160 170 180 190 200 210
pF1KB7 RLVTAKGGLVEVINRKVWREVTRGLSLPTTITSAAFTLRTQYMKYLYPYECETRALSSPG
::: :::::::::.:.:::.:.::.:::.:::::::::::::::::::::: :.::.:.
CCDS12 VLVTEKGGLVEVINKKLWREITKGLNLPTSITSAAFTLRTQYMKYLYPYECEKRGLSNPN
280 290 300 310 320 330
220 230 240 250 260 270
pF1KB7 ELQAAIDSNRREGRRQAYTATPLFGLAGPPPRGAQDPALGPGPAPPATQSSPGPAQGSTS
::::::::::::::::.. .. ::. . : ::. : .: :: : : .::.
CCDS12 ELQAAIDSNRREGRRQSFGGS-LFAYS---PGGAH----GMLSSPKLPVSSLGLA-ASTN
340 350 360 370 380
280 290 300
pF1KB7 GLPAHACAQLSPSP-IKKEE-SGIPNPCLA-LPVGLALGPT-------------------
: ....:.: ::::: :.:: . :::.:: :.
CCDS12 G------SSITPAPKIKKEEDSAIPITVPGRLPVSLAGHPVVAAQAAAVQAAAAQAAVAA
390 400 410 420 430 440
310 320 330 340 350
pF1KB7 --------REKLAPEEPPEKRAVLMGPMDPP--RPCMPPSFLPRG-KVPLR--------E
:::: :::::. .:.. . . . .:: . ..:. :
CCDS12 QAAALEQLREKLESAEPPEKKMALVADEQQRLMQRALQQNFLAMAAQLPMSIRINSQASE
450 460 470 480 490 500
360 370 380 390 400
pF1KB7 ERLDGPLNLAGS-GISSINMALEINGVVYTGVLFARRQPVPASQGPTNPAPPPSTGPPSS
: :. .::.:. : .::.:..::::..::::::: :: ::: :...:
CCDS12 SRQDSAVNLTGTNGSNSISMSVEINGIMYTGVLFA--QP---------PAPTPTSAPNKG
510 520 530 540 550
410
pF1KB7 ILP
CCDS12 GGGGGGSSSNAGGRGGNTGTSGGQAGPAGLSTPSTSTSNNSLP
560 570 580 590
>>CCDS10264.1 ARID3B gene_id:10620|Hs108|chr15 (560 aa)
initn: 938 init1: 699 opt: 789 Z-score: 480.8 bits: 98.4 E(32554): 1.8e-20
Smith-Waterman score: 908; 42.9% identity (63.8% similar) in 431 aa overlap (7-409:125-532)
10 20 30
pF1KB7 MEALQKQQAARLAQGVGPLAPACPLLPPQPPLPDHR
:..:: :.:.. : : : :: :
CCDS10 DGGLEDEDGDDEVAEVAEKETQAASKYFHVQKVARQDPRVAPMSN----LLPAPGLPPH-
100 110 120 130 140
40 50 60 70 80 90
pF1KB7 TLQAPEGALGNVGAEEEEDAEEDEEKREEAGAEEEAAEESRPGAQGPSSPSSQPPGLHPH
:: : .. .:: . . :: . .:. .: . :.. : . .
CCDS10 GQQAKE--------DHTKDASKASPSVSTAGQPNWNLDEQLK-QNGGLAWSDDADGGRGR
150 160 170 180 190 200
100 110 120 130 140 150
pF1KB7 EWTYEEQFKQLYELDADPKRKEFLDDLFSFMQKRGTPVNRVPIMAKQVLDLYALFRLVTA
: . . : .:::::.::.::::::::: ::::::::.::.::::::.:::: :..:::
CCDS10 EISRD--FAKLYELDGDPERKEFLDDLFVFMQKRGTPINRIPIMAKQILDLYMLYKLVTE
210 220 230 240 250
160 170 180 190 200 210
pF1KB7 KGGLVEVINRKVWREVTRGLSLPTTITSAAFTLRTQYMKYLYPYECETRALSSPGELQAA
::::::.::.:.:::.:.::.:::.::::::::::::::::: :::: .:::::.:::::
CCDS10 KGGLVEIINKKIWREITKGLNLPTSITSAAFTLRTQYMKYLYAYECEKKALSSPAELQAA
260 270 280 290 300 310
220 230 240 250 260 270
pF1KB7 IDSNRREGRRQAYTATPLFGLAGPPPRGAQDPALGPGPAPPATQSSPGPAQGSTSGLPAH
::.::::::: .:... ::: . : : : .:. : : . ::.:: .
CCDS10 IDGNRREGRRPSYSSS-LFGYS-PAAATAAAAAGAPALLSPPKIRFPILGLGSSSGTNT-
320 330 340 350 360 370
280 290 300 310 320
pF1KB7 ACAQLSPSPIKKEESG-----IPNPC-LALPVGLA----------LGPTREKLAPEEPPE
. ..::. .. .: .: : ::.:: :: : ::.: :: :
CCDS10 SSPRISPATTLRKGDGAPVTTVPVPNRLAVPVTLASQQAGTRTAALEQLRERLESGEPAE
380 390 400 410 420 430
330 340 350 360
pF1KB7 KRAVLMGPMDPP--RPCMPPSFLPRGK-VPL------REERLDGP---LNLAGSGISSIN
:.: .. . . . .:. .. .:. ::.: .. :::. :.:.:::
CCDS10 KKASRLSEEEQRLVQQAFQRNFFSMARQLPMKIRINGREDRAEASAAALNLTTSSIGSIN
440 450 460 470 480 490
370 380 390 400 410
pF1KB7 MALEINGVVYTGVLFARRQPVPASQGPTNPAPPPSTGPPSSILP
:...:.:..:.:::::.. :. . :. :: : : .:
CCDS10 MSVDIDGTTYAGVLFAQK---PVVHLITGSAPQ-SLGSSASSSSSSHCSPSPTSSRGTPS
500 510 520 530 540 550
CCDS10 AEPSTSWSL
560
>>CCDS76777.1 ARID3B gene_id:10620|Hs108|chr15 (561 aa)
initn: 938 init1: 699 opt: 789 Z-score: 480.8 bits: 98.4 E(32554): 1.8e-20
Smith-Waterman score: 904; 43.1% identity (62.7% similar) in 432 aa overlap (7-409:125-533)
10 20 30
pF1KB7 MEALQKQQAARLAQGVGPLAPACPLLPPQPPLPDHR
:..:: :.:.. : : : :: :
CCDS76 DGGLEDEDGDDEVAEVAEKETQAASKYFHVQKVARQDPRVAPMSN----LLPAPGLPPH-
100 110 120 130 140
40 50 60 70 80 90
pF1KB7 TLQAPEGALGNVGAEEEEDAEEDEEKREEAGAEEEAAEESRPGAQGPSSPSSQPPGLHPH
:: : .. .:: . . :: . .:. .: . :.. : . .
CCDS76 GQQAKE--------DHTKDASKASPSVSTAGQPNWNLDEQLK-QNGGLAWSDDADGGRGR
150 160 170 180 190 200
100 110 120 130 140 150
pF1KB7 EWTYEEQFKQLYELDADPKRKEFLDDLFSFMQKRGTPVNRVPIMAKQVLDLYALFRLVTA
: . . : .:::::.::.::::::::: ::::::::.::.::::::.:::: :..:::
CCDS76 EISRD--FAKLYELDGDPERKEFLDDLFVFMQKRGTPINRIPIMAKQILDLYMLYKLVTE
210 220 230 240 250
160 170 180 190 200 210
pF1KB7 KGGLVEVINRKVWREVTRGLSLPTTITSAAFTLRTQYMKYLYPYECETRALSSPGELQAA
::::::.::.:.:::.:.::.:::.::::::::::::::::: :::: .:::::.:::::
CCDS76 KGGLVEIINKKIWREITKGLNLPTSITSAAFTLRTQYMKYLYAYECEKKALSSPAELQAA
260 270 280 290 300 310
220 230 240 250 260 270
pF1KB7 IDSNRREGRRQAYTATPLFGLAGPPPRGAQDPALGPGPAPPATQSSPGPAQGSTSGLPAH
::.::::::: .:... ::: . : : : .:. : : . ::.:: .
CCDS76 IDGNRREGRRPSYSSS-LFGYS-PAAATAAAAAGAPALLSPPKIRFPILGLGSSSGTNT-
320 330 340 350 360 370
280 290 300 310 320
pF1KB7 ACAQLSPSPIKKEESG-----IPNPC-LALPVGLA----------LGPTREKLAPEEPPE
. ..::. .. .: .: : ::.:: :: : ::.: :: :
CCDS76 SSPRISPATTLRKGDGAPVTTVPVPNRLAVPVTLASQQAGTRTAALEQLRERLESGEPAE
380 390 400 410 420 430
330 340 350 360
pF1KB7 KRAVLMGPMDPP--RPCMPPSF------LP-----RGKVPLREERLDGPLNLAGSGISSI
:.: .. . . . .: :: :.. : : . :::. :.:.::
CCDS76 KKASRLSEEEQRLVQQAFQRNFFSMARQLPMKIRINGRAEDRAEASAAALNLTTSSIGSI
440 450 460 470 480 490
370 380 390 400 410
pF1KB7 NMALEINGVVYTGVLFARRQPVPASQGPTNPAPPPSTGPPSSILP
::...:.:..:.:::::.. :. . :. :: : : .:
CCDS76 NMSVDIDGTTYAGVLFAQK---PVVHLITGSAPQ-SLGSSASSSSSSHCSPSPTSSRGTP
500 510 520 530 540 550
CCDS76 SAEPSTSWSL
560
412 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 07:42:22 2016 done: Fri Nov 4 07:42:23 2016
Total Scan time: 3.260 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]