FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0485, 199 aa
1>>>pF1KE0485 199 - 199 aa - 199 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.0863+/-0.000703; mu= 13.9687+/- 0.042
mean_var=56.8995+/-11.220, 0's: 0 Z-trim(108.4): 18 B-trim: 0 in 0/53
Lambda= 0.170028
statistics sampled from 10179 (10197) to 10179 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.712), E-opt: 0.2 (0.313), width: 16
Scan time: 1.710
The best scores are: opt bits E(32554)
CCDS13981.1 APOBEC3A gene_id:200315|Hs108|chr22 ( 199) 1423 356.8 5e-99
CCDS13982.1 APOBEC3B gene_id:9582|Hs108|chr22 ( 382) 1191 300.0 1.2e-81
CCDS13984.1 APOBEC3G gene_id:60489|Hs108|chr22 ( 384) 820 209.0 3e-54
CCDS58807.1 APOBEC3B gene_id:9582|Hs108|chr22 ( 357) 804 205.1 4.2e-53
CCDS13983.1 APOBEC3C gene_id:27350|Hs108|chr22 ( 190) 417 110.0 9.3e-25
CCDS46709.1 APOBEC3D gene_id:140564|Hs108|chr22 ( 386) 382 101.6 6.6e-22
CCDS41747.1 AICDA gene_id:57379|Hs108|chr12 ( 198) 378 100.5 7.3e-22
CCDS33648.1 APOBEC3F gene_id:200316|Hs108|chr22 ( 373) 355 95.0 6.3e-20
CCDS13985.1 APOBEC3H gene_id:164668|Hs108|chr22 ( 183) 310 83.8 7.2e-17
CCDS54531.1 APOBEC3H gene_id:164668|Hs108|chr22 ( 182) 305 82.5 1.7e-16
CCDS54530.1 APOBEC3H gene_id:164668|Hs108|chr22 ( 200) 305 82.6 1.8e-16
CCDS81662.1 AICDA gene_id:57379|Hs108|chr12 ( 188) 263 72.3 2.2e-13
CCDS4848.1 APOBEC2 gene_id:10930|Hs108|chr6 ( 224) 251 69.3 1.9e-12
CCDS8579.1 APOBEC1 gene_id:339|Hs108|chr12 ( 236) 246 68.1 4.7e-12
>>CCDS13981.1 APOBEC3A gene_id:200315|Hs108|chr22 (199 aa)
initn: 1423 init1: 1423 opt: 1423 Z-score: 1891.3 bits: 356.8 E(32554): 5e-99
Smith-Waterman score: 1423; 100.0% identity (100.0% similar) in 199 aa overlap (1-199:1-199)
10 20 30 40 50 60
pF1KE0 MEASPASGPRHLMDPHIFTSNFNNGIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHNQAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MEASPASGPRHLMDPHIFTSNFNNGIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHNQAK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 NLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 NLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 RLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPWDGLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 RLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPWDGLD
130 140 150 160 170 180
190
pF1KE0 EHSQALSGRLRAILQNQGN
:::::::::::::::::::
CCDS13 EHSQALSGRLRAILQNQGN
190
>>CCDS13982.1 APOBEC3B gene_id:9582|Hs108|chr22 (382 aa)
initn: 1195 init1: 1133 opt: 1191 Z-score: 1579.4 bits: 300.0 E(32554): 1.2e-81
Smith-Waterman score: 1191; 88.6% identity (93.3% similar) in 193 aa overlap (10-199:190-382)
10 20 30
pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG---IGRHKTYLCYE
:.:::: :: :::: . :..::::::
CCDS13 FVYNEGQQFMPWYKFDENYAFLHRTLKEILRYLMDPDTFTFNFNNDPLVLRRRQTYLCYE
160 170 180 190 200 210
40 50 60 70 80 90
pF1KE0 VERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFI
:::::::: : :::: ::: :.::::::::::::::::::::::::::::::::::::::
CCDS13 VERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFI
220 230 240 250 260 270
100 110 120 130 140 150
pF1KE0 SWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYD
280 290 300 310 320 330
160 170 180 190
pF1KE0 EFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN
::..:::::: .:::::::::::.:::::::::::::::::::
CCDS13 EFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQNQGN
340 350 360 370 380
>--
initn: 377 init1: 184 opt: 380 Z-score: 504.2 bits: 101.1 E(32554): 9.2e-22
Smith-Waterman score: 380; 37.7% identity (62.3% similar) in 191 aa overlap (9-194:8-189)
10 20 30 40 50
pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG---IGRHKTYLCYEVERLDNGTSVKMDQHRGFLHN
: . : : .::.: :: :.::::: .. : : .. : ...
CCDS13 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEV-KIKRGRS-NLLWDTGVFRG
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 QAKNLLCGFYGR-HAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQE
:. : . :::. ::. . :: . ...:::.::.:: . :.... ::.:
CCDS13 QVY-----FKPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPD--CVAKLAEFLSE
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 NTHVRLRIFAARIYDY-DPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQP
. .: : : :::.: : . :..:: : .:::.:.:: :.:: .::..:: ..: :.:
CCDS13 HPNVTLTISAARLYYYWERDYRRALCRLSQAGARVTIMDYEEFAYCWENFVYNEGQQFMP
120 130 140 150 160 170
180 190
pF1KE0 WDGLDEHSQALSGRLRAILQNQGN
: .::. : :. ::
CCDS13 WYKFDENYAFLHRTLKEILRYLMDPDTFTFNFNNDPLVLRRRQTYLCYEVERLDNGTWVL
180 190 200 210 220 230
>>CCDS13984.1 APOBEC3G gene_id:60489|Hs108|chr22 (384 aa)
initn: 828 init1: 471 opt: 820 Z-score: 1087.5 bits: 209.0 E(32554): 3e-54
Smith-Waterman score: 820; 65.3% identity (77.2% similar) in 193 aa overlap (10-199:194-384)
10 20 30
pF1KE0 MEASPASGPRHLMDPHIFTSNFNNGI---GRHKTYLCYE
:: ::: :: :::: :::.::::::
CCDS13 FVYSQRELFEPWNNLPKYYILLHIMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYE
170 180 190 200 210 220
40 50 60 70 80 90
pF1KE0 VERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFI
:::. : : : ..:.:::: ::: . . :::::: :::..: .:: : :::: :
CCDS13 VERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFT
230 240 250 260 270 280
100 110 120 130 140 150
pF1KE0 SWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYD
::::::: :: :. :...: :: : ::.::::: . .:.:. : .:::..:::::.
CCDS13 SWSPCFS--CAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISIMTYS
290 300 310 320 330 340
160 170 180 190
pF1KE0 EFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN
:::::::::::::::::::::::::::: :::::::::::: :
CCDS13 EFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN
350 360 370 380
>--
initn: 295 init1: 143 opt: 348 Z-score: 461.8 bits: 93.2 E(32554): 2.1e-19
Smith-Waterman score: 348; 38.3% identity (61.7% similar) in 188 aa overlap (18-194:17-193)
10 20 30 40 50
pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG--IGRHKT-YLCYEVERLDNGTSVKMDQH--RGFL
:. :: : ..:..: .::::: . . . .: . :: .
CCDS13 MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEV-KTKGPSRPPLDAKIFRGQV
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 HNQAKNLLCGFYGRHAELRFLDLVPSL-QLDPAQIYRVTWFISWSPCFSWGCAGEVRAFL
... : : :.::. . .: : :.:::.:::::: . :. .. .::
CCDS13 YSELK--------YHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTK--CTRDMATFL
60 70 80 90 100
120 130 140 150 160
pF1KE0 QENTHVRLRIFAARIYDY-DPLYKEALQML---RDAG-AQVSIMTYDEFKHCWDTFVDHQ
:. .: : ::.::.: . :: :.:::. : ::. : ..::.::::.:::. :: :
CCDS13 AEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKIMNYDEFQHCWSKFVYSQ
110 120 130 140 150 160
170 180 190
pF1KE0 GCPFQPWDGLDEHSQALSGRLRAILQNQGN
:.::..: .. : : ::
CCDS13 RELFEPWNNLPKYYILLHIMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMH
170 180 190 200 210 220
>>CCDS58807.1 APOBEC3B gene_id:9582|Hs108|chr22 (357 aa)
initn: 866 init1: 804 opt: 804 Z-score: 1066.8 bits: 205.1 E(32554): 4.2e-53
Smith-Waterman score: 960; 75.6% identity (80.3% similar) in 193 aa overlap (10-199:190-357)
10 20 30
pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG---IGRHKTYLCYE
:.:::: :: :::: . :..::::::
CCDS58 FVYNEGQQFMPWYKFDENYAFLHRTLKEILRYLMDPDTFTFNFNNDPLVLRRRQTYLCYE
160 170 180 190 200 210
40 50 60 70 80 90
pF1KE0 VERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFI
:::::::: : :::: ::: :. :::::::::::::
CCDS58 VERLDNGTWVLMDQHMGFLCNE-------------------------LDPAQIYRVTWFI
220 230 240 250
100 110 120 130 140 150
pF1KE0 SWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 SWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYD
260 270 280 290 300 310
160 170 180 190
pF1KE0 EFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN
::..:::::: .:::::::::::.:::::::::::::::::::
CCDS58 EFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQNQGN
320 330 340 350
>--
initn: 377 init1: 184 opt: 380 Z-score: 504.7 bits: 101.1 E(32554): 8.6e-22
Smith-Waterman score: 380; 37.7% identity (62.3% similar) in 191 aa overlap (9-194:8-189)
10 20 30 40 50
pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG---IGRHKTYLCYEVERLDNGTSVKMDQHRGFLHN
: . : : .::.: :: :.::::: .. : : .. : ...
CCDS58 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEV-KIKRGRS-NLLWDTGVFRG
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 QAKNLLCGFYGR-HAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQE
:. : . :::. ::. . :: . ...:::.::.:: . :.... ::.:
CCDS58 QVY-----FKPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPD--CVAKLAEFLSE
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 NTHVRLRIFAARIYDY-DPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQP
. .: : : :::.: : . :..:: : .:::.:.:: :.:: .::..:: ..: :.:
CCDS58 HPNVTLTISAARLYYYWERDYRRALCRLSQAGARVTIMDYEEFAYCWENFVYNEGQQFMP
120 130 140 150 160 170
180 190
pF1KE0 WDGLDEHSQALSGRLRAILQNQGN
: .::. : :. ::
CCDS58 WYKFDENYAFLHRTLKEILRYLMDPDTFTFNFNNDPLVLRRRQTYLCYEVERLDNGTWVL
180 190 200 210 220 230
>>CCDS13983.1 APOBEC3C gene_id:27350|Hs108|chr22 (190 aa)
initn: 408 init1: 200 opt: 417 Z-score: 558.0 bits: 110.0 E(32554): 9.3e-25
Smith-Waterman score: 417; 39.1% identity (63.5% similar) in 192 aa overlap (9-195:8-190)
10 20 30 40 50
pF1KE0 MEASPASGPRHLMDPHIFTSNFNN---GIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHN
: . : : : .:.: . :..:.::. :: . . :. . : ..:
CCDS13 MNPQIRNPMKAMYPGTFYFQFKNLWEANDRNETWLCFTVEGIKRRSVVSW--KTGVFRN
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 QAKNLL-CGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQE
:. . : ::: ::. . :.: :.:::. ::::: . ::::: :: .
CCDS13 QVDSETHC-----HAERCFLSWFCDDILSPNTKYQVTWYTSWSPCPD--CAGEVAEFLAR
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 NTHVRLRIFAARIYDYD-PLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQP
...: : ::.::.: .. : :.:.:. : . :. : :: :..::.::..:: ... ::.:
CCDS13 HSNVNLTIFTARLYYFQYPCYQEGLRSLSQEGVAVEIMDYEDFKYCWENFVYNDNEPFKP
120 130 140 150 160 170
180 190
pF1KE0 WDGLDEHSQALSGRLRAILQNQGN
: :: . . :. ::: ::
CCDS13 WKGLKTNFRLLKRRLRESLQ
180 190
>>CCDS46709.1 APOBEC3D gene_id:140564|Hs108|chr22 (386 aa)
initn: 374 init1: 176 opt: 382 Z-score: 506.8 bits: 101.6 E(32554): 6.6e-22
Smith-Waterman score: 426; 40.6% identity (63.5% similar) in 192 aa overlap (9-195:204-386)
10 20 30
pF1KE0 MEASPASGPRHLMDPHIFTSNFNNGI---GRHKTYLCY
: . : :::: .:.: . ::....::.
CCDS46 CNEGQPFMPWYKFDDNYASLHRTLKEILRNPMEAMYPHIFYFHFKNLLKACGRNESWLCF
180 190 200 210 220 230
40 50 60 70 80 90
pF1KE0 EVERLDNGTSVKMDQHRGFLHNQAK-NLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTW
.: . ..: ..:: ..::. . : ::: ::. . :.: :.:::
CCDS46 TMEVTKHHSAVF--RKRGVFRNQVDPETHC-----HAERCFLSWFCDDILSPNTNYEVTW
240 250 260 270 280
100 110 120 130 140 150
pF1KE0 FISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARI-YDYDPLYKEALQMLRDAGAQVSIM
. ::::: ::::: :: ....: : ::.::. : .: :.:.: : . ::.:.::
CCDS46 YTSWSPCPE--CAGEVAEFLARHSNVNLTIFTARLCYFWDTDYQEGLCSLSQEGASVKIM
290 300 310 320 330 340
160 170 180 190
pF1KE0 TYDEFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN
: .: :: .:: . ::.:: ::. . . :. ::: :::
CCDS46 GYKDFVSCWKNFVYSDDEPFKPWKGLQTNFRLLKRRLREILQ
350 360 370 380
>--
initn: 374 init1: 176 opt: 382 Z-score: 506.8 bits: 101.6 E(32554): 6.6e-22
Smith-Waterman score: 382; 36.9% identity (61.1% similar) in 198 aa overlap (9-196:8-203)
10 20 30 40 50
pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG---IGRHKTYLCYEVERLDNGTSVKMDQ--HRG-F
: . : : .::.: :: :.:::::. . ... : ::
CCDS46 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGPV
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 LHNQAKNLLCGFYGR---HAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVR
: .. .: : : :::. ::. . .: . ...:::.::.::. :. .:
CCDS46 LPKRQSNHRQEVYFRFENHAEMCFLSWFCGNRLPANRRFQITWFVSWNPCLP--CVVKVT
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 AFLQENTHVRLRIFAARIYDY-DPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQG
:: :. .: : : :::.: : : .. .: :. :::.:.:: :..: .::..:: ..:
CCDS46 KFLAEHPNVTLTISAARLYYYRDRDWRWVLLRLHKAGARVKIMDYEDFAYCWENFVCNEG
120 130 140 150 160 170
180 190
pF1KE0 CPFQPWDGLDEHSQALSGRLRAILQNQGN
::.:: .:.. .: :. ::.:
CCDS46 QPFMPWYKFDDNYASLHRTLKEILRNPMEAMYPHIFYFHFKNLLKACGRNESWLCFTMEV
180 190 200 210 220 230
>>CCDS41747.1 AICDA gene_id:57379|Hs108|chr12 (198 aa)
initn: 368 init1: 291 opt: 378 Z-score: 506.0 bits: 100.5 E(32554): 7.3e-22
Smith-Waterman score: 461; 43.6% identity (68.6% similar) in 188 aa overlap (12-194:5-180)
10 20 30 40 50
pF1KE0 MEASPASGPRHLMDPHIFTSNFNN---GIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHN
::. . : .:.: . ::..::::: :.: :..:: ..: :.:.:
CCDS41 MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLD--FGYLRN
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 QAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQEN
:: : :.:: :: . . .:::.. :::::: :::::.. :: .: ::. :
CCDS41 --KN------GCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYD--CARHVADFLRGN
60 70 80 90 100
120 130 140 150 160 170
pF1KE0 THVRLRIFAARIY--DYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQP
.. ::::.::.: . :.:. :. ::.:..:::. .. .::.:::... :.
CCDS41 PNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKA
110 120 130 140 150 160
180 190
pF1KE0 WDGLDEHSQALSGRLRAILQNQGN
:.:: :.: :: .:: ::
CCDS41 WEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL
170 180 190
>>CCDS33648.1 APOBEC3F gene_id:200316|Hs108|chr22 (373 aa)
initn: 446 init1: 173 opt: 355 Z-score: 471.2 bits: 95.0 E(32554): 6.3e-20
Smith-Waterman score: 435; 39.6% identity (65.1% similar) in 192 aa overlap (9-195:191-373)
10 20 30
pF1KE0 MEASPASGPRHLMDPHIFTSNFNN---GIGRHKTYLCY
: . : :::: .:.: . ::....::.
CCDS33 YSEGQPFMPWYKFDDNYAFLHRTLKEILRNPMEAMYPHIFYFHFKNLRKAYGRNESWLCF
170 180 190 200 210 220
40 50 60 70 80 90
pF1KE0 EVERLDNGTSVKMDQHRGFLHNQAK-NLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTW
.: . . . :. .:: ..::. . : ::: ::. . :.: :.:::
CCDS33 TMEVVKHHSPVSW--KRGVFRNQVDPETHC-----HAERCFLSWFCDDILSPNTNYEVTW
230 240 250 260 270
100 110 120 130 140 150
pF1KE0 FISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDY-DPLYKEALQMLRDAGAQVSIM
. ::::: ::::: :: ....: : ::.::.: . : :.:.:. : . ::.: ::
CCDS33 YTSWSPCPE--CAGEVAEFLARHSNVNLTIFTARLYYFWDTDYQEGLRSLSQEGASVEIM
280 290 300 310 320 330
160 170 180 190
pF1KE0 TYDEFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN
: .::.::..:: .. ::.:: :: . :...:. ::.
CCDS33 GYKDFKYCWENFVYNDDEPFKPWKGLKYNFLFLDSKLQEILE
340 350 360 370
>--
initn: 446 init1: 173 opt: 371 Z-score: 492.4 bits: 98.9 E(32554): 4.1e-21
Smith-Waterman score: 371; 36.8% identity (64.3% similar) in 185 aa overlap (18-196:17-190)
10 20 30 40 50
pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG--IGRHKT-YLCYEVERLDNGTSVKMDQH--RGFL
:. :: : ..:..: .::::: . . . ..: . :: .
CCDS33 MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEV-KTKGPSRPRLDAKIFRGQV
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 HNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQ
..: .. :::. ::. . :: . ...:::.::.:: . :.... ::
CCDS33 YSQPEH--------HAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPD--CVAKLAEFLA
60 70 80 90 100
120 130 140 150 160 170
pF1KE0 ENTHVRLRIFAARIYDY-DPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQ
:. .: : : :::.: : . :..:: : .:::.:.:: .:: .::..:: .: ::.
CCDS33 EHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYSEGQPFM
110 120 130 140 150 160
180 190
pF1KE0 PWDGLDEHSQALSGRLRAILQNQGN
:: .:.. : :. ::.:
CCDS33 PWYKFDDNYAFLHRTLKEILRNPMEAMYPHIFYFHFKNLRKAYGRNESWLCFTMEVVKHH
170 180 190 200 210 220
>>CCDS13985.1 APOBEC3H gene_id:164668|Hs108|chr22 (183 aa)
initn: 276 init1: 121 opt: 310 Z-score: 416.4 bits: 83.8 E(32554): 7.2e-17
Smith-Waterman score: 329; 34.0% identity (60.9% similar) in 197 aa overlap (12-196:3-183)
10 20 30 40 50
pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG--IGR----HKTYLCYEVERLDNGTSVKMDQHRGF
:. . : .::: . : .:. :::.. .::.. ::.
CCDS13 MALLTAETFRLQFNNKRRLRRPYYPRKALLCYQLTP-QNGST----PTRGY
10 20 30 40
60 70 80 90 100 110
pF1KE0 LHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFL
..:. : : :::. :.. . :. :: .: :.:: ...:::: : :: :. :.
CCDS13 FENKKK---C-----HAEICFINEIKSMGLDETQCYQVTCYLTWSPCSS--CAWELVDFI
50 60 70 80 90
120 130 140 150 160 170
pF1KE0 QENTHVRLRIFAARIYDY--DPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQG--
. . :. : :::.:.: . : : .:..: . . : .: . :: ::..::::.
CCDS13 KAHDHLNLGIFASRLYYHWCKPQQK-GLRLLCGSQVPVEVMGFPEFADCWENFVDHEKPL
100 110 120 130 140 150
180 190
pF1KE0 --CPFQPWDGLDEHSQALSGRLRAILQNQGN
:.. . ::..:.:.. ::. : :.
CCDS13 SFNPYKMLEELDKNSRAIKRRLERIKQS
160 170 180
>>CCDS54531.1 APOBEC3H gene_id:164668|Hs108|chr22 (182 aa)
initn: 276 init1: 121 opt: 305 Z-score: 409.8 bits: 82.5 E(32554): 1.7e-16
Smith-Waterman score: 324; 34.0% identity (60.8% similar) in 194 aa overlap (12-193:3-180)
10 20 30 40 50
pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG--IGR----HKTYLCYEVERLDNGTSVKMDQHRGF
:. . : .::: . : .:. :::.. .::.. ::.
CCDS54 MALLTAETFRLQFNNKRRLRRPYYPRKALLCYQLTP-QNGST----PTRGY
10 20 30 40
60 70 80 90 100 110
pF1KE0 LHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFL
..:. : : :::. :.. . :. :: .: :.:: ...:::: : :: :. :.
CCDS54 FENKKK---C-----HAEICFINEIKSMGLDETQCYQVTCYLTWSPCSS--CAWELVDFI
50 60 70 80 90
120 130 140 150 160 170
pF1KE0 QENTHVRLRIFAARIYDY--DPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQG--
. . :. : :::.:.: . : : .:..: . . : .: . :: ::..::::.
CCDS54 KAHDHLNLGIFASRLYYHWCKPQQK-GLRLLCGSQVPVEVMGFPEFADCWENFVDHEKPL
100 110 120 130 140 150
180 190
pF1KE0 --CPFQPWDGLDEHSQALSGRLRAILQNQGN
:.. . ::..:.:.. ::. :
CCDS54 SFNPYKMLEELDKNSRAIKRRLERIKS
160 170 180
199 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 05:01:19 2016 done: Thu Nov 3 05:01:20 2016
Total Scan time: 1.710 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]