FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0485, 199 aa 1>>>pF1KE0485 199 - 199 aa - 199 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.0863+/-0.000703; mu= 13.9687+/- 0.042 mean_var=56.8995+/-11.220, 0's: 0 Z-trim(108.4): 18 B-trim: 0 in 0/53 Lambda= 0.170028 statistics sampled from 10179 (10197) to 10179 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.712), E-opt: 0.2 (0.313), width: 16 Scan time: 1.710 The best scores are: opt bits E(32554) CCDS13981.1 APOBEC3A gene_id:200315|Hs108|chr22 ( 199) 1423 356.8 5e-99 CCDS13982.1 APOBEC3B gene_id:9582|Hs108|chr22 ( 382) 1191 300.0 1.2e-81 CCDS13984.1 APOBEC3G gene_id:60489|Hs108|chr22 ( 384) 820 209.0 3e-54 CCDS58807.1 APOBEC3B gene_id:9582|Hs108|chr22 ( 357) 804 205.1 4.2e-53 CCDS13983.1 APOBEC3C gene_id:27350|Hs108|chr22 ( 190) 417 110.0 9.3e-25 CCDS46709.1 APOBEC3D gene_id:140564|Hs108|chr22 ( 386) 382 101.6 6.6e-22 CCDS41747.1 AICDA gene_id:57379|Hs108|chr12 ( 198) 378 100.5 7.3e-22 CCDS33648.1 APOBEC3F gene_id:200316|Hs108|chr22 ( 373) 355 95.0 6.3e-20 CCDS13985.1 APOBEC3H gene_id:164668|Hs108|chr22 ( 183) 310 83.8 7.2e-17 CCDS54531.1 APOBEC3H gene_id:164668|Hs108|chr22 ( 182) 305 82.5 1.7e-16 CCDS54530.1 APOBEC3H gene_id:164668|Hs108|chr22 ( 200) 305 82.6 1.8e-16 CCDS81662.1 AICDA gene_id:57379|Hs108|chr12 ( 188) 263 72.3 2.2e-13 CCDS4848.1 APOBEC2 gene_id:10930|Hs108|chr6 ( 224) 251 69.3 1.9e-12 CCDS8579.1 APOBEC1 gene_id:339|Hs108|chr12 ( 236) 246 68.1 4.7e-12 >>CCDS13981.1 APOBEC3A gene_id:200315|Hs108|chr22 (199 aa) initn: 1423 init1: 1423 opt: 1423 Z-score: 1891.3 bits: 356.8 E(32554): 5e-99 Smith-Waterman score: 1423; 100.0% identity (100.0% similar) in 199 aa overlap (1-199:1-199) 10 20 30 40 50 60 pF1KE0 MEASPASGPRHLMDPHIFTSNFNNGIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHNQAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MEASPASGPRHLMDPHIFTSNFNNGIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHNQAK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 NLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 NLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 RLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPWDGLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 RLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPWDGLD 130 140 150 160 170 180 190 pF1KE0 EHSQALSGRLRAILQNQGN ::::::::::::::::::: CCDS13 EHSQALSGRLRAILQNQGN 190 >>CCDS13982.1 APOBEC3B gene_id:9582|Hs108|chr22 (382 aa) initn: 1195 init1: 1133 opt: 1191 Z-score: 1579.4 bits: 300.0 E(32554): 1.2e-81 Smith-Waterman score: 1191; 88.6% identity (93.3% similar) in 193 aa overlap (10-199:190-382) 10 20 30 pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG---IGRHKTYLCYE :.:::: :: :::: . :..:::::: CCDS13 FVYNEGQQFMPWYKFDENYAFLHRTLKEILRYLMDPDTFTFNFNNDPLVLRRRQTYLCYE 160 170 180 190 200 210 40 50 60 70 80 90 pF1KE0 VERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFI :::::::: : :::: ::: :.:::::::::::::::::::::::::::::::::::::: CCDS13 VERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFI 220 230 240 250 260 270 100 110 120 130 140 150 pF1KE0 SWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYD 280 290 300 310 320 330 160 170 180 190 pF1KE0 EFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN ::..:::::: .:::::::::::.::::::::::::::::::: CCDS13 EFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQNQGN 340 350 360 370 380 >-- initn: 377 init1: 184 opt: 380 Z-score: 504.2 bits: 101.1 E(32554): 9.2e-22 Smith-Waterman score: 380; 37.7% identity (62.3% similar) in 191 aa overlap (9-194:8-189) 10 20 30 40 50 pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG---IGRHKTYLCYEVERLDNGTSVKMDQHRGFLHN : . : : .::.: :: :.::::: .. : : .. : ... CCDS13 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEV-KIKRGRS-NLLWDTGVFRG 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 QAKNLLCGFYGR-HAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQE :. : . :::. ::. . :: . ...:::.::.:: . :.... ::.: CCDS13 QVY-----FKPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPD--CVAKLAEFLSE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 NTHVRLRIFAARIYDY-DPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQP . .: : : :::.: : . :..:: : .:::.:.:: :.:: .::..:: ..: :.: CCDS13 HPNVTLTISAARLYYYWERDYRRALCRLSQAGARVTIMDYEEFAYCWENFVYNEGQQFMP 120 130 140 150 160 170 180 190 pF1KE0 WDGLDEHSQALSGRLRAILQNQGN : .::. : :. :: CCDS13 WYKFDENYAFLHRTLKEILRYLMDPDTFTFNFNNDPLVLRRRQTYLCYEVERLDNGTWVL 180 190 200 210 220 230 >>CCDS13984.1 APOBEC3G gene_id:60489|Hs108|chr22 (384 aa) initn: 828 init1: 471 opt: 820 Z-score: 1087.5 bits: 209.0 E(32554): 3e-54 Smith-Waterman score: 820; 65.3% identity (77.2% similar) in 193 aa overlap (10-199:194-384) 10 20 30 pF1KE0 MEASPASGPRHLMDPHIFTSNFNNGI---GRHKTYLCYE :: ::: :: :::: :::.:::::: CCDS13 FVYSQRELFEPWNNLPKYYILLHIMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYE 170 180 190 200 210 220 40 50 60 70 80 90 pF1KE0 VERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFI :::. : : : ..:.:::: ::: . . :::::: :::..: .:: : :::: : CCDS13 VERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFT 230 240 250 260 270 280 100 110 120 130 140 150 pF1KE0 SWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYD ::::::: :: :. :...: :: : ::.::::: . .:.:. : .:::..:::::. CCDS13 SWSPCFS--CAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISIMTYS 290 300 310 320 330 340 160 170 180 190 pF1KE0 EFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN :::::::::::::::::::::::::::: :::::::::::: : CCDS13 EFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN 350 360 370 380 >-- initn: 295 init1: 143 opt: 348 Z-score: 461.8 bits: 93.2 E(32554): 2.1e-19 Smith-Waterman score: 348; 38.3% identity (61.7% similar) in 188 aa overlap (18-194:17-193) 10 20 30 40 50 pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG--IGRHKT-YLCYEVERLDNGTSVKMDQH--RGFL :. :: : ..:..: .::::: . . . .: . :: . CCDS13 MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEV-KTKGPSRPPLDAKIFRGQV 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 HNQAKNLLCGFYGRHAELRFLDLVPSL-QLDPAQIYRVTWFISWSPCFSWGCAGEVRAFL ... : : :.::. . .: : :.:::.:::::: . :. .. .:: CCDS13 YSELK--------YHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTK--CTRDMATFL 60 70 80 90 100 120 130 140 150 160 pF1KE0 QENTHVRLRIFAARIYDY-DPLYKEALQML---RDAG-AQVSIMTYDEFKHCWDTFVDHQ :. .: : ::.::.: . :: :.:::. : ::. : ..::.::::.:::. :: : CCDS13 AEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKIMNYDEFQHCWSKFVYSQ 110 120 130 140 150 160 170 180 190 pF1KE0 GCPFQPWDGLDEHSQALSGRLRAILQNQGN :.::..: .. : : :: CCDS13 RELFEPWNNLPKYYILLHIMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMH 170 180 190 200 210 220 >>CCDS58807.1 APOBEC3B gene_id:9582|Hs108|chr22 (357 aa) initn: 866 init1: 804 opt: 804 Z-score: 1066.8 bits: 205.1 E(32554): 4.2e-53 Smith-Waterman score: 960; 75.6% identity (80.3% similar) in 193 aa overlap (10-199:190-357) 10 20 30 pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG---IGRHKTYLCYE :.:::: :: :::: . :..:::::: CCDS58 FVYNEGQQFMPWYKFDENYAFLHRTLKEILRYLMDPDTFTFNFNNDPLVLRRRQTYLCYE 160 170 180 190 200 210 40 50 60 70 80 90 pF1KE0 VERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFI :::::::: : :::: ::: :. ::::::::::::: CCDS58 VERLDNGTWVLMDQHMGFLCNE-------------------------LDPAQIYRVTWFI 220 230 240 250 100 110 120 130 140 150 pF1KE0 SWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYD 260 270 280 290 300 310 160 170 180 190 pF1KE0 EFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN ::..:::::: .:::::::::::.::::::::::::::::::: CCDS58 EFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQNQGN 320 330 340 350 >-- initn: 377 init1: 184 opt: 380 Z-score: 504.7 bits: 101.1 E(32554): 8.6e-22 Smith-Waterman score: 380; 37.7% identity (62.3% similar) in 191 aa overlap (9-194:8-189) 10 20 30 40 50 pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG---IGRHKTYLCYEVERLDNGTSVKMDQHRGFLHN : . : : .::.: :: :.::::: .. : : .. : ... CCDS58 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEV-KIKRGRS-NLLWDTGVFRG 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 QAKNLLCGFYGR-HAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQE :. : . :::. ::. . :: . ...:::.::.:: . :.... ::.: CCDS58 QVY-----FKPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPD--CVAKLAEFLSE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 NTHVRLRIFAARIYDY-DPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQP . .: : : :::.: : . :..:: : .:::.:.:: :.:: .::..:: ..: :.: CCDS58 HPNVTLTISAARLYYYWERDYRRALCRLSQAGARVTIMDYEEFAYCWENFVYNEGQQFMP 120 130 140 150 160 170 180 190 pF1KE0 WDGLDEHSQALSGRLRAILQNQGN : .::. : :. :: CCDS58 WYKFDENYAFLHRTLKEILRYLMDPDTFTFNFNNDPLVLRRRQTYLCYEVERLDNGTWVL 180 190 200 210 220 230 >>CCDS13983.1 APOBEC3C gene_id:27350|Hs108|chr22 (190 aa) initn: 408 init1: 200 opt: 417 Z-score: 558.0 bits: 110.0 E(32554): 9.3e-25 Smith-Waterman score: 417; 39.1% identity (63.5% similar) in 192 aa overlap (9-195:8-190) 10 20 30 40 50 pF1KE0 MEASPASGPRHLMDPHIFTSNFNN---GIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHN : . : : : .:.: . :..:.::. :: . . :. . : ..: CCDS13 MNPQIRNPMKAMYPGTFYFQFKNLWEANDRNETWLCFTVEGIKRRSVVSW--KTGVFRN 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 QAKNLL-CGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQE :. . : ::: ::. . :.: :.:::. ::::: . ::::: :: . CCDS13 QVDSETHC-----HAERCFLSWFCDDILSPNTKYQVTWYTSWSPCPD--CAGEVAEFLAR 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 NTHVRLRIFAARIYDYD-PLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQP ...: : ::.::.: .. : :.:.:. : . :. : :: :..::.::..:: ... ::.: CCDS13 HSNVNLTIFTARLYYFQYPCYQEGLRSLSQEGVAVEIMDYEDFKYCWENFVYNDNEPFKP 120 130 140 150 160 170 180 190 pF1KE0 WDGLDEHSQALSGRLRAILQNQGN : :: . . :. ::: :: CCDS13 WKGLKTNFRLLKRRLRESLQ 180 190 >>CCDS46709.1 APOBEC3D gene_id:140564|Hs108|chr22 (386 aa) initn: 374 init1: 176 opt: 382 Z-score: 506.8 bits: 101.6 E(32554): 6.6e-22 Smith-Waterman score: 426; 40.6% identity (63.5% similar) in 192 aa overlap (9-195:204-386) 10 20 30 pF1KE0 MEASPASGPRHLMDPHIFTSNFNNGI---GRHKTYLCY : . : :::: .:.: . ::....::. CCDS46 CNEGQPFMPWYKFDDNYASLHRTLKEILRNPMEAMYPHIFYFHFKNLLKACGRNESWLCF 180 190 200 210 220 230 40 50 60 70 80 90 pF1KE0 EVERLDNGTSVKMDQHRGFLHNQAK-NLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTW .: . ..: ..:: ..::. . : ::: ::. . :.: :.::: CCDS46 TMEVTKHHSAVF--RKRGVFRNQVDPETHC-----HAERCFLSWFCDDILSPNTNYEVTW 240 250 260 270 280 100 110 120 130 140 150 pF1KE0 FISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARI-YDYDPLYKEALQMLRDAGAQVSIM . ::::: ::::: :: ....: : ::.::. : .: :.:.: : . ::.:.:: CCDS46 YTSWSPCPE--CAGEVAEFLARHSNVNLTIFTARLCYFWDTDYQEGLCSLSQEGASVKIM 290 300 310 320 330 340 160 170 180 190 pF1KE0 TYDEFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN : .: :: .:: . ::.:: ::. . . :. ::: ::: CCDS46 GYKDFVSCWKNFVYSDDEPFKPWKGLQTNFRLLKRRLREILQ 350 360 370 380 >-- initn: 374 init1: 176 opt: 382 Z-score: 506.8 bits: 101.6 E(32554): 6.6e-22 Smith-Waterman score: 382; 36.9% identity (61.1% similar) in 198 aa overlap (9-196:8-203) 10 20 30 40 50 pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG---IGRHKTYLCYEVERLDNGTSVKMDQ--HRG-F : . : : .::.: :: :.:::::. . ... : :: CCDS46 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGPV 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 LHNQAKNLLCGFYGR---HAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVR : .. .: : : :::. ::. . .: . ...:::.::.::. :. .: CCDS46 LPKRQSNHRQEVYFRFENHAEMCFLSWFCGNRLPANRRFQITWFVSWNPCLP--CVVKVT 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 AFLQENTHVRLRIFAARIYDY-DPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQG :: :. .: : : :::.: : : .. .: :. :::.:.:: :..: .::..:: ..: CCDS46 KFLAEHPNVTLTISAARLYYYRDRDWRWVLLRLHKAGARVKIMDYEDFAYCWENFVCNEG 120 130 140 150 160 170 180 190 pF1KE0 CPFQPWDGLDEHSQALSGRLRAILQNQGN ::.:: .:.. .: :. ::.: CCDS46 QPFMPWYKFDDNYASLHRTLKEILRNPMEAMYPHIFYFHFKNLLKACGRNESWLCFTMEV 180 190 200 210 220 230 >>CCDS41747.1 AICDA gene_id:57379|Hs108|chr12 (198 aa) initn: 368 init1: 291 opt: 378 Z-score: 506.0 bits: 100.5 E(32554): 7.3e-22 Smith-Waterman score: 461; 43.6% identity (68.6% similar) in 188 aa overlap (12-194:5-180) 10 20 30 40 50 pF1KE0 MEASPASGPRHLMDPHIFTSNFNN---GIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHN ::. . : .:.: . ::..::::: :.: :..:: ..: :.:.: CCDS41 MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLD--FGYLRN 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 QAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQEN :: : :.:: :: . . .:::.. :::::: :::::.. :: .: ::. : CCDS41 --KN------GCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYD--CARHVADFLRGN 60 70 80 90 100 120 130 140 150 160 170 pF1KE0 THVRLRIFAARIY--DYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQP .. ::::.::.: . :.:. :. ::.:..:::. .. .::.:::... :. CCDS41 PNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKA 110 120 130 140 150 160 180 190 pF1KE0 WDGLDEHSQALSGRLRAILQNQGN :.:: :.: :: .:: :: CCDS41 WEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL 170 180 190 >>CCDS33648.1 APOBEC3F gene_id:200316|Hs108|chr22 (373 aa) initn: 446 init1: 173 opt: 355 Z-score: 471.2 bits: 95.0 E(32554): 6.3e-20 Smith-Waterman score: 435; 39.6% identity (65.1% similar) in 192 aa overlap (9-195:191-373) 10 20 30 pF1KE0 MEASPASGPRHLMDPHIFTSNFNN---GIGRHKTYLCY : . : :::: .:.: . ::....::. CCDS33 YSEGQPFMPWYKFDDNYAFLHRTLKEILRNPMEAMYPHIFYFHFKNLRKAYGRNESWLCF 170 180 190 200 210 220 40 50 60 70 80 90 pF1KE0 EVERLDNGTSVKMDQHRGFLHNQAK-NLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTW .: . . . :. .:: ..::. . : ::: ::. . :.: :.::: CCDS33 TMEVVKHHSPVSW--KRGVFRNQVDPETHC-----HAERCFLSWFCDDILSPNTNYEVTW 230 240 250 260 270 100 110 120 130 140 150 pF1KE0 FISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDY-DPLYKEALQMLRDAGAQVSIM . ::::: ::::: :: ....: : ::.::.: . : :.:.:. : . ::.: :: CCDS33 YTSWSPCPE--CAGEVAEFLARHSNVNLTIFTARLYYFWDTDYQEGLRSLSQEGASVEIM 280 290 300 310 320 330 160 170 180 190 pF1KE0 TYDEFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN : .::.::..:: .. ::.:: :: . :...:. ::. CCDS33 GYKDFKYCWENFVYNDDEPFKPWKGLKYNFLFLDSKLQEILE 340 350 360 370 >-- initn: 446 init1: 173 opt: 371 Z-score: 492.4 bits: 98.9 E(32554): 4.1e-21 Smith-Waterman score: 371; 36.8% identity (64.3% similar) in 185 aa overlap (18-196:17-190) 10 20 30 40 50 pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG--IGRHKT-YLCYEVERLDNGTSVKMDQH--RGFL :. :: : ..:..: .::::: . . . ..: . :: . CCDS33 MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEV-KTKGPSRPRLDAKIFRGQV 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 HNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQ ..: .. :::. ::. . :: . ...:::.::.:: . :.... :: CCDS33 YSQPEH--------HAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPD--CVAKLAEFLA 60 70 80 90 100 120 130 140 150 160 170 pF1KE0 ENTHVRLRIFAARIYDY-DPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQ :. .: : : :::.: : . :..:: : .:::.:.:: .:: .::..:: .: ::. CCDS33 EHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYSEGQPFM 110 120 130 140 150 160 180 190 pF1KE0 PWDGLDEHSQALSGRLRAILQNQGN :: .:.. : :. ::.: CCDS33 PWYKFDDNYAFLHRTLKEILRNPMEAMYPHIFYFHFKNLRKAYGRNESWLCFTMEVVKHH 170 180 190 200 210 220 >>CCDS13985.1 APOBEC3H gene_id:164668|Hs108|chr22 (183 aa) initn: 276 init1: 121 opt: 310 Z-score: 416.4 bits: 83.8 E(32554): 7.2e-17 Smith-Waterman score: 329; 34.0% identity (60.9% similar) in 197 aa overlap (12-196:3-183) 10 20 30 40 50 pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG--IGR----HKTYLCYEVERLDNGTSVKMDQHRGF :. . : .::: . : .:. :::.. .::.. ::. CCDS13 MALLTAETFRLQFNNKRRLRRPYYPRKALLCYQLTP-QNGST----PTRGY 10 20 30 40 60 70 80 90 100 110 pF1KE0 LHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFL ..:. : : :::. :.. . :. :: .: :.:: ...:::: : :: :. :. CCDS13 FENKKK---C-----HAEICFINEIKSMGLDETQCYQVTCYLTWSPCSS--CAWELVDFI 50 60 70 80 90 120 130 140 150 160 170 pF1KE0 QENTHVRLRIFAARIYDY--DPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQG-- . . :. : :::.:.: . : : .:..: . . : .: . :: ::..::::. CCDS13 KAHDHLNLGIFASRLYYHWCKPQQK-GLRLLCGSQVPVEVMGFPEFADCWENFVDHEKPL 100 110 120 130 140 150 180 190 pF1KE0 --CPFQPWDGLDEHSQALSGRLRAILQNQGN :.. . ::..:.:.. ::. : :. CCDS13 SFNPYKMLEELDKNSRAIKRRLERIKQS 160 170 180 >>CCDS54531.1 APOBEC3H gene_id:164668|Hs108|chr22 (182 aa) initn: 276 init1: 121 opt: 305 Z-score: 409.8 bits: 82.5 E(32554): 1.7e-16 Smith-Waterman score: 324; 34.0% identity (60.8% similar) in 194 aa overlap (12-193:3-180) 10 20 30 40 50 pF1KE0 MEASPASGPRHLMDPHIFTSNFNNG--IGR----HKTYLCYEVERLDNGTSVKMDQHRGF :. . : .::: . : .:. :::.. .::.. ::. CCDS54 MALLTAETFRLQFNNKRRLRRPYYPRKALLCYQLTP-QNGST----PTRGY 10 20 30 40 60 70 80 90 100 110 pF1KE0 LHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFL ..:. : : :::. :.. . :. :: .: :.:: ...:::: : :: :. :. CCDS54 FENKKK---C-----HAEICFINEIKSMGLDETQCYQVTCYLTWSPCSS--CAWELVDFI 50 60 70 80 90 120 130 140 150 160 170 pF1KE0 QENTHVRLRIFAARIYDY--DPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQG-- . . :. : :::.:.: . : : .:..: . . : .: . :: ::..::::. CCDS54 KAHDHLNLGIFASRLYYHWCKPQQK-GLRLLCGSQVPVEVMGFPEFADCWENFVDHEKPL 100 110 120 130 140 150 180 190 pF1KE0 --CPFQPWDGLDEHSQALSGRLRAILQNQGN :.. . ::..:.:.. ::. : CCDS54 SFNPYKMLEELDKNSRAIKRRLERIKS 160 170 180 199 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 05:01:19 2016 done: Thu Nov 3 05:01:20 2016 Total Scan time: 1.710 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]