FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5147, 354 aa 1>>>pF1KB5147 354 - 354 aa - 354 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4154+/-0.00084; mu= 15.3354+/- 0.050 mean_var=62.9272+/-12.741, 0's: 0 Z-trim(106.2): 17 B-trim: 0 in 0/51 Lambda= 0.161680 statistics sampled from 8851 (8857) to 8851 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.659), E-opt: 0.2 (0.272), width: 16 Scan time: 2.100 The best scores are: opt bits E(32554) CCDS9785.1 ARG2 gene_id:384|Hs108|chr14 ( 354) 2340 554.5 5e-158 CCDS5145.1 ARG1 gene_id:383|Hs108|chr6 ( 322) 1336 320.3 1.4e-87 CCDS59038.1 ARG1 gene_id:383|Hs108|chr6 ( 330) 1317 315.8 3.2e-86 >>CCDS9785.1 ARG2 gene_id:384|Hs108|chr14 (354 aa) initn: 2340 init1: 2340 opt: 2340 Z-score: 2950.6 bits: 554.5 E(32554): 5e-158 Smith-Waterman score: 2340; 100.0% identity (100.0% similar) in 354 aa overlap (1-354:1-354) 10 20 30 40 50 60 pF1KB5 MSLRGSLSRLLQTRVHSILKKSVHSVAVIGAPFSQGQKRKGVEHGPAAIREAGLMKRLSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 MSLRGSLSRLLQTRVHSILKKSVHSVAVIGAPFSQGQKRKGVEHGPAAIREAGLMKRLSS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 LGCHLKDFGDLSFTPVPKDDLYNNLIVNPRSVGLANQELAEVVSRAVSDGYSCVTLGGDH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 LGCHLKDFGDLSFTPVPKDDLYNNLIVNPRSVGLANQELAEVVSRAVSDGYSCVTLGGDH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 SLAIGTISGHARHCPDLCVVWVDAHADINTPLTTSSGNLHGQPVSFLLRELQDKVPQLPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 SLAIGTISGHARHCPDLCVVWVDAHADINTPLTTSSGNLHGQPVSFLLRELQDKVPQLPG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 FSWIKPCISSASIVYIGLRDVDPPEHFILKNYDIQYFSMRDIDRLGIQKVMERTFDLLIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 FSWIKPCISSASIVYIGLRDVDPPEHFILKNYDIQYFSMRDIDRLGIQKVMERTFDLLIG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 KRQRPIHLSFDIDAFDPTLAPATGTPVVGGLTYREGMYIAEEIHNTGLLSALDLVEVNPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 KRQRPIHLSFDIDAFDPTLAPATGTPVVGGLTYREGMYIAEEIHNTGLLSALDLVEVNPQ 250 260 270 280 290 300 310 320 330 340 350 pF1KB5 LATSEEEAKTTANLAVDVIASSFGQTREGGHIVYDQLPTPSSPDESENQARVRI :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 LATSEEEAKTTANLAVDVIASSFGQTREGGHIVYDQLPTPSSPDESENQARVRI 310 320 330 340 350 >>CCDS5145.1 ARG1 gene_id:383|Hs108|chr6 (322 aa) initn: 1353 init1: 1110 opt: 1336 Z-score: 1685.6 bits: 320.3 E(32554): 1.4e-87 Smith-Waterman score: 1336; 60.1% identity (85.4% similar) in 316 aa overlap (25-340:7-321) 10 20 30 40 50 60 pF1KB5 MSLRGSLSRLLQTRVHSILKKSVHSVAVIGAPFSQGQKRKGVEHGPAAIREAGLMKRLSS ....::::::.:: : :::.::...:.:::...:. CCDS51 MSAKSRTIGIIGAPFSKGQPRGGVEEGPTVLRKAGLLEKLKE 10 20 30 40 70 80 90 100 110 120 pF1KB5 LGCHLKDFGDLSFTPVPKDDLYNNLIVNPRSVGLANQELAEVVSRAVSDGYSCVTLGGDH : .::.::: :. .:.:. .. .. :::::: :...:: :... ..: ..::::: CCDS51 QECDVKDYGDLPFADIPNDSPFQ-IVKNPRSVGKASEQLAGKVAEVKKNGRISLVLGGDH 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB5 SLAIGTISGHARHCPDLCVVWVDAHADINTPLTTSSGNLHGQPVSFLLRELQDKVPQLPG :::::.:::::: ::: :.:::::.::::::::.:::::::::::::.::. :.:..:: CCDS51 SLAIGSISGHARVHPDLGVIWVDAHTDINTPLTTTSGNLHGQPVSFLLKELKGKIPDVPG 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB5 FSWIKPCISSASIVYIGLRDVDPPEHFILKNYDIQYFSMRDIDRLGIQKVMERTFDLLIG :::. ::::. .::::::::::: ::.:::. :.:::: ..::::: ::::.:.. :.: CCDS51 FSWVTPCISAKDIVYIGLRDVDPGEHYILKTLGIKYFSMTEVDRLGIGKVMEETLSYLLG 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB5 KRQRPIHLSFDIDAFDPTLAPATGTPVVGGLTYREGMYIAEEIHNTGLLSALDLVEVNPQ ...::::::::.:..::...::::::::::::::::.::.:::..:::::.::..::::. CCDS51 RKKRPIHLSFDVDGLDPSFTPATGTPVVGGLTYREGLYITEEIYKTGLLSGLDIMEVNPS 230 240 250 260 270 280 310 320 330 340 350 pF1KB5 LATSEEEAKTTANLAVDVIASSFGQTREGGHIVYDQLPTPSSPDESENQARVRI :. . ::. :.: :: . . :: .:::.: : : : CCDS51 LGKTPEEVTRTVNTAVAITLACFGLAREGNHKPIDYLNPPK 290 300 310 320 >>CCDS59038.1 ARG1 gene_id:383|Hs108|chr6 (330 aa) initn: 1322 init1: 1110 opt: 1317 Z-score: 1661.5 bits: 315.8 E(32554): 3.2e-86 Smith-Waterman score: 1317; 59.0% identity (83.6% similar) in 324 aa overlap (25-340:7-329) 10 20 30 40 50 60 pF1KB5 MSLRGSLSRLLQTRVHSILKKSVHSVAVIGAPFSQGQKRKGVEHGPAAIREAGLMKRLSS ....::::::.:: : :::.::...:.:::...:. CCDS59 MSAKSRTIGIIGAPFSKGQPRGGVEEGPTVLRKAGLLEKLKE 10 20 30 40 70 80 90 100 110 pF1KB5 --------LGCHLKDFGDLSFTPVPKDDLYNNLIVNPRSVGLANQELAEVVSRAVSDGYS : : .::.::: :. .:.:. .. .. :::::: :...:: :... ..: CCDS59 QVTQNFLILECDVKDYGDLPFADIPNDSPFQ-IVKNPRSVGKASEQLAGKVAEVKKNGRI 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB5 CVTLGGDHSLAIGTISGHARHCPDLCVVWVDAHADINTPLTTSSGNLHGQPVSFLLRELQ ..::::::::::.:::::: ::: :.:::::.::::::::.:::::::::::::.::. CCDS59 SLVLGGDHSLAIGSISGHARVHPDLGVIWVDAHTDINTPLTTTSGNLHGQPVSFLLKELK 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB5 DKVPQLPGFSWIKPCISSASIVYIGLRDVDPPEHFILKNYDIQYFSMRDIDRLGIQKVME :.:..:::::. ::::. .::::::::::: ::.:::. :.:::: ..::::: :::: CCDS59 GKIPDVPGFSWVTPCISAKDIVYIGLRDVDPGEHYILKTLGIKYFSMTEVDRLGIGKVME 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 RTFDLLIGKRQRPIHLSFDIDAFDPTLAPATGTPVVGGLTYREGMYIAEEIHNTGLLSAL .:.. :.:...::::::::.:..::...::::::::::::::::.::.:::..:::::.: CCDS59 ETLSYLLGRKKRPIHLSFDVDGLDPSFTPATGTPVVGGLTYREGLYITEEIYKTGLLSGL 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB5 DLVEVNPQLATSEEEAKTTANLAVDVIASSFGQTREGGHIVYDQLPTPSSPDESENQARV :..::::.:. . ::. :.: :: . . :: .:::.: : : : CCDS59 DIMEVNPSLGKTPEEVTRTVNTAVAITLACFGLAREGNHKPIDYLNPPK 290 300 310 320 330 pF1KB5 RI 354 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 21:45:41 2016 done: Sat Nov 5 21:45:41 2016 Total Scan time: 2.100 Total Display time: -0.020 Function used was FASTA [36.3.4 Apr, 2011]