FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6476, 355 aa 1>>>pF1KB6476 355 - 355 aa - 355 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.4080+/-0.00117; mu= 6.7114+/- 0.069 mean_var=146.1146+/-29.874, 0's: 0 Z-trim(106.0): 152 B-trim: 32 in 1/52 Lambda= 0.106103 statistics sampled from 8536 (8707) to 8536 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.636), E-opt: 0.2 (0.267), width: 16 Scan time: 2.490 The best scores are: opt bits E(32554) CCDS73772.1 SH3GL3 gene_id:6457|Hs108|chr15 ( 355) 2321 367.3 1.1e-101 CCDS10325.2 SH3GL3 gene_id:6457|Hs108|chr15 ( 347) 2162 342.9 2.3e-94 CCDS6483.1 SH3GL2 gene_id:6456|Hs108|chr9 ( 352) 1532 246.5 2.5e-65 CCDS32874.1 SH3GL1 gene_id:6455|Hs108|chr19 ( 368) 1184 193.2 2.9e-49 CCDS56076.1 SH3GL1 gene_id:6455|Hs108|chr19 ( 320) 708 120.3 2.2e-27 CCDS59335.1 SH3GL1 gene_id:6455|Hs108|chr19 ( 304) 545 95.4 6.9e-20 >>CCDS73772.1 SH3GL3 gene_id:6457|Hs108|chr15 (355 aa) initn: 2321 init1: 2321 opt: 2321 Z-score: 1938.9 bits: 367.3 E(32554): 1.1e-101 Smith-Waterman score: 2321; 100.0% identity (100.0% similar) in 355 aa overlap (1-355:1-355) 10 20 30 40 50 60 pF1KB6 MDGIFAGIICNQANRCLTWTSQQLFSEKISGAEGTKLDDEFLDMERKIDVTNKVVAEILS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 MDGIFAGIICNQANRCLTWTSQQLFSEKISGAEGTKLDDEFLDMERKIDVTNKVVAEILS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 KTTEYLQPNPAYRAKLGMLNTVSKIRGQVKTTGYPQTEGLLGDCMLKYGKELGEDSTFGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 KTTEYLQPNPAYRAKLGMLNTVSKIRGQVKTTGYPQTEGLLGDCMLKYGKELGEDSTFGN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 ALIEVGESMKLMAEVKDSLDINVKQTFIDPLQLLQDKDLKEIGHHLKKLEGRRLDYDYKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 ALIEVGESMKLMAEVKDSLDINVKQTFIDPLQLLQDKDLKEIGHHLKKLEGRRLDYDYKK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 KRVGKIPDEEVRQAVEKFEESKELAERSMFNFLENDVEQVSQLAVFIEAALDYHRQSTEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 KRVGKIPDEEVRQAVEKFEESKELAERSMFNFLENDVEQVSQLAVFIEAALDYHRQSTEI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 LQELQSKLQMRISAASSVPRREYKPRPVKRSSSELNGVSTTSVVKTTGSNIPMDQPCCRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 LQELQSKLQMRISAASSVPRREYKPRPVKRSSSELNGVSTTSVVKTTGSNIPMDQPCCRG 250 260 270 280 290 300 310 320 330 340 350 pF1KB6 LYDFEPENQGELGFKEGDIITLTNQIDENWYEGMIHGESGFFPINYVEVIVPLPQ ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 LYDFEPENQGELGFKEGDIITLTNQIDENWYEGMIHGESGFFPINYVEVIVPLPQ 310 320 330 340 350 >>CCDS10325.2 SH3GL3 gene_id:6457|Hs108|chr15 (347 aa) initn: 2162 init1: 2162 opt: 2162 Z-score: 1807.5 bits: 342.9 E(32554): 2.3e-94 Smith-Waterman score: 2162; 99.4% identity (100.0% similar) in 335 aa overlap (21-355:13-347) 10 20 30 40 50 60 pF1KB6 MDGIFAGIICNQANRCLTWTSQQLFSEKISGAEGTKLDDEFLDMERKIDVTNKVVAEILS ..:::::::::::::::::::::::::::::::::::::: CCDS10 MSVAGLKKQFHKASQLFSEKISGAEGTKLDDEFLDMERKIDVTNKVVAEILS 10 20 30 40 50 70 80 90 100 110 120 pF1KB6 KTTEYLQPNPAYRAKLGMLNTVSKIRGQVKTTGYPQTEGLLGDCMLKYGKELGEDSTFGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 KTTEYLQPNPAYRAKLGMLNTVSKIRGQVKTTGYPQTEGLLGDCMLKYGKELGEDSTFGN 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB6 ALIEVGESMKLMAEVKDSLDINVKQTFIDPLQLLQDKDLKEIGHHLKKLEGRRLDYDYKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ALIEVGESMKLMAEVKDSLDINVKQTFIDPLQLLQDKDLKEIGHHLKKLEGRRLDYDYKK 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB6 KRVGKIPDEEVRQAVEKFEESKELAERSMFNFLENDVEQVSQLAVFIEAALDYHRQSTEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 KRVGKIPDEEVRQAVEKFEESKELAERSMFNFLENDVEQVSQLAVFIEAALDYHRQSTEI 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB6 LQELQSKLQMRISAASSVPRREYKPRPVKRSSSELNGVSTTSVVKTTGSNIPMDQPCCRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LQELQSKLQMRISAASSVPRREYKPRPVKRSSSELNGVSTTSVVKTTGSNIPMDQPCCRG 240 250 260 270 280 290 310 320 330 340 350 pF1KB6 LYDFEPENQGELGFKEGDIITLTNQIDENWYEGMIHGESGFFPINYVEVIVPLPQ ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LYDFEPENQGELGFKEGDIITLTNQIDENWYEGMIHGESGFFPINYVEVIVPLPQ 300 310 320 330 340 >>CCDS6483.1 SH3GL2 gene_id:6456|Hs108|chr9 (352 aa) initn: 1554 init1: 1124 opt: 1532 Z-score: 1286.2 bits: 246.5 E(32554): 2.5e-65 Smith-Waterman score: 1532; 67.1% identity (87.1% similar) in 340 aa overlap (23-355:15-352) 10 20 30 40 50 60 pF1KB6 MDGIFAGIICNQANRCLTWTSQQLFSEKISGAEGTKLDDEFLDMERKIDVTNKVVAEILS : :::..:::::::::.: .::::.:::...: ::.. CCDS64 MSVAGLKKQFHKATQKVSEKVGGAEGTKLDDDFKEMERKVDVTSRAVMEIMT 10 20 30 40 50 70 80 90 100 110 120 pF1KB6 KTTEYLQPNPAYRAKLGMLNTVSKIRGQVKTTGYPQTEGLLGDCMLKYGKELGEDSTFGN :: :::::::: ::::.:.::.:::::: : ::::.:.::.. :::.:.:::.: .:: CCDS64 KTIEYLQPNPASRAKLSMINTMSKIRGQEKGPGYPQAEALLAEAMLKFGRELGDDCNFGP 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB6 ALIEVGESMKLMAEVKDSLDINVKQTFIDPLQLLQDKDLKEIGHHLKKLEGRRLDYDYKK :: ::::.:. ..::::::::.:::.:::::: :.::::.:: ::::::::::::.:::: CCDS64 ALGEVGEAMRELSEVKDSLDIEVKQNFIDPLQNLHDKDLREIQHHLKKLEGRRLDFDYKK 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB6 KRVGKIPDEEVRQAVEKFEESKELAERSMFNFLENDVEQVSQLAVFIEAALDYHRQSTEI :: :::::::.:::.:::.::::.:: ::::.:: :.::::::.....: :.::.:...: CCDS64 KRQGKIPDEELRQALEKFDESKEIAESSMFNLLEMDIEQVSQLSALVQAQLEYHKQAVQI 180 190 200 210 220 230 250 260 270 280 290 pF1KB6 LQELQSKLQMRISAASSVPRREYKPRP-------VKRSSSELNGVSTTSVVKTTGSNIPM ::.. .:. :: ::: :::::.:.: . :.. .:.: :.. : .: . : CCDS64 LQQVTVRLEERIRQASSQPRREYQPKPRMSLEFPTGDSTQPNGGLSHTGTPKPSG--VQM 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB6 DQPCCRGLYDFEPENQGELGFKEGDIITLTNQIDENWYEGMIHGESGFFPINYVEVIVPL ::::::.::::::::.:::::::::::::::::::::::::.::.::::::::::..: : CCDS64 DQPCCRALYDFEPENEGELGFKEGDIITLTNQIDENWYEGMLHGHSGFFPINYVEILVAL 300 310 320 330 340 350 pF1KB6 PQ :. CCDS64 PH >>CCDS32874.1 SH3GL1 gene_id:6455|Hs108|chr19 (368 aa) initn: 1562 init1: 1184 opt: 1184 Z-score: 998.0 bits: 193.2 E(32554): 2.9e-49 Smith-Waterman score: 1528; 64.7% identity (84.4% similar) in 360 aa overlap (19-355:11-368) 10 20 30 40 50 60 pF1KB6 MDGIFAGIICNQANRCLTWTSQQLFSEKISGAEGTKLDDEFLDMERKIDVTNKVVAEILS . ..:: :::..:::::::::.: .::.:.:::.:.:.:.:. CCDS32 MSVAGLKKQFYKASQLVSEKVGGAEGTKLDDDFKEMEKKVDVTSKAVTEVLA 10 20 30 40 50 70 80 90 100 110 120 pF1KB6 KTTEYLQPNPAYRAKLGMLNTVSKIRGQVKTTGYPQTEGLLGDCMLKYGKELGEDSTFGN .: :::::::: :::: :::::::::::::. ::::.:::::.::...::::: .:.::. CCDS32 RTIEYLQPNPASRAKLTMLNTVSKIRGQVKNPGYPQSEGLLGECMIRHGKELGGESNFGD 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB6 ALIEVGESMKLMAEVKDSLDINVKQTFIDPLQLLQDKDLKEIGHHLKKLEGRRLDYDYKK ::...::::: .:::::::::.:::.:::::: : .:::::: ::::::::::::.:::: CCDS32 ALLDAGESMKRLAEVKDSLDIEVKQNFIDPLQNLCEKDLKEIQHHLKKLEGRRLDFDYKK 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB6 KRVGKIPDEEVRQAVEKFEESKELAERSMFNFLENDVEQVSQLAVFIEAALDYHRQSTEI :: :::::::.:::.::::::::.:: :: :.::.:.::::::.....: ::::::...: CCDS32 KRQGKIPDEELRQALEKFEESKEVAETSMHNLLETDIEQVSQLSALVDAQLDYHRQAVQI 180 190 200 210 220 230 250 260 270 280 pF1KB6 LQELQSKLQMRISAASSVPRREYKPRPVKRSSSEL------NG---------VSTTSVVK :.:: ::. :. ::: :.:::::.: : .: :: ....: . CCDS32 LDELAEKLKRRMREASSRPKREYKPKP--REPFDLGEPEQSNGGFPCTTAPKIAASSSFR 240 250 260 270 280 290 290 300 310 320 330 pF1KB6 TTGSNI--------PMDQPCCRGLYDFEPENQGELGFKEGDIITLTNQIDENWYEGMIHG .. . : :.::: :..::::::::.:::::.:::.:::::::::::::::. : CCDS32 SSDKPIRTPSRSMPPLDQPSCKALYDFEPENDGELGFHEGDVITLTNQIDENWYEGMLDG 300 310 320 330 340 350 340 350 pF1KB6 ESGFFPINYVEVIVPLPQ .:::::..::::.::::: CCDS32 QSGFFPLSYVEVLVPLPQ 360 >>CCDS56076.1 SH3GL1 gene_id:6455|Hs108|chr19 (320 aa) initn: 1306 init1: 708 opt: 708 Z-score: 605.1 bits: 120.3 E(32554): 2.2e-27 Smith-Waterman score: 1180; 54.7% identity (72.2% similar) in 360 aa overlap (19-355:11-320) 10 20 30 40 50 60 pF1KB6 MDGIFAGIICNQANRCLTWTSQQLFSEKISGAEGTKLDDEFLDMERKIDVTNKVVAEILS . ..:: :::..:::::::::.: .::.:.:::.:.:.:.:. CCDS56 MSVAGLKKQFYKASQLVSEKVGGAEGTKLDDDFKEMEKKVDVTSKAVTEVLA 10 20 30 40 50 70 80 90 100 110 120 pF1KB6 KTTEYLQPNPAYRAKLGMLNTVSKIRGQVKTTGYPQTEGLLGDCMLKYGKELGEDSTFGN .: ::::::: :. CCDS56 RTIEYLQPNP------------------------------------------------GD 60 130 140 150 160 170 180 pF1KB6 ALIEVGESMKLMAEVKDSLDINVKQTFIDPLQLLQDKDLKEIGHHLKKLEGRRLDYDYKK ::...::::: .:::::::::.:::.:::::: : .:::::: ::::::::::::.:::: CCDS56 ALLDAGESMKRLAEVKDSLDIEVKQNFIDPLQNLCEKDLKEIQHHLKKLEGRRLDFDYKK 70 80 90 100 110 120 190 200 210 220 230 240 pF1KB6 KRVGKIPDEEVRQAVEKFEESKELAERSMFNFLENDVEQVSQLAVFIEAALDYHRQSTEI :: :::::::.:::.::::::::.:: :: :.::.:.::::::.....: ::::::...: CCDS56 KRQGKIPDEELRQALEKFEESKEVAETSMHNLLETDIEQVSQLSALVDAQLDYHRQAVQI 130 140 150 160 170 180 250 260 270 280 pF1KB6 LQELQSKLQMRISAASSVPRREYKPRPVKRSSSEL------NG---------VSTTSVVK :.:: ::. :. ::: :.:::::.: : .: :: ....: . CCDS56 LDELAEKLKRRMREASSRPKREYKPKP--REPFDLGEPEQSNGGFPCTTAPKIAASSSFR 190 200 210 220 230 240 290 300 310 320 330 pF1KB6 TTGSNI--------PMDQPCCRGLYDFEPENQGELGFKEGDIITLTNQIDENWYEGMIHG .. . : :.::: :..::::::::.:::::.:::.:::::::::::::::. : CCDS56 SSDKPIRTPSRSMPPLDQPSCKALYDFEPENDGELGFHEGDVITLTNQIDENWYEGMLDG 250 260 270 280 290 300 340 350 pF1KB6 ESGFFPINYVEVIVPLPQ .:::::..::::.::::: CCDS56 QSGFFPLSYVEVLVPLPQ 310 320 >>CCDS59335.1 SH3GL1 gene_id:6455|Hs108|chr19 (304 aa) initn: 923 init1: 545 opt: 545 Z-score: 470.6 bits: 95.4 E(32554): 6.9e-20 Smith-Waterman score: 1070; 51.9% identity (67.8% similar) in 360 aa overlap (19-355:11-304) 10 20 30 40 50 60 pF1KB6 MDGIFAGIICNQANRCLTWTSQQLFSEKISGAEGTKLDDEFLDMERKIDVTNKVVAEILS . ..:: :::..:::::::::.: .::.:.:::.:.:.:.:. CCDS59 MSVAGLKKQFYKASQLVSEKVGGAEGTKLDDDFKEMEKKVDVTSKAVTEVLA 10 20 30 40 50 70 80 90 100 110 120 pF1KB6 KTTEYLQPNPAYRAKLGMLNTVSKIRGQVKTTGYPQTEGLLGDCMLKYGKELGEDSTFGN .: :::::::: :::: ::::::::::: . : CCDS59 RTIEYLQPNPASRAKLTMLNTVSKIRGQ-------------NLC---------------- 60 70 80 130 140 150 160 170 180 pF1KB6 ALIEVGESMKLMAEVKDSLDINVKQTFIDPLQLLQDKDLKEIGHHLKKLEGRRLDYDYKK .:::::: ::::::::::::.:::: CCDS59 -----------------------------------EKDLKEIQHHLKKLEGRRLDFDYKK 90 100 190 200 210 220 230 240 pF1KB6 KRVGKIPDEEVRQAVEKFEESKELAERSMFNFLENDVEQVSQLAVFIEAALDYHRQSTEI :: :::::::.:::.::::::::.:: :: :.::.:.::::::.....: ::::::...: CCDS59 KRQGKIPDEELRQALEKFEESKEVAETSMHNLLETDIEQVSQLSALVDAQLDYHRQAVQI 110 120 130 140 150 160 250 260 270 280 pF1KB6 LQELQSKLQMRISAASSVPRREYKPRPVKRSSSEL------NG---------VSTTSVVK :.:: ::. :. ::: :.:::::.: : .: :: ....: . CCDS59 LDELAEKLKRRMREASSRPKREYKPKP--REPFDLGEPEQSNGGFPCTTAPKIAASSSFR 170 180 190 200 210 220 290 300 310 320 330 pF1KB6 TTGSNI--------PMDQPCCRGLYDFEPENQGELGFKEGDIITLTNQIDENWYEGMIHG .. . : :.::: :..::::::::.:::::.:::.:::::::::::::::. : CCDS59 SSDKPIRTPSRSMPPLDQPSCKALYDFEPENDGELGFHEGDVITLTNQIDENWYEGMLDG 230 240 250 260 270 280 340 350 pF1KB6 ESGFFPINYVEVIVPLPQ .:::::..::::.::::: CCDS59 QSGFFPLSYVEVLVPLPQ 290 300 355 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 16:26:14 2016 done: Fri Nov 4 16:26:14 2016 Total Scan time: 2.490 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]