FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6381, 272 aa 1>>>pF1KB6381 272 - 272 aa - 272 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.5320+/-0.00108; mu= 1.1354+/- 0.065 mean_var=249.2795+/-52.292, 0's: 0 Z-trim(110.1): 143 B-trim: 589 in 1/54 Lambda= 0.081233 statistics sampled from 11210 (11353) to 11210 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.684), E-opt: 0.2 (0.349), width: 16 Scan time: 2.530 The best scores are: opt bits E(32554) CCDS32109.1 SRSF5 gene_id:6430|Hs108|chr14 ( 272) 1772 220.5 1e-57 CCDS13318.1 SRSF6 gene_id:6431|Hs108|chr20 ( 344) 1036 134.3 1.1e-31 CCDS333.1 SRSF4 gene_id:6429|Hs108|chr1 ( 494) 1014 131.9 8.7e-31 CCDS11600.1 SRSF1 gene_id:6426|Hs108|chr17 ( 248) 593 82.2 3.8e-16 CCDS58580.1 SRSF1 gene_id:6426|Hs108|chr17 ( 201) 456 66.1 2.3e-11 >>CCDS32109.1 SRSF5 gene_id:6430|Hs108|chr14 (272 aa) initn: 1772 init1: 1772 opt: 1772 Z-score: 1149.5 bits: 220.5 E(32554): 1e-57 Smith-Waterman score: 1772; 100.0% identity (100.0% similar) in 272 aa overlap (1-272:1-272) 10 20 30 40 50 60 pF1KB6 MSGCRVFIGRLNPAAREKDVERFFKGYGRIRDIDLKRGFGFVEFEDPRDADDAVYELDGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MSGCRVFIGRLNPAAREKDVERFFKGYGRIRDIDLKRGFGFVEFEDPRDADDAVYELDGK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 ELCSERVTIEHARARSRGGRGRGRYSDRFSSRRPRNDRRNAPPVRTENRLIVENLSSRVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 ELCSERVTIEHARARSRGGRGRGRYSDRFSSRRPRNDRRNAPPVRTENRLIVENLSSRVS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 WQDLKDFMRQAGEVTFADAHRPKLNEGVVEFASYGDLKNAIEKLSGKEINGRKIKLIEGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 WQDLKDFMRQAGEVTFADAHRPKLNEGVVEFASYGDLKNAIEKLSGKEINGRKIKLIEGS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 KRHSRSRSRSRSRTRSSSRSRSRSRSRSRKSYSRSRSRSRSRSRSKSRSVSRSPVPEKSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 KRHSRSRSRSRSRTRSSSRSRSRSRSRSRKSYSRSRSRSRSRSRSKSRSVSRSPVPEKSQ 190 200 210 220 230 240 250 260 270 pF1KB6 KRGSSSRSKSPASVDRQRSRSRSRSRSVDSGN :::::::::::::::::::::::::::::::: CCDS32 KRGSSSRSKSPASVDRQRSRSRSRSRSVDSGN 250 260 270 >>CCDS13318.1 SRSF6 gene_id:6431|Hs108|chr20 (344 aa) initn: 1608 init1: 522 opt: 1036 Z-score: 682.1 bits: 134.3 E(32554): 1.1e-31 Smith-Waterman score: 1048; 62.5% identity (79.3% similar) in 280 aa overlap (5-267:3-280) 10 20 30 40 50 60 pF1KB6 MSGCRVFIGRLNPAAREKDVERFFKGYGRIRDIDLKRGFGFVEFEDPRDADDAVYELDGK ::.::::. .::::..:::.::::. ..::: :.::::::: ::::::::::.:: CCDS13 MPRVYIGRLSYNVREKDIQRFFSGYGRLLEVDLKNGYGFVEFEDSRDADDAVYELNGK 10 20 30 40 50 70 80 90 100 110 pF1KB6 ELCSERVTIEHARA--RSRGGRGRGRYSDR--FSSRRPRNDRRNAPPVRTENRLIVENLS :::.::: .::::. :.: : . : : .:::: . . .:::::: :::::::: CCDS13 ELCGERVIVEHARGPRRDRDGYSYGSRSGGGGYSSRRTSGRDKYGPPVRTEYRLIVENLS 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB6 SRVSWQDLKDFMRQAGEVTFADAHRPKLNEGVVEFASYGDLKNAIEKLSGKEINGRKIKL :: ::::::::::::::::.::::. . ::::.:: ::.:.: :..::.: :::::.:.: CCDS13 SRCSWQDLKDFMRQAGEVTYADAHKERTNEGVIEFRSYSDMKRALDKLDGTEINGRNIRL 120 130 140 150 160 170 180 190 200 210 220 pF1KB6 IE------------GSKRHSRSRSRSRSRTRSSSRSRSRSRSRSRKSYSRSRSRSRSRSR :: ::. .:::: :::::.: :::::::: :.:: : :::::..::::: CCDS13 IEDKPRTSHRRSYSGSRSRSRSRRRSRSRSRRSSRSRSRSISKSR-SRSRSRSKGRSRSR 180 190 200 210 220 230 230 240 250 260 270 pF1KB6 SKSR-SVSRSPVPEKSQKRGSSSRSKSPASVDRQRSRSRSRSRSVDSGN ::.: : :.: ::. ::: :.:.: .. . ..::::::::: CCDS13 SKGRKSRSKSKSKPKSD-RGSHSHSRSRSKDEYEKSRSRSRSRSPKENGKGDIKSKSRSR 240 250 260 270 280 290 CCDS13 SQSRSNSPLPVPPSKARSVSPPPKRATSRSRSRSRSKSRSRSRSSSRD 300 310 320 330 340 >>CCDS333.1 SRSF4 gene_id:6429|Hs108|chr1 (494 aa) initn: 1235 init1: 527 opt: 1014 Z-score: 666.2 bits: 131.9 E(32554): 8.7e-31 Smith-Waterman score: 1014; 61.0% identity (80.9% similar) in 277 aa overlap (5-269:3-271) 10 20 30 40 50 60 pF1KB6 MSGCRVFIGRLNPAAREKDVERFFKGYGRIRDIDLKRGFGFVEFEDPRDADDAVYELDGK ::.::::. :::.::::::::::.: ..::: :.:::::.: ::::::::::.:: CCDS33 MPRVYIGRLSYQARERDVERFFKGYGKILEVDLKNGYGFVEFDDLRDADDAVYELNGK 10 20 30 40 50 70 80 90 100 110 pF1KB6 ELCSERVTIEHARA-RSRGGRGRGRYSDRFSSRRPRNDRRNAPPVRTENRLIVENLSSRV .::.::: .::::. : :. : :: . .. :: :. . ::.::: :::::::::: CCDS33 DLCGERVIVEHARGPRRDGSYGSGRSG--YGYRRSGRDKYG-PPTRTEYRLIVENLSSRC 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB6 SWQDLKDFMRQAGEVTFADAHRPKLNEGVVEFASYGDLKNAIEKLSGKEINGRKIKLIE- :::::::.::::::::.::::. . ::::.::.::.:.: :.:::.: :.:::::.:.: CCDS33 SWQDLKDYMRQAGEVTYADAHKGRKNEGVIEFVSYSDMKRALEKLDGTEVNGRKIRLVED 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB6 --GSKR---HSRSRSRSRSRTRSSSRSRSRSRSRSRKS-YSRSRSRSRSRSRSKSRSVSR ::.: .:::::.::::.:: .::::: : :: .:.::::::: :::.:.: :: CCDS33 KPGSRRRRSYSRSRSHSRSRSRSRHSRKSRSRSGSSKSSHSKSRSRSRSGSRSRSKSRSR 180 190 200 210 220 230 240 250 260 270 pF1KB6 SPVPEKSQKRGSSSRSKSPASVDRQRSRS----RSRSRSVDSGN : .:..:... .:.:: : ...:::: .:::.: : CCDS33 S----QSRSRSKKEKSRSP-SKEKSRSRSHSAGKSRSKSKDQAEEKIQNNDNVGKPKSRS 240 250 260 270 280 290 CCDS33 PSRHKSKSKSRSRSQERRVEEEKRGSVSRGRSQEKSLRQSRSRSRSKGGSRSRSRSRSKS 300 310 320 330 340 350 >>CCDS11600.1 SRSF1 gene_id:6426|Hs108|chr17 (248 aa) initn: 304 init1: 238 opt: 593 Z-score: 403.3 bits: 82.2 E(32554): 3.8e-16 Smith-Waterman score: 593; 47.3% identity (67.1% similar) in 243 aa overlap (4-233:16-248) 10 20 30 40 pF1KB6 MSGCRVFIGRLNPAAREKDVERFFKGYGRIRDIDLK--RG---FGFVE ::...: : : : ::.: : :: ::::::: :: :.::: CCDS11 MSGGGVIRGPAGNNDCRIYVGNLPPDIRTKDIEDVFYKYGAIRDIDLKNRRGGPPFAFVE 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB6 FEDPRDADDAVYELDGKELCSERVTIEHARARSRG-GRGRGRYSDRFSSRRPRNDRRNAP :::::::.:::: :: . . :. .: :. .:: ::: : . .. ::. : . : CCDS11 FEDPRDAEDAVYGRDGYDYDGYRLRVEFPRS-GRGTGRGGGGGG---GGGAPRG-RYGPP 70 80 90 100 110 110 120 130 140 150 160 pF1KB6 PVRTENRLIVENLSSRVSWQDLKDFMRQAGEVTFADAHRPKLNEGVVEFASYGDLKNAIE :.:::..: .: ::::::: ::.::.: .::..: . :::::. :. :.. CCDS11 SRRSENRVVVSGLPPSGSWQDLKDHMREAGDVCYADVYRD--GTGVVEFVRKEDMTYAVR 120 130 140 150 160 170 170 180 190 200 210 pF1KB6 KLSGKEINGRK-----IKL-IEGSKRHSRSRSRSRSRTRSSSRSRSRSRSRSRKSYSRSR ::.. .. ... :.. ..: . : .:::::::.:: ::::: ::::: :: : CCDS11 KLDNTKFRSHEGETAYIRVKVDGPRSPSYGRSRSRSRSRSRSRSRSNSRSRS---YSPRR 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB6 SRSRSR-SRSKSRSVSRSPVPEKSQKRGSSSRSKSPASVDRQRSRSRSRSRSVDSGN ::. : : .::: ::. CCDS11 SRGSPRYSPRHSRSRSRT 240 >>CCDS58580.1 SRSF1 gene_id:6426|Hs108|chr17 (201 aa) initn: 474 init1: 175 opt: 456 Z-score: 317.7 bits: 66.1 E(32554): 2.3e-11 Smith-Waterman score: 456; 45.8% identity (67.8% similar) in 177 aa overlap (4-174:16-185) 10 20 30 40 pF1KB6 MSGCRVFIGRLNPAAREKDVERFFKGYGRIRDIDLK--RG---FGFVE ::...: : : : ::.: : :: ::::::: :: :.::: CCDS58 MSGGGVIRGPAGNNDCRIYVGNLPPDIRTKDIEDVFYKYGAIRDIDLKNRRGGPPFAFVE 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB6 FEDPRDADDAVYELDGKELCSERVTIEHARARSRG-GRGRGRYSDRFSSRRPRNDRRNAP :::::::.:::: :: . . :. .: :. .:: ::: : . .. ::. : . : CCDS58 FEDPRDAEDAVYGRDGYDYDGYRLRVEFPRS-GRGTGRGGGGGG---GGGAPRG-RYGPP 70 80 90 100 110 110 120 130 140 150 160 pF1KB6 PVRTENRLIVENLSSRVSWQDLKDFMRQAGEVTFADAHRPKLNEGVVEFASYGDLKNAIE :.:::..: .: ::::::: ::.::.: .::..: . :::::. :. :.. CCDS58 SRRSENRVVVSGLPPSGSWQDLKDHMREAGDVCYADVYRD--GTGVVEFVRKEDMTYAVR 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB6 KLSGKEINGRKIKLIEGSKRHSRSRSRSRSRTRSSSRSRSRSRSRSRKSYSRSRSRSRSR ::.. .. .... CCDS58 KLDNTKFRSHEVGYTRILFFDQNWIQWS 180 190 200 272 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 20:42:49 2016 done: Fri Nov 4 20:42:49 2016 Total Scan time: 2.530 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]