FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB6381, 272 aa
1>>>pF1KB6381 272 - 272 aa - 272 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.5320+/-0.00108; mu= 1.1354+/- 0.065
mean_var=249.2795+/-52.292, 0's: 0 Z-trim(110.1): 143 B-trim: 589 in 1/54
Lambda= 0.081233
statistics sampled from 11210 (11353) to 11210 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.684), E-opt: 0.2 (0.349), width: 16
Scan time: 2.530
The best scores are: opt bits E(32554)
CCDS32109.1 SRSF5 gene_id:6430|Hs108|chr14 ( 272) 1772 220.5 1e-57
CCDS13318.1 SRSF6 gene_id:6431|Hs108|chr20 ( 344) 1036 134.3 1.1e-31
CCDS333.1 SRSF4 gene_id:6429|Hs108|chr1 ( 494) 1014 131.9 8.7e-31
CCDS11600.1 SRSF1 gene_id:6426|Hs108|chr17 ( 248) 593 82.2 3.8e-16
CCDS58580.1 SRSF1 gene_id:6426|Hs108|chr17 ( 201) 456 66.1 2.3e-11
>>CCDS32109.1 SRSF5 gene_id:6430|Hs108|chr14 (272 aa)
initn: 1772 init1: 1772 opt: 1772 Z-score: 1149.5 bits: 220.5 E(32554): 1e-57
Smith-Waterman score: 1772; 100.0% identity (100.0% similar) in 272 aa overlap (1-272:1-272)
10 20 30 40 50 60
pF1KB6 MSGCRVFIGRLNPAAREKDVERFFKGYGRIRDIDLKRGFGFVEFEDPRDADDAVYELDGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MSGCRVFIGRLNPAAREKDVERFFKGYGRIRDIDLKRGFGFVEFEDPRDADDAVYELDGK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB6 ELCSERVTIEHARARSRGGRGRGRYSDRFSSRRPRNDRRNAPPVRTENRLIVENLSSRVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 ELCSERVTIEHARARSRGGRGRGRYSDRFSSRRPRNDRRNAPPVRTENRLIVENLSSRVS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB6 WQDLKDFMRQAGEVTFADAHRPKLNEGVVEFASYGDLKNAIEKLSGKEINGRKIKLIEGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 WQDLKDFMRQAGEVTFADAHRPKLNEGVVEFASYGDLKNAIEKLSGKEINGRKIKLIEGS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB6 KRHSRSRSRSRSRTRSSSRSRSRSRSRSRKSYSRSRSRSRSRSRSKSRSVSRSPVPEKSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 KRHSRSRSRSRSRTRSSSRSRSRSRSRSRKSYSRSRSRSRSRSRSKSRSVSRSPVPEKSQ
190 200 210 220 230 240
250 260 270
pF1KB6 KRGSSSRSKSPASVDRQRSRSRSRSRSVDSGN
::::::::::::::::::::::::::::::::
CCDS32 KRGSSSRSKSPASVDRQRSRSRSRSRSVDSGN
250 260 270
>>CCDS13318.1 SRSF6 gene_id:6431|Hs108|chr20 (344 aa)
initn: 1608 init1: 522 opt: 1036 Z-score: 682.1 bits: 134.3 E(32554): 1.1e-31
Smith-Waterman score: 1048; 62.5% identity (79.3% similar) in 280 aa overlap (5-267:3-280)
10 20 30 40 50 60
pF1KB6 MSGCRVFIGRLNPAAREKDVERFFKGYGRIRDIDLKRGFGFVEFEDPRDADDAVYELDGK
::.::::. .::::..:::.::::. ..::: :.::::::: ::::::::::.::
CCDS13 MPRVYIGRLSYNVREKDIQRFFSGYGRLLEVDLKNGYGFVEFEDSRDADDAVYELNGK
10 20 30 40 50
70 80 90 100 110
pF1KB6 ELCSERVTIEHARA--RSRGGRGRGRYSDR--FSSRRPRNDRRNAPPVRTENRLIVENLS
:::.::: .::::. :.: : . : : .:::: . . .:::::: ::::::::
CCDS13 ELCGERVIVEHARGPRRDRDGYSYGSRSGGGGYSSRRTSGRDKYGPPVRTEYRLIVENLS
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB6 SRVSWQDLKDFMRQAGEVTFADAHRPKLNEGVVEFASYGDLKNAIEKLSGKEINGRKIKL
:: ::::::::::::::::.::::. . ::::.:: ::.:.: :..::.: :::::.:.:
CCDS13 SRCSWQDLKDFMRQAGEVTYADAHKERTNEGVIEFRSYSDMKRALDKLDGTEINGRNIRL
120 130 140 150 160 170
180 190 200 210 220
pF1KB6 IE------------GSKRHSRSRSRSRSRTRSSSRSRSRSRSRSRKSYSRSRSRSRSRSR
:: ::. .:::: :::::.: :::::::: :.:: : :::::..:::::
CCDS13 IEDKPRTSHRRSYSGSRSRSRSRRRSRSRSRRSSRSRSRSISKSR-SRSRSRSKGRSRSR
180 190 200 210 220 230
230 240 250 260 270
pF1KB6 SKSR-SVSRSPVPEKSQKRGSSSRSKSPASVDRQRSRSRSRSRSVDSGN
::.: : :.: ::. ::: :.:.: .. . ..:::::::::
CCDS13 SKGRKSRSKSKSKPKSD-RGSHSHSRSRSKDEYEKSRSRSRSRSPKENGKGDIKSKSRSR
240 250 260 270 280 290
CCDS13 SQSRSNSPLPVPPSKARSVSPPPKRATSRSRSRSRSKSRSRSRSSSRD
300 310 320 330 340
>>CCDS333.1 SRSF4 gene_id:6429|Hs108|chr1 (494 aa)
initn: 1235 init1: 527 opt: 1014 Z-score: 666.2 bits: 131.9 E(32554): 8.7e-31
Smith-Waterman score: 1014; 61.0% identity (80.9% similar) in 277 aa overlap (5-269:3-271)
10 20 30 40 50 60
pF1KB6 MSGCRVFIGRLNPAAREKDVERFFKGYGRIRDIDLKRGFGFVEFEDPRDADDAVYELDGK
::.::::. :::.::::::::::.: ..::: :.:::::.: ::::::::::.::
CCDS33 MPRVYIGRLSYQARERDVERFFKGYGKILEVDLKNGYGFVEFDDLRDADDAVYELNGK
10 20 30 40 50
70 80 90 100 110
pF1KB6 ELCSERVTIEHARA-RSRGGRGRGRYSDRFSSRRPRNDRRNAPPVRTENRLIVENLSSRV
.::.::: .::::. : :. : :: . .. :: :. . ::.::: ::::::::::
CCDS33 DLCGERVIVEHARGPRRDGSYGSGRSG--YGYRRSGRDKYG-PPTRTEYRLIVENLSSRC
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB6 SWQDLKDFMRQAGEVTFADAHRPKLNEGVVEFASYGDLKNAIEKLSGKEINGRKIKLIE-
:::::::.::::::::.::::. . ::::.::.::.:.: :.:::.: :.:::::.:.:
CCDS33 SWQDLKDYMRQAGEVTYADAHKGRKNEGVIEFVSYSDMKRALEKLDGTEVNGRKIRLVED
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB6 --GSKR---HSRSRSRSRSRTRSSSRSRSRSRSRSRKS-YSRSRSRSRSRSRSKSRSVSR
::.: .:::::.::::.:: .::::: : :: .:.::::::: :::.:.: ::
CCDS33 KPGSRRRRSYSRSRSHSRSRSRSRHSRKSRSRSGSSKSSHSKSRSRSRSGSRSRSKSRSR
180 190 200 210 220 230
240 250 260 270
pF1KB6 SPVPEKSQKRGSSSRSKSPASVDRQRSRS----RSRSRSVDSGN
: .:..:... .:.:: : ...:::: .:::.: :
CCDS33 S----QSRSRSKKEKSRSP-SKEKSRSRSHSAGKSRSKSKDQAEEKIQNNDNVGKPKSRS
240 250 260 270 280 290
CCDS33 PSRHKSKSKSRSRSQERRVEEEKRGSVSRGRSQEKSLRQSRSRSRSKGGSRSRSRSRSKS
300 310 320 330 340 350
>>CCDS11600.1 SRSF1 gene_id:6426|Hs108|chr17 (248 aa)
initn: 304 init1: 238 opt: 593 Z-score: 403.3 bits: 82.2 E(32554): 3.8e-16
Smith-Waterman score: 593; 47.3% identity (67.1% similar) in 243 aa overlap (4-233:16-248)
10 20 30 40
pF1KB6 MSGCRVFIGRLNPAAREKDVERFFKGYGRIRDIDLK--RG---FGFVE
::...: : : : ::.: : :: ::::::: :: :.:::
CCDS11 MSGGGVIRGPAGNNDCRIYVGNLPPDIRTKDIEDVFYKYGAIRDIDLKNRRGGPPFAFVE
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB6 FEDPRDADDAVYELDGKELCSERVTIEHARARSRG-GRGRGRYSDRFSSRRPRNDRRNAP
:::::::.:::: :: . . :. .: :. .:: ::: : . .. ::. : . :
CCDS11 FEDPRDAEDAVYGRDGYDYDGYRLRVEFPRS-GRGTGRGGGGGG---GGGAPRG-RYGPP
70 80 90 100 110
110 120 130 140 150 160
pF1KB6 PVRTENRLIVENLSSRVSWQDLKDFMRQAGEVTFADAHRPKLNEGVVEFASYGDLKNAIE
:.:::..: .: ::::::: ::.::.: .::..: . :::::. :. :..
CCDS11 SRRSENRVVVSGLPPSGSWQDLKDHMREAGDVCYADVYRD--GTGVVEFVRKEDMTYAVR
120 130 140 150 160 170
170 180 190 200 210
pF1KB6 KLSGKEINGRK-----IKL-IEGSKRHSRSRSRSRSRTRSSSRSRSRSRSRSRKSYSRSR
::.. .. ... :.. ..: . : .:::::::.:: ::::: ::::: :: :
CCDS11 KLDNTKFRSHEGETAYIRVKVDGPRSPSYGRSRSRSRSRSRSRSRSNSRSRS---YSPRR
180 190 200 210 220 230
220 230 240 250 260 270
pF1KB6 SRSRSR-SRSKSRSVSRSPVPEKSQKRGSSSRSKSPASVDRQRSRSRSRSRSVDSGN
::. : : .::: ::.
CCDS11 SRGSPRYSPRHSRSRSRT
240
>>CCDS58580.1 SRSF1 gene_id:6426|Hs108|chr17 (201 aa)
initn: 474 init1: 175 opt: 456 Z-score: 317.7 bits: 66.1 E(32554): 2.3e-11
Smith-Waterman score: 456; 45.8% identity (67.8% similar) in 177 aa overlap (4-174:16-185)
10 20 30 40
pF1KB6 MSGCRVFIGRLNPAAREKDVERFFKGYGRIRDIDLK--RG---FGFVE
::...: : : : ::.: : :: ::::::: :: :.:::
CCDS58 MSGGGVIRGPAGNNDCRIYVGNLPPDIRTKDIEDVFYKYGAIRDIDLKNRRGGPPFAFVE
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB6 FEDPRDADDAVYELDGKELCSERVTIEHARARSRG-GRGRGRYSDRFSSRRPRNDRRNAP
:::::::.:::: :: . . :. .: :. .:: ::: : . .. ::. : . :
CCDS58 FEDPRDAEDAVYGRDGYDYDGYRLRVEFPRS-GRGTGRGGGGGG---GGGAPRG-RYGPP
70 80 90 100 110
110 120 130 140 150 160
pF1KB6 PVRTENRLIVENLSSRVSWQDLKDFMRQAGEVTFADAHRPKLNEGVVEFASYGDLKNAIE
:.:::..: .: ::::::: ::.::.: .::..: . :::::. :. :..
CCDS58 SRRSENRVVVSGLPPSGSWQDLKDHMREAGDVCYADVYRD--GTGVVEFVRKEDMTYAVR
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB6 KLSGKEINGRKIKLIEGSKRHSRSRSRSRSRTRSSSRSRSRSRSRSRKSYSRSRSRSRSR
::.. .. ....
CCDS58 KLDNTKFRSHEVGYTRILFFDQNWIQWS
180 190 200
272 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 20:42:49 2016 done: Fri Nov 4 20:42:49 2016
Total Scan time: 2.530 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]