FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5874, 494 aa 1>>>pF1KB5874 494 - 494 aa - 494 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.8510+/-0.0014; mu= 2.4436+/- 0.085 mean_var=456.2730+/-92.315, 0's: 0 Z-trim(110.5): 167 B-trim: 206 in 1/54 Lambda= 0.060043 statistics sampled from 11533 (11685) to 11533 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.651), E-opt: 0.2 (0.359), width: 16 Scan time: 3.270 The best scores are: opt bits E(32554) CCDS333.1 SRSF4 gene_id:6429|Hs108|chr1 ( 494) 3163 288.7 9.9e-78 CCDS13318.1 SRSF6 gene_id:6431|Hs108|chr20 ( 344) 1385 134.5 1.8e-31 CCDS32109.1 SRSF5 gene_id:6430|Hs108|chr14 ( 272) 1020 102.7 5.3e-22 CCDS11600.1 SRSF1 gene_id:6426|Hs108|chr17 ( 248) 599 66.2 4.8e-11 CCDS46095.1 SRRM5 gene_id:100170229|Hs108|chr19 ( 715) 606 67.4 5.8e-11 >>CCDS333.1 SRSF4 gene_id:6429|Hs108|chr1 (494 aa) initn: 3163 init1: 3163 opt: 3163 Z-score: 1509.0 bits: 288.7 E(32554): 9.9e-78 Smith-Waterman score: 3163; 99.8% identity (100.0% similar) in 494 aa overlap (1-494:1-494) 10 20 30 40 50 60 pF1KB5 MPRVYIGRLSYQARERDVERFFKGYGKILEVDLKNGYGFVEFDDLRDADDAVYELNGKDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MPRVYIGRLSYQARERDVERFFKGYGKILEVDLKNGYGFVEFDDLRDADDAVYELNGKDL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 CGERVIVEHARGPRRDGSYGSGRSGYGYRRSGRDKYGPPTRTEYRLIVENLSSRCSWQDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 CGERVIVEHARGPRRDGSYGSGRSGYGYRRSGRDKYGPPTRTEYRLIVENLSSRCSWQDL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 KDYMRQAGEVTYADAHKGRKNEGVIEFVSYSDMKRALEKLDGTEVNGRKIRLVEDKPGSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KDYMRQAGEVTYADAHKGRKNEGVIEFVSYSDMKRALEKLDGTEVNGRKIRLVEDKPGSR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 RRRSYSRSRSHSRSRSRSRHSRKSRSRSGSSKSSHSKSRSRSRSGSRSRSKSRSRSQSRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RRRSYSRSRSHSRSRSRSRHSRKSRSRSGSSKSSHSKSRSRSRSGSRSRSKSRSRSQSRS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 RSKKEKSRSPSKDKSRSRSHSAGKSRSKSKDQAEEKIQNNDNVGKPKSRSPSRHKSKSKS ::::::::::::.::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RSKKEKSRSPSKEKSRSRSHSAGKSRSKSKDQAEEKIQNNDNVGKPKSRSPSRHKSKSKS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 RSRSQERRVEEEKRGSVSRGRSQEKSLRQSRSRSRSKGGSRSRSRSRSKSKDKRKGRKRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RSRSQERRVEEEKRGSVSRGRSQEKSLRQSRSRSRSKGGSRSRSRSRSKSKDKRKGRKRS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 REESRSRSRSRSKSERSRKRGSKRDSKAGSSKKKKKEDTDRSQSRSPSRSVSKEREHAKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 REESRSRSRSRSKSERSRKRGSKRDSKAGSSKKKKKEDTDRSQSRSPSRSVSKEREHAKS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 ESSQREGRGESENAGTNQETRSRSRSNSKSKPNLPSESRSRSKSASKTRSRSKSRSRSAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ESSQREGRGESENAGTNQETRSRSRSNSKSKPNLPSESRSRSKSASKTRSRSKSRSRSAS 430 440 450 460 470 480 490 pF1KB5 RSPSRSRSRSHSRS :::::::::::::: CCDS33 RSPSRSRSRSHSRS 490 >>CCDS13318.1 SRSF6 gene_id:6431|Hs108|chr20 (344 aa) initn: 841 init1: 841 opt: 1385 Z-score: 678.3 bits: 134.5 E(32554): 1.8e-31 Smith-Waterman score: 1427; 66.5% identity (80.9% similar) in 361 aa overlap (1-352:1-344) 10 20 30 40 50 60 pF1KB5 MPRVYIGRLSYQARERDVERFFKGYGKILEVDLKNGYGFVEFDDLRDADDAVYELNGKDL :::::::::::..::.:..:::.:::..::::::::::::::.: :::::::::::::.: CCDS13 MPRVYIGRLSYNVREKDIQRFFSGYGRLLEVDLKNGYGFVEFEDSRDADDAVYELNGKEL 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 CGERVIVEHARGPRRD--G-SYGSGRSGYGY---RRSGRDKYGPPTRTEYRLIVENLSSR :::::::::::::::: : :::: .: :: : :::::::::.:::::::::::::: CCDS13 CGERVIVEHARGPRRDRDGYSYGSRSGGGGYSSRRTSGRDKYGPPVRTEYRLIVENLSSR 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB5 CSWQDLKDYMRQAGEVTYADAHKGRKNEGVIEFVSYSDMKRALEKLDGTEVNGRKIRLVE ::::::::.:::::::::::::: : ::::::: :::::::::.::::::.:::.:::.: CCDS13 CSWQDLKDFMRQAGEVTYADAHKERTNEGVIEFRSYSDMKRALDKLDGTEINGRNIRLIE 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB5 DKPGSRRRRSYSRSRSHSRSRSRSRHSRKSRSRSGSSKSSHSKSRSRSRSGSRSRSKSRS ::: . .::::: :::.:::: ::: :::: .: .::::: : :::::.::: CCDS13 DKPRTSHRRSYSGSRSRSRSRRRSR----SRSRRSS------RSRSRSISKSRSRSRSRS 190 200 210 220 230 240 250 260 270 280 290 pF1KB5 RSQSRSRSKKEKSRSPSKDKSRSRSHSAGKSRSKSKDQAEEKIQNNDNVGKPKSRSPSRH ...:::::: .:::: ::.: .: : ..:::.:::. :. . .. .::::... CCDS13 KGRSRSRSKGRKSRSKSKSKPKSDRGSHSHSRSRSKDEYEK------SRSRSRSRSPKEN 240 250 260 270 280 300 310 320 330 340 350 pF1KB5 KS---KSKSRSRSQERRVEEEKRGSVSRGRSQEKSLRQSRSRSRSKGGSRSRSRSRSKSK . ::::::::: : :..:: ... :::::.. :.:::::::.:. CCDS13 GKGDIKSKSRSRSQSRSNSPLPVPP-SKARSVSPPPKRATSRSRSRSRSKSRSRSRSSSR 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB5 DKRKGRKRSREESRSRSRSRSKSERSRKRGSKRDSKAGSSKKKKKEDTDRSQSRSPSRSV : CCDS13 D >>CCDS32109.1 SRSF5 gene_id:6430|Hs108|chr14 (272 aa) initn: 1381 init1: 525 opt: 1020 Z-score: 508.5 bits: 102.7 E(32554): 5.3e-22 Smith-Waterman score: 1020; 61.0% identity (81.2% similar) in 277 aa overlap (3-271:5-269) 10 20 30 40 50 pF1KB5 MPRVYIGRLSYQARERDVERFFKGYGKILEVDLKNGYGFVEFDDLRDADDAVYELNGK ::.::::. :::.::::::::::.: ..::: :.:::::.: ::::::::::.:: CCDS32 MSGCRVFIGRLNPAAREKDVERFFKGYGRIRDIDLKRGFGFVEFEDPRDADDAVYELDGK 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 DLCGERVIVEHARGPRRDGSYGSGRSG--YGYRRSGRDKYG-PPTRTEYRLIVENLSSRC .::.::: .::::. : :. : :: . .. :: :. . ::.::: :::::::::: CCDS32 ELCSERVTIEHARA-RSRGGRGRGRYSDRFSSRRPRNDRRNAPPVRTENRLIVENLSSRV 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 SWQDLKDYMRQAGEVTYADAHKGRKNEGVIEFVSYSDMKRALEKLDGTEVNGRKIRLVED :::::::.::::::::.::::. . ::::.::.::.:.: :.:::.: :.:::::.:.: CCDS32 SWQDLKDFMRQAGEVTFADAHRPKLNEGVVEFASYGDLKNAIEKLSGKEINGRKIKLIE- 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 KPGSRRRRSYSRSRSHSRSRSRSRHSRKSRSRSGSSKSSHSKSRSRSRSGSRSRSKSRSR ::.: .:::::.::::.:: .::::: :..:.:.::::::: :::.:.: :: CCDS32 --GSKR---HSRSRSRSRSRTRSSSRSRSRSRS-RSRKSYSRSRSRSRSRSRSKSRSVSR 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB5 S----QSRSRSKKEKSRSP-SKDKSRSRSHSAGKSRSKSKDQAEEKIQNNDNVGKPKSRS : .:..:... .:.:: : :..:::: .:::.: : CCDS32 SPVPEKSQKRGSSSRSKSPASVDRQRSRS----RSRSRSVDSGN 240 250 260 270 300 310 320 330 340 350 pF1KB5 PSRHKSKSKSRSRSQERRVEEEKRGSVSRGRSQEKSLRQSRSRSRSKGGSRSRSRSRSKS >>CCDS11600.1 SRSF1 gene_id:6426|Hs108|chr17 (248 aa) initn: 711 init1: 184 opt: 599 Z-score: 311.8 bits: 66.2 E(32554): 4.8e-11 Smith-Waterman score: 599; 46.5% identity (65.1% similar) in 241 aa overlap (3-232:17-248) 10 20 30 40 pF1KB5 MPRVYIGRLSYQARERDVERFFKGYGKILEVDLKNGYG-----FVE :.:.: : . : .:.: : :: : ..:::: : ::: CCDS11 MSGGGVIRGPAGNNDCRIYVGNLPPDIRTKDIEDVFYKYGAIRDIDLKNRRGGPPFAFVE 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB5 FDDLRDADDAVYELNGKDLCGERVIVEHARGPRRDGSYGSGRSGYGYRRSGRDKYGPPTR :.: :::.:::: .: : : :. :: :. : : :.: .: : . : .::::.: CCDS11 FEDPRDAEDAVYGRDGYDYDGYRLRVEFPRSGRGTGRGGGGGGGGG---APRGRYGPPSR 70 80 90 100 110 110 120 130 140 150 160 pF1KB5 -TEYRLIVENLSSRCSWQDLKDYMRQAGEVTYADAHKGRKNEGVIEFVSYSDMKRALEKL .: :..: .: :::::::.::.::.: :::.. : . ::.::: :: :..:: CCDS11 RSENRVVVSGLPPSGSWQDLKDHMREAGDVCYADVY--RDGTGVVEFVRKEDMTYAVRKL 120 130 140 150 160 170 170 180 190 200 210 pF1KB5 DGTEVNGRK-----IRLVEDKPGSRRRRSYSRSRSHSRSRSRSRHSRKSRSRSGSSKSSH :.:. ... ::. : : : ::.::::.:::::::: .::::: : . :. CCDS11 DNTKFRSHEGETAYIRVKVDGP---RSPSYGRSRSRSRSRSRSRSRSNSRSRSYSPRRSR 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB5 SKSRSRSRSGSRSRSKSRSRSQSRSRSKKEKSRSPSKDKSRSRSHSAGKSRSKSKDQAEE .. : : :::::.. CCDS11 GSPRYSPRH-SRSRSRT 240 >>CCDS46095.1 SRRM5 gene_id:100170229|Hs108|chr19 (715 aa) initn: 502 init1: 502 opt: 606 Z-score: 310.2 bits: 67.4 E(32554): 5.8e-11 Smith-Waterman score: 618; 37.1% identity (67.0% similar) in 345 aa overlap (163-494:260-586) 140 150 160 170 180 190 pF1KB5 ADAHKGRKNEGVIEFVSYSDMKRALEKLDGTEVNGRKIRLVEDKPGSRRRRSYSRSRSHS ::...: .. .. : .:.:.::: CCDS46 KSDNPSPSSSRKVKSYGQMIIPSREKSYSPTEMSSR-VKSYNQASTRSRPQSHSQSRSPR 230 240 250 260 270 280 200 210 220 230 240 pF1KB5 RSRSRSRHSRKSRSRSGSSKSSHSKSRSRSRSG--------SRSRSKSRSRSQSRSRS-K :::: :.. .:: :: : : .::..:::.:.: :.:::.:...::..::. . CCDS46 RSRSGSQKRTHSRVRSHSWKRNHSRARSRTRKGILSQMGRHSQSRSHSKGKSQNQSRTPR 290 300 310 320 330 340 250 260 270 280 290 300 pF1KB5 KEKSRSPSKDKSRSRSHSAGKSRSKSKDQAEEKIQNNDNVGKPKSRSPSRHKSKSKSRSR . .:.. :.. :. :::: ..: :: .:. . ... :. .: ::......:.::: CCDS46 RGRSHNWSRNPSKERSHSHSRSSSKERDHRGSSSPRKES-GRSQSGSPNKQRDHSRSRSP 350 360 370 380 390 400 310 320 330 340 350 360 pF1KB5 SQERRVEEEKRGSVSRGRSQEKSLRQSRSRSRSKGGSRSRSRSRSKSKDKRKGRKRSREE .. : . . .: ::. .: ..:. :::.. ..:.::::.: .: . ..::: CCDS46 NKARDRSRSRSPYKARDRSRSRSPNKARDCSRSRSPYKARDRSRSRSPNKARDHSRSRSP 410 420 430 440 450 460 370 380 390 400 410 pF1KB5 SRSRSRSRSKSERSRKRGSKRDSKAGSSKKKKKEDTDRSQSRS----PSRSVSKEREHAK ...:.::::.: :..: :. :: .:.. . .:: :. ::: ::::.: . CCDS46 NKARDRSRSRSP-SKERD---HSQLGSPSKERDHRRSRSPSKERQCRQSRSSSKERDHRR 470 480 490 500 510 520 420 430 440 450 460 470 pF1KB5 SESSQREGRGESENAGTNQETRSRSRSNSKSKPNLPSESRSRSKSASKTRSRSKSRSRSA :.: ..: : . .. . :.: :.::.:.: ::: : . .: :: :: :.: CCDS46 SRSPSKE-RQRRQSRSPNKE---RDRSQSRS----PSEEREHRQS----RSPSKERDRRR 530 540 550 560 570 480 490 pF1KB5 SRSPSRSRSRSHSRS ::::. : : .::: CCDS46 WRSPSKERERRQSRSSSEERDHSRSRSPNKQSGYSRPRASSKEKAHSRSRTPSKEGNHSQ 580 590 600 610 620 630 494 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 15:25:45 2016 done: Sat Nov 5 15:25:46 2016 Total Scan time: 3.270 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]