FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8703, 574 aa 1>>>pF1KB8703 574 - 574 aa - 574 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.7825+/-0.000814; mu= 5.7871+/- 0.049 mean_var=238.0925+/-47.768, 0's: 0 Z-trim(116.6): 7 B-trim: 189 in 1/53 Lambda= 0.083119 statistics sampled from 17251 (17256) to 17251 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.819), E-opt: 0.2 (0.53), width: 16 Scan time: 3.950 The best scores are: opt bits E(32554) CCDS73958.1 SENP3 gene_id:26168|Hs108|chr17 ( 574) 4035 496.6 3.6e-140 CCDS3322.1 SENP5 gene_id:205564|Hs108|chr3 ( 755) 1040 137.5 5.7e-32 CCDS44868.2 SENP1 gene_id:29843|Hs108|chr12 ( 644) 559 79.8 1.2e-14 CCDS77876.1 SENP5 gene_id:205564|Hs108|chr3 ( 709) 524 75.6 2.3e-13 CCDS33902.1 SENP2 gene_id:59343|Hs108|chr3 ( 589) 494 71.9 2.4e-12 >>CCDS73958.1 SENP3 gene_id:26168|Hs108|chr17 (574 aa) initn: 4035 init1: 4035 opt: 4035 Z-score: 2630.0 bits: 496.6 E(32554): 3.6e-140 Smith-Waterman score: 4035; 99.8% identity (99.8% similar) in 574 aa overlap (1-574:1-574) 10 20 30 40 50 60 pF1KB8 MKETIQGTGSWGPEPPGPGIPPAYSSPRRERLRWPPPPKPRLKSGGGFGPDPGSGTTVPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 MKETIQGTGSWGPEPPGPGIPPAYSSPRRERLRWPPPPKPRLKSGGGFGPDPGSGTTVPA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 RRLPVPRPSFDASASEEEEEEEEEVDEDEEEEVAAWRLPPRWSQLGTSQRPRPSRPTHRK :::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::: CCDS73 RRLPVPRPSFDASASEEEEEEEEEEDEDEEEEVAAWRLPPRWSQLGTSQRPRPSRPTHRK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 TCSQRRRRAMRAFRMLLYSKSTSLTFHWKLWGRHRGRRRGLAHPKNHLSPQQGGATPQVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 TCSQRRRRAMRAFRMLLYSKSTSLTFHWKLWGRHRGRRRGLAHPKNHLSPQQGGATPQVP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 SPCCRFDSPRGPPPPRLGLLGALMAEDGVRGSPPVPSGPPMEEDGLRWTPKSPLDPDSGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 SPCCRFDSPRGPPPPRLGLLGALMAEDGVRGSPPVPSGPPMEEDGLRWTPKSPLDPDSGL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 LSCTLPNGFGGQSGPEGERSLAPPDASILISNVCSIGDHVAQELFQGSDLGMAEEAERPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 LSCTLPNGFGGQSGPEGERSLAPPDASILISNVCSIGDHVAQELFQGSDLGMAEEAERPG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 EKAGQHSPLREEHVTCVQSILDEFLQTYGSLIPLSTDEVVEKLEDIFQQEFSTPSRKGLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 EKAGQHSPLREEHVTCVQSILDEFLQTYGSLIPLSTDEVVEKLEDIFQQEFSTPSRKGLV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 LQLIQSYQRMPGNAMVRGFRVAYKRHVLTMDDLGTLYGQNWLNDQVMNMYGDLVMDTVPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 LQLIQSYQRMPGNAMVRGFRVAYKRHVLTMDDLGTLYGQNWLNDQVMNMYGDLVMDTVPE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 KVHFFNSFFYDKLRTKGYDGVKRWTKNVDIFNKELLLIPIHLEVHWSLISVDVRRRTITY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 KVHFFNSFFYDKLRTKGYDGVKRWTKNVDIFNKELLLIPIHLEVHWSLISVDVRRRTITY 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB8 FDSQRTLNRRCPKHIAKYLQAEAVKKDRLDFHQGWKGYFKMNVARQNNDSDCGAFVLQYC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 FDSQRTLNRRCPKHIAKYLQAEAVKKDRLDFHQGWKGYFKMNVARQNNDSDCGAFVLQYC 490 500 510 520 530 540 550 560 570 pF1KB8 KHLALSQPFSFTQQDMPKLRRQIYKELCHCKLTV :::::::::::::::::::::::::::::::::: CCDS73 KHLALSQPFSFTQQDMPKLRRQIYKELCHCKLTV 550 560 570 >>CCDS3322.1 SENP5 gene_id:205564|Hs108|chr3 (755 aa) initn: 1041 init1: 887 opt: 1040 Z-score: 687.5 bits: 137.5 E(32554): 5.7e-32 Smith-Waterman score: 1040; 53.5% identity (79.2% similar) in 284 aa overlap (291-572:475-753) 270 280 290 300 310 pF1KB8 LAPPDASILISNVCSIGDHVAQELFQGSDLGMAEEAERPGEKAGQH-SPLREEHVT-CVQ :. : . : : .:. ::. .:... :.. CCDS33 DGSLKQSILSSELLDHPYCKSPLEAPLVCSGLKLENQVGGGKNSQKASPVDDEQLSVCLS 450 460 470 480 490 500 320 330 340 350 360 370 pF1KB8 SILDEFLQTYGSLIPLSTDEVVEKLEDIFQQEFSTPSRKGLVLQLIQSYQRMPGNAMVRG ..::: .. ::::.::: ::. .:.:.:...:: .:: .. . : .:. . . CCDS33 GFLDEVMKKYGSLVPLSEKEVLGRLKDVFNEDFS--NRKPFINREITNYRARHQKC---N 510 520 530 540 550 380 390 400 410 420 430 pF1KB8 FRVAYKRHVLTMDDLGTLYGQNWLNDQVMNMYGDLVMDTVPEKVHFFNSFFYDKLRTKGY ::. :..:.: ::::.:: :::::::::.::::.:.::.::.:::::::::. .: :::: CCDS33 FRIFYNKHMLDMDDLATLDGQNWLNDQVINMYGELIMDAVPDKVHFFNSFFHRQLVTKGY 560 570 580 590 600 610 440 450 460 470 480 490 pF1KB8 DGVKRWTKNVDIFNKELLLIPIHLEVHWSLISVDVRRRTITYFDSQRTLNRRCPKHIAKY .:::::::.::.:.: :::::::::::::::.: . : :...::: . : ..: :: CCDS33 NGVKRWTKKVDLFKKSLLLIPIHLEVHWSLITVTLSNRIISFYDSQGIHFKFCVENIRKY 620 630 640 650 660 670 500 510 520 530 540 550 pF1KB8 LQAEAVKKDRLDFHQGWKGYFKMNVARQNNDSDCGAFVLQYCKHLALSQPFSFTQQDMPK : .:: .:.: .: :::. . .:.::::::.::::::: ::: :::.:.:.:::. CCDS33 LLTEAREKNRPEFLQGWQTAVTKCIPQQKNDSDCGVFVLQYCKCLALEQPFQFSQEDMPR 680 690 700 710 720 730 560 570 pF1KB8 LRRQIYKELCHCKLTV .:..::::::.:.: CCDS33 VRKRIYKELCECRLMD 740 750 >>CCDS44868.2 SENP1 gene_id:29843|Hs108|chr12 (644 aa) initn: 492 init1: 331 opt: 559 Z-score: 376.7 bits: 79.8 E(32554): 1.2e-14 Smith-Waterman score: 562; 37.0% identity (63.7% similar) in 273 aa overlap (308-572:393-643) 280 290 300 310 320 330 pF1KB8 DHVAQELFQGSDLGMAEEAERPGEKAGQHSPLREE-HVTCVQSILDEFLQTYGSLIPLST ::..: :: :: : : . : CCDS44 QKALALQLQNQRLQEREHSVHDSVELHLRVPLEKEIPVTVVQET-----QKKGHKLTDSE 370 380 390 400 410 340 350 360 370 380 390 pF1KB8 DEVVEKLEDIFQQEFSTPSRKGLVLQLIQSYQRMPGNAMVRGFRVAYKRHVLTMDDLGTL :: : :.. ..:... :.: ... ..::.. :. :. :: CCDS44 DEFPEITEEM-EKEIKNVFRNG-----------NQDEVLSEAFRLTITRK-----DIQTL 420 430 440 450 460 400 410 420 430 440 450 pF1KB8 YGQNWLNDQVMNMYGDLVMDTVPEK----VHFFNSFFYDKLRTKGYDGVKRWTKNVDIFN :::::...:.: ...:. :: :: ::.::. ::.: ::..::::::.::.:. CCDS44 NHLNWLNDEIINFYMNMLMERSKEKGLPSVHAFNTFFFTKLKTAGYQAVKRWTKKVDVFS 470 480 490 500 510 520 460 470 480 490 500 510 pF1KB8 KELLLIPIHLEVHWSLISVDVRRRTITYFDSQRTLNRRCPKHIAKYLQAEAVKKDRLDFH ..::.:::: ::: : :: :...:::.::. .: . . . .::. :.. : : .: CCDS44 VDILLVPIHLGVHWCLAVVDFRKKNITYYDSMGGINNEACRILLQYLKQESIDKKRKEFD 530 540 550 560 570 580 520 530 540 550 560 pF1KB8 -QGWKGYFK--MNVARQNNDSDCGAFVLQYCKHLALSQPFSFTQQDMPKLRRQIYKELCH .::. . : ... .: : :::: :. .: .. ..:..:::: :: .:... :. : CCDS44 TNGWQLFSKKSQEIPQQMNGSDCGMFACKYADCITKDRPINFTQQHMPYFRKRMVWEILH 590 600 610 620 630 640 570 pF1KB8 CKLTV :: CCDS44 RKLL >>CCDS77876.1 SENP5 gene_id:205564|Hs108|chr3 (709 aa) initn: 848 init1: 371 opt: 524 Z-score: 353.4 bits: 75.6 E(32554): 2.3e-13 Smith-Waterman score: 769; 44.7% identity (66.9% similar) in 284 aa overlap (291-572:475-707) 270 280 290 300 310 pF1KB8 LAPPDASILISNVCSIGDHVAQELFQGSDLGMAEEAERPGEKAGQH-SPLREEHVT-CVQ :. : . : : .:. ::. .:... :.. CCDS77 DGSLKQSILSSELLDHPYCKSPLEAPLVCSGLKLENQVGGGKNSQKASPVDDEQLSVCLS 450 460 470 480 490 500 320 330 340 350 360 370 pF1KB8 SILDEFLQTYGSLIPLSTDEVVEKLEDIFQQEFSTPSRKGLVLQLIQSYQRMPGNAMVRG ..::: .. ::::.::: ::. .:.:.:...:: .:: .. . : .:. . . CCDS77 GFLDEVMKKYGSLVPLSEKEVLGRLKDVFNEDFS--NRKPFINREITNYRARHQKC---N 510 520 530 540 550 380 390 400 410 420 430 pF1KB8 FRVAYKRHVLTMDDLGTLYGQNWLNDQVMNMYGDLVMDTVPEKVHFFNSFFYDKLRTKGY ::. :..:.: ::::.:: :::::::::.::::.:.::.::.:::::::::. .: :::: CCDS77 FRIFYNKHMLDMDDLATLDGQNWLNDQVINMYGELIMDAVPDKVHFFNSFFHRQLVTKGY 560 570 580 590 600 610 440 450 460 470 480 490 pF1KB8 DGVKRWTKNVDIFNKELLLIPIHLEVHWSLISVDVRRRTITYFDSQRTLNRRCPKHIAKY .::::::: :.: :: CCDS77 NGVKRWTK----------------------------------------------KNIRKY 620 630 500 510 520 530 540 550 pF1KB8 LQAEAVKKDRLDFHQGWKGYFKMNVARQNNDSDCGAFVLQYCKHLALSQPFSFTQQDMPK : .:: .:.: .: :::. . .:.::::::.::::::: ::: :::.:.:.:::. CCDS77 LLTEAREKNRPEFLQGWQTAVTKCIPQQKNDSDCGVFVLQYCKCLALEQPFQFSQEDMPR 640 650 660 670 680 690 560 570 pF1KB8 LRRQIYKELCHCKLTV .:..::::::.:.: CCDS77 VRKRIYKELCECRLMD 700 >>CCDS33902.1 SENP2 gene_id:59343|Hs108|chr3 (589 aa) initn: 469 init1: 293 opt: 494 Z-score: 335.0 bits: 71.9 E(32554): 2.4e-12 Smith-Waterman score: 494; 34.1% identity (69.0% similar) in 229 aa overlap (356-572:361-588) 330 340 350 360 370 380 pF1KB8 QTYGSLIPLSTDEVVEKLEDIFQQEFSTPSRKGLVLQLIQSYQRMPGNAMVRG-----FR : .:.: ..... .::. .: . CCDS33 LGSGSNGLLRRKVSIIETKEKNCSGKERDRRTDDLLELTEDMEKEISNALGHGPQDEILS 340 350 360 370 380 390 390 400 410 420 430 pF1KB8 VAYKRHVLTMDDLGTLYGQNWLNDQVMNMYGDLVMDTVPEK----VHFFNSFFYDKLRTK :.: .. : :. :: . .::::.:.:.: .:... .. .: :..::: ::.. CCDS33 SAFKLRI-TRGDIQTLKNYHWLNDEVINFYMNLLVERNKKQGYPALHVFSTFFYPKLKSG 400 410 420 430 440 440 450 460 470 480 490 pF1KB8 GYDGVKRWTKNVDIFNKELLLIPIHLEVHWSLISVDVRRRTITYFDSQRTLNRRCPKHIA ::..::::::.:..:..:..:.::: .:::::. .:.:.. . :.::. ..: . . CCDS33 GYQAVKRWTKGVNLFEQEIILVPIHRKVHWSLVVIDLRKKCLKYLDSMGQKGHRICEILL 450 460 470 480 490 500 500 510 520 530 540 550 pF1KB8 KYLQAEAVKKDRLDFHQGWKGYFKMN---VARQNNDSDCGAFVLQYCKHLALSQPFSFTQ .::: :. : :.. . .:. . .: : :::: :. .: ... ..:..::: CCDS33 QYLQDESKTKRNSDLNLLEWTHHSMKPHEIPQQLNGSDCGMFTCKYADYISRDKPITFTQ 510 520 530 540 550 560 560 570 pF1KB8 QDMPKLRRQIYKELCHCKLTV ..:: .:... :. : .: CCDS33 HQMPLFRKKMVWEILHQQLL 570 580 574 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 14:45:01 2016 done: Fri Nov 4 14:45:02 2016 Total Scan time: 3.950 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]