FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1331, 589 aa 1>>>pF1KA1331 589 - 589 aa - 589 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.2133+/-0.000932; mu= 14.4197+/- 0.056 mean_var=81.3677+/-16.033, 0's: 0 Z-trim(106.2): 22 B-trim: 0 in 0/52 Lambda= 0.142183 statistics sampled from 8818 (8834) to 8818 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.642), E-opt: 0.2 (0.271), width: 16 Scan time: 2.710 The best scores are: opt bits E(32554) CCDS33902.1 SENP2 gene_id:59343|Hs108|chr3 ( 589) 3987 827.9 0 CCDS44868.2 SENP1 gene_id:29843|Hs108|chr12 ( 644) 1001 215.4 1.8e-55 CCDS73958.1 SENP3 gene_id:26168|Hs108|chr17 ( 574) 494 111.4 3.3e-24 CCDS3322.1 SENP5 gene_id:205564|Hs108|chr3 ( 755) 488 110.2 9.9e-24 >>CCDS33902.1 SENP2 gene_id:59343|Hs108|chr3 (589 aa) initn: 3987 init1: 3987 opt: 3987 Z-score: 4420.2 bits: 827.9 E(32554): 0 Smith-Waterman score: 3987; 99.8% identity (99.8% similar) in 589 aa overlap (1-589:1-589) 10 20 30 40 50 60 pF1KA1 MYRWLVRILGTIFRFCDRSVPPARALLKRRRSDSTLFSTVDTDEIPAKRPRLDCFIHQVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MYRWLVRILGTIFRFCDRSVPPARALLKRRRSDSTLFSTVDTDEIPAKRPRLDCFIHQVK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 NSLYNAASLFGFPFQLTTKPMVTSACNGTRNVAPSGEVFSNSSSCELTGSGSWNNMLKLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 NSLYNAASLFGFPFQLTTKPMVTSACNGTRNVAPSGEVFSNSSSCELTGSGSWNNMLKLG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 NKSPNGISDYPKIRVTVTRDQPRRVLPSFGFTLNSEGCNRRPGGRRHSKGNPESSLMWKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 NKSPNGISDYPKIRVTVTRDQPRRVLPSFGFTLNSEGCNRRPGGRRHSKGNPESSLMWKP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 QEQAVTEMISEESGKGLRRPHCTVEEGVQKEEREKYRKLLERLKESGHGNSVCPVTSNYH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QEQAVTEMISEESGKGLRRPHCTVEEGVQKEEREKYRKLLERLKESGHGNSVCPVTSNYH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 SSQRSQMDTLKTKGWGEEQNHGVKTTQFVPKQYRLVETRGPLCSLRSEKRCSKGKITDTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SSQRSQMDTLKTKGWGEEQNHGVKTTQFVPKQYRLVETRGPLCSLRSEKRCSKGKITDTE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 KMVGIRFENESRRGYQLEPDLSEEVSARLRLGSGSNGLLRRKVSIIETKEKNCSGKERDR ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TMVGIRFENESRRGYQLEPDLSEEVSARLRLGSGSNGLLRRKVSIIETKEKNCSGKERDR 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 RTDDLLELTEDMEKEISNALGHGPQDEILSSAFKLRITRGDIQTLKNYHWLNDEVINFYM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RTDDLLELTEDMEKEISNALGHGPQDEILSSAFKLRITRGDIQTLKNYHWLNDEVINFYM 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 NLLVERNKKQGYPALHVFSTFFYPKLKSGGYQAVKRWTKGVNLFEQEIILVPIHRKVHWS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 NLLVERNKKQGYPALHVFSTFFYPKLKSGGYQAVKRWTKGVNLFEQEIILVPIHRKVHWS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 LVVIDLRKKCLKYLDSMGQKGHRICEILLQYLQDESKTKRNSDLNLLEWTHHSMKPHEIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LVVIDLRKKCLKYLDSMGQKGHRICEILLQYLQDESKTKRNSDLNLLEWTHHSMKPHEIP 490 500 510 520 530 540 550 560 570 580 pF1KA1 QQLNGSDCGMFTCKYADYISRDKPITFTQHQMPLFRKKMVWEILHQQLL ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QQLNGSDCGMFTCKYADYISRDKPITFTQHQMPLFRKKMVWEILHQQLL 550 560 570 580 >>CCDS44868.2 SENP1 gene_id:29843|Hs108|chr12 (644 aa) initn: 1047 init1: 975 opt: 1001 Z-score: 1109.3 bits: 215.4 E(32554): 1.8e-55 Smith-Waterman score: 1001; 48.1% identity (76.6% similar) in 308 aa overlap (282-589:345-644) 260 270 280 290 300 310 pF1KA1 TKGWGEEQNHGVKTTQFVPKQYRLVETRGPLCSLRSEKRCSKGKITDTEKMVGIRFENES : :. . . . . . .: ......:. CCDS44 SDSVILLKVKDSQTPTPSSTFFQAELWIKELTSVYDSRARERLRQIEEQKALALQLQNQ- 320 330 340 350 360 370 320 330 340 350 360 370 pF1KA1 RRGYQLEPDLSEEVSARLRLGSGSNGLLRRKVSIIETKEKNCSGKERDRRTDDLLELTED : . : .. . : .::. :.... . ..: . .:.. :.. :.::. CCDS44 -RLQEREHSVHDSVELHLRVP------LEKEIPVTVVQETQKKGHKLTDSEDEFPEITEE 380 390 400 410 420 380 390 400 410 420 430 pF1KA1 MEKEISNALGHGPQDEILSSAFKLRITRGDIQTLKNYHWLNDEVINFYMNLLVERNKKQG :::::.:.. .: :::.:: ::.: ::: :::::.. .:::::.::::::.:.::.:..: CCDS44 MEKEIKNVFRNGNQDEVLSEAFRLTITRKDIQTLNHLNWLNDEIINFYMNMLMERSKEKG 430 440 450 460 470 480 440 450 460 470 480 490 pF1KA1 YPALHVFSTFFYPKLKSGGYQAVKRWTKGVNLFEQEIILVPIHRKVHWSLVVIDLRKKCL :..:.:.:::. :::..:::::::::: :..: .:.::::: ::: :.:.:.::: . CCDS44 LPSVHAFNTFFFTKLKTAGYQAVKRWTKKVDVFSVDILLVPIHLGVHWCLAVVDFRKKNI 490 500 510 520 530 540 500 510 520 530 540 550 pF1KA1 KYLDSMGQKGHRICEILLQYLQDESKTKRNSDLNLLEWTHHSMKPHEIPQQLNGSDCGMF : :::: ... :.::::::..:: :. .... : : : .:::::.:::::::: CCDS44 TYYDSMGGINNEACRILLQYLKQESIDKKRKEFDTNGWQLFSKKSQEIPQQMNGSDCGMF 550 560 570 580 590 600 560 570 580 pF1KA1 TCKYADYISRDKPITFTQHQMPLFRKKMVWEILHQQLL .::::: :..:.::.:::..:: :::.:::::::..:: CCDS44 ACKYADCITKDRPINFTQQHMPYFRKRMVWEILHRKLL 610 620 630 640 >>CCDS73958.1 SENP3 gene_id:26168|Hs108|chr17 (574 aa) initn: 494 init1: 293 opt: 494 Z-score: 548.1 bits: 111.4 E(32554): 3.3e-24 Smith-Waterman score: 494; 34.1% identity (69.4% similar) in 229 aa overlap (361-588:356-572) 340 350 360 370 380 390 pF1KA1 LGSGSNGLLRRKVSIIETKEKNCSGKERDRRTDDLLELTEDMEKEISNALGHGPQDEILS : .:.: ..... .::. .: . CCDS73 QTYGSLIPLSTDEVVEKLEDIFQQEFSTPSRKGLVLQLIQSYQRMPGNAMVRG-----FR 330 340 350 360 370 380 400 410 420 430 440 pF1KA1 SAFKLRI-TRGDIQTLKNYHWLNDEVINFYMNLLVERNKKQGYPALHVFSTFFYPKLKSG :.: .. : :. :: . .::::.:.:.: .:... .. .: :..::: ::.. CCDS73 VAYKRHVLTMDDLGTLYGQNWLNDQVMNMYGDLVMDTVPEK----VHFFNSFFYDKLRTK 390 400 410 420 430 450 460 470 480 490 500 pF1KA1 GYQAVKRWTKGVNLFEQEIILVPIHRKVHWSLVVIDLRKKCLKYLDSMGQKGHRICEILL ::..::::::.:..:..:..:.::: .:::::. .:.:.. . :.::. ..: . . CCDS73 GYDGVKRWTKNVDIFNKELLLIPIHLEVHWSLISVDVRRRTITYFDSQRTLNRRCPKHIA 440 450 460 470 480 490 510 520 530 540 550 560 pF1KA1 QYLQDESKTKRNSDLNLLEWTHHSMKPHEIPQQLNGSDCGMFTCKYADYISRDKPITFTQ .::: :. : :.. : ... .. .: : :::: :. .: ... ..:..::: CCDS73 KYLQAEAVKKDRLDFHQ-GW--KGYFKMNVARQNNDSDCGAFVLQYCKHLALSQPFSFTQ 500 510 520 530 540 550 570 580 pF1KA1 HQMPLFRKKMVWEILHQQLL ..:: .:... :. : .: CCDS73 QDMPKLRRQIYKELCHCKLTV 560 570 >>CCDS3322.1 SENP5 gene_id:205564|Hs108|chr3 (755 aa) initn: 443 init1: 250 opt: 488 Z-score: 539.5 bits: 110.2 E(32554): 9.9e-24 Smith-Waterman score: 488; 30.6% identity (63.9% similar) in 291 aa overlap (304-589:475-754) 280 290 300 310 320 330 pF1KA1 RLVETRGPLCSLRSEKRCSKGKITDTEKMVGIRFENE---SRRGYQLEPDLSEEVSARLR :...::. .. . . : .:..:. : CCDS33 DGSLKQSILSSELLDHPYCKSPLEAPLVCSGLKLENQVGGGKNSQKASPVDDEQLSVCL- 450 460 470 480 490 500 340 350 360 370 380 pF1KA1 LGSGS-NGLLRRKVSIIETKEKNCSGKERDRRTDDLLELTEDMEKEISNALGHGPQDEIL :: . .... :.. .::. :. .: ..:. . ...::.: .. . .. CCDS33 --SGFLDEVMKKYGSLVPLSEKEVLGRLKDVFNEDFSNRKPFINREITNYRARHQKCNFR 510 520 530 540 550 560 390 400 410 420 430 440 pF1KA1 SSAFKLRITRGDIQTLKNYHWLNDEVINFYMNLLVERNKKQGYPALHVFSTFFYPKLKSG : . :. :: . .::::.:::.: .:... . .: :..::. .: . CCDS33 IFYNKHMLDMDDLATLDGQNWLNDQVINMYGELIMDAVPDK----VHFFNSFFHRQLVTK 570 580 590 600 610 450 460 470 480 490 500 pF1KA1 GYQAVKRWTKGVNLFEQEIILVPIHRKVHWSLVVIDLRKKCLKYLDSMGQKGHRIC-EIL ::..:::::: :.::.. ..:.::: .:::::... : .. ... ::.: . ..: : . CCDS33 GYNGVKRWTKKVDLFKKSLLLIPIHLEVHWSLITVTLSNRIISFYDSQGIH-FKFCVENI 620 630 640 650 660 670 510 520 530 540 550 560 pF1KA1 LQYLQDESKTKRNSDLNLLEWTHHSMKPHEIPQQLNGSDCGMFTCKYADYISRDKPITFT .:: :.. : .. : : : :::: : ::::.:. .: .. ..:. :. CCDS33 RKYLLTEAREKNRPEF-LQGWQTAVTK--CIPQQKNDSDCGVFVLQYCKCLALEQPFQFS 680 690 700 710 720 730 570 580 pF1KA1 QHQMPLFRKKMVWEILHQQLL :..:: ::.. :. . .:. CCDS33 QEDMPRVRKRIYKELCECRLMD 740 750 589 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 20:58:53 2016 done: Wed Nov 2 20:58:54 2016 Total Scan time: 2.710 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]