FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA2009, 569 aa 1>>>pF1KA2009 569 - 569 aa - 569 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.9999+/-0.000926; mu= 5.5805+/- 0.057 mean_var=283.0735+/-59.225, 0's: 0 Z-trim(116.2): 15 B-trim: 724 in 1/53 Lambda= 0.076230 statistics sampled from 16811 (16820) to 16811 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.795), E-opt: 0.2 (0.517), width: 16 Scan time: 3.230 The best scores are: opt bits E(32554) CCDS10319.1 MEX3B gene_id:84206|Hs108|chr15 ( 569) 3834 434.8 1.3e-121 CCDS11951.2 MEX3C gene_id:51320|Hs108|chr18 ( 659) 1244 150.1 8.1e-36 CCDS32865.2 MEX3D gene_id:399664|Hs108|chr19 ( 651) 1125 137.0 7e-32 CCDS53377.1 MEX3A gene_id:92312|Hs108|chr1 ( 520) 1008 124.0 4.5e-28 >>CCDS10319.1 MEX3B gene_id:84206|Hs108|chr15 (569 aa) initn: 3834 init1: 3834 opt: 3834 Z-score: 2296.7 bits: 434.8 E(32554): 1.3e-121 Smith-Waterman score: 3834; 100.0% identity (100.0% similar) in 569 aa overlap (1-569:1-569) 10 20 30 40 50 60 pF1KA2 MPSSLFADLERNGSGGGGGGSSGGGETLDDQRALQLALDQLSLLGLDSDEGASLYDSEPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MPSSLFADLERNGSGGGGGGSSGGGETLDDQRALQLALDQLSLLGLDSDEGASLYDSEPR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA2 KKSVNMTECVPVPSSEHVAEIVGRQGCKIKALRAKTNTYIKTPVRGEEPVFVVTGRKEDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 KKSVNMTECVPVPSSEHVAEIVGRQGCKIKALRAKTNTYIKTPVRGEEPVFVVTGRKEDV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA2 AMARREIISAAEHFSMIRASRNKNTALNGAVPGPPNLPGQTTIQVRVPYRVVGLVVGPKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 AMARREIISAAEHFSMIRASRNKNTALNGAVPGPPNLPGQTTIQVRVPYRVVGLVVGPKG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA2 ATIKRIQQQTHTYIVTPSRDKEPVFEVTGMPENVDRAREEIEAHIALRTGGIIELTDEND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ATIKRIQQQTHTYIVTPSRDKEPVFEVTGMPENVDRAREEIEAHIALRTGGIIELTDEND 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA2 FHANGTDVGFDLHHGSGGSGPGSLWSKPTPSITPTPGRKPFSSYRNDSSSSLGSASTDSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 FHANGTDVGFDLHHGSGGSGPGSLWSKPTPSITPTPGRKPFSSYRNDSSSSLGSASTDSY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA2 FGGGTSSSAAATQRLADYSPPSPALSFAHNGNNNNNGNGYTYTAGGEASVPSPDGCPELQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 FGGGTSSSAAATQRLADYSPPSPALSFAHNGNNNNNGNGYTYTAGGEASVPSPDGCPELQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA2 PTFDPAPAPPPGAPLIWAQFERSPGGGPAAPVSSSCSSSASSSASSSSVVFPGGGASAPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 PTFDPAPAPPPGAPLIWAQFERSPGGGPAAPVSSSCSSSASSSASSSSVVFPGGGASAPS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA2 NANLGLLVHRRLHPGTSCPRLSPPLHMAPGAGEHHLARRVRSDPGGGGLAYAAYANGLGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 NANLGLLVHRRLHPGTSCPRLSPPLHMAPGAGEHHLARRVRSDPGGGGLAYAAYANGLGA 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA2 QLPGLQPSDTSGSSSSSSSSSSSSSSSSGLRRKGSRDCSVCFESEVIAALVPCGHNLFCM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 QLPGLQPSDTSGSSSSSSSSSSSSSSSSGLRRKGSRDCSVCFESEVIAALVPCGHNLFCM 490 500 510 520 530 540 550 560 pF1KA2 ECANRICEKSEPECPVCHTAVTQAIRIFS ::::::::::::::::::::::::::::: CCDS10 ECANRICEKSEPECPVCHTAVTQAIRIFS 550 560 >>CCDS11951.2 MEX3C gene_id:51320|Hs108|chr18 (659 aa) initn: 1707 init1: 1106 opt: 1244 Z-score: 756.5 bits: 150.1 E(32554): 8.1e-36 Smith-Waterman score: 1720; 55.0% identity (69.6% similar) in 573 aa overlap (1-569:167-659) 10 20 30 pF1KA2 MPSSLFADLERNGSGGGGGGSSGGGETLDD .:.. : : .. .......: :: :: CCDS11 DRSSLLLLSPPAATASQTQQIPGGSLGSVLLPAARF-DAREAAAAAAAAGVLYGG---DD 140 150 160 170 180 190 40 50 60 70 80 pF1KA2 QRALQLALDQLSLLGLDSDEGASLYDSEP----RKKSVNMTECVPVPSSEHVAEIVGRQG .... :. . . .:. ..: :.:::: :::::::::::::::::::: CCDS11 AQGMMAAMLSHAYGPGGCGAAAAALNGEQAALLRRKSVNTTECVPVPSSEHVAEIVGRQG 200 210 220 230 240 250 90 100 110 120 130 140 pF1KA2 CKIKALRAKTNTYIKTPVRGEEPVFVVTGRKEDVAMARREIISAAEHFSMIRASRNKNTA :::::::::::::::::::::::.:::::::::::::.:::.:::::::::::::::: CCDS11 CKIKALRAKTNTYIKTPVRGEEPIFVVTGRKEDVAMAKREILSAAEHFSMIRASRNKNGP 260 270 280 290 300 310 150 160 170 180 190 200 pF1KA2 LNGAVPGPPNLPGQTTIQVRVPYRVVGLVVGPKGATIKRIQQQTHTYIVTPSRDKEPVFE :.. ::::::::.::::::::::::::::::::::::::::::::::::::::::: CCDS11 ALGGLSCSPNLPGQTTVQVRVPYRVVGLVVGPKGATIKRIQQQTHTYIVTPSRDKEPVFE 320 330 340 350 360 370 210 220 230 240 250 260 pF1KA2 VTGMPENVDRAREEIEAHIALRTGGIIELTDENDFHANGTDVGFDLHHGSGGSGPGSLWS :::::::::::::::: :::.:::. :::..::::: :::::.:. ::. :: : CCDS11 VTGMPENVDRAREEIEMHIAMRTGNYIELNEENDFHYNGTDVSFE-----GGTL-GSAWL 380 390 400 410 420 270 280 290 300 310 320 pF1KA2 KPTPSITPTPGRKPFSSYRNDSSSSLGSASTDSYFGGGTSSSAAATQRLADYSPPSPALS . .: . :. .: .:.:::::::::::.::::::: ..::::.:: :: CCDS11 SSNP-VPPSRARM-ISNYRNDSSSSLGSGSTDSYFG---------SNRLADFSPTSP--- 430 440 450 460 470 330 340 350 360 370 380 pF1KA2 FAHNGNNNNNGNGYTYTAGGEASVPSPDGCPELQPTFDPAPAPPPGAPLIWAQFERSPGG :. .: . . :: : : . .:.:: :. .: ::. :: CCDS11 FS---------TGNFWFGDTLPSVGSEDLAVD-SPAFDSLPT---SAQTIWTPFE----- 480 490 500 510 390 400 410 420 430 440 pF1KA2 GPAAPVSSSCSSSASSSASSSSVVFPGGGASAPSNANLGLLVHRRLHPGTSCPRLSPPLH :. :.: : .: :: : . .: : ::::: . CCDS11 -PVNPLS--------------------GFGSDPS----GNMKTQRRGSQPSTPRLSPTF- 520 530 540 450 460 470 480 490 500 pF1KA2 MAPGAGEHHLARRVRSDPGGGGLAYAAYANGLGAQLPGLQPSDTSGSSSSSSSSSSSSSS : . :: ::::::::: . : : .: :: :. ..:..: :::...:.:: CCDS11 --PESIEHPLARRVRSDPPSTG-------NHVG--LPIYIPAFSNGTNSYSSSNGGSTSS 550 560 570 580 590 510 520 530 540 550 560 pF1KA2 SSGLRRKGSRDCSVCFESEVIAALVPCGHNLFCMECANRICEKSEPECPVCHTAVTQAIR : :. ..:: .:::.::::::::::::::::::::.:::: : ::::.:::::::. CCDS11 SPPESRR-KHDCVICFENEVIAALVPCGHNLFCMECANKICEKRTPSCPVCQTAVTQAIQ 600 610 620 630 640 650 pF1KA2 IFS : : CCDS11 IHS >>CCDS32865.2 MEX3D gene_id:399664|Hs108|chr19 (651 aa) initn: 1505 init1: 1088 opt: 1125 Z-score: 685.8 bits: 137.0 E(32554): 7e-32 Smith-Waterman score: 1533; 53.3% identity (70.4% similar) in 523 aa overlap (60-569:173-651) 30 40 50 60 70 80 pF1KA2 DQRALQLALDQLSLLGLDSDEGASLYDSEPRKKSVNMTECVPVPSSEHVAEIVGRQGCKI :::::::::::::::::::::::::::::: CCDS32 PPDVFAGFAPHPAALGPPTLLADQMSVIGSRKKSVNMTECVPVPSSEHVAEIVGRQGCKI 150 160 170 180 190 200 90 100 110 120 130 140 pF1KA2 KALRAKTNTYIKTPVRGEEPVFVVTGRKEDVAMARREIISAAEHFSMIRASRNKNTALNG ::::::::::::::::::::::.:::::::: ::.:::.:::::::.:::.:.: .: : CCDS32 KALRAKTNTYIKTPVRGEEPVFIVTGRKEDVEMAKREILSAAEHFSIIRATRSKAGGLPG 210 220 230 240 250 260 150 160 170 180 190 200 pF1KA2 AVPGPPNLPGQTTIQVRVPYRVVGLVVGPKGATIKRIQQQTHTYIVTPSRDKEPVFEVTG :. ::::::::::::::::::::::::::::::::::::.::::::::.::::::: ::: CCDS32 AAQGPPNLPGQTTIQVRVPYRVVGLVVGPKGATIKRIQQRTHTYIVTPGRDKEPVFAVTG 270 280 290 300 310 320 210 220 230 240 250 260 pF1KA2 MPENVDRAREEIEAHIALRTGGIIELTDENDFHANGTDVGFDLHHGSGGSGPGSLWSKPT ::::::::::::::::.::::.. . ..::::::::: .:: ... :::.: CCDS32 MPENVDRAREEIEAHITLRTGAFTDAGPDSDFHANGTDVCLDLLGAAA-----SLWAK-- 330 340 350 360 370 270 280 290 300 310 320 pF1KA2 PSITPTPGRKPFSS---YRNDSSSSLGSASTDSYFGGGTSSSAAATQRLADYSPPSPALS ::. ::.: .. :.:.. ::. :. : .:. .. .. . :.:: CCDS32 ---TPNQGRRPPTATAGLRGDTA--LGAPSAPEAFYAGSRGGPSVPD-------PGPASP 380 390 400 410 420 330 340 350 360 370 380 pF1KA2 FAHNGNNNNNGNGYTYTA---GGEASVPSPDGCPELQPTFD--PAPAPPPGAPLIWAQFE .. .::. :... : :. ... .:: : .. :: :.: ::: :: CCDS32 YSGSGNG-----GFAFGAEGPGAPVGTAAPDDC-DFGFDFDFLALDLTVPAAATIWAPFE 430 440 450 460 470 390 400 410 420 430 440 pF1KA2 RSPGGGPAAPVSSSCSSSASSSASSSSVVFPGGGASAPSNANLGLLVHRRLHPGTSCPRL :. .: :. :.::. .. . :..:: :.: : : : . :: CCDS32 RA---APL-PAFSGCSTVNGAPGP------PAAGARRSSGA--GTPRHSPTLPEPGGLRL 480 490 500 510 520 450 460 470 480 490 pF1KA2 SPPLHM--AP---GAGEHHLARRVRSDPGGGGLAYAAYANGLGAQLPGLQPSDTSGSSSS :: :: :: . . : :::.... :. . : . : : ::.: . CCDS32 ELPLSRRGAPDPVGALSWRPPQGPVSFPGGAAFSTATSLPSSPAA-AACAPLD-SGASEN 530 540 550 560 570 580 500 510 520 530 540 550 pF1KA2 SSSSSSSSSSSSGLRRKGSRDCSVCFESEVIAALVPCGHNLFCMECANRICEKSEPECPV : . :.::. . .:.: :: :.::.:::::::::::::.:: ::: :::::::. CCDS32 SRKPPSASSAPA-----LARECVVCAEGEVMAALVPCGHNLFCMDCAVRICGKSEPECPA 590 600 610 620 630 560 pF1KA2 CHTAVTQAIRIFS :.: .::::.::: CCDS32 CRTPATQAIHIFS 640 650 >>CCDS53377.1 MEX3A gene_id:92312|Hs108|chr1 (520 aa) initn: 975 init1: 512 opt: 1008 Z-score: 617.5 bits: 124.0 E(32554): 4.5e-28 Smith-Waterman score: 1296; 50.3% identity (64.2% similar) in 519 aa overlap (53-569:117-520) 30 40 50 60 70 80 pF1KA2 GGGETLDDQRALQLALDQLSLLGLDSDEGASLY-DSEPR-KKSVNMTECVPVPSSEHVAE .:: ..: : : : : :::::::.:::::: CCDS53 APPAAPTAAPAAQTPQPPTAPKGASDAKLCALYKEAELRLKGSSNTTECVPVPTSEHVAE 90 100 110 120 130 140 90 100 110 120 130 140 pF1KA2 IVGRQGCKIKALRAKTNTYIKTPVRGEEPVFVVTGRKEDVAMARREIISAAEHFSMIRAS :::::::::::::::::::::::::::::::.::::.:::: :::::::::::::::::: CCDS53 IVGRQGCKIKALRAKTNTYIKTPVRGEEPVFMVTGRREDVATARREIISAAEHFSMIRAS 150 160 170 180 190 200 150 160 170 180 190 200 pF1KA2 RNKNTALNGAVPGPPNLPGQTTIQVRVPYRVVGLVVGPKGATIKRIQQQTHTYIVTPSRD :::. : :..:. ::::.::.::::::::::::::::::::::::::.:::.::::: CCDS53 RNKSGAAFGVAPA---LPGQVTIRVRVPYRVVGLVVGPKGATIKRIQQQTNTYIITPSRD 210 220 230 240 250 260 210 220 230 240 250 260 pF1KA2 KEPVFEVTGMPENVDRAREEIEAHIALRTGGIIELTDENDFHANGTDVGFDLHHGSGGSG ..::::.:: : ::.:::::::.:::.::: :.: ..:::: :.. :...: ..... CCDS53 RDPVFEITGAPGNVERAREEIETHIAVRTGKILEYNNENDFLAGSPDAAIDSRYSDA--- 270 280 290 300 310 320 270 280 290 300 310 320 pF1KA2 PGSLWSKPTPSITPTPGRKPFSSYRNDSSSSLGSASTDSYFGGGTSSSAAATQRLADYSP : . :: ::.:..:..: . .: ..:: : CCDS53 ----WR------VHQPGCKPLSTFRQNSLGCIGECGVDSGF------------------- 330 340 350 330 340 350 360 370 380 pF1KA2 PSPALSFAHNGNNNNNGNGYTYTAGGEASVPSPDGCPELQPTFDPAPAPPPGAPLIWAQF .: : ...:.. . : :: . . : .. : : .: :: :: CCDS53 EAPRL--GEQGGDFGYG-GYLFPGYGVGKQDVYYGVAETSP------------PL-WA-- 360 370 380 390 390 400 410 420 430 440 pF1KA2 ERSPGGGPAAPVSSSCSSSASSSASSSSVVFPGGGASAPSNANLGLLVHRRLHPGTSCPR : :.: .: ::::::.:::. . : : .: :: :.:: CCDS53 ----GQENATP-TSVLFSSASSSSSSSAKARAG-----PPGA------HRS--PATSA-- 400 410 420 430 450 460 470 480 490 500 pF1KA2 LSPPLHMAPGAGEHHLARRVRSDPGGGGLAYAAYANGLGAQLPGLQPSDTSGSSSSSSSS .: : :: : :: : : : . .: : . :: CCDS53 -GPEL-----AG---LPRR----PPGEPLQGFSKLGGGGLRSPG---------------- 440 450 460 510 520 530 540 550 560 pF1KA2 SSSSSSSSGLRRKGSRDCSVCFESEVIAALVPCGHNLFCMECANRICEKSEPECPVCHTA :.::: ::::::: :::::::::::::::: ::::...::::::: . CCDS53 -------------GGRDCMVCFESEVTAALVPCGHNLFCMECAVRICERTDPECPVCHIT 470 480 490 500 510 pF1KA2 VTQAIRIFS .:::::::: CCDS53 ATQAIRIFS 520 569 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 22:23:23 2016 done: Wed Nov 2 22:23:24 2016 Total Scan time: 3.230 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]