FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0330, 608 aa 1>>>pF1KE0330 608 - 608 aa - 608 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0704+/-0.000951; mu= 15.4528+/- 0.057 mean_var=80.6284+/-16.049, 0's: 0 Z-trim(106.1): 27 B-trim: 0 in 0/51 Lambda= 0.142834 statistics sampled from 8761 (8770) to 8761 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.64), E-opt: 0.2 (0.269), width: 16 Scan time: 3.670 The best scores are: opt bits E(32554) CCDS41342.2 MROH7 gene_id:374977|Hs108|chr1 (1323) 544 122.3 4.1e-27 CCDS75803.1 MROH1 gene_id:727957|Hs108|chr8 (1632) 414 95.5 5.7e-19 CCDS47938.1 MROH1 gene_id:727957|Hs108|chr8 (1641) 414 95.5 5.7e-19 CCDS74674.1 MROH2A gene_id:339766|Hs108|chr2 (1688) 293 70.6 1.9e-11 >>CCDS41342.2 MROH7 gene_id:374977|Hs108|chr1 (1323 aa) initn: 484 init1: 239 opt: 544 Z-score: 600.3 bits: 122.3 E(32554): 4.1e-27 Smith-Waterman score: 546; 28.5% identity (63.2% similar) in 478 aa overlap (108-575:360-809) 80 90 100 110 120 130 pF1KE0 GDARDSRQALRARMSSKHRICSQEEVVIPCAYDSDSESVDLELSNLEIIKKGSSSIELTD : :.. ..: :: ::: : :... CCDS41 ILGSNETLSLDSSLLFSDTSTLTLSSQQDDAKDNSIHTVPLE-ENLE------SWSEMAS 330 340 350 360 370 380 140 150 160 170 180 190 pF1KE0 LDIPDIP-GLHCEPLSH-SPRHLTQQDPLSEAIVEKLIQSIQKVFNGELKGELEKLKFLG . . ..: :. :.:. . . . . . :. ... . . :: . : ... .. CCDS41 IKVGQFPLGF---PISNPAGKDAVTLQGIPEGAFDEVTSCLVKVPEKTEGG--NNMALVE 390 400 410 420 430 200 210 220 230 240 250 pF1KE0 DLSSLSQALPYDETAKSFIHSHIADIVHTLNVLVQEERPHSLSSSMRQEVFVTIADLSYQ ....:... : :.. .. : :.. .::: :::::.:.... ...::. CCDS41 NVTTLQKSQDLLE-AEGEKKTMIKKIMRQ----IQEEPLDSLSSSVRKQAMEILTQLSH- 440 450 460 470 480 490 260 270 280 290 300 310 pF1KE0 DVHLLLGSEDRAELFSLTIKSIITLPSVRTLTQIQEIMPNGTCNTECLYRQTFQAFSEML .. :: ..:.:: .. ..:...::::... . .: . . . ::.::..:.. .: CCDS41 -TQPTLGMRERSELVNVCVHSVFSLPSVQAMQEKDEAKAE---TIQALYHQTLEALQTLL 500 510 520 530 540 320 330 340 350 360 370 pF1KE0 QSLVVKDPHLENLDTIIKHLVPWLQSVKDHERERATASMAQVLKCLSKHLNLKLPLRFQR ..: ..:: .: .:.. : ::..: : ::: ::. . ..::. . : . .:: : CCDS41 KALFIEDPTPAGLKSILEALGPWMNSGKAHERARAVNTNVSVLNHMLLTLPFFMPLGFPA 550 560 570 580 590 600 380 390 400 410 420 430 pF1KE0 LGHLVALMALLCGDPQEKVAEEAAEGIHSLLHITLRLKYITHDKKDQQNLKRALTKCREF :: :.. . : :::.:... :: .:: .:. :.:. ..:: .. : :. . ..: CCDS41 LGLLLGRLILHIGDPDEEIGCEALDGI-IILYTILELQKRARDK-EETNKKELYESNKHF 610 620 630 640 650 660 440 450 460 470 480 pF1KE0 LELHSSAAKCFYNCPFRIAQVFEGFLDSNELCQFIMTTFDTLK-TLKHPC-----IQRSA : .. .. : . .:. . : :: ... ........ :: . . : ... : CCDS41 LGPYNPVSPC--QNILRVIEEFGDFLGPQQIKDLLLAALEGLKGSSEAPGKDSREMMQLA 670 680 690 700 710 720 490 500 510 520 530 540 pF1KE0 GELLLT--LAKNTESQFEEVPEIMGVICAQLPIISQPRVRQQIINTVSLFISRPKYTDIV .:..:. : . .: .:::: : :: :..::.:: . :::. : .:..: CCDS41 SEVMLSSVLEWYRHRALEVIPEIMQGIYMQLSHIQEPRARQVALLPVSLLASSF-MTEVV 730 740 750 760 770 780 550 560 570 580 590 600 pF1KE0 LSFLLCHPVPYNRHLAEVWRMLSVELPSTTWILWRLLRKLQKCHNEPAQEKMAYVAVAVS ...:.: :.: : . ::.::.: . :: CCDS41 VALLMC-PLPLNSNGAEMWRQLILCKPSCDVRDLLDLLLGSLKEKPVTKEGRASIVPLAA 790 800 810 820 830 840 >>CCDS75803.1 MROH1 gene_id:727957|Hs108|chr8 (1632 aa) initn: 304 init1: 232 opt: 414 Z-score: 454.1 bits: 95.5 E(32554): 5.7e-19 Smith-Waterman score: 478; 26.4% identity (61.1% similar) in 450 aa overlap (157-602:746-1174) 130 140 150 160 170 180 pF1KE0 KKGSSSIELTDLDIPDIPGLHCEPLSHSPRHLTQQDP--LSEAIVEK-LIQSIQKVFNGE :.. . : : : ::. ....: . :. CCDS75 RKSIGILNIFKDRSENEVEKVKSALILCYGHVAARAPRELVLAKVESDILRNICQHFS-- 720 730 740 750 760 770 190 200 210 220 230 240 pF1KE0 LKGELEKLKFLGDLSSLSQALPYDETAKSFIHSHIADIVHTLNVLVQEERPHSLSSSMRQ : :: .. .. .:.:. . : :: .. :..: . ... : : :: . .:. CCDS75 TKDPALKLCLVQSVCMVSRAICSSTQAGSFHFTRKAELVAQMMEFIRAEPPDSLRTPIRK 780 790 800 810 820 830 250 260 270 280 290 300 pF1KE0 EVFVTIADLSYQDVHLLLGSEDRAELFSLTIKSIITLPSVRTLTQIQEIMPNGTCNTECL ....: . : .:. : . ::... ..::..: : . .: .: :. . : CCDS75 KAMLTCTYLV--SVEPALDEQARADVIHGCLHSIMAL-----LPEPKE--EDGGCQ-KSL 840 850 860 870 880 310 320 330 340 350 360 pF1KE0 YRQTFQAFSEMLQSLVVKDPHLENLDTIIKHLVPWLQSVKDHERERATASMAQVLKCLSK : .:..:. ..: ::. .. ..:. .:.:: ::..: . ::: :: . : .:. . . CCDS75 YLETLHALEDLLTSLLQRNMTPQGLQIMIEHLSPWIKSPRGHERARALGLSALLLRYFLE 890 900 910 920 930 940 370 380 390 400 410 420 pF1KE0 HLNLKLPLRFQRLGHLVALMALLCGDPQEKVAEEAAEGIHSLLHITLRLKYITHDKKDQQ :: .. . :. :: :..:.. :.: . .::.. ..:::.. : . ...: .: CCDS75 HLRVSALVPFHNLGLLIGLFSPRCADLWPATRQEAVDCVYSLLYLQLGYEGFSRDYRD-- 950 960 970 980 990 1000 430 440 450 460 470 480 pF1KE0 NLKRALTKCREFLELHSSAAKCFYNCPFRIAQVFEGFLDSNELCQFIMTTFDTLKTLKHP .. . : . .. : .: . : :..: ..:.. : ..: ....: :..: .. CCDS75 DVAERLLSLKDGL-VHPDPAILFHTC-HSVGQIIAKRLPPDQLISLLLTMFEALGDPEKN 1010 1020 1030 1040 1050 490 500 510 520 530 540 pF1KE0 CIQRSAGELLLTLAKNTESQFEE-VPEIMGVICAQLPIISQPRVRQQIINTVSLFISRPK : .:.: .. : .. . ..: ::::..:. ..: . .: ..: :. . . CCDS75 C-SRAATVMINCLLQERGGVLQEKVPEIVSVLRSKLQEAQGEHVLPAAQHSVYLLAT--Q 1060 1070 1080 1090 1100 1110 550 560 570 580 590 600 pF1KE0 YTDIVLSFLLCHPVPYNRHLAEVWRMLSVELPSTTWILWRLLRKLQKCHNEPAQEKMAYV . :.: :: :.: . : .:: :.:: .. .: ::.:... . : .:. :.. CCDS75 HCAAVVSSLLGSPLPLDSHTCMLWRALAVEPRLAAQVLGLLLEKMSR--DVPFKESRAFL 1120 1130 1140 1150 1160 1170 pF1KE0 AVAVSP CCDS75 LGRTPDRVATLLPLSATCALFEVMSTPAAGPAVLELYPQLFVVLLLRVSCTVGVQLPRNL 1180 1190 1200 1210 1220 1230 >>CCDS47938.1 MROH1 gene_id:727957|Hs108|chr8 (1641 aa) initn: 304 init1: 232 opt: 414 Z-score: 454.0 bits: 95.5 E(32554): 5.7e-19 Smith-Waterman score: 481; 26.2% identity (60.9% similar) in 455 aa overlap (152-602:749-1183) 130 140 150 160 170 180 pF1KE0 NLEIIKKGSSSIELTDLDIPDIPGLHCEPLSHSPRHLTQQDPLSEAIVEKLIQSIQKVFN ...::.:. :. :.... : .. CCDS47 IGILNIFKDRSENEVEKVKSALILCYGHVAARAPRELVLAKVESD-ILRNICQHFSTKVL 720 730 740 750 760 770 190 200 210 220 230 pF1KE0 G---ELKGELEKLKFLGDLSSLSQALPYDETAKSFIHSHIADIVHTLNVLVQEERPHSLS : : : :: .. .. .:.:. . : :: .. :..: . ... : : :: CCDS47 GIKVETKDPALKLCLVQSVCMVSRAICSSTQAGSFHFTRKAELVAQMMEFIRAEPPDSLR 780 790 800 810 820 830 240 250 260 270 280 290 pF1KE0 SSMRQEVFVTIADLSYQDVHLLLGSEDRAELFSLTIKSIITLPSVRTLTQIQEIMPNGTC . .:.....: . : .:. : . ::... ..::..: : . .: .: : CCDS47 TPIRKKAMLTCTYLV--SVEPALDEQARADVIHGCLHSIMAL-----LPEPKE--EDGGC 840 850 860 870 880 300 310 320 330 340 350 pF1KE0 NTECLYRQTFQAFSEMLQSLVVKDPHLENLDTIIKHLVPWLQSVKDHERERATASMAQVL . . :: .:..:. ..: ::. .. ..:. .:.:: ::..: . ::: :: . : .: CCDS47 Q-KSLYLETLHALEDLLTSLLQRNMTPQGLQIMIEHLSPWIKSPRGHERARALGLSALLL 890 900 910 920 930 940 360 370 380 390 400 410 pF1KE0 KCLSKHLNLKLPLRFQRLGHLVALMALLCGDPQEKVAEEAAEGIHSLLHITLRLKYITHD . . .:: .. . :. :: :..:.. :.: . .::.. ..:::.. : . ...: CCDS47 RYFLEHLRVSALVPFHNLGLLIGLFSPRCADLWPATRQEAVDCVYSLLYLQLGYEGFSRD 950 960 970 980 990 1000 420 430 440 450 460 470 pF1KE0 KKDQQNLKRALTKCREFLELHSSAAKCFYNCPFRIAQVFEGFLDSNELCQFIMTTFDTLK .: .. . : . .. : .: . : :..: ..:.. : ..: ....: :..: CCDS47 YRD--DVAERLLSLKDGL-VHPDPAILFHTC-HSVGQIIAKRLPPDQLISLLLTMFEALG 1010 1020 1030 1040 1050 1060 480 490 500 510 520 530 pF1KE0 TLKHPCIQRSAGELLLTLAKNTESQFEE-VPEIMGVICAQLPIISQPRVRQQIINTVSLF .. : .:.: .. : .. . ..: ::::..:. ..: . .: ..: :. CCDS47 DPEKNC-SRAATVMINCLLQERGGVLQEKVPEIVSVLRSKLQEAQGEHVLPAAQHSVYLL 1070 1080 1090 1100 1110 1120 540 550 560 570 580 590 pF1KE0 ISRPKYTDIVLSFLLCHPVPYNRHLAEVWRMLSVELPSTTWILWRLLRKLQKCHNEPAQE . .. :.: :: :.: . : .:: :.:: .. .: ::.:... . : .: CCDS47 AT--QHCAAVVSSLLGSPLPLDSHTCMLWRALAVEPRLAAQVLGLLLEKMSR--DVPFKE 1130 1140 1150 1160 1170 600 pF1KE0 KMAYVAVAVSP . :.. CCDS47 SRAFLLGRTPDRVATLLPLSATCALFEVMSTPAAGPAVLELYPQLFVVLLLRVSCTVGVQ 1180 1190 1200 1210 1220 1230 >>CCDS74674.1 MROH2A gene_id:339766|Hs108|chr2 (1688 aa) initn: 145 init1: 109 opt: 293 Z-score: 319.1 bits: 70.6 E(32554): 1.9e-11 Smith-Waterman score: 344; 20.2% identity (58.7% similar) in 426 aa overlap (163-588:805-1202) 140 150 160 170 180 190 pF1KE0 IELTDLDIPDIPGLHCEPLSHSPRHLTQQDPLSEAIVEKLIQSIQKVFNGELKGELEKLK :.. :... ..: : . :. CCDS74 RETVKSALMVMYSCVASYCHPQLLLNLVDSPITAKIIHHYVSSCQDIC--------LKMA 780 790 800 810 820 200 210 220 230 240 250 pF1KE0 FLGDLSSLSQALPYDETAKSFIHSHIADIVHTLNVLVQEERPHSLSSSMRQEVFVTIADL :. .. ....:. . ..: .. . .. . .... : .: : .: .. ... : CCDS74 FMKSVVQVTKAINNIKDLEDFHFAQKTTLTSIIVAVIKAEPTDNLVSPVRALAMEALSHL 830 840 850 860 870 880 260 270 280 290 300 310 pF1KE0 SYQDVHLLLGSEDRAELFSLTIKSIITLPSVRTLTQIQEIMPNGTCNTECLYRQTFQAFS : .. . ..:. .::....:.:.:.: .. . . . . :: ...... CCDS74 S--KLKPFYSTEENSELMDISIHSVISL----------QLPGEDNESIKTLYANALSSLE 890 900 910 920 930 320 330 340 350 360 370 pF1KE0 EMLQSLVVKDPHLENLDTIIKHLVPWLQSVKDHERERATASMAQVLKCLSKHLNLKLPLR ....::. .. ..:. ... : :. : :. :::.:.. .. . . . :. CCDS74 QLMESLLQRQLDPKGLQEMVQLLEKWILSEKEWEREKAVSLHLYLMWIYVHSTAVCIHLK 940 950 960 970 980 990 380 390 400 410 420 430 pF1KE0 FQRLGHLVALMALLCGDPQEKVAEEAAEGIHSLLHITLRLKYITHDKKDQQNLKRALTKC . ..: .:.:.: : .... . . . ::: . . :..:. :: CCDS74 LGQFGTMVGLIAPCTCDAHQRTRMASMNVLSSLLDLHASQTCSLWGPSKQKELE----KC 1000 1010 1020 1030 1040 1050 440 450 460 470 480 490 pF1KE0 REFLELHSSAAKCFYNCPFRIAQVFEGFLDSNELCQFIMTTFDTLKTLKHPCIQRSAGEL . .:.:. .. .. :::.: .. .:. ..:. .. ... . :. . CCDS74 KG--DLQSTDVEKIFCASSRIAKVVCMEFSCDEVVSLIQKLCENTGAMNLQHDKASVTWI 1060 1070 1080 1090 1100 500 510 520 530 540 550 pF1KE0 LLTLAKNTESQFEEVPEIMGVICAQLPIISQPRVRQQIINTVSLFISRPKYTDIVLSFLL . : .. ..: ::...: ..::....:.::. .:. . :. . . : .:. :: CCDS74 AFFLQMRAKELEDKVAEILSAILVHLPVVDHPEVRRLLIDGILLLAHHHQET--ILTSLL 1110 1120 1130 1140 1150 1160 560 570 580 590 600 pF1KE0 CHPVPYNRHLAEVWRMLSVELPSTTWILWRLLRKLQKCHNEPAQEKMAYVAVAVSP .:.:.. :::::: .: ..: . .: :. .:: CCDS74 RQPLPMESHLAEVWLAVSENVPFARTMLHSLMGRLQSRLSPRISATSKADIWRLAAVDPL 1170 1180 1190 1200 1210 1220 CCDS74 MTLCTIHLLIQKLDENDKLPDFLPDLIYTLLLQLGSSHRPEAAPPVLKMWKLVHTTPLPE 1230 1240 1250 1260 1270 1280 608 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 15:43:29 2016 done: Thu Nov 3 15:43:30 2016 Total Scan time: 3.670 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]