FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3240, 873 aa 1>>>pF1KB3240 873 - 873 aa - 873 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.2681+/-0.0011; mu= 15.3075+/- 0.067 mean_var=191.3232+/-40.033, 0's: 0 Z-trim(109.5): 14 B-trim: 475 in 1/51 Lambda= 0.092724 statistics sampled from 10902 (10907) to 10902 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.667), E-opt: 0.2 (0.335), width: 16 Scan time: 3.370 The best scores are: opt bits E(32554) CCDS6342.1 ZHX1 gene_id:11244|Hs108|chr8 ( 873) 5719 778.4 0 CCDS6336.1 ZHX2 gene_id:22882|Hs108|chr8 ( 837) 600 93.6 1.6e-18 CCDS13315.1 ZHX3 gene_id:23051|Hs108|chr20 ( 956) 511 81.7 6.8e-15 >>CCDS6342.1 ZHX1 gene_id:11244|Hs108|chr8 (873 aa) initn: 5719 init1: 5719 opt: 5719 Z-score: 4146.5 bits: 778.4 E(32554): 0 Smith-Waterman score: 5719; 100.0% identity (100.0% similar) in 873 aa overlap (1-873:1-873) 10 20 30 40 50 60 pF1KB3 MASRRKSTTPCMVLASEQDPDLELISDLDEGPPVLTPVENTRAESISSDEEVHESVDSDN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 MASRRKSTTPCMVLASEQDPDLELISDLDEGPPVLTPVENTRAESISSDEEVHESVDSDN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 QQNKKVEGGYECKYCTFQTPDLNMFTFHVDSEHPNVVLNSSYVCVECNFLTKRYDALSEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 QQNKKVEGGYECKYCTFQTPDLNMFTFHVDSEHPNVVLNSSYVCVECNFLTKRYDALSEH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 NLKYHPGEENFKLTMVKRNNQTIFEQTINDLTFDGSFVKEENAEQAESTEVSSSGISISK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 NLKYHPGEENFKLTMVKRNNQTIFEQTINDLTFDGSFVKEENAEQAESTEVSSSGISISK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 TPIMKMMKNKVENKRIAVHHNSVEDVPEEKENEIKPDREEIVENPSSSASESNTSTSIVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 TPIMKMMKNKVENKRIAVHHNSVEDVPEEKENEIKPDREEIVENPSSSASESNTSTSIVN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 RIHPSTASTVVTPAAVLPGLAQVITAVSAQQNSNLIPKVLIPVNSIPTYNAALDNNPLLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 RIHPSTASTVVTPAAVLPGLAQVITAVSAQQNSNLIPKVLIPVNSIPTYNAALDNNPLLL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 NTYNKFPYPTMSEITVLSAQAKYTEEQIKIWFSAQRLKHGVSWTPEEVEEARRKQFNGTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 NTYNKFPYPTMSEITVLSAQAKYTEEQIKIWFSAQRLKHGVSWTPEEVEEARRKQFNGTV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 HTVPQTITVIPTHISTGSNGLPSILQTCQIVGQPGLVLTQVAGTNTLPVTAPIALTVAGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 HTVPQTITVIPTHISTGSNGLPSILQTCQIVGQPGLVLTQVAGTNTLPVTAPIALTVAGV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB3 PSQNNIQKSQVPAAQPTAETKPATAAVPTSQSVKHETALVNPDSFGIRAKKTKEQLAELK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 PSQNNIQKSQVPAAQPTAETKPATAAVPTSQSVKHETALVNPDSFGIRAKKTKEQLAELK 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB3 VSYLKNQFPHDSEIIRLMKITGLTKGEIKKWFSDTRYNQRNSKSNQCLHLNNDSSTTIII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 VSYLKNQFPHDSEIIRLMKITGLTKGEIKKWFSDTRYNQRNSKSNQCLHLNNDSSTTIII 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB3 DSSDETTESPTVGTAQPKQSWNPFPDFTPQKFKEKTAEQLRVLQASFLNSSVLTDEELNR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 DSSDETTESPTVGTAQPKQSWNPFPDFTPQKFKEKTAEQLRVLQASFLNSSVLTDEELNR 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB3 LRAQTKLTRREIDAWFTEKKKSKALKEEKMEIDESNAGSSKEEAGETSPADESGAPKSGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 LRAQTKLTRREIDAWFTEKKKSKALKEEKMEIDESNAGSSKEEAGETSPADESGAPKSGS 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB3 TGKICKKTPEQLHMLKSAFVRTQWPSPEEYDKLAKESGLARTDIVSWFGDTRYAWKNGNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 TGKICKKTPEQLHMLKSAFVRTQWPSPEEYDKLAKESGLARTDIVSWFGDTRYAWKNGNL 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB3 KWYYYYQSANSSSMNGLSSLRKRGRGRPKGRGRGRPRGRPRGSKRINNWDRGPSLIKFKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 KWYYYYQSANSSSMNGLSSLRKRGRGRPKGRGRGRPRGRPRGSKRINNWDRGPSLIKFKT 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB3 GTAILKDYYLKHKFLNEQDLDELVNKSHMGYEQVREWFAERQRRSELGIELFEENEEEDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 GTAILKDYYLKHKFLNEQDLDELVNKSHMGYEQVREWFAERQRRSELGIELFEENEEEDE 790 800 810 820 830 840 850 860 870 pF1KB3 VIDDQEEDEEETDDSDTWEPPRHVKRKLSKSDD ::::::::::::::::::::::::::::::::: CCDS63 VIDDQEEDEEETDDSDTWEPPRHVKRKLSKSDD 850 860 870 >>CCDS6336.1 ZHX2 gene_id:22882|Hs108|chr8 (837 aa) initn: 1730 init1: 464 opt: 600 Z-score: 445.9 bits: 93.6 E(32554): 1.6e-18 Smith-Waterman score: 1887; 39.9% identity (66.4% similar) in 890 aa overlap (1-858:1-811) 10 20 30 40 50 pF1KB3 MASRRKSTTPCMVLAS---EQDPDLELISDLDEG-----PPVLTPVENTRAESISSDEEV :::.::::::::: .: ::: :. ..: : : .. :. :...:: CCDS63 MASKRKSTTPCMVRTSQVVEQDVPEEVDRAKEKGIGTPQPDVAKDSWAAELENSSKENEV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB3 HESVDSDNQQNKKVEGGYECKYCTFQTPDLNMFTFHVDSEHPNVVLNSSYVCVECNFLTK : . ..:.::..:::::::: ..: .:: :: ::: .::::.:: :::.:::: :: CCDS63 IEVKSMGESQSKKLQGGYECKYCPYSTQNLNEFTEHVDMQHPNVILNPLYVCAECNFTTK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB3 RYDALSEHNLKYHPGEENFKLTMVKRNNQTIFEQTINDLTFDGSFVKEENAEQAESTEVS .::.::.:: :.:::: :::: ..::::::..::.:. . :.. .. .: : CCDS63 KYDSLSDHNSKFHPGEANFKLKLIKRNNQTVLEQSIETTNHVVSITT-----SGPGTGDS 130 140 150 160 170 180 190 200 210 220 230 pF1KB3 SSGISISKTPIMKMMKNKVENKRIAVHHNSVEDVPEEKENEIKPDREEIVENPSSSASES .::::.::::::: : :.. :. ::.. : :: : :. ::. .: CCDS63 DSGISVSKTPIMKPGKPKADAKK----------VPKKPE-EITP--ENHVEG---TARLV 180 190 200 210 240 250 260 270 280 290 pF1KB3 NTSTSIVNRIHPSTASTVVTPAAVLPGLAQVITAVSAQQNSNLIPKVLIPVNSIPTYNAA . .. :..:. . :..:. .:. : ::.::: .:.:. ::.: CCDS63 TDTAEILSRLGGV--------ELLQDTLGHVMPSVQLPPNINLVPKVPVPLNTTK-YNSA 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB3 LDNNPLLLNTYNKFPYPTMSEITVLSAQAKYTEEQIKIWFSAQRLKHGVSWTPEEVEEAR ::.: ..:..:::::::..:.. :.: .:. ::.:.:::..::::::.::.:::::::: CCDS63 LDTNATMINSFNKFPYPTQAELSWLTAASKHPEEHIRIWFATQRLKHGISWSPEEVEEAR 280 290 300 310 320 330 360 370 380 390 400 pF1KB3 RKQFNGTVHTVPQTITVIPTHISTGSNGLPSILQT---CQIVGQPGLVLTQVAGTNTLPV .:.::::...:: ::::.:.... . : :::: :::.:: .::::::.. .: CCDS63 KKMFNGTIQSVPPTITVLPAQLAPTKVTQP-ILQTALPCQILGQTSLVLTQVTSGSTTVS 340 350 360 370 380 410 420 430 440 450 460 pF1KB3 TAPIALTVAGVPSQNNIQKSQVPAAQPTAETKPATAAVPTSQSVKHETALVNPDSFGIRA .::.:.:::: .... . .: : : . .: : :: : . ..: : CCDS63 CSPITLAVAGVTNHGQKRPLVTPQAAPEPK-RPHIAQVPEPPP-KVANPPLTPAS---DR 390 400 410 420 430 440 470 480 490 500 510 520 pF1KB3 KKTKEQLAELKVSYLKNQFPHDSEIIRLMKITGLTKGEIKKWFSDTRYN-QRNSKSNQCL ::::::.:.::.:.:..::: :.:. ::...:::...:::::::: :: ::. . CCDS63 KKTKEQIAHLKASFLQSQFPDDAEVYRLIEVTGLARSEIKKWFSDHRYRCQRG-----IV 450 460 470 480 490 530 540 550 560 570 580 pF1KB3 HLNNDSSTTIIIDSSDETTESPTVGTAQPKQSWNPFPDFTPQKFKEKTAEQLRVLQASFL :....: ..:. ...... .... .:::.:::::::: :...:. ::: CCDS63 HITSESL------AKDQL----AIAASRHGRTYHAYPDFAPQKFKEKTQGQVKILEDSFL 500 510 520 530 540 590 600 610 620 630 640 pF1KB3 NSSVLTDEELNRLRAQTKLTRREIDAWFTEKKKSKALKEEKMEIDESNAGSSKEEAGETS .:: :. ::.:::..:::.:::::.::.:..: . :. . .: ..:.. ...: . CCDS63 KSSFPTQAELDRLRVETKLSRREIDSWFSERRKLRDSMEQAV-LDSMGSGKKGQDVGAPN 550 560 570 580 590 600 650 660 670 680 690 700 pF1KB3 PA----DE-SGAPKSGST---GKICKKTPEQLHMLKSAFVRTQWPSPEEYDKLAKESGLA : :. ::: ..: . :. ::.:.:.:.:.:::::.:.:::.:: ..::. CCDS63 GALSRLDQLSGAQLTSSLPSPSPAIAKSQEQVHLLRSTFARTQWPTPQEYDQLAAKTGLV 610 620 630 640 650 660 710 720 730 740 750 760 pF1KB3 RTDIVSWFGDTRYAWKNGNLKWYYYYQSANSSSMNGLSSLRKRGRGRPKGRGRGRPRGRP ::.:: :: ..: :.:..::. :: .. .: ... ... .: ... : CCDS63 RTEIVRWFKENRCLLKTGTVKWMEQYQHQPMADDHGYDAVARKAT-KPMAES---P---- 670 680 690 700 710 720 770 780 790 800 810 pF1KB3 RGSKRINNWDRGPSLIKFKTGTAILKDYYLKHKFLNEQDLDELVNKSHMGYEQVR----- :.: .. .:: : : :.::..::.. ..: : .. CCDS63 ------------------KNGGDVVPQYYKDPKKLCEEDLEKLVTRVKVGSEPAKDCLPA 730 740 750 760 820 830 840 850 860 pF1KB3 ---EWFAERQRRSELGIELFEENEEEDEVIDDQE----EDEEETDDSDTWEPPRHVKRKL : ..:.. : . .:::: . :.: : :.. .: ::.: CCDS63 KPSEATSDRSEGSSRDGQGSDENEE-SSVVDYVEVTVGEEDAISDRSDSWSQAAAEGVSE 770 780 790 800 810 820 870 pF1KB3 SKSDD CCDS63 LAESDSDCVPAEAGQA 830 >>CCDS13315.1 ZHX3 gene_id:23051|Hs108|chr20 (956 aa) initn: 1627 init1: 417 opt: 511 Z-score: 380.8 bits: 81.7 E(32554): 6.8e-15 Smith-Waterman score: 1652; 36.2% identity (61.5% similar) in 940 aa overlap (1-821:1-886) 10 20 30 40 50 pF1KB3 MASRRKSTTPCMVLASE---QDPDLEL--ISDLDEGPPVLTPVENTRAESISSDEEVHES :::.::::::::. .. :: ..: : ::: : : . : : .... : CCDS13 MASKRKSTTPCMIPVKTVVLQDASMEAQPAETLPEGPQQDLPPEASAASSEAAQNP--SS 10 20 30 40 50 60 70 80 90 100 110 pF1KB3 VDSD---NQQNKKVEGG-YECKYCTFQTPDLNMFTFHVDSEHPNVVLNSSYVCVECNFLT .:.. : . . ..: : :::: :.. :...:. :..::: . . ..:: :.::. CCDS13 TDGSTLANGHRSTLDGYLYSCKYCDFRSHDMTQFVGHMNSEHTDFNKDPTFVCSGCSFLA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB3 KRYDALSEHNLKYHPGEENFKLTMVKRNNQTIFEQTINDLTFDGSFVKEENAEQAESTEV : ..:: :: : :: .: ...: .:... ::.: . : ... : .:: :.. CCDS13 KTPEGLSLHNATCHSGEASFVWNVAKPDNHVVVEQSIPESTSTPDLAGEPSAEGADG--- 120 130 140 150 160 170 180 190 200 210 220 pF1KB3 SSSGISISKTPIMKMMKNKVENKRIAVHHNSVEDVPEEKENEIKPD----REEIVENPSS .. : :.::::::.::.:.: :.: :. :.:: . .: : . :. :. : CCDS13 -QAEIIITKTPIMKIMKGKAEAKKI---HTLKENVPSQPVGEALPKLSTGEMEVREGDHS 180 190 200 210 220 230 230 240 250 260 270 pF1KB3 ----SASESNTSTSIVNRIHPSTASTVVTPAAVLP-GLAQVIT-----AVSAQQN----- .. :..:.: .. : ... . : . ::: :.:: .. : ::.. CCDS13 FINGAVPVSQASASSAKNPHAANGPLIGT-VPVLPAGIAQFLSLQQQPPVHAQHHVHQPL 240 250 260 270 280 290 280 290 300 310 320 330 pF1KB3 --SNLIPKVLIPVNSIPTYNAALDNNPLLLNTYNKFPYPTMSEITVLSAQAKYTEEQIKI .. .:::.::..::::::::.:.: .: :...:::::: .:. :.. .:: :::.:: CCDS13 PTAKALPKVMIPLSSIPTYNAAMDSNSFLKNSFHKFPYPTKAELCYLTVVTKYPEEQLKI 300 310 320 330 340 350 340 350 360 370 380 pF1KB3 WFSAQRLKHGVSWTPEEVEEARRKQFNGTVHTVPQ-TITVIPTHISTGSNGLPSILQTC- ::.:::::.:.::.:::.:.::.:.:: ....::: ::::. : . ...... ..:. CCDS13 WFTAQRLKQGISWSPEEIEDARKKMFNTVIQSVPQPTITVLNTPLVASAGNVQHLIQAAL 360 370 380 390 400 410 390 400 410 420 430 440 pF1KB3 --QIVGQP-----GLVLTQVAGTNTLPVTA-PIALTVAGVPSQNNIQKSQVPAAQPTAET ..:::: ::..:: .: : .:. :. :::..::.: .. .. .. :. . CCDS13 PGHVVGQPEGTGGGLLVTQPLMANGLQATSSPLPLTVTSVPKQPGVAPINTVCSNTTSAV 420 430 440 450 460 470 450 460 470 480 490 500 pF1KB3 KPATAAVPTSQSVKHETALVNPDSFGIRAKKTKEQLAELKVSYLKNQFPHDSEIIRLMKI : ..:: . :. . :. . ::..:::. :: :. .:::: .::. .: :. CCDS13 KVVNAAQSLLTACPSITSQAFLDASIYKNKKSHEQLSALKGSFCRNQFPGQSEVEHLTKV 480 490 500 510 520 530 510 520 530 540 550 pF1KB3 TGLTKGEIKKWFSDTRYNQRNSKSNQCLHLNNDSSTTIIIDSSDETTESP---------- :::. :..::::: ::. :: :... . . .: :. ::::: :.. :: CCDS13 TGLSTREVRKWFSDRRYHCRNLKGSRAM-IPGDHSS-IIIDSVPEVSFSPSSKVPEVTCI 540 550 560 570 580 560 570 580 590 600 pF1KB3 -TVGT--AQP---KQSWNPFPDFTPQKFKEKTAEQLRVLQASFLNSSVLTDEELNRLRAQ :..: ..: .:::. ::::: :.::.. ::::.:..:: .. . ::::.:::.. CCDS13 PTTATLATHPSAKRQSWHQTPDFTPTKYKERAPEQLRALESSFAQNPLPLDEELDRLRSE 590 600 610 620 630 640 610 620 630 640 pF1KB3 TKLTRREIDAWFTEKKKSKALKEEKMEIDESNAGSSKEEAGE------------------ ::.::::::.::.:..: :. :: . .: ::.. .:::.: CCDS13 TKMTRREIDSWFSERRK-KVNAEETKKAEE-NASQEEEEAAEDEGGEEDLASELRVSGEN 650 660 670 680 690 700 650 660 pF1KB3 ---------------TSPA----------------------------DESGAPKSGSTGK .:: :::. :: CCDS13 GSLEMPSSHILAERKVSPIKINLKNLRVTEANGRNEIPGLGACDPEDDESNKLAEQLPGK 710 720 730 740 750 760 670 680 690 700 710 720 pF1KB3 I-CKKTPEQLHMLKSAFVRTQWPSPEEYDKLAKESGLARTDIVSWFGDTRYAWKNGNLKW . :::: .: :.:.. ::.::::: ..::.. ..:: : ..: ::::.::: :::.::: CCDS13 VSCKKTAQQRHLLRQLFVQTQWPSNQDYDSIMAQTGLPRPEVVRWFGDSRYALKNGQLKW 770 780 790 800 810 820 730 740 750 760 770 780 pF1KB3 YYYYQSANSSSMNGLSSLRKRGRGRPKGRGRGRPRGRPRGSKRINNWDRGPSLIKFKTGT : : ::: . :.:. . :. CCDS13 YEDY---------------KRG-------------------------NFPPGLLVIAPGN 830 840 790 800 810 820 830 840 pF1KB3 -AILKDYYLKHKFLNEQDLDELVNKSHMGYEQVREWFAERQRRSELGIELFEENEEEDEV .:.:::. ::.: :.::..: .:..:. .::..::::. CCDS13 RELLQDYYMTHKMLYEEDLQNLCDKTQMSSQQVKQWFAEKMGEETRAVADTGSEDQGPGT 850 860 870 880 890 900 850 860 870 pF1KB3 IDDQEEDEEETDDSDTWEPPRHVKRKLSKSDD CCDS13 GELTAVHKGMGDTYSEVSENSESWEPRVPEASSEPFDTSSPQAGRQLETD 910 920 930 940 950 873 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 02:28:06 2016 done: Sat Nov 5 02:28:07 2016 Total Scan time: 3.370 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]