FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0854, 837 aa 1>>>pF1KSDA0854 837 - 837 aa - 837 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.8814+/-0.000975; mu= 11.7255+/- 0.059 mean_var=205.0377+/-41.974, 0's: 0 Z-trim(111.0): 12 B-trim: 0 in 0/55 Lambda= 0.089569 statistics sampled from 12000 (12007) to 12000 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.703), E-opt: 0.2 (0.369), width: 16 Scan time: 4.310 The best scores are: opt bits E(32554) CCDS6336.1 ZHX2 gene_id:22882|Hs108|chr8 ( 837) 5541 729.3 6.4e-210 CCDS6342.1 ZHX1 gene_id:11244|Hs108|chr8 ( 873) 600 90.9 1.1e-17 CCDS13315.1 ZHX3 gene_id:23051|Hs108|chr20 ( 956) 521 80.7 1.3e-14 >>CCDS6336.1 ZHX2 gene_id:22882|Hs108|chr8 (837 aa) initn: 5541 init1: 5541 opt: 5541 Z-score: 3882.2 bits: 729.3 E(32554): 6.4e-210 Smith-Waterman score: 5541; 100.0% identity (100.0% similar) in 837 aa overlap (1-837:1-837) 10 20 30 40 50 60 pF1KSD MASKRKSTTPCMVRTSQVVEQDVPEEVDRAKEKGIGTPQPDVAKDSWAAELENSSKENEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 MASKRKSTTPCMVRTSQVVEQDVPEEVDRAKEKGIGTPQPDVAKDSWAAELENSSKENEV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD IEVKSMGESQSKKLQGGYECKYCPYSTQNLNEFTEHVDMQHPNVILNPLYVCAECNFTTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 IEVKSMGESQSKKLQGGYECKYCPYSTQNLNEFTEHVDMQHPNVILNPLYVCAECNFTTK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD KYDSLSDHNSKFHPGEANFKLKLIKRNNQTVLEQSIETTNHVVSITTSGPGTGDSDSGIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 KYDSLSDHNSKFHPGEANFKLKLIKRNNQTVLEQSIETTNHVVSITTSGPGTGDSDSGIS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD VSKTPIMKPGKPKADAKKVPKKPEEITPENHVEGTARLVTDTAEILSRLGGVELLQDTLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 VSKTPIMKPGKPKADAKKVPKKPEEITPENHVEGTARLVTDTAEILSRLGGVELLQDTLG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD HVMPSVQLPPNINLVPKVPVPLNTTKYNSALDTNATMINSFNKFPYPTQAELSWLTAASK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 HVMPSVQLPPNINLVPKVPVPLNTTKYNSALDTNATMINSFNKFPYPTQAELSWLTAASK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD HPEEHIRIWFATQRLKHGISWSPEEVEEARKKMFNGTIQSVPPTITVLPAQLAPTKVTQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 HPEEHIRIWFATQRLKHGISWSPEEVEEARKKMFNGTIQSVPPTITVLPAQLAPTKVTQP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD ILQTALPCQILGQTSLVLTQVTSGSTTVSCSPITLAVAGVTNHGQKRPLVTPQAAPEPKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 ILQTALPCQILGQTSLVLTQVTSGSTTVSCSPITLAVAGVTNHGQKRPLVTPQAAPEPKR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD PHIAQVPEPPPKVANPPLTPASDRKKTKEQIAHLKASFLQSQFPDDAEVYRLIEVTGLAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 PHIAQVPEPPPKVANPPLTPASDRKKTKEQIAHLKASFLQSQFPDDAEVYRLIEVTGLAR 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD SEIKKWFSDHRYRCQRGIVHITSESLAKDQLAIAASRHGRTYHAYPDFAPQKFKEKTQGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 SEIKKWFSDHRYRCQRGIVHITSESLAKDQLAIAASRHGRTYHAYPDFAPQKFKEKTQGQ 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD VKILEDSFLKSSFPTQAELDRLRVETKLSRREIDSWFSERRKLRDSMEQAVLDSMGSGKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 VKILEDSFLKSSFPTQAELDRLRVETKLSRREIDSWFSERRKLRDSMEQAVLDSMGSGKK 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD GQDVGAPNGALSRLDQLSGAQLTSSLPSPSPAIAKSQEQVHLLRSTFARTQWPTPQEYDQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 GQDVGAPNGALSRLDQLSGAQLTSSLPSPSPAIAKSQEQVHLLRSTFARTQWPTPQEYDQ 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD LAAKTGLVRTEIVRWFKENRCLLKTGTVKWMEQYQHQPMADDHGYDAVARKATKPMAESP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 LAAKTGLVRTEIVRWFKENRCLLKTGTVKWMEQYQHQPMADDHGYDAVARKATKPMAESP 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD KNGGDVVPQYYKDPKKLCEEDLEKLVTRVKVGSEPAKDCLPAKPSEATSDRSEGSSRDGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 KNGGDVVPQYYKDPKKLCEEDLEKLVTRVKVGSEPAKDCLPAKPSEATSDRSEGSSRDGQ 730 740 750 760 770 780 790 800 810 820 830 pF1KSD GSDENEESSVVDYVEVTVGEEDAISDRSDSWSQAAAEGVSELAESDSDCVPAEAGQA ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 GSDENEESSVVDYVEVTVGEEDAISDRSDSWSQAAAEGVSELAESDSDCVPAEAGQA 790 800 810 820 830 >>CCDS6342.1 ZHX1 gene_id:11244|Hs108|chr8 (873 aa) initn: 1730 init1: 464 opt: 600 Z-score: 431.3 bits: 90.9 E(32554): 1.1e-17 Smith-Waterman score: 1887; 39.8% identity (66.5% similar) in 890 aa overlap (1-811:1-858) 10 20 30 40 50 60 pF1KSD MASKRKSTTPCMVRTSQVVEQDVPEEVDRAKEKGIGTPQPDVAKDSWAAELENSSKENEV :::.::::::::: .: ::: :. ..: : : .. :. :...:: CCDS63 MASRRKSTTPCMVLAS---EQDPDLELISDLDEG-----PPVLTPVENTRAESISSDEEV 10 20 30 40 50 70 80 90 100 110 120 pF1KSD IEVKSMGESQSKKLQGGYECKYCPYSTQNLNEFTEHVDMQHPNVILNPLYVCAECNFTTK : . ..:.::..:::::::: ..: .:: :: ::: .::::.:: :::.:::: :: CCDS63 HESVDSDNQQNKKVEGGYECKYCTFQTPDLNMFTFHVDSEHPNVVLNSSYVCVECNFLTK 60 70 80 90 100 110 130 140 150 160 170 pF1KSD KYDSLSDHNSKFHPGEANFKLKLIKRNNQTVLEQSIETTNHVVSITT-----SGPGTGDS .::.::.:: :.:::: :::: ..::::::..::.:. . :.. .. .: : CCDS63 RYDALSEHNLKYHPGEENFKLTMVKRNNQTIFEQTINDLTFDGSFVKEENAEQAESTEVS 120 130 140 150 160 170 180 190 200 210 220 pF1KSD DSGISVSKTPIMKPGKPKADAKK----------VPKKPE-EITP--ENHVEGTARLVTDT .::::.::::::: : :.. :. ::.. : :: : :. ::. . .... CCDS63 SSGISISKTPIMKMMKNKVENKRIAVHHNSVEDVPEEKENEIKPDREEIVENPSSSASES 180 190 200 210 220 230 230 240 250 260 270 pF1KSD ---AEILSRLGGVEL--------LQDTLGHVMPSVQLPPNINLVPKVPVPLNTTK-YNSA . :..:. . :..:. .:. : ::.::: .:.:. ::.: CCDS63 NTSTSIVNRIHPSTASTVVTPAAVLPGLAQVITAVSAQQNSNLIPKVLIPVNSIPTYNAA 240 250 260 270 280 290 280 290 300 310 320 330 pF1KSD LDTNATMINSFNKFPYPTQAELSWLTAASKHPEEHIRIWFATQRLKHGISWSPEEVEEAR ::.: ..:..:::::::..:.. :.: .:. ::.:.:::..::::::.::.:::::::: CCDS63 LDNNPLLLNTYNKFPYPTMSEITVLSAQAKYTEEQIKIWFSAQRLKHGVSWTPEEVEEAR 300 310 320 330 340 350 340 350 360 370 380 pF1KSD KKMFNGTIQSVPPTITVLPAQLAPTKVTQP-ILQTALPCQILGQTSLVLTQVTSGSTTVS .:.::::...:: ::::.:.... . : :::: :::.:: .::::::.. .: CCDS63 RKQFNGTVHTVPQTITVIPTHISTGSNGLPSILQT---CQIVGQPGLVLTQVAGTNTLPV 360 370 380 390 400 390 400 410 420 430 440 pF1KSD CSPITLAVAGVTNHGQKRPLVTPQAAPEPK-RPHIAQVPEPPP-KVANPPLTPAS---DR .::.:.:::: .... . .: : : . .: : :: : . ..: : CCDS63 TAPIALTVAGVPSQNNIQKSQVPAAQPTAETKPATAAVPTSQSVKHETALVNPDSFGIRA 410 420 430 440 450 460 450 460 470 480 490 pF1KSD KKTKEQIAHLKASFLQSQFPDDAEVYRLIEVTGLARSEIKKWFSDHRYRCQRG-----IV ::::::.:.::.:.:..::: :.:. ::...:::...:::::::: :: ::. . CCDS63 KKTKEQLAELKVSYLKNQFPHDSEIIRLMKITGLTKGEIKKWFSDTRYN-QRNSKSNQCL 470 480 490 500 510 520 500 510 520 530 540 pF1KSD HITSESL------AKDQLA----IAASRHGRTYHAYPDFAPQKFKEKTQGQVKILEDSFL :....: ..:. . ..... .... .:::.:::::::: :...:. ::: CCDS63 HLNNDSSTTIIIDSSDETTESPTVGTAQPKQSWNPFPDFTPQKFKEKTAEQLRVLQASFL 530 540 550 560 570 580 550 560 570 580 590 600 pF1KSD KSSFPTQAELDRLRVETKLSRREIDSWFSERRKLRDSMEQAV-LDSMGSGKKGQDVGAPN .:: :. ::.:::..:::.:::::.::.:..: . :. . .: ..:.. ...: . CCDS63 NSSVLTDEELNRLRAQTKLTRREIDAWFTEKKKSKALKEEKMEIDESNAGSSKEEAGETS 590 600 610 620 630 640 610 620 630 640 650 660 pF1KSD GALSRLDQLSGAQLTSSLPSPSPAIAKSQEQVHLLRSTFARTQWPTPQEYDQLAAKTGLV : :. ::: ..: . :. ::.:.:.:.:.:::::.:.:::.:: ..::. CCDS63 PA----DE-SGAPKSGST---GKICKKTPEQLHMLKSAFVRTQWPSPEEYDKLAKESGLA 650 660 670 680 690 700 670 680 690 700 710 720 pF1KSD RTEIVRWFKENRCLLKTGTVKWMEQYQHQPMADDHGYDAVARKAT-KPMAES---P---- ::.:: :: ..: :.:..::. :: .. .: ... ... .: ... : CCDS63 RTDIVSWFGDTRYAWKNGNLKWYYYYQSANSSSMNGLSSLRKRGRGRPKGRGRGRPRGRP 710 720 730 740 750 760 730 740 750 760 pF1KSD ------------------KNGGDVVPQYYKDPKKLCEEDLEKLVTRVKVGSEPAKDCLPA :.: .. .:: : : :.::..::.. ..: : .. CCDS63 RGSKRINNWDRGPSLIKFKTGTAILKDYYLKHKFLNEQDLDELVNKSHMGYEQVR----- 770 780 790 800 810 770 780 790 800 810 820 pF1KSD KPSEATSDRSEGSSRDGQGSDENEESS-VVDYVEVTVGEEDAISDRSDSWSQAAAEGVSE : ..:.. : . .:::: . :.: : :.. .: ::.: CCDS63 ---EWFAERQRRSELGIELFEENEEEDEVIDDQE----EDEEETDDSDTWEPPRHVKRKL 820 830 840 850 860 830 pF1KSD LAESDSDCVPAEAGQA CCDS63 SKSDD 870 >>CCDS13315.1 ZHX3 gene_id:23051|Hs108|chr20 (956 aa) initn: 1261 init1: 377 opt: 521 Z-score: 375.7 bits: 80.7 E(32554): 1.3e-14 Smith-Waterman score: 1384; 33.1% identity (59.7% similar) in 913 aa overlap (11-784:11-908) 10 20 30 40 50 60 pF1KSD MASKRKSTTPCMVRTSQVVEQDVPEEVDRAKEKGIGTPQPDVAKDSWAAELENSSKENEV ::. .. :: ::. :.. :. : :: :. .. :: : ... . . CCDS13 MASKRKSTTPCMIPVKTVVLQDASMEAQPAETLPEG-PQQDLPPEASAASSEAAQNPSST 10 20 30 40 50 70 80 90 100 110 pF1KSD IEVKSMGESQSKKLQGG-YECKYCPYSTQNLNEFTEHVDMQHPNVILNPLYVCAECNFTT . ....... . :.: : :::: . ......:. :.. .: . .: .::. :.: . CCDS13 -DGSTLANGHRSTLDGYLYSCKYCDFRSHDMTQFVGHMNSEHTDFNKDPTFVCSGCSFLA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD KKYDSLSDHNSKFHPGEANFKLKLIKRNNQTVLEQSIETTNHVVSITTSGPGTG-DSDSG : ..:: ::. : :::.: .. : .:..:.:::: .. . ... . : :... CCDS13 KTPEGLSLHNATCHSGEASFVWNVAKPDNHVVVEQSIPESTSTPDLAGEPSAEGADGQAE 120 130 140 150 160 170 180 190 200 210 220 pF1KSD ISVSKTPIMKPGKPKADAKK-------VPKKPE-EITP-----ENHV-EGTARLVTDTAE : ..:::::: : ::.::: ::..: : : : .: :: ... .. CCDS13 IIITKTPIMKIMKGKAEAKKIHTLKENVPSQPVGEALPKLSTGEMEVREGDHSFINGAVP 180 190 200 210 220 230 230 240 250 pF1KSD ILSR---------------LGGVELL-----------QDTLGHVMPSVQLP-PNINLVPK . . .: : .: :. :.. :. : :. . .:: CCDS13 VSQASASSAKNPHAANGPLIGTVPVLPAGIAQFLSLQQQPPVHAQHHVHQPLPTAKALPK 240 250 260 270 280 290 260 270 280 290 300 310 pF1KSD VPVPLNTTK-YNSALDTNATMINSFNKFPYPTQAELSWLTAASKHPEEHIRIWFATQRLK : .::.. ::.:.:.:. . :::.::::::.::: .::...:.:::...:::..:::: CCDS13 VMIPLSSIPTYNAAMDSNSFLKNSFHKFPYPTKAELCYLTVVTKYPEEQLKIWFTAQRLK 300 310 320 330 340 350 320 330 340 350 360 370 pF1KSD HGISWSPEEVEEARKKMFNGTIQSVP-PTITVLPAQL-APTKVTQPILQTALPCQILGQT .::::::::.:.::::::: .::::: :::::: . : : . .: ..:.::: ...:: CCDS13 QGISWSPEEIEDARKKMFNTVIQSVPQPTITVLNTPLVASAGNVQHLIQAALPGHVVGQP 360 370 380 390 400 410 380 390 400 410 420 pF1KSD -----SLVLTQ-VTSGSTTVSCSPITLAVAGVTNHGQKRPL--VTPQAAPEPKRPHIAQ- .:..:: . ... .. ::. :.:..: .. :. : ... : . :: CCDS13 EGTGGGLLVTQPLMANGLQATSSPLPLTVTSVPKQPGVAPINTVCSNTTSAVKVVNAAQS 420 430 440 450 460 470 430 440 450 460 470 480 pF1KSD VPEPPPKVANPPLTPAS--DRKKTKEQIAHLKASFLQSQFPDDAEVYRLIEVTGLARSEI . :.... . :: ::..::.. ::.:: ..::: ..:: .: .::::. :. CCDS13 LLTACPSITSQAFLDASIYKNKKSHEQLSALKGSFCRNQFPGQSEVEHLTKVTGLSTREV 480 490 500 510 520 530 490 500 510 pF1KSD KKWFSDHRYRCQ-----RGIVHITSESLAKDQ-----------------------LAIAA .:::::.::.:. :... :. :. :: CCDS13 RKWFSDRRYHCRNLKGSRAMIPGDHSSIIIDSVPEVSFSPSSKVPEVTCIPTTATLATHP 540 550 560 570 580 590 520 530 540 550 560 570 pF1KSD SRHGRTYHAYPDFAPQKFKEKTQGQVKILEDSFLKSSFPTQAELDRLRVETKLSRREIDS : . ...: :::.: :.::.. :.. ::.:: .. .: . :::::: :::..:::::: CCDS13 SAKRQSWHQTPDFTPTKYKERAPEQLRALESSFAQNPLPLDEELDRLRSETKMTRREIDS 600 610 620 630 640 650 580 590 600 610 pF1KSD WFSERRKLRDSME-------------QAVLDSMGSGKKGQD--VGAPNGALS-------- ::::::: .. : .:. : : ... :.. ::.: CCDS13 WFSERRKKVNAEETKKAEENASQEEEEAAEDEGGEEDLASELRVSGENGSLEMPSSHILA 660 670 680 690 700 710 620 630 640 pF1KSD --------------RLDQLSGAQLTSSLPSPSP----------------AIAKSQEQVHL :. . .: . .: . .: . :. .: :: CCDS13 ERKVSPIKINLKNLRVTEANGRNEIPGLGACDPEDDESNKLAEQLPGKVSCKKTAQQRHL 720 730 740 750 760 770 650 660 670 680 690 700 pF1KSD LRSTFARTQWPTPQEYDQLAAKTGLVRTEIVRWFKENRCLLKTGTVKWMEQYQHQPMADD ::. :..::::. :.::.. :.::: : :.:::: ..: ::.: .::.:.:.. . CCDS13 LRQLFVQTQWPSNQDYDSIMAQTGLPRPEVVRWFGDSRYALKNGQLKWYEDYKRGNFPP- 780 790 800 810 820 830 710 720 730 740 750 760 pF1KSD HGYDAVARKATKPMAESPKNGGDVVPQYYKDPKKLCEEDLEKLVTRVKVGSEPAKDCLPA : ..: : : ... .:: : : ::::..: .....:. .:. . CCDS13 -GLLVIA----------PGNR-ELLQDYYMTHKMLYEEDLQNLCDKTQMSSQQVKQWFAE 840 850 860 870 880 770 780 790 800 810 820 pF1KSD KPSEATSDRSEGSSRD-GQGSDENEESSVVDYVEVTVGEEDAISDRSDSWSQAAAEGVSE : .: : .. .:.: : :. : CCDS13 KMGEETRAVADTGSEDQGPGTGELTAVHKGMGDTYSEVSENSESWEPRVPEASSEPFDTS 890 900 910 920 930 940 837 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 03:46:02 2016 done: Thu Nov 3 03:46:02 2016 Total Scan time: 4.310 Total Display time: 0.100 Function used was FASTA [36.3.4 Apr, 2011]