FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1730, 744 aa 1>>>pF1KSDA1730 744 - 744 aa - 744 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1549+/-0.0012; mu= 15.3425+/- 0.072 mean_var=76.7275+/-15.509, 0's: 0 Z-trim(102.0): 42 B-trim: 0 in 0/48 Lambda= 0.146419 statistics sampled from 6730 (6744) to 6730 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.557), E-opt: 0.2 (0.207), width: 16 Scan time: 3.730 The best scores are: opt bits E(32554) CCDS30717.1 ZYG11B gene_id:79699|Hs108|chr1 ( 744) 4900 1045.4 0 CCDS44148.1 ZYG11A gene_id:440590|Hs108|chr1 ( 759) 2949 633.3 4.2e-181 CCDS76166.1 ZYG11A gene_id:440590|Hs108|chr1 ( 417) 1653 359.4 6.3e-99 CCDS6910.1 ZER1 gene_id:10444|Hs108|chr9 ( 766) 816 182.7 1.8e-45 >>CCDS30717.1 ZYG11B gene_id:79699|Hs108|chr1 (744 aa) initn: 4900 init1: 4900 opt: 4900 Z-score: 5592.3 bits: 1045.4 E(32554): 0 Smith-Waterman score: 4900; 100.0% identity (100.0% similar) in 744 aa overlap (1-744:1-744) 10 20 30 40 50 60 pF1KSD MPEDQAGAAMEEASPYSLLDICLNFLTTHLEKFCSARQDGTLCLQEPGVFPQEVADRLLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 MPEDQAGAAMEEASPYSLLDICLNFLTTHLEKFCSARQDGTLCLQEPGVFPQEVADRLLR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD TMAFHGLLNDGTVGIFRGNQMRLKRACIRKAKISAVAFRKAFCHHKLVELDATGVNADIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 TMAFHGLLNDGTVGIFRGNQMRLKRACIRKAKISAVAFRKAFCHHKLVELDATGVNADIT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD ITDIISGLGSNKWIQQNLQCLVLNSLTLSLEDPYERCFSRLSGLRALSITNVLFYNEDLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 ITDIISGLGSNKWIQQNLQCLVLNSLTLSLEDPYERCFSRLSGLRALSITNVLFYNEDLA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD EVASLPRLESLDISNTSITDITALLACKDRLKSLTMHHLKCLKMTTTQILDVVRELKHLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 EVASLPRLESLDISNTSITDITALLACKDRLKSLTMHHLKCLKMTTTQILDVVRELKHLN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD HLDISDDKQFTSDIALRLLEQKDILPNLVSLDVSGRKHVTDKAVEAFIQQRPSMQFVGLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 HLDISDDKQFTSDIALRLLEQKDILPNLVSLDVSGRKHVTDKAVEAFIQQRPSMQFVGLL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD ATDAGYSEFLTGEGHLKVSGEANETQIAEALKRYSERAFFVREALFHLFSLTHVMEKTKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 ATDAGYSEFLTGEGHLKVSGEANETQIAEALKRYSERAFFVREALFHLFSLTHVMEKTKP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD EILKLVVTGMRNHPMNLPVQLAASACVFNLTKQDLAAGMPVRLLADVTHLLLKAMEHFPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 EILKLVVTGMRNHPMNLPVQLAASACVFNLTKQDLAAGMPVRLLADVTHLLLKAMEHFPN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD HQQLQKNCLLSLCSDRILQDVPFNRFEAAKLVMQWLCNHEDQNMQRMAVAIISILAAKLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 HQQLQKNCLLSLCSDRILQDVPFNRFEAAKLVMQWLCNHEDQNMQRMAVAIISILAAKLS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD TEQTAQLGTELFIVRQLLQIVKQKTNQNSVDTTLKFTLSALWNLTDESPTTCRHFIENQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 TEQTAQLGTELFIVRQLLQIVKQKTNQNSVDTTLKFTLSALWNLTDESPTTCRHFIENQG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD LELFMRVLESFPTESSIQQKVLGLLNNIAEVQELHSELMWKDFIDHISSLLHSVEVEVSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 LELFMRVLESFPTESSIQQKVLGLLNNIAEVQELHSELMWKDFIDHISSLLHSVEVEVSY 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD FAAGIIAHLISRGEQAWTLSRSQRNSLLDDLHSAILKWPTPECEMVAYRSFNPFFPLLGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 FAAGIIAHLISRGEQAWTLSRSQRNSLLDDLHSAILKWPTPECEMVAYRSFNPFFPLLGC 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD FTTPGVQLWAVWAMQHVCSKNPSRYCSMLIEEGGLQHLYNIKDHEHTDPHVQQIAVAILD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 FTTPGVQLWAVWAMQHVCSKNPSRYCSMLIEEGGLQHLYNIKDHEHTDPHVQQIAVAILD 670 680 690 700 710 720 730 740 pF1KSD SLEKHIVRHGRPPPCKKQPQARLN :::::::::::::::::::::::: CCDS30 SLEKHIVRHGRPPPCKKQPQARLN 730 740 >>CCDS44148.1 ZYG11A gene_id:440590|Hs108|chr1 (759 aa) initn: 2509 init1: 1665 opt: 2949 Z-score: 3364.8 bits: 633.3 E(32554): 4.2e-181 Smith-Waterman score: 2949; 62.9% identity (85.1% similar) in 731 aa overlap (11-736:31-756) 10 20 30 40 pF1KSD MPEDQAGAAMEEASPYSLLDICLNFLTTHLEKFCSARQDG ::::::.:..:::: : ..:::.:: : :: CCDS44 MVHFLHPGHTPRNIVPPDAQKDALGCCVVQEEASPYTLVNICLNVLIANLEKLCSERPDG 10 20 30 40 50 60 50 60 70 80 90 100 pF1KSD TLCLQEPGVFPQEVADRLLRTMAFHGLLNDGTVGIFRGNQMRLKRACIRKAKISAVAFRK :::: : ::::::.:.::.:...: :.: :..:::::::.:: . :.:::::..:: : CCDS44 TLCLPEHWSFPQEVAERFLRVMTWQGKLTDRTASIFRGNQMKLKLVNIQKAKISTAAFIK 70 80 90 100 110 120 110 120 130 140 150 160 pF1KSD AFCHHKLVELDATGVNADITITDIISGLGSNKWIQQNLQCLVLNSLTLSLEDPYERCFSR :::.:::.::.::.:.::. . :::::: ::.:::::::::.:.: .. .. ::. CCDS44 AFCRHKLIELNATAVHADLPVPDIISGLCSNRWIQQNLQCLLLDSTSIP-QNSRLLFFSQ 130 140 150 160 170 170 180 190 200 210 220 pF1KSD LSGLRALSITNVLFYNEDLAEVASLPRLESLDISNTSITDITALLACKDRLKSLTMHHLK :.::: ::. :: :..::::.:..:::::::::::: .:::.:::.:::::::::::.:: CCDS44 LTGLRILSVFNVCFHTEDLANVSQLPRLESLDISNTLVTDISALLTCKDRLKSLTMHYLK 180 190 200 210 220 230 230 240 250 260 270 280 pF1KSD CLKMTTTQILDVVRELKHLNHLDISDDKQFTSDIALRLLEQKDILPNLVSLDVSGRKHVT :: :: .::: :.:::: : :::::: .:. ::.:..::.:::::::.::::.:: . .: CCDS44 CLAMTKSQILAVIRELKCLLHLDISDHRQLKSDLAFHLLQQKDILPNVVSLDISGGNCIT 240 250 260 270 280 290 290 300 310 320 330 340 pF1KSD DKAVEAFIQQRPSMQFVGLLATDAGYSEFLTGEGHLKVSGEANETQIAEALKRYSERAFF :.::: ::. ::.:::::::::::: :.:.: . :.:.: :. .::.:::.:: .:. : CCDS44 DEAVELFIRLRPAMQFVGLLATDAGSSDFFTTKQGLRVAGGASMSQISEALSRYRNRSCF 300 310 320 330 340 350 350 360 370 380 390 400 pF1KSD VREALFHLFSLTHVMEKTKPEILKLVVTGMRNHPMNLPVQLAASACVFNLTKQDLAAGMP :.::: .::. : :: : : :::::. ::::::..: ::..::::..:::.: :: ::: CCDS44 VKEALHRLFTETFSMEVTMPAILKLVAIGMRNHPLDLRVQFTASACALNLTRQGLAKGMP 360 370 380 390 400 410 410 420 430 440 450 460 pF1KSD VRLLADVTHLLLKAMEHFPNHQQLQKNCLLSLCSDRILQDVPFNRFEAAKLVMQWLCNHE ::::..:: ::.::...::..::::::::::: ..::: ::::.::.:::.::.:::.:: CCDS44 VRLLSEVTCLLFKALKNFPHYQQLQKNCLLSLTNSRILVDVPFDRFDAAKFVMRWLCKHE 420 430 440 450 460 470 470 480 490 500 510 pF1KSD DQNMQRMAVAIISILAAKLSTEQTAQLGTELFI-VRQLLQIVKQKTNQNSVDTTLKFTLS . .:: :::.. :::: .:: :::::: :::. :..:: ::::::..: :.:. :::. CCDS44 NPKMQTMAVSVTSILALQLSPEQTAQL-EELFMAVKELLAIVKQKTTENLDDVTFLFTLK 480 490 500 510 520 530 520 530 540 550 560 570 pF1KSD ALWNLTDESPTTCRHFIENQGLELFMRVLESFPTESSIQQKVLGLLNNIAEVQELHSELM ::::::: ::..:.::::::::..:..:::.: .::.::.::::::::::::.:: :.:. CCDS44 ALWNLTDGSPAACKHFIENQGLQIFIQVLETF-SESAIQSKVLGLLNNIAEVRELSSKLV 540 550 560 570 580 590 580 590 600 610 620 630 pF1KSD WKDFIDHISSLLHSVEVEVSYFAAGIIAHLISRGEQAWTLSRS-QRNSLLDDLHSAILKW .: . ::.::: : :.::::::::::::: : .: : .::. :: .::.:::..: .: CCDS44 TEDVLKHINSLLCSREMEVSYFAAGIIAHLTS-DRQLW-ISRDFQRRTLLQDLHATIQNW 600 610 620 630 640 650 640 650 660 670 680 690 pF1KSD PTPECEMVA---YRSFNPFFPLLGCFTTPGVQLWAVWAMQHVCSKNPSRYCSMLIEEGGL :. :.:.: ::::. :::::: :. : :::::.::: ::::::::.::.::.:: :: CCDS44 PSSSCKMTALVTYRSFKTFFPLLGNFSQPEVQLWALWAMYHVCSKNPSKYCKMLVEEEGL 660 670 680 690 700 710 700 710 720 730 740 pF1KSD QHLYNIKDHEHTDPHVQQIAVAILDSLEKHIVRHGRPPPCKKQPQARLN : : .:..: .. :..::::..:::... :.. . :: :. CCDS44 QLLCDIQEHSEATPKAQQIAASILDDFRMHFMNYQRPTLCQMPF 720 730 740 750 >>CCDS76166.1 ZYG11A gene_id:440590|Hs108|chr1 (417 aa) initn: 1547 init1: 945 opt: 1653 Z-score: 1889.5 bits: 359.4 E(32554): 6.3e-99 Smith-Waterman score: 1653; 61.9% identity (84.7% similar) in 417 aa overlap (325-736:2-414) 300 310 320 330 340 350 pF1KSD QFVGLLATDAGYSEFLTGEGHLKVSGEANETQIAEALKRYSERAFFVREALFHLFSLTHV .::.:::.:: .:. ::.::: .::. : CCDS76 MSQISEALSRYRNRSCFVKEALHRLFTETFS 10 20 30 360 370 380 390 400 410 pF1KSD MEKTKPEILKLVVTGMRNHPMNLPVQLAASACVFNLTKQDLAAGMPVRLLADVTHLLLKA :: : : :::::. ::::::..: ::..::::..:::.: :: :::::::..:: ::.:: CCDS76 MEVTMPAILKLVAIGMRNHPLDLRVQFTASACALNLTRQGLAKGMPVRLLSEVTCLLFKA 40 50 60 70 80 90 420 430 440 450 460 470 pF1KSD MEHFPNHQQLQKNCLLSLCSDRILQDVPFNRFEAAKLVMQWLCNHEDQNMQRMAVAIISI ...::..::::::::::: ..::: ::::.::.:::.::.:::.::. .:: :::.. :: CCDS76 LKNFPHYQQLQKNCLLSLTNSRILVDVPFDRFDAAKFVMRWLCKHENPKMQTMAVSVTSI 100 110 120 130 140 150 480 490 500 510 520 530 pF1KSD LAAKLSTEQTAQLGTELFI-VRQLLQIVKQKTNQNSVDTTLKFTLSALWNLTDESPTTCR :: .:: :::::: :::. :..:: ::::::..: :.:. :::.::::::: ::..:. CCDS76 LALQLSPEQTAQL-EELFMAVKELLAIVKQKTTENLDDVTFLFTLKALWNLTDGSPAACK 160 170 180 190 200 210 540 550 560 570 580 590 pF1KSD HFIENQGLELFMRVLESFPTESSIQQKVLGLLNNIAEVQELHSELMWKDFIDHISSLLHS ::::::::..:..:::.: .::.::.::::::::::::.:: :.:. .: . ::.::: : CCDS76 HFIENQGLQIFIQVLETF-SESAIQSKVLGLLNNIAEVRELSSKLVTEDVLKHINSLLCS 220 230 240 250 260 600 610 620 630 640 pF1KSD VEVEVSYFAAGIIAHLISRGEQAWTLSRS-QRNSLLDDLHSAILKWPTPECEMVA---YR :.::::::::::::: : .: : .::. :: .::.:::..: .::. :.:.: :: CCDS76 REMEVSYFAAGIIAHLTS-DRQLW-ISRDFQRRTLLQDLHATIQNWPSSSCKMTALVTYR 270 280 290 300 310 320 650 660 670 680 690 700 pF1KSD SFNPFFPLLGCFTTPGVQLWAVWAMQHVCSKNPSRYCSMLIEEGGLQHLYNIKDHEHTDP ::. :::::: :. : :::::.::: ::::::::.::.::.:: ::: : .:..: .. : CCDS76 SFKTFFPLLGNFSQPEVQLWALWAMYHVCSKNPSKYCKMLVEEEGLQLLCDIQEHSEATP 330 340 350 360 370 380 710 720 730 740 pF1KSD HVQQIAVAILDSLEKHIVRHGRPPPCKKQPQARLN ..::::..:::... :.. . :: :. CCDS76 KAQQIAASILDDFRMHFMNYQRPTLCQMPF 390 400 410 >>CCDS6910.1 ZER1 gene_id:10444|Hs108|chr9 (766 aa) initn: 732 init1: 269 opt: 816 Z-score: 929.7 bits: 182.7 E(32554): 1.8e-45 Smith-Waterman score: 931; 28.6% identity (60.3% similar) in 773 aa overlap (10-720:1-752) 10 20 30 40 50 pF1KSD MPEDQAGAAMEEASPYSLLDICLNFLTTHLEKFCSARQDGTLCLQEPGVF-PQEVADRL- : .: ::. .: .: .:. . : .: .: :.:. ::: CCDS69 MASDTPESLMALCTDFCLRNLDGTLGYLLDKETLRLHPDIFLPSEICDRLV 10 20 30 40 50 60 70 80 90 100 110 pF1KSD -----LRTMAFHGLLNDGTVGIFRGNQ-MRLKRACIRKAKISAVAFRKAFCHHKLVELDA : . : . ... ..: . :: : .:. .. . .:. .. :::: CCDS69 NEYVELVNAACNFEPHESFFSLFSDPRSTRLTRIHLREDLVQDQDL-EAIRKQDLVELYL 60 70 80 90 100 110 120 130 140 150 pF1KSD TGVNADITITDIISGLGSNKWIQQNLQCLVLNSLTLSLEDP------Y---ERC------ : : . . .. : : . .:. . ... :.: : : CCDS69 T--NCEKLSAKSLQTLRSFSHTLVSLSLFGCTNIFYEEENPGGCEDEYLVNPTCQVLVKD 120 130 140 150 160 160 170 180 190 200 210 pF1KSD --FSRLSGLRALSITNVLFYNEDLAEVASLPR----LESLDISNTSITDITALLACKDRL : .: :: :.. .. : . : :: : : .::.:. . .: . : :: : CCDS69 FTFEGFSRLRFLNLGRMI----DWVPVESLLRPLNSLAALDLSGIQTSDAAFLTQWKDSL 170 180 190 200 210 220 220 230 240 250 260 pF1KSD KSLTMHHLKCLKMTTTQILDVVRELKHLNHLDISDDK-------QFTSDIALRLLEQKDI ::..... .. .: :. .:..: ::::: :. ..: .. : :. :: CCDS69 VSLVLYNMD---LSDDHI-RVIVQLHKLRHLDISRDRLSSYYKFKLTREV-LSLFVQK-- 230 240 250 260 270 270 280 290 300 pF1KSD LPNLVSLDVSGR--------KHVTDKAVEAFIQ------------QRPSMQFVGLLATDA : ::.:::.::. ... ..: .. :. .:: .::.::. .. CCDS69 LGNLMSLDISGHMILENCSISKMEEEAGQTSIEPSKSSIIPFRALKRP-LQFLGLFENSL 280 290 300 310 320 330 310 320 330 340 350 360 pF1KSD GYSEFLTGEGHLKVSGEANETQIAEALKRYSE-RAFFVREALFHLFSLTHVMEKTKPEI- :: ::::. :: :. .:.. :.: : .. .:. ::..... :. . . CCDS69 CR---LTHIPAYKVSGDKNEEQVLNAIEAYTEHRPEITSRAINLLFDIARI-ERCNQLLR 340 350 360 370 380 390 370 380 390 400 410 420 pF1KSD -LKLVVTGMRNHPMNLPVQLAASACVFNLTKQDLAAGMPVRLLADVTHLLLKAMEHFPNH ::::.:... : .. .:...:: .: ::... . . :.: .: ...:..:: . .. CCDS69 ALKLVITALKCHKYDRNIQVTGSAALFYLTNSEYRSEQSVKLRRQVIQVVLNGMESY-QE 400 410 420 430 440 450 430 440 450 460 470 480 pF1KSD QQLQKNCLLSLCSDRILQDVPFNRFEAAKLVMQWLC-NHEDQNMQRMAVAIISILAAKLS .:.:: :.::. : ... :. .. .:... : ...:...::.:: . . :. ... CCDS69 VTVQRNCCLTLCNFSIPEELEFQYRRVNELLLSILNPTRQDESIQRIAVHLCNALVCQVD 460 470 480 490 500 510 490 500 510 520 530 540 pF1KSD TEQTAQLGTELFIVRQLLQIVKQKTNQNSVDTTLKFTLSALWNLTDESPTTCRHFIENQG ... .: :.: .:.....: ... : ...:. :::::.:::.: .:. :.. .: CCDS69 NDHKEAVGKMGFVVT-MLKLIQKKLLDKTCDQVMEFSWSALWNITDETPDNCEMFLNFNG 520 530 540 550 560 570 550 560 570 580 590 pF1KSD LELFMRVLESFPTESSIQQKVLGLLNNIAEVQELHSELMWKDFIDHISSLLHSVE--VEV ..::. :. :: .. .....::::.:.:::.::. .:: ..::. .:.::.: .:: CCDS69 MKLFLDCLKEFPEKQELHRNMLGLLGNVAEVKELRPQLMTSQFISVFSNLLESKADGIEV 580 590 600 610 620 630 600 610 620 630 640 650 pF1KSD SYFAAGIIAHLISRGEQAWTLSRSQRNSLLDDLHSAILKWPTPECEMVAYRSFNPFFPLL :: : :...:.. : .:: . . ::. . . . .:: .: . . ::::.:.. :: CCDS69 SYNACGVLSHIMFDGPEAWGVCEPQREEVEERMWAAIQSWDINSRRNINYRSFEPILRLL 640 650 660 670 680 690 660 670 680 690 700 710 pF1KSD GCFTTPGVQLWAVWAMQHVCSKNPSRYCSMLIEEGGLQHLYNIKDHEHTDPHVQQIAVAI .: : ::.::. .. : :..:: .::.:::. : .: . .....: . CCDS69 PQGISPVSQHWATWALYNLVSVYPDKYCPLLIKEGGMPLLRDIIKMATARQETKEMARKV 700 710 720 730 740 750 720 730 740 pF1KSD LDSLEKHIVRHGRPPPCKKQPQARLN .. CCDS69 IEHCSNFKEENMDTSR 760 744 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 19:08:09 2016 done: Thu Nov 3 19:08:09 2016 Total Scan time: 3.730 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]