FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB1338, 605 aa 1>>>pF1KB1338 605 - 605 aa - 605 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.7130+/-0.000914; mu= 1.4138+/- 0.055 mean_var=298.3236+/-60.130, 0's: 0 Z-trim(115.4): 32 B-trim: 0 in 0/54 Lambda= 0.074256 statistics sampled from 15904 (15934) to 15904 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.791), E-opt: 0.2 (0.489), width: 16 Scan time: 3.730 The best scores are: opt bits E(32554) CCDS11570.1 EPN3 gene_id:55040|Hs108|chr17 ( 632) 2700 302.8 8.8e-82 CCDS46199.1 EPN1 gene_id:29924|Hs108|chr19 ( 576) 1324 155.3 2e-37 CCDS11204.1 EPN2 gene_id:22905|Hs108|chr17 ( 584) 1116 133.1 1e-30 CCDS11203.1 EPN2 gene_id:22905|Hs108|chr17 ( 641) 1006 121.3 3.8e-27 CCDS46200.1 EPN1 gene_id:29924|Hs108|chr19 ( 550) 1001 120.7 4.9e-27 CCDS46198.1 EPN1 gene_id:29924|Hs108|chr19 ( 662) 998 120.5 7e-27 CCDS13998.1 ENTHD1 gene_id:150350|Hs108|chr22 ( 607) 699 88.4 2.9e-17 CCDS47330.1 CLINT1 gene_id:9685|Hs108|chr5 ( 625) 598 77.6 5.4e-14 CCDS56389.1 CLINT1 gene_id:9685|Hs108|chr5 ( 643) 576 75.3 2.8e-13 CCDS56388.1 CLINT1 gene_id:9685|Hs108|chr5 ( 625) 560 73.5 9e-13 >>CCDS11570.1 EPN3 gene_id:55040|Hs108|chr17 (632 aa) initn: 2695 init1: 2695 opt: 2700 Z-score: 1581.7 bits: 302.8 E(32554): 8.8e-82 Smith-Waterman score: 4013; 95.6% identity (95.6% similar) in 632 aa overlap (1-605:1-632) 10 20 30 40 50 60 pF1KB1 MTTSALRRQVKNIVHNYSEAEIKVREATSNDPWGPPSSLMSEIADLTFNTVAFTEVMGML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MTTSALRRQVKNIVHNYSEAEIKVREATSNDPWGPPSSLMSEIADLTFNTVAFTEVMGML 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB1 WRRLNDSGKNWRHVYKALTLLDYLLKTGSERVAHQCRENLYTIQTLKDFQYIDRDGKDQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 WRRLNDSGKNWRHVYKALTLLDYLLKTGSERVAHQCRENLYTIQTLKDFQYIDRDGKDQG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB1 VNVREKVKQVMALLKDEERLRQERTHALKTKERMALEGIGIGSGQLGFSRRYGEDYSRSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 VNVREKVKQVMALLKDEERLRQERTHALKTKERMALEGIGIGSGQLGFSRRYGEDYSRSR 130 140 150 160 170 180 190 200 210 220 pF1KB1 GSPSSYNSSSSSPRYTSDLEQARPQTSGEEELQLQLALAMSREEAEK------------- ::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GSPSSYNSSSSSPRYTSDLEQARPQTSGEEELQLQLALAMSREEAEKPVPPASHRDEDLQ 190 200 210 220 230 240 230 240 250 260 270 pF1KB1 --------------EVRSWQGDGSPMANGAGAVVHHQRDREPEREERKEEEKLKTSQSSI :::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LQLALRLSRQEHEKEVRSWQGDGSPMANGAGAVVHHQRDREPEREERKEEEKLKTSQSSI 250 260 270 280 290 300 280 290 300 310 320 330 pF1KB1 LDLADIFVPALAPPSTHCSADPWDIPGFRPNTEASGSSWGPSADPWSPIPSGTVLSRSQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LDLADIFVPALAPPSTHCSADPWDIPGFRPNTEASGSSWGPSADPWSPIPSGTVLSRSQP 310 320 330 340 350 360 340 350 360 370 380 390 pF1KB1 WDLTPMLSSSEPWGRTPVLPAGPPTTDPWALNSPHHKLPSTGADPWGASLETSDTPGGAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 WDLTPMLSSSEPWGRTPVLPAGPPTTDPWALNSPHHKLPSTGADPWGASLETSDTPGGAS 370 380 390 400 410 420 400 410 420 430 440 450 pF1KB1 TFDPFAKPPESTETKEGLEQALPSGKPSSPVELDLFGDPSPSSKQNGTKEPDALDLGILG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 TFDPFAKPPESTETKEGLEQALPSGKPSSPVELDLFGDPSPSSKQNGTKEPDALDLGILG 430 440 450 460 470 480 460 470 480 490 500 510 pF1KB1 EALTQPSKEARACRTPESFLGPSASSLVNLDSLVKAPQVAKTRNPFLTGLSAPSPTNPFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 EALTQPSKEARACRTPESFLGPSASSLVNLDSLVKAPQVAKTRNPFLTGLSAPSPTNPFG 490 500 510 520 530 540 520 530 540 550 560 570 pF1KB1 AGETGRPTLNQMRTGSPALGLAGGPVGAPLGSMTYSASLPLPLSSVPAGLTLPASVSVFP ::: :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AGEPGRPTLNQMRTGSPALGLAGGPVGAPLGSMTYSASLPLPLSSVPAGLTLPASVSVFP 550 560 570 580 590 600 580 590 600 pF1KB1 QAGAFAPQPLLPTPSSAGPRPPPPQTGTNPFL :::::::::::::::::::::::::::::::: CCDS11 QAGAFAPQPLLPTPSSAGPRPPPPQTGTNPFL 610 620 630 >>CCDS46199.1 EPN1 gene_id:29924|Hs108|chr19 (576 aa) initn: 1236 init1: 876 opt: 1324 Z-score: 785.6 bits: 155.3 E(32554): 2e-37 Smith-Waterman score: 1433; 44.6% identity (65.2% similar) in 623 aa overlap (1-568:1-571) 10 20 30 40 50 60 pF1KB1 MTTSALRRQVKNIVHNYSEAEIKVREATSNDPWGPPSSLMSEIADLTFNTVAFTEVMGML :.::.::::.::::::::::::::::::::::::: :::::::::::.:.:::.:.:.:. CCDS46 MSTSSLRRQMKNIVHNYSEAEIKVREATSNDPWGPSSSLMSEIADLTYNVVAFSEIMSMI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB1 WRRLNDSGKNWRHVYKALTLLDYLLKTGSERVAHQCRENLYTIQTLKDFQYIDRDGKDQG :.:::: ::::::::::.::..::.:::::::..::.::.:..::::::::.:::::::: CCDS46 WKRLNDHGKNWRHVYKAMTLMEYLIKTGSERVSQQCKENMYAVQTLKDFQYVDRDGKDQG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB1 VNVREKVKQVMALLKDEERLRQERTHALKTKERMALEGIGIGSGQLGFSRRYGEDYSRSR ::::::.::..:::.::.:::.::.:::::::..: . CCDS46 VNVREKAKQLVALLRDEDRLREERAHALKTKEKLA-----------------------QT 130 140 150 190 200 210 220 230 240 pF1KB1 GSPSSYNSSSSSPRYTSDLEQARPQTSGEEELQLQLALAMSREEAEKEVRSWQGDGSPMA .. :: .:. : . ::: ::.:::::::::::::::.:::.. : . . CCDS46 ATASSAAVGSGPP---PEAEQAWPQSSGEEELQLQLALAMSKEEADQPPSCGPEDDAQL- 160 170 180 190 200 210 250 260 270 280 pF1KB1 NGAGAVVHHQRDREPEREERKEEEKLKTS------------QSSILDLADIFV-PALAPP . : .. ....:.: :: .: .. .:. . .::..::::.:. :: :: CCDS46 QLALSLSREEHDKE-ERIRRGDDLRLQMAIEESKRETGGKEESSLMDLADVFTAPAPAP- 220 230 240 250 260 270 290 300 310 320 330 pF1KB1 STHCSADPWDIPGFR----PNTEASGSSWG-----PSADPWS-PIPSGTVLSRSQPW-DL ..::: :. :.. ... :: :.::::. : :. . ..:: CCDS46 ----TTDPWGGPAPMAAAVPTAAPTSDPWGGPPVPPAADPWGGPAPTP---ASGDPWRPA 280 290 300 310 320 340 350 360 370 380 pF1KB1 TPMLSSSEPWGRTPVLPAGP-PTTDPWA-------LNSPHHKLPSTGA----DPWGASLE .: : .::: ::. :: :: :::. ...: . : : : ::::.: CCDS46 APAGPSVDPWGGTPAPAAGEGPTPDPWGSSDGGVPVSGPSASDPWTPAPAFSDPWGGS-P 330 340 350 360 370 380 390 400 410 420 430 440 pF1KB1 TSDTPGGASTFDPFAKPPESTETKEGLEQALPSGKPSSPVELDLFGDPSPSSKQNGTKEP .. . .:... : :. . :. :::.. :: ::.:.. :. . : CCDS46 AKPSTNGTTAAGGFDTEPDEFSDFDRLRTALPTSG-SSAGELELLAGEVPA------RSP 390 400 410 420 430 450 460 470 480 490 pF1KB1 DALDL----GILGEALTQPSKEARAC------RTPESFLGPSASSLVNLDSLVK----AP :.:. : :.::. .: : .::::::::.:. ::.:::::. .: CCDS46 GAFDMSGVRGSLAEAVGSPPPAATPTPTPPTRKTPESFLGPNAA-LVDLDSLVSRPGPTP 440 450 460 470 480 490 500 510 520 530 540 pF1KB1 QVAKTRNPFLTG---LSAPSPTNPFGAGETGRPTLNQMRTGSPALGLAGGPVG--APLGS ::. :::: : ..:: :::: . . ::::.: ::. . :.: .:::. CCDS46 PGAKASNPFLPGGGPATGPSVTNPFQPAPPATLTLNQLRL-SPVPPVPGAPPTYISPLGG 500 510 520 530 540 550 550 560 570 580 590 600 pF1KB1 MTYSASLPLPLSSVPAGLTLPASVSVFPQAGAFAPQPLLPTPSSAGPRPPPPQTGTNPFL . .:: :. .: : : . CCDS46 ---GPGLP-PM--MPPGPPAPNTNPFLL 560 570 >>CCDS11204.1 EPN2 gene_id:22905|Hs108|chr17 (584 aa) initn: 1123 init1: 929 opt: 1116 Z-score: 665.1 bits: 133.1 E(32554): 1e-30 Smith-Waterman score: 1518; 47.3% identity (68.3% similar) in 628 aa overlap (1-605:1-583) 10 20 30 40 50 60 pF1KB1 MTTSALRRQVKNIVHNYSEAEIKVREATSNDPWGPPSSLMSEIADLTFNTVAFTEVMGML ::::..:::.::::.:::::::::::::::::::: ::::.::::::.:.:::.:.:.:. CCDS11 MTTSSIRRQMKNIVNNYSEAEIKVREATSNDPWGPSSSLMTEIADLTYNVVAFSEIMSMV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB1 WRRLNDSGKNWRHVYKALTLLDYLLKTGSERVAHQCRENLYTIQTLKDFQYIDRDGKDQG :.:::: :::::::::::::::::.::::::::.:::::...:::::::::::::::::: CCDS11 WKRLNDHGKNWRHVYKALTLLDYLIKTGSERVAQQCRENIFAIQTLKDFQYIDRDGKDQG 70 80 90 100 110 120 130 140 150 160 170 pF1KB1 VNVREKVKQVMALLKDEERLRQERTHALKTKERMALEGIGIGSGQLGFSRRYGE------ .::::: ::..:::::::::. ::..::::::::: . :.::.:. :.: .. CCDS11 INVREKSKQLVALLKDEERLKAERAQALKTKERMAQVATGMGSNQITFGRGSSQPNLSTS 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB1 ----DYSRSRGSPSSYNSSSSSPRYTSDLEQARPQTSGEEELQLQLALAMSREEAEKEVR .:... :::.::..:.: :: .:.::::::::::::::::::::::::: ::.: : CCDS11 HSEQEYGKAGGSPASYHGSTS-PRVSSELEQARPQTSGEEELQLQLALAMSREVAEQEER 190 200 210 220 230 240 250 260 270 280 290 pF1KB1 SWQGDGSPMANGAGAVVHHQRDREPEREERKEEEKLKTSQSSILDLADIFVPALAPPSTH .:: . .. .. :. . .:.:. .:...::: : . :. .: . . CCDS11 LRRGDDLRLQ-----MALEESRRDTVKIPKKKEHGSLPQQTTLLDLMDAL-PSSGPAAQK 240 250 260 270 280 290 300 310 320 330 340 pF1KB1 CSADPWDIPGFRPNTEASGSSWGPSADPWSPIPSGTVLSRSQPWDL--TPMLSSSEPWGR :.:: : .:. . . :: : : : :.:: : .: .::: CCDS11 --AEPW---GPSASTNQT-NPWGGPAAP---------ASTSDPWPSFGTKPAASIDPWG- 300 310 320 330 350 360 370 380 390 400 pF1KB1 TPV---LPAGPPTTDPWALNS-PHHKLPSTGADPWGASLETSDTPGGASTFDPFAKPPES .:. . . : ..:::: .. : . . ..: ::: . :. . ...:. :.. . CCDS11 VPTGATVQSVPKNSDPWAASQQPASSAGKRASDAWGA-VSTTKPVSVSGSFELFSNLNGT 340 350 360 370 380 390 410 420 430 440 450 460 pF1KB1 TETKEGLEQALPSGKPSSPVELDLFGDPSPSSKQNGTKEPDALDLGILGEALTQPSKEAR . . . : ..: .. .: :: ..::: :: .. : : ..::. :: CCDS11 IKDDFSEFDNLRTSKKTAESVTSL-----PS-QNNGTTSPDPFESQPLTVASSKPSS-AR 400 410 420 430 440 470 480 490 500 510 520 pF1KB1 ACRTPESFLGPSASSLVNLDSLVKAPQV-AKTRNPFLT-GLSAPS-PTNPFGAGETGRPT .::::::::.:. :::::::: : :.. ::::. : : : :.::: ... : CCDS11 --KTPESFLGPNAA-LVNLDSLVTRPAPPAQSLNPFLAPGAPATSAPVNPFQVNQPQPLT 450 460 470 480 490 500 530 540 550 560 570 pF1KB1 LNQMRTGSPALGLAG--GPVGAPLGSMTYSASLPLPLSSVPAGLTLPASVSVFPQAGAFA :::.: :::.:: . :: : . ::. ::. :..: .. :. : . : CCDS11 LNQLR-GSPVLGTSTSFGP-GPGVESMAV-ASMT---SAAPQPALGATGSSLTPLGPA-- 510 520 530 540 550 580 590 600 pF1KB1 PQPLLPTPSSAGPRPPPPQ-TGT-NPFL .. .:.: : : ::: :::: CCDS11 ---MMNMVGSVGIPPSAAQATGTTNPFLL 560 570 580 >>CCDS11203.1 EPN2 gene_id:22905|Hs108|chr17 (641 aa) initn: 1123 init1: 929 opt: 1006 Z-score: 600.9 bits: 121.3 E(32554): 3.8e-27 Smith-Waterman score: 1400; 43.7% identity (63.9% similar) in 664 aa overlap (1-575:1-629) 10 20 30 40 50 60 pF1KB1 MTTSALRRQVKNIVHNYSEAEIKVREATSNDPWGPPSSLMSEIADLTFNTVAFTEVMGML ::::..:::.::::.:::::::::::::::::::: ::::.::::::.:.:::.:.:.:. CCDS11 MTTSSIRRQMKNIVNNYSEAEIKVREATSNDPWGPSSSLMTEIADLTYNVVAFSEIMSMV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB1 WRRLNDSGKNWRHVYKALTLLDYLLKTGSERVAHQCRENLYTIQTLKDFQYIDRDGKDQG :.:::: :::::::::::::::::.::::::::.:::::...:::::::::::::::::: CCDS11 WKRLNDHGKNWRHVYKALTLLDYLIKTGSERVAQQCRENIFAIQTLKDFQYIDRDGKDQG 70 80 90 100 110 120 130 140 150 160 170 pF1KB1 VNVREKVKQVMALLKDEERLRQERTHALKTKERMALEGIGIGSGQLGFSRRYGE------ .::::: ::..:::::::::. ::..::::::::: . :.::.:. :.: .. CCDS11 INVREKSKQLVALLKDEERLKAERAQALKTKERMAQVATGMGSNQITFGRGSSQPNLSTS 130 140 150 160 170 180 180 pF1KB1 ----DYSRSRGSPSSYNSS----------------------------------------- .:... :::.::..: CCDS11 HSEQEYGKAGGSPASYHGSPEASLCPQHRTGAPLGQSEELQPLSQRHPFLPHLGLASRPN 190 200 210 220 230 240 190 200 210 220 230 pF1KB1 ---------------SSSPRYTSDLEQARPQTSGEEELQLQLALAMSREEAEKEVRSWQG ..::: .:.::::::::::::::::::::::::: ::.: : .: CCDS11 GDWSQPCLTCDRAARATSPRVSSELEQARPQTSGEEELQLQLALAMSREVAEQEERLRRG 250 260 270 280 290 300 240 250 260 270 280 290 pF1KB1 DGSPMANGAGAVVHHQRDREPEREERKEEEKLKTSQSSILDLADIFVPALAPPSTHCSAD : . .....: :. . .:.:. .:...::: : . :. .: . .:. CCDS11 DDLRLQ----MALEESR-RDTVKIPKKKEHGSLPQQTTLLDLMDAL-PSSGPAAQ--KAE 310 320 330 340 350 300 310 320 330 340 350 pF1KB1 PWDIPGFRPNTEASGSSWGPSADPWSPIPSGTVLSRSQPWDL--TPMLSSSEPWGRTPV- :: :. : . . :: : : : :.:: : .: .::: .:. CCDS11 PWG-PSASTN---QTNPWGGPAAP---------ASTSDPWPSFGTKPAASIDPWG-VPTG 360 370 380 390 360 370 380 390 400 pF1KB1 --LPAGPPTTDPWALNS-PHHKLPSTGADPWGASLETSDTPGGASTFDPFAKPPESTETK . . : ..:::: .. : . . ..: ::: . :. . ...:. :.. . . CCDS11 ATVQSVPKNSDPWAASQQPASSAGKRASDAWGA-VSTTKPVSVSGSFELFSNLNGTIKDD 400 410 420 430 440 450 410 420 430 440 450 460 pF1KB1 EGLEQALPSGKPSSPVELDLFGDPSPSSKQNGTKEPDALDLGILGEALTQPSKEARACRT . . : ..: .. .: : :..::: :: .. : : ..::. :: .: CCDS11 FSEFDNLRTSKKTAESVTSL---P---SQNNGTTSPDPFESQPLTVASSKPSS-AR--KT 460 470 480 490 500 470 480 490 500 510 520 pF1KB1 PESFLGPSASSLVNLDSLVKAPQV-AKTRNPFLT-GLSAPS-PTNPFGAGETGRPTLNQM :::::::.:. :::::::: : :.. ::::. : : : :.::: ... ::::. CCDS11 PESFLGPNAA-LVNLDSLVTRPAPPAQSLNPFLAPGAPATSAPVNPFQVNQPQPLTLNQL 510 520 530 540 550 560 530 540 550 560 570 pF1KB1 RTGSPALGLAG--GPVGAPLGSM---TYSASLPLPL-----SSV----PAGLTLPASVSV : :::.:: . :: : . :: ..... : : ::. :: ... .::.. CCDS11 R-GSPVLGTSTSFGP-GPGVESMAVASMTSAAPQPALGATGSSLTPLGPAMMNMVGSVGI 570 580 590 600 610 620 580 590 600 pF1KB1 FPQAGAFAPQPLLPTPSSAGPRPPPPQTGTNPFL :.: CCDS11 PPSAAQATGTTNPFLL 630 640 >>CCDS46200.1 EPN1 gene_id:29924|Hs108|chr19 (550 aa) initn: 1257 init1: 876 opt: 1001 Z-score: 598.8 bits: 120.7 E(32554): 4.9e-27 Smith-Waterman score: 1440; 46.0% identity (64.3% similar) in 611 aa overlap (1-568:1-545) 10 20 30 40 50 60 pF1KB1 MTTSALRRQVKNIVHNYSEAEIKVREATSNDPWGPPSSLMSEIADLTFNTVAFTEVMGML :.::.::::.::::::::::::::::::::::::: :::::::::::.:.:::.:.:.:. CCDS46 MSTSSLRRQMKNIVHNYSEAEIKVREATSNDPWGPSSSLMSEIADLTYNVVAFSEIMSMI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB1 WRRLNDSGKNWRHVYKALTLLDYLLKTGSERVAHQCRENLYTIQTLKDFQYIDRDGKDQG :.:::: ::::::::::.::..::.:::::::..::.::.:..::::::::.:::::::: CCDS46 WKRLNDHGKNWRHVYKAMTLMEYLIKTGSERVSQQCKENMYAVQTLKDFQYVDRDGKDQG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB1 VNVREKVKQVMALLKDEERLRQERTHALKTKERMALEGIGIGSGQLGFSRRYGEDYSRSR ::::::.::..:::.::.:::.::.:::::::..: . CCDS46 VNVREKAKQLVALLRDEDRLREERAHALKTKEKLA-----------------------QT 130 140 150 190 200 210 220 230 240 pF1KB1 GSPSSYNSSSSSPRYTSDLEQARPQTSGEEELQLQLALAMSREEAEKEVRSWQGDGSPMA .. :: .:. : . ::: ::.:::::::::::::::.:::..: : .:: . CCDS46 ATASSAAVGSGPP---PEAEQAWPQSSGEEELQLQLALAMSKEEADQEERIRRGDDLRLQ 160 170 180 190 200 210 250 260 270 280 290 pF1KB1 NGAGAVVHHQRDREPEREERKEEEKLKTSQSSILDLADIFV-PALAPPSTHCSADPWDIP . .: .:: .:: ::..::::.:. :: :: ..::: : CCDS46 MAI---------EESKRETGGKEE------SSLMDLADVFTAPAPAP-----TTDPWGGP 220 230 240 250 300 310 320 330 340 pF1KB1 GFR----PNTEASGSSWG-----PSADPWS-PIPSGTVLSRSQPW-DLTPMLSSSEPWGR . :.. ... :: :.::::. : :. . ..:: .: : .::: CCDS46 APMAAAVPTAAPTSDPWGGPPVPPAADPWGGPAPTP---ASGDPWRPAAPAGPSVDPWGG 260 270 280 290 300 310 350 360 370 380 390 pF1KB1 TPVLPAGP-PTTDPWA-------LNSPHHKLPSTGA----DPWGASLETSDTPGGASTFD ::. :: :: :::. ...: . : : : ::::.: .: : .: CCDS46 TPAPAAGEGPTPDPWGSSDGGVPVSGPSASDPWTPAPAFSDPWGGSPAKPSTNG--TTAG 320 330 340 350 360 400 410 420 430 440 450 pF1KB1 PFAKPPESTETKEGLEQALPSGKPSSPVELDLFGDPSPSSKQNGTKEPDALDL----GIL : :. . :. :::.. :: ::.:.. :. . : :.:. : : CCDS46 GFDTEPDEFSDFDRLRTALPTSG-SSAGELELLAGEVPA------RSPGAFDMSGVRGSL 370 380 390 400 410 420 460 470 480 490 500 pF1KB1 GEALTQPSKEARAC------RTPESFLGPSASSLVNLDSLVK----APQVAKTRNPFLTG .::. .: : .::::::::.:. ::.:::::. .: ::. :::: : CCDS46 AEAVGSPPPAATPTPTPPTRKTPESFLGPNAA-LVDLDSLVSRPGPTPPGAKASNPFLPG 430 440 450 460 470 480 510 520 530 540 550 pF1KB1 ---LSAPSPTNPFGAGETGRPTLNQMRTGSPALGLAGGPVG--APLGSMTYSASLPLPLS ..:: :::: . . ::::.: ::. . :.: .:::. . .:: :. CCDS46 GGPATGPSVTNPFQPAPPATLTLNQLRL-SPVPPVPGAPPTYISPLGG---GPGLP-PM- 490 500 510 520 530 560 570 580 590 600 pF1KB1 SVPAGLTLPASVSVFPQAGAFAPQPLLPTPSSAGPRPPPPQTGTNPFL .: : : . CCDS46 -MPPGPPAPNTNPFLL 540 550 >>CCDS46198.1 EPN1 gene_id:29924|Hs108|chr19 (662 aa) initn: 1257 init1: 876 opt: 998 Z-score: 596.0 bits: 120.5 E(32554): 7e-27 Smith-Waterman score: 1440; 45.7% identity (64.8% similar) in 611 aa overlap (1-568:112-657) 10 20 30 pF1KB1 MTTSALRRQVKNIVHNYSEAEIKVREATSN :.::.::::.:::::::::::::::::::: CCDS46 CQHLPQPSSGSRPISPRIGALCPLLLQPGTMSTSSLRRQMKNIVHNYSEAEIKVREATSN 90 100 110 120 130 140 40 50 60 70 80 90 pF1KB1 DPWGPPSSLMSEIADLTFNTVAFTEVMGMLWRRLNDSGKNWRHVYKALTLLDYLLKTGSE ::::: :::::::::::.:.:::.:.:.:.:.:::: ::::::::::.::..::.::::: CCDS46 DPWGPSSSLMSEIADLTYNVVAFSEIMSMIWKRLNDHGKNWRHVYKAMTLMEYLIKTGSE 150 160 170 180 190 200 100 110 120 130 140 150 pF1KB1 RVAHQCRENLYTIQTLKDFQYIDRDGKDQGVNVREKVKQVMALLKDEERLRQERTHALKT ::..::.::.:..::::::::.::::::::::::::.::..:::.::.:::.::.::::: CCDS46 RVSQQCKENMYAVQTLKDFQYVDRDGKDQGVNVREKAKQLVALLRDEDRLREERAHALKT 210 220 230 240 250 260 160 170 180 190 200 210 pF1KB1 KERMALEGIGIGSGQLGFSRRYGEDYSRSRGSPSSYNSSSSSPRYTSDLEQARPQTSGEE ::..: . .. :: .:. : . ::: ::.:::: CCDS46 KEKLA-----------------------QTATASSAAVGSGPP---PEAEQAWPQSSGEE 270 280 290 220 230 240 250 260 270 pF1KB1 ELQLQLALAMSREEAEKEVRSWQGDGSPMANGAGAVVHHQRDREPEREERKEEEKLKTSQ :::::::::::.:::..: : .:: . . .: .:: .:: CCDS46 ELQLQLALAMSKEEADQEERIRRGDDLRLQMAI---------EESKRETGGKEE------ 300 310 320 330 340 280 290 300 310 320 pF1KB1 SSILDLADIFV-PALAPPSTHCSADPWDIPGFR----PNTEASGSSWG-----PSADPWS ::..::::.:. :: :: ..::: :. :.. ... :: :.::::. CCDS46 SSLMDLADVFTAPAPAP-----TTDPWGGPAPMAAAVPTAAPTSDPWGGPPVPPAADPWG 350 360 370 380 390 330 340 350 360 370 pF1KB1 -PIPSGTVLSRSQPW-DLTPMLSSSEPWGRTPVLPAGP-PTTDPWA-------LNSPHHK : :. . ..:: .: : .::: ::. :: :: :::. ...: . CCDS46 GPAPTP---ASGDPWRPAAPAGPSVDPWGGTPAPAAGEGPTPDPWGSSDGGVPVSGPSAS 400 410 420 430 440 450 380 390 400 410 420 pF1KB1 LPSTGA----DPWGASLETSDTPGGASTFDPFAKPPESTETKEGLEQALPSGKPSSPVEL : : : ::::.: .. . .:... : :. . :. :::.. :: :: CCDS46 DPWTPAPAFSDPWGGS-PAKPSTNGTTAAGGFDTEPDEFSDFDRLRTALPTSG-SSAGEL 460 470 480 490 500 510 430 440 450 460 470 pF1KB1 DLFGDPSPSSKQNGTKEPDALDL----GILGEALTQPSKEARAC------RTPESFLGPS .:.. :. . : :.:. : :.::. .: : .::::::::. CCDS46 ELLAGEVPA------RSPGAFDMSGVRGSLAEAVGSPPPAATPTPTPPTRKTPESFLGPN 520 530 540 550 560 480 490 500 510 520 pF1KB1 ASSLVNLDSLVK----APQVAKTRNPFLTG---LSAPSPTNPFGAGETGRPTLNQMRTGS :. ::.:::::. .: ::. :::: : ..:: :::: . . ::::.: : CCDS46 AA-LVDLDSLVSRPGPTPPGAKASNPFLPGGGPATGPSVTNPFQPAPPATLTLNQLRL-S 570 580 590 600 610 620 530 540 550 560 570 580 pF1KB1 PALGLAGGPVG--APLGSMTYSASLPLPLSSVPAGLTLPASVSVFPQAGAFAPQPLLPTP :. . :.: .:::. . .:: :. .: : : . CCDS46 PVPPVPGAPPTYISPLGG---GPGLP-PM--MPPGPPAPNTNPFLL 630 640 650 660 590 600 pF1KB1 SSAGPRPPPPQTGTNPFL >>CCDS13998.1 ENTHD1 gene_id:150350|Hs108|chr22 (607 aa) initn: 682 init1: 682 opt: 699 Z-score: 423.4 bits: 88.4 E(32554): 2.9e-17 Smith-Waterman score: 699; 47.9% identity (74.8% similar) in 234 aa overlap (5-233:2-234) 10 20 30 40 50 60 pF1KB1 MTTSALRRQVKNIVHNYSEAEIKVREATSNDPWGPPSSLMSEIADLTFNTVAFTEVMGML :.::::::.:.:::.:::::::::::::::: :::: .:.::::::....:.:.:: CCDS13 MAFRRQVKNFVKNYSDAEIKVREATSNDPWGPSSSLMLDISDLTFNTISLSEIMNML 10 20 30 40 50 70 80 90 100 110 120 pF1KB1 WRRLNDSGKNWRHVYKALTLLDYLLKTGSERVAHQCRENLYTIQTLKDFQYIDRDGKDQG :.:::: :::::::::.:::.:::.:.::..: ..:::.. ..:::::::.::. ::::: CCDS13 WHRLNDHGKNWRHVYKSLTLMDYLIKNGSKKVIQHCREGFCNLQTLKDFQHIDEAGKDQG 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB1 VNVREKVKQVMALLKDEERLRQERTHALKTKERMALEGIGIGSGQLGFSRRYGEDYSRSR .::: :::..:: :: : .:: : .:..: . ..: ... ::: : : CCDS13 YYIREKSKQVITLLMDEPLLCKEREVACRTRQRTS-HSILFSKRQLGSSNSLTACTSAPT 120 130 140 150 160 170 190 200 210 220 230 pF1KB1 GSPSSYNSSSSSPRY-----TSDLEQARPQTSGEEELQLQLALAMSREEAEKEVRSWQGD . :. ... . :.. .. .: . ....: .:.: ....:. CCDS13 PDISASEKKYKLPKFGRLHNKRNVCKAGLKQEHCQDVHLPTETMLSQETLPLKIHGWKST 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB1 GSPMANGAGAVVHHQRDREPEREERKEEEKLKTSQSSILDLADIFVPALAPPSTHCSADP CCDS13 EDLMTFLDDDPELPLLATPPSIVSPITCLSEAEEVCNLSGADAVPTLSENSPSGQRDVSL 240 250 260 270 280 290 >>CCDS47330.1 CLINT1 gene_id:9685|Hs108|chr5 (625 aa) initn: 398 init1: 332 opt: 598 Z-score: 364.8 bits: 77.6 E(32554): 5.4e-14 Smith-Waterman score: 657; 27.8% identity (60.4% similar) in 583 aa overlap (9-560:13-570) 10 20 30 40 50 pF1KB1 MTTSALRRQVKNIVHNYSEAEIKVREATSNDPWGPPSSLMSEIADLTFNTVAFTEV .. :.: :::: : ::::::..::::: ..::.::: :: : :. CCDS47 MLNMWKVRELVDKATNVVMNYSEIESKVREATNDDPWGPSGQLMGEIAKATFMYEQFPEL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB1 MGMLWRR-LNDSGKNWRHVYKALTLLDYLLKTGSERVAHQCRENLYTIQTLKDFQYIDRD :.::: : :.:. ::::.:::.: :: ::...:::::. . ::..: ...:......:. CCDS47 MNMLWSRMLKDNKKNWRRVYKSLLLLAYLIRNGSERVVTSAREHIYDLRSLENYHFVDEH 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB1 GKDQGVNVREKVKQVMALLKDEERLRQERTHALKTKERMALEGIGIGSGQLGFSRRYGED :::::.:.:.:::... . .:..:::.:: .: :.:... .:..: ..: . ::.: CCDS47 GKDQGINIRQKVKELVEFAQDDDRLREERKKAKKNKDKY----VGVSSDSVG-GFRYSER 130 140 150 160 170 180 190 200 210 220 230 pF1KB1 YSRSRGSPSSYNSSSSSPRYTSDLEQARPQTSGEEELQLQLALAMSREEAEKEVRSWQGD :. : .:. . .. .. ..: : .. ::. ... ... . : :. . : CCDS47 YD-----PEP--KSKWDEEWDKN-KSAFPFSDKLGELSDKIGSTID-DTISKFRRKDRED 180 190 200 210 220 240 250 260 270 280 290 pF1KB1 GSPMANGAGAVVHHQRDREPEREERKEEEKLKTSQSSILDLADIFVPALAPPSTHC-SAD . . . . .: : :. : . ::: . :.. : . .. . . : .:. CCDS47 SPERCSDSDEEKKARRGRSPKGEFKDEEETVTTKHIHITQATE------TTTTRHKRTAN 230 240 250 260 270 280 300 310 320 330 340 pF1KB1 PWDIPGFRPNTEASGSSWGPSAD-----PWSPIPSGTVLSRSQPWDLTPMLS-SSEPWGR : . .. .:.. .:. . : : . ... :.:. ::. ... .:. : CCDS47 PSKTIDLGAAAHYTGDKASPDQNASTHTPQSSVKTSVPSSKSSG-DLVDLFDGTSQSTGG 290 300 310 320 330 350 360 370 380 390 400 pF1KB1 TPVLPAGPPTTDPWALNS--PHHKLPSTGADPWGASLETSDTPGG--ASTFDPFAKPPE- . : .: : .. : . ..: .: ...:.: ::. . :.. . CCDS47 SADLFGGFADFGSAAASGSFPSQVTATSGNGDFGDWSAFNQAPSGPVASSGEFFGSASQP 340 350 360 370 380 390 410 420 430 440 450 pF1KB1 STETKEGLEQAL--PSGKPSSPVELDLFGDPSPSSKQNGTKEPDALDLGILGEAL----- ..: : ..:: : . .: .::.:. . . .. . . . .. . .: .: CCDS47 AVELVSGSQSALGPPPAASNSSDLFDLMGSSQATMTSSQSMNFSMMSTNTVGLGLPMSRS 400 410 420 430 440 450 460 470 480 490 500 510 pF1KB1 --TQPSKEARACRTPESFLGPSASSLVNLDSLVKAPQVAKTRNPFLTGL----SAPSPTN :. ... . : .. ::.. ..::.:. . : .: ..: :. . . .: : CCDS47 QNTDMVQKSVSKTLPSTWSDPSVN--ISLDNLLPGMQPSKPQQPSLNTMIQQQNMQQPMN 460 470 480 490 500 510 520 530 540 550 560 pF1KB1 ----PFGAGETGRPTLNQMRTGSPALGLAGGPVGAPLGS-MTYSASLPLPLSSVPAGLTL ::: . . :. :.. . . .: :::. . . :: . .. ::...: CCDS47 VMTQSFGAVNLSSPS-NMLPVRPQTNALIGGPMPMSMPNVMTGTMGMA-PLGNTPMMNQS 520 530 540 550 560 570 570 580 590 600 pF1KB1 PASVSVFPQAGAFAPQPLLPTPSSAGPRPPPPQTGTNPFL CCDS47 MMGMNMNIGMSAAGMGLTGTMGMGMPNIAMTSGTVQPKQDAFANFANFSK 580 590 600 610 620 >>CCDS56389.1 CLINT1 gene_id:9685|Hs108|chr5 (643 aa) initn: 650 init1: 315 opt: 576 Z-score: 351.9 bits: 75.3 E(32554): 2.8e-13 Smith-Waterman score: 635; 26.9% identity (59.2% similar) in 605 aa overlap (9-587:13-588) 10 20 30 40 50 pF1KB1 MTTSALRRQVKNIVHNYSEAEIKVREATSNDPWGPPSSLMSEIADLTFNTVAFTEV .. :.: :::: : ::::::..::::: ..::.::: :: : :. CCDS56 MLNMWKVRELVDKATNVVMNYSEIESKVREATNDDPWGPSGQLMGEIAKATFMYEQFPEL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB1 MGMLWRR-LNDSGKNWRHVYKALTLLDYLLKTGSERVAHQCRENLYTIQTLKDFQYIDRD :.::: : :.:. ::::.:::.: :: ::...:::::. . ::..: ...:......:. CCDS56 MNMLWSRMLKDNKKNWRRVYKSLLLLAYLIRNGSERVVTSAREHIYDLRSLENYHFVDEH 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB1 GKDQGVNVREKVKQVMALLKDEERLRQERTHALKTKERMALEGIGIGSGQLGFSRRYGED :::::.:.:.:::... . .:..:::.:: .: :.:... .:..: ..: . ::.: CCDS56 GKDQGINIRQKVKELVEFAQDDDRLREERKKAKKNKDKY----VGVSSDSVG-GFRYSER 130 140 150 160 170 180 190 200 210 220 230 pF1KB1 YSRSRGSPSSYNSSSSSPRYTSDLEQARPQTSGEEELQLQLALAMSREEAEKEVRSWQGD :. : .:. . .. .. ..: : .. ::. ... ... . : :. . : CCDS56 YD-----PEP--KSKWDEEWDKN-KSAFPFSDKLGELSDKIGSTID-DTISKFRRKDRED 180 190 200 210 220 240 250 260 270 280 290 pF1KB1 GSPMANGAGAVVHHQRDREPEREERKEEEKLKTSQSSILDLADIFVPALAPPSTHC-SAD . . . . .: : :. : . ::: . :.. : . .. . . : .:. CCDS56 SPERCSDSDEEKKARRGRSPKGEFKDEEETVTTKHIHITQATE------TTTTRHKRTAN 230 240 250 260 270 280 300 310 320 330 340 pF1KB1 PWDIPGFRPNTEASGSSWGPSAD-----PWSPIPSGTVLSRSQPWDLTPMLS-SSEPWGR : . .. .:.. .:. . : : . ... :.:. ::. ... .:. : CCDS56 PSKTIDLGAAAHYTGDKASPDQNASTHTPQSSVKTSVPSSKSSG-DLVDLFDGTSQSTGG 290 300 310 320 330 350 360 370 380 390 400 pF1KB1 TPVLPAGPPTTDPWALNS--PHHKLPSTGADPWGASLETSDTPGG--ASTFDPFAKPPE- . : .: : .. : . ..: .: ...:.: ::. . :.. . CCDS56 SADLFGGFADFGSAAASGSFPSQVTATSGNGDFGDWSAFNQAPSGPVASSGEFFGSASQP 340 350 360 370 380 390 410 420 430 440 450 pF1KB1 STETKEGLEQAL--PSGKPSSPVELDLFGDPSPSSKQNGTKEPDALDLGILGEAL----T ..: : ..:: : . .: .::.:. . . .. . . . .. . .: .: . CCDS56 AVELVSGSQSALGPPPAASNSSDLFDLMGSSQATMTSSQSMNFSMMSTNTVGLGLPMSRS 400 410 420 430 440 450 460 470 480 490 500 510 pF1KB1 QPSKEARACRTPESFLGPSASSLVN------LDSLVKAPQVAKTRNPFLTGLSAPSPTNP :: ... . . : . ...:. : : . :.: . . .: :.. .: .: CCDS56 QPLQNVSTVLQKPNPLYNQNTDMVQKSVSKTLPSTWSDPSVNISLDNLLPGMQPSKPQQP 460 470 480 490 500 510 520 530 540 550 560 570 pF1KB1 FGAGETGRPTLNQMRTGSPALGLAGGPVGAPLGSMTYSASLPL-PLSSVPAGLTLPASVS . :. :... . ... :: .. . : ::. : ... : .: :. CCDS56 ------SLNTMIQQQNMQQPMNVMTQSFGA-VNLSSPSNMLPVRPQTNALIGGPMPMSMP 520 530 540 550 560 570 580 590 600 pF1KB1 VFPQAGAFAPQPLLPTPSSAGPRPPPPQTGTNPFL ..:... :: :: CCDS56 NV-MTGTMGMAPLGNTPMMNQSMMGMNMNIGMSAAGMGLTGTMGMGMPNIAMTSGTVQPK 580 590 600 610 620 630 >>CCDS56388.1 CLINT1 gene_id:9685|Hs108|chr5 (625 aa) initn: 634 init1: 315 opt: 560 Z-score: 342.8 bits: 73.5 E(32554): 9e-13 Smith-Waterman score: 619; 26.9% identity (59.0% similar) in 598 aa overlap (16-587:2-570) 10 20 30 40 50 60 pF1KB1 MTTSALRRQVKNIVHNYSEAEIKVREATSNDPWGPPSSLMSEIADLTFNTVAFTEVMGML :::: : ::::::..::::: ..::.::: :: : :.:.:: CCDS56 MNYSEIESKVREATNDDPWGPSGQLMGEIAKATFMYEQFPELMNML 10 20 30 40 70 80 90 100 110 pF1KB1 WRR-LNDSGKNWRHVYKALTLLDYLLKTGSERVAHQCRENLYTIQTLKDFQYIDRDGKDQ : : :.:. ::::.:::.: :: ::...:::::. . ::..: ...:......:. :::: CCDS56 WSRMLKDNKKNWRRVYKSLLLLAYLIRNGSERVVTSAREHIYDLRSLENYHFVDEHGKDQ 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB1 GVNVREKVKQVMALLKDEERLRQERTHALKTKERMALEGIGIGSGQLGFSRRYGEDYSRS :.:.:.:::... . .:..:::.:: .: :.:... .:..: ..: . ::.: :. CCDS56 GINIRQKVKELVEFAQDDDRLREERKKAKKNKDKY----VGVSSDSVG-GFRYSERYD-- 110 120 130 140 150 180 190 200 210 220 230 pF1KB1 RGSPSSYNSSSSSPRYTSDLEQARPQTSGEEELQLQLALAMSREEAEKEVRSWQGDGSPM : .:. . .. .. ..: : .. ::. ... ... . : :. . :. CCDS56 ---PEP--KSKWDEEWDKN-KSAFPFSDKLGELSDKIGSTID-DTISKFRRKDREDSPER 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB1 ANGAGAVVHHQRDREPEREERKEEEKLKTSQSSILDLADIFVPALAPPSTHC-SADPWDI . . . .: : :. : . ::: . :.. : . .. . . : .:.: CCDS56 CSDSDEEKKARRGRSPKGEFKDEEETVTTKHIHITQATE------TTTTRHKRTANPSKT 220 230 240 250 260 300 310 320 330 340 350 pF1KB1 PGFRPNTEASGSSWGPSAD-----PWSPIPSGTVLSRSQPWDLTPMLS-SSEPWGRTPVL . .. .:.. .:. . : : . ... :.:. ::. ... .:. : . : CCDS56 IDLGAAAHYTGDKASPDQNASTHTPQSSVKTSVPSSKSSG-DLVDLFDGTSQSTGGSADL 270 280 290 300 310 320 360 370 380 390 400 pF1KB1 PAGPPTTDPWALNS--PHHKLPSTGADPWGASLETSDTPGG--ASTFDPFAKPPE-STET .: : .. : . ..: .: ...:.: ::. . :.. . ..: CCDS56 FGGFADFGSAAASGSFPSQVTATSGNGDFGDWSAFNQAPSGPVASSGEFFGSASQPAVEL 330 340 350 360 370 380 410 420 430 440 450 460 pF1KB1 KEGLEQAL--PSGKPSSPVELDLFGDPSPSSKQNGTKEPDALDLGILGEAL----TQPSK : ..:: : . .: .::.:. . . .. . . . .. . .: .: .:: . CCDS56 VSGSQSALGPPPAASNSSDLFDLMGSSQATMTSSQSMNFSMMSTNTVGLGLPMSRSQPLQ 390 400 410 420 430 440 470 480 490 500 510 pF1KB1 EARACRTPESFLGPSASSLVN------LDSLVKAPQVAKTRNPFLTGLSAPSPTNPFGAG .. . . : . ...:. : : . :.: . . .: :.. .: .: CCDS56 NVSTVLQKPNPLYNQNTDMVQKSVSKTLPSTWSDPSVNISLDNLLPGMQPSKPQQP---- 450 460 470 480 490 500 520 530 540 550 560 570 pF1KB1 ETGRPTLNQMRTGSPALGLAGGPVGAPLGSMTYSASLPL-PLSSVPAGLTLPASVSVFPQ . :. :... . ... :: .. . : ::. : ... : .: :. . CCDS56 --SLNTMIQQQNMQQPMNVMTQSFGA-VNLSSPSNMLPVRPQTNALIGGPMPMSMPNV-M 510 520 530 540 550 580 590 600 pF1KB1 AGAFAPQPLLPTPSSAGPRPPPPQTGTNPFL .:... :: :: CCDS56 TGTMGMAPLGNTPMMNQSMMGMNMNIGMSAAGMGLTGTMGMGMPNIAMTSGTVQPKQDAF 560 570 580 590 600 610 605 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 20:25:05 2016 done: Thu Nov 3 20:25:06 2016 Total Scan time: 3.730 Total Display time: 0.120 Function used was FASTA [36.3.4 Apr, 2011]