FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0036, 715 aa 1>>>pF1KE0036 715 - 715 aa - 715 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4996+/-0.000923; mu= 18.8307+/- 0.056 mean_var=71.0587+/-13.999, 0's: 0 Z-trim(105.2): 27 B-trim: 79 in 1/53 Lambda= 0.152148 statistics sampled from 8294 (8311) to 8294 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.625), E-opt: 0.2 (0.255), width: 16 Scan time: 3.150 The best scores are: opt bits E(32554) CCDS11602.1 EPX gene_id:8288|Hs108|chr17 ( 715) 4868 1078.2 0 CCDS11604.1 MPO gene_id:4353|Hs108|chr17 ( 745) 3480 773.6 0 CCDS32689.1 LPO gene_id:4025|Hs108|chr17 ( 712) 2499 558.2 1.5e-158 CCDS54149.1 LPO gene_id:4025|Hs108|chr17 ( 629) 2387 533.6 3.4e-151 CCDS46221.1 PXDN gene_id:7837|Hs108|chr2 (1479) 1739 391.6 4.5e-108 CCDS47855.1 PXDNL gene_id:137902|Hs108|chr8 (1463) 1572 354.9 4.9e-97 CCDS1643.1 TPO gene_id:7173|Hs108|chr2 ( 933) 1388 314.4 4.8e-85 CCDS1646.1 TPO gene_id:7173|Hs108|chr2 ( 760) 988 226.6 1.1e-58 CCDS1644.1 TPO gene_id:7173|Hs108|chr2 ( 876) 533 126.7 1.4e-28 CCDS32221.1 DUOX1 gene_id:53905|Hs108|chr15 (1551) 479 115.0 8.6e-25 CCDS10117.1 DUOX2 gene_id:50506|Hs108|chr15 (1548) 474 113.9 1.8e-24 >>CCDS11602.1 EPX gene_id:8288|Hs108|chr17 (715 aa) initn: 4868 init1: 4868 opt: 4868 Z-score: 5770.3 bits: 1078.2 E(32554): 0 Smith-Waterman score: 4868; 100.0% identity (100.0% similar) in 715 aa overlap (1-715:1-715) 10 20 30 40 50 60 pF1KE0 MHLLPALAGVLATLVLAQPCEGTDPASPGAVETSVLRDCIAEAKLLVDAAYNWTQKSIKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MHLLPALAGVLATLVLAQPCEGTDPASPGAVETSVLRDCIAEAKLLVDAAYNWTQKSIKQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 RLRSGSASPMDLLSYFKQPVAATRTVVRAADYMHVALGLLEEKLQPQRSGPFNVTDVLTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RLRSGSASPMDLLSYFKQPVAATRTVVRAADYMHVALGLLEEKLQPQRSGPFNVTDVLTE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 PQLRLLSQASGCALRDQAERCSDKYRTITGRCNNKRRPLLGASNQALARWLPAEYEDGLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PQLRLLSQASGCALRDQAERCSDKYRTITGRCNNKRRPLLGASNQALARWLPAEYEDGLS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 LPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQWGQFIDHDLDFSPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQWGQFIDHDLDFSPE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 SPARVAFTAGVDCERTCAQLPPCFPIKIPPNDPRIKNQRDCIPFFRSAPSCPQNKNRVRN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SPARVAFTAGVDCERTCAQLPPCFPIKIPPNDPRIKNQRDCIPFFRSAPSCPQNKNRVRN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 QINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLLAINQRFQDNGRALLPFDNLHDDPCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 QINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLLAINQRFQDNGRALLPFDNLHDDPCL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 LTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHNRLATELRRLNPRWNGDKLYNEARK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHNRLATELRRLNPRWNGDKLYNEARK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE0 IMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCSNVDPRVANVFTLAFRFGHTMLQPF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 IMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCSNVDPRVANVFTLAFRFGHTMLQPF 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE0 MFRLDSQYRASAPNSHVPLSSAFFASWRIVYEGGIDPILRGLMATPAKLNRQDAMLVDEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MFRLDSQYRASAPNSHVPLSSAFFASWRIVYEGGIDPILRGLMATPAKLNRQDAMLVDEL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE0 RDRLFRQVRRIGLDLAALNMQRSRDHGLPGYNAWRRFCGLSQPRNLAQLSRVLKNQDLAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RDRLFRQVRRIGLDLAALNMQRSRDHGLPGYNAWRRFCGLSQPRNLAQLSRVLKNQDLAR 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE0 KFLNLYGTPDNIDIWIGAIAEPLLPGARVGPLLACLFENQFRRARDGDRFWWQKRGVFTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 KFLNLYGTPDNIDIWIGAIAEPLLPGARVGPLLACLFENQFRRARDGDRFWWQKRGVFTK 610 620 630 640 650 660 670 680 690 700 710 pF1KE0 RQRKALSRISLSRIICDNTGITTVSRDIFRANIYPRGFVNCSRIPRLNLSAWRGT ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RQRKALSRISLSRIICDNTGITTVSRDIFRANIYPRGFVNCSRIPRLNLSAWRGT 670 680 690 700 710 >>CCDS11604.1 MPO gene_id:4353|Hs108|chr17 (745 aa) initn: 3419 init1: 2842 opt: 3480 Z-score: 4123.5 bits: 773.6 E(32554): 0 Smith-Waterman score: 3480; 70.0% identity (87.2% similar) in 716 aa overlap (1-713:27-742) 10 20 30 pF1KE0 MHLLPALAGVLATLVLAQPCEGTDPASPGAVETS :.:: ::::.:: :. :: ::. :: : :.:: CCDS11 MGVPFFSSLRCMVDLGPCWAGGLTAEMKLLLALAGLLAILATPQPSEGAAPAVLGEVDTS 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE0 VLRDCIAEAKLLVDAAYNWTQKSIKQRLRSGSASPMDLLSYFKQPVAATRTVVRAADYMH .. . . ::: ::: ::. ..::::::::::::::.::::::::::::::.::::::.: CCDS11 LVLSSMEEAKQLVDKAYKERRESIKQRLRSGSASPMELLSYFKQPVAATRTAVRAADYLH 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE0 VALGLLEEKLQPQRSGPFNVTDVLTEPQLRLLSQASGCALRDQAERC--SDKYRTITGRC ::: :::.::. ::::::::: :: .::..:::: .: . : .:::::::: : CCDS11 VALDLLERKLRSLWRRPFNVTDVLTPAQLNVLSKSSGCAYQDVGVTCPEQDKYRTITGMC 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE0 NNKRRPLLGASNQALARWLPAEYEDGLSLPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNE ::.: : :::::.:..::::::::::.:::.::::. .:::: . :.:::::.:::::.. CCDS11 NNRRSPTLGASNRAFVRWLPAEYEDGFSLPYGWTPGVKRNGFPVALARAVSNEIVRFPTD 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE0 RLTSDRGRALMFMQWGQFIDHDLDFSPESPARVAFTAGVDCERTCAQLPPCFPIKIPPND .:: :. :.::::::::..::::::.:: ::..:..::.:: .:.: :::::.:::::: CCDS11 QLTPDQERSLMFMQWGQLLDHDLDFTPEPAARASFVTGVNCETSCVQQPPCFPLKIPPND 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE0 PRIKNQRDCIPFFRSAPSCPQNKNRVRNQINALTSFVDASMVYGSEVSLSLRLRNRTNYL :::::: :::::::: :.:: .. .:::::::::::::::::::: :. ::: .: : CCDS11 PRIKNQADCIPFFRSCPACPGSNITIRNQINALTSFVDASMVYGSEEPLARNLRNMSNQL 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE0 GLLAINQRFQDNGRALLPFDNLHDDPCLLTNRSARIPCFLAGDTRSTETPKLAAMHTLFM ::::.:::::::::::::::::::::::::::::::::::::::::.: :.:..::::.. CCDS11 GLLAVNQRFQDNGRALLPFDNLHDDPCLLTNRSARIPCFLAGDTRSSEMPELTSMHTLLL 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE0 REHNRLATELRRLNPRWNGDKLYNEARKIMGAMVQIITYRDFLPLVLGKARARRTLGHYR ::::::::::. :::::.:..::.:::::.:::::::::::.:::::: . :. : :: CCDS11 REHNRLATELKSLNPRWDGERLYQEARKIVGAMVQIITYRDYLPLVLGPTAMRKYLPTYR 430 440 450 460 470 480 460 470 480 490 500 510 pF1KE0 GYCSNVDPRVANVFTLAFRFGHTMLQPFMFRLDSQYRASAPNSHVPLSSAFFASWRIVYE .: ..::::.::::: :::.:::..::::::::..:. :: .:::: .::::::.: : CCDS11 SYNDSVDPRIANVFTNAFRYGHTLIQPFMFRLDNRYQPMEPNPRVPLSRVFFASWRVVLE 490 500 510 520 530 540 520 530 540 550 560 570 pF1KE0 GGIDPILRGLMATPAKLNRQDAMLVDELRDRLFRQVRRIGLDLAALNMQRSRDHGLPGYN ::::::::::::::::::::. . :::.:.:::.:: :::::: :::::::::::::::: CCDS11 GGIDPILRGLMATPAKLNRQNQIAVDEIRERLFEQVMRIGLDLPALNMQRSRDHGLPGYN 550 560 570 580 590 600 580 590 600 610 620 630 pF1KE0 AWRRFCGLSQPRNLAQLSRVLKNQDLARKFLNLYGTPDNIDIWIGAIAEPLLPGARVGPL :::::::: ::....::. ::.: ::::... ::::.:::::.:...::: .::::: CCDS11 AWRRFCGLPQPETVGQLGTVLRNLKLARKLMEQYGTPNNIDIWMGGVSEPLKRKGRVGPL 610 620 630 640 650 660 640 650 660 670 680 690 pF1KE0 LACLFENQFRRARDGDRFWWQKRGVFTKRQRKALSRISLSRIICDNTGITTVSRD-IFRA :::.. .:::. ::::::::...:::. .::.::..::: :::::::::::::.. :: . CCDS11 LACIIGTQFRKLRDGDRFWWENEGVFSMQQRQALAQISLPRIICDNTGITTVSKNNIFMS 670 680 690 700 710 720 700 710 pF1KE0 NIYPRGFVNCSRIPRLNLSAWRGT : ::: ::::: .: :::..:: CCDS11 NSYPRDFVNCSTLPALNLASWREAS 730 740 >>CCDS32689.1 LPO gene_id:4025|Hs108|chr17 (712 aa) initn: 2219 init1: 1205 opt: 2499 Z-score: 2960.0 bits: 558.2 E(32554): 1.5e-158 Smith-Waterman score: 2499; 52.0% identity (76.9% similar) in 719 aa overlap (1-712:1-707) 10 20 30 40 50 60 pF1KE0 MHLLPALAGVLATLVLAQPCEGTDPASPGAVETSVLRDCIAEAKLLVDAAYNWTQKSIKQ :..: : ..::.:.: : .: :. ...::.. : ...::. :. :. .. .: CCDS32 MRVLLHLPALLASLILLQAAASTTRAQ--TTRTSAISDTVSQAKVQVNKAFLDSRTRLKT 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 RLRSGSASPMDLLSYFKQPVAATRTVVRAADYMHVALGLLEEKLQPQRSGPFNVTDVLTE . : . . .: :.:. . :::..: .. . .: :. :... :::: CCDS32 AMSSETPTSRQLSEYLKHAKGRTRTAIRNGQVWEESLKRLR-----QKASLTNVTD---- 60 70 80 90 100 130 140 150 160 170 pF1KE0 PQLRL--LSQASGCALRDQAERCS--DKYRTITGRCNNKRRPLLGASNQALARWLPAEYE :.: : :: ::. . ::. . :::::: :::.:.: :::.:.::::::::::: CCDS32 PSLDLTSLSLEVGCGAPAPVVRCDPCSPYRTITGDCNNRRKPALGAANRALARWLPAEYE 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE0 DGLSLPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQWGQFIDHDLD :::::::::::.. :::: :::.: :::.:: . ::. . :..:.:.::::::..::::: CCDS32 DGLSLPFGWTPGKTRNGFPLPLAREVSNKIVGYLNEEGVLDQNRSLLFMQWGQIVDHDLD 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE0 FSPESPARVAFTAGVDCERTCAQLPPCFPIKIPPNDPRIKNQRDCIPFFRSAPSCPQN-- :.:.. . . ..:.. : : :::: .:::::. .: :.::::.. :: CCDS32 FAPDTELGSSEYSKAQCDEYCIQGDNCFPIMFPPNDPKAGTQGKCMPFFRAGFVCPTPPY 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE0 KNRVRNQINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLLAINQRFQDNGRALLPFDNL :. .:.::::::::.:::.::.:: ::. :::: .. :::.:.::. .:.: ::.:. CCDS32 KSLAREQINALTSFLDASFVYSSEPSLASRLRNLSSPLGLMAVNQEVSDHGLPYLPYDSK 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE0 HDDPCLLTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHNRLATELRRLNPRWNGDKL . .:: . : .::.:::::::.:..: ::. ::::.::::::: ::.::::.:.:.:: CCDS32 KPSPCEFINTTARVPCFLAGDSRASEHILLATSHTLFLREHNRLARELKRLNPQWDGEKL 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE0 YNEARKIMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCSNVDPRVANVFTLAFRFGH :.:::::.::.:::::.::.::..:: . .. . :.:: .::::..::::.:::::: CCDS32 YQEARKILGAFVQIITFRDYLPILLGD-HMQKWIPPYQGYSESVDPRISNVFTFAFRFGH 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE0 TMLQPFMFRLDSQYRASAPNSHVPLSSAFFASWRIVYEGGIDPILRGLMATPAKLNRQDA . ::::: .:. .:. ..:: . :: .::.: .:::::..:::.: .:: .:. CCDS32 LEVPSSMFRLDENYQPWGPEPELPLHTLFFNTWRMVKDGGIDPLVRGLLAKKSKLMKQNK 470 480 490 500 510 520 540 550 560 570 580 590 pF1KE0 MLVDELRDRLFRQVRRI-GLDLAALNMQRSRDHGLPGYNAWRRFCGLSQPRNLAQLSRVL :.. :::..::. ..:: :.::::.: :: :::: ::::.:: :: ::::..: .:. :: CCDS32 MMTGELRNKLFQPTHRIHGFDLAAINTQRCRDHGQPGYNSWRAFCDLSQPQTLEELNTVL 530 540 550 560 570 580 600 610 620 630 640 650 pF1KE0 KNQDLARKFLNLYGTPDNIDIWIGAIAEPLLPGARVGPLLACLFENQFRRARDGDRFWWQ :.. ::.:.:.:::::::::::::::::::. .:::::::::. .::.. ::::::::. CCDS32 KSKMLAKKLLGLYGTPDNIDIWIGAIAEPLVERGRVGPLLACLLGKQFQQIRDGDRFWWE 590 600 610 620 630 640 660 670 680 690 700 710 pF1KE0 KRGVFTKRQRKALSRISLSRIICDNTGITTVSRDIFRANIYPRGFVNCSRIPRLNLSAWR . ::::..:. .:...:.::..:::: :: : :: : :: :: ::.:: : .:.:: : CCDS32 NPGVFTNEQKDSLQKMSFSRLVCDNTRITKVPRDPFWANSYPYDFVDCSAIDKLDLSPWA 650 660 670 680 690 700 pF1KE0 GT CCDS32 SVKN 710 >>CCDS54149.1 LPO gene_id:4025|Hs108|chr17 (629 aa) initn: 2219 init1: 1205 opt: 2387 Z-score: 2827.9 bits: 533.6 E(32554): 3.4e-151 Smith-Waterman score: 2387; 56.8% identity (80.3% similar) in 600 aa overlap (120-712:26-624) 90 100 110 120 130 140 pF1KE0 ADYMHVALGLLEEKLQPQRSGPFNVTDVLTEPQLRL--LSQASGCALRDQAERCS--DKY .:.: : :: ::. . ::. . : CCDS54 MRVLLHLPALLASLILLQAAASTTRDPSLDLTSLSLEVGCGAPAPVVRCDPCSPY 10 20 30 40 50 150 160 170 180 190 200 pF1KE0 RTITGRCNNKRRPLLGASNQALARWLPAEYEDGLSLPFGWTPSRRRNGFLLPLVRAVSNQ ::::: :::.:.: :::.:.::::::::::::::::::::::.. :::: :::.: :::. CCDS54 RTITGDCNNRRKPALGAANRALARWLPAEYEDGLSLPFGWTPGKTRNGFPLPLAREVSNK 60 70 80 90 100 110 210 220 230 240 250 260 pF1KE0 IVRFPNERLTSDRGRALMFMQWGQFIDHDLDFSPESPARVAFTAGVDCERTCAQLPPCFP :: . ::. . :..:.:.::::::..::::::.:.. . . ..:.. : : ::: CCDS54 IVGYLNEEGVLDQNRSLLFMQWGQIVDHDLDFAPDTELGSSEYSKAQCDEYCIQGDNCFP 120 130 140 150 160 170 270 280 290 300 310 320 pF1KE0 IKIPPNDPRIKNQRDCIPFFRSAPSCPQN--KNRVRNQINALTSFVDASMVYGSEVSLSL : .:::::. .: :.::::.. :: :. .:.::::::::.:::.::.:: ::. CCDS54 IMFPPNDPKAGTQGKCMPFFRAGFVCPTPPYKSLAREQINALTSFLDASFVYSSEPSLAS 180 190 200 210 220 230 330 340 350 360 370 380 pF1KE0 RLRNRTNYLGLLAINQRFQDNGRALLPFDNLHDDPCLLTNRSARIPCFLAGDTRSTETPK :::: .. :::.:.::. .:.: ::.:. . .:: . : .::.:::::::.:..: CCDS54 RLRNLSSPLGLMAVNQEVSDHGLPYLPYDSKKPSPCEFINTTARVPCFLAGDSRASEHIL 240 250 260 270 280 290 390 400 410 420 430 440 pF1KE0 LAAMHTLFMREHNRLATELRRLNPRWNGDKLYNEARKIMGAMVQIITYRDFLPLVLGKAR ::. ::::.::::::: ::.::::.:.:.:::.:::::.::.:::::.::.::..:: . CCDS54 LATSHTLFLREHNRLARELKRLNPQWDGEKLYQEARKILGAFVQIITFRDYLPILLGD-H 300 310 320 330 340 350 450 460 470 480 490 500 pF1KE0 ARRTLGHYRGYCSNVDPRVANVFTLAFRFGHTMLQPFMFRLDSQYRASAPNSHVPLSSAF .. . :.:: .::::..::::.:::::: . ::::: .:. .:. ..:: . : CCDS54 MQKWIPPYQGYSESVDPRISNVFTFAFRFGHLEVPSSMFRLDENYQPWGPEPELPLHTLF 360 370 380 390 400 410 510 520 530 540 550 560 pF1KE0 FASWRIVYEGGIDPILRGLMATPAKLNRQDAMLVDELRDRLFRQVRRI-GLDLAALNMQR : .::.: .:::::..:::.: .:: .:. :.. :::..::. ..:: :.::::.: :: CCDS54 FNTWRMVKDGGIDPLVRGLLAKKSKLMKQNKMMTGELRNKLFQPTHRIHGFDLAAINTQR 420 430 440 450 460 470 570 580 590 600 610 620 pF1KE0 SRDHGLPGYNAWRRFCGLSQPRNLAQLSRVLKNQDLARKFLNLYGTPDNIDIWIGAIAEP :::: ::::.:: :: ::::..: .:. :::.. ::.:.:.:::::::::::::::::: CCDS54 CRDHGQPGYNSWRAFCDLSQPQTLEELNTVLKSKMLAKKLLGLYGTPDNIDIWIGAIAEP 480 490 500 510 520 530 630 640 650 660 670 680 pF1KE0 LLPGARVGPLLACLFENQFRRARDGDRFWWQKRGVFTKRQRKALSRISLSRIICDNTGIT :. .:::::::::. .::.. ::::::::.. ::::..:. .:...:.::..:::: :: CCDS54 LVERGRVGPLLACLLGKQFQQIRDGDRFWWENPGVFTNEQKDSLQKMSFSRLVCDNTRIT 540 550 560 570 580 590 690 700 710 pF1KE0 TVSRDIFRANIYPRGFVNCSRIPRLNLSAWRGT : :: : :: :: ::.:: : .:.:: : CCDS54 KVPRDPFWANSYPYDFVDCSAIDKLDLSPWASVKN 600 610 620 >>CCDS46221.1 PXDN gene_id:7837|Hs108|chr2 (1479 aa) initn: 1199 init1: 633 opt: 1739 Z-score: 2053.6 bits: 391.6 E(32554): 4.5e-108 Smith-Waterman score: 1793; 41.7% identity (69.4% similar) in 696 aa overlap (40-713:628-1313) 10 20 30 40 50 60 pF1KE0 VLATLVLAQPCEGTDPASPGAVETSVLRDCIAEAKLLVDAAYNWTQKSIKQRLRSGSASP :.:: :: : : :. . . : :: CCDS46 NTIGSASVSMVLSVNVPDVSRNGDPFVATSIVEAIATVDRAINSTRTHL---FDSRPRSP 600 610 620 630 640 650 70 80 90 100 110 120 pF1KE0 MDLLSYFKQPVAA-TRTVVRAADYMHVALGLLEEKLQP----QRSGP-FNVTDVLTEPQL :::. :. : : .::.. .. .: :..:..: . .: .. .:... : CCDS46 NDLLALFRYPRDPYTVEQARAGEIFERTLQLIQEHVQHGLMVDLNGTSYHYNDLVSPQYL 660 670 680 690 700 710 130 140 150 160 170 pF1KE0 RLLSQASGCALRDQAERCSD-----KYRTITGRCNNKRRPLLGASNQALARWLPAEYEDG :... :::. . ... ::: :::: : ::: ..:. ::: :. : : . ::.: CCDS46 NLIANLSGCTAHRRVNNCSDMCFHQKYRTHDGTCNNLQHPMWGASLTAFERLLKSVYENG 720 730 740 750 760 770 180 190 200 210 220 230 pF1KE0 LSLPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQWGQFIDHDLDFS .. : : .: : :: ::. : ::. .. .: .: :. . :.::::::.::::: . CCDS46 FNTPRGINPHRLYNGHALPMPRLVSTTLI--GTETVTPDEQFTHMLMQWGQFLDHDLDST 780 790 800 810 820 830 240 250 260 270 280 290 pF1KE0 PESPARVAFTAGVDCERTCAQLPPCFPIKIPPNDPRIKNQRDCIPFFRSAPSCPQ----- . ... :. : : .:.. :::: . ::::: : .. :. : ::.: : . CCDS46 VVALSQARFSDGQHCSNVCSNDPPCFSVMIPPNDSRARSGARCMFFVRSSPVCGSGMTSL 840 850 860 870 880 890 300 310 320 330 340 pF1KE0 --NKNRVRNQINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLL--AINQRFQDNGRALL :. :.::: :::..::: :::: . .:. ... ::: .: :: .:. :: CCDS46 LMNSVYPREQINQLTSYIDASNVYGSTEHEARSIRDLASHRGLLRQGIVQR---SGKPLL 900 910 920 930 940 350 360 370 380 390 400 pF1KE0 PFDNLHDDPCLLTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHNRLATELRRLNPRW :: . :. . . :::::::: :..: :..::::..:::::.:::: .:::.: CCDS46 PFATGPPTECMRDENESPIPCFLAGDHRANEQLGLTSMHTLWFREHNRIATELLKLNPHW 950 960 970 980 990 1000 410 420 430 440 450 460 pF1KE0 NGDKLYNEARKIMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCSNVDPRVANVF-TL .:: .: :.:::.:: .: :::. .:: .::.. . ::::.:.:: ... . :.: : CCDS46 DGDTIYYETRKIVGAEIQHITYQHWLPKILGEV-GMRTLGEYHGYDPGINAGIFNAFATA 1010 1020 1030 1040 1050 1060 470 480 490 500 510 520 pF1KE0 AFRFGHTMLQPFMFRLDSQYRASAPNSHVPLSSAFFASWRIVYEGGIDPILRGLMATPAK :::::::...:...::: ... : . :.:: .:::. .::: ::::::.::::... .: CCDS46 AFRFGHTLVNPLLYRLDENFQPIAQD-HLPLHKAFFSPFRIVNEGGIDPLLRGLFGVAGK 1070 1080 1090 1100 1110 1120 530 540 550 560 570 580 pF1KE0 LNRQDAMLVDELRDRLFRQVRRIGLDLAALNMQRSRDHGLPGYNAWRRFCGLSQPRNLAQ . . .: :: .::: ... ..:::::.:.::.::::.: :. .: .:.:: ... . CCDS46 MRVPSQLLNTELTERLFSMAHTVALDLAAINIQRGRDHGIPPYHDYRVYCNLSAAHTFED 1130 1140 1150 1160 1170 1180 590 600 610 620 630 640 pF1KE0 LSRVLKNQDLARKFLNLYGTPDNIDIWIGAIAEPLLPGARVGPLLACLFENQFRRARDGD :. .:: .. .:. :::. :::.. . ..: :.::.:.:: : ::. .::.: :::: CCDS46 LKNEIKNPEIREKLKRLYGSTLNIDLFPALVVEDLVPGSRLGPTLMCLLSTQFKRLRDGD 1190 1200 1210 1220 1230 1240 650 660 670 680 690 700 pF1KE0 RFWWQKRGVFTKRQRKALSRISLSRIICDNT-GITTVSRDIFRANIYPRGFVNCSRIPRL :.:... :::. : ... ::.::.:::. .:: :. :.::. .:.:. .:..:::. CCDS46 RLWYENPGVFSPAQLTQIKQTSLARILCDNADNITRVQSDVFRVAEFPHGYGSCDEIPRV 1250 1260 1270 1280 1290 1300 710 pF1KE0 NLSAWRGT .: .:. CCDS46 DLRVWQDCCEDCRTRGQFNAFSYHFRGRRSLEFSYQEDKPTKKTRPRKIPSVGRQGEHLS 1310 1320 1330 1340 1350 1360 >>CCDS47855.1 PXDNL gene_id:137902|Hs108|chr8 (1463 aa) initn: 1045 init1: 622 opt: 1572 Z-score: 1855.6 bits: 354.9 E(32554): 4.9e-97 Smith-Waterman score: 1600; 39.1% identity (65.4% similar) in 705 aa overlap (31-713:610-1296) 10 20 30 40 50 pF1KE0 MHLLPALAGVLATLVLAQPCEGTDPASPGAVETSVLRDCIAEAKLLVDAAYNWTQKSI-K ::.:.: : . . ::.: : :.. . . CCDS47 CVARNSFGLAVTNMFLTVTAIQGRQAGDDFVESSIL-DAVQR----VDSAINSTRRHLFS 580 590 600 610 620 630 60 70 80 90 100 110 pF1KE0 QRLRSGSASPMDLLSYFKQPVAATRT-VVRAADYMHVALGLLEEKLQPQ-----RSGPFN :. ...: :::. :. : . ..::.. .. .: :..:... .. : CCDS47 QKPHTSS----DLLAQFHYPRDPLIVEMARAGEIFEHTLQLIRERVKQGLTVDLEGKEFR 640 650 660 670 680 690 120 130 140 150 160 pF1KE0 VTDVLTEPQLRLLSQASGCALRDQAERCSD-----KYRTITGRCNNKRRPLLGASNQALA .:... .: :... :::. : ::. :::. : ::: ..: ::. :.: CCDS47 YNDLVSPRSLSLIANLSGCTARRPLPNCSNRCFHAKYRAHDGTCNNLQQPTWGAALTAFA 700 710 720 730 740 750 170 180 190 200 210 220 pF1KE0 RWLPAEYEDGLSLPFGW-TPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQW : : :.::. : : : :. :: : :.. .: .: :.. . :.:.: CCDS47 RLLQPAYRDGIRAPRGLGLPVGSRQP--LPPPRLVATVWAR--AAAVTPDHSYTRMLMHW 760 770 780 790 800 230 240 250 260 270 280 pF1KE0 GQFIDHDLDFSPESPARVAFTAGVDCERTCAQLPPCFPIKIPPNDPRIKNQRDCIPFFRS : :..:::: . . . . :. : : .:.. :::::.. ::: .. :. : :: CCDS47 GWFLEHDLDHTVPALSTARFSDGRPCSSVCTNDPPCFPMNTRHADPR-GTHAPCMLFARS 810 820 830 840 850 860 290 300 310 320 330 340 pF1KE0 APSCPQNKNRV-------RNQINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLLAINQR .:.: ... . :.::: :...:.: :::: : ::. . ::: . CCDS47 SPACASGRPSATVDSVYAREQINQQTAYIDGSNVYGSSERESQALRDPSVPRGLLKTGFP 870 880 890 900 910 920 350 360 370 380 390 400 pF1KE0 FQDNGRALLPFDNLHDDPCLLTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHNRLAT . .:. ::::.. : .. . ::::::: :..: :::::::..:::::.:: CCDS47 WPPSGKPLLPFSTGPPTECARQEQES--PCFLAGDHRANEHLALAAMHTLWFREHNRMAT 930 940 950 960 970 980 410 420 430 440 450 460 pF1KE0 ELRRLNPRWNGDKLYNEARKIMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCSNVDP :: :::.:.:. .:.:::::.:: .: ::: .:: ::: .: : :::: ::. CCDS47 ELSALNPHWEGNTVYQEARKIVGAELQHITYSHWLPKVLGDPGTRMLRG-YRGYNPNVNA 990 1000 1010 1020 1030 1040 470 480 490 500 510 pF1KE0 RVANVF-TLAFRFGHTMLQPFMFRLDSQYRASAPNSHVPLSSAFFASWRIVYEGGIDPIL . : : : :::::::...:...::.. . ..:.:. .:.:. ::. ::::::.: CCDS47 GIINSFATAAFRFGHTLINPILYRLNATL-GEISEGHLPFHKALFSPSRIIKEGGIDPVL 1050 1060 1070 1080 1090 1100 520 530 540 550 560 570 pF1KE0 RGLMATPAKLNRQDAMLVDELRDRLFRQVRRIGLDLAALNMQRSRDHGLPGYNAWRRFCG :::... :: . .: :: .::: . ..: :: .::.::::.: : .: ::. CCDS47 RGLFGVAAKWRAPSYLLSPELTQRLFSAAYSAAVDSAATIIQRGRDHGIPPYVDFRVFCN 1110 1120 1130 1140 1150 1160 580 590 600 610 620 630 pF1KE0 LSQPRNLAQLSRVLKNQDLARKFLNLYGTPDNIDIWIGAIAEPLLPGARVGPLLACLFEN :.. .:. .:. .:.... .:. .:::.: .::.: . ..: :.::.:::: : ::: . CCDS47 LTSVKNFEDLQNEIKDSEIRQKLRKLYGSPGDIDLWPALMVEDLIPGTRVGPTLMCLFVT 1170 1180 1190 1200 1210 1220 640 650 660 670 680 690 pF1KE0 QFRRARDGDRFWWQKRGVFTKRQRKALSRISLSRIICDN-TGITTVSRDIFRANIYPRGF ::.: :::::::... :::: : :.. ::::..::: .: :. :.: ::. . CCDS47 QFQRLRDGDRFWYENPGVFTPAQLTQLKQASLSRVLCDNGDSIQQVQADVFVKAEYPQDY 1230 1240 1250 1260 1270 1280 700 710 pF1KE0 VNCSRIPRLNLSAWRGT .:::.::...: .:. CCDS47 LNCSEIPKVDLRVWQDCCADCRSRGQFRAVTQESQKKRSAQYSYPVDKDMELSHLRSRQQ 1290 1300 1310 1320 1330 1340 >>CCDS1643.1 TPO gene_id:7173|Hs108|chr2 (933 aa) initn: 1899 init1: 865 opt: 1388 Z-score: 1640.3 bits: 314.4 E(32554): 4.8e-85 Smith-Waterman score: 2053; 44.4% identity (70.3% similar) in 710 aa overlap (29-715:32-735) 10 20 30 40 50 pF1KE0 MHLLPALAGVLATLVLAQPCEGTDPASPGAVETSVLRDCIAEAKLLVDAA-YNWTQKS : : : . . . :.: :::.: : :.. CCDS16 RALAVLSVTLVMACTEAFFPFISRGKELLWGKPEESRVSSVLEESKRLVDTAMYATMQRN 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE0 IKQRLRSGSASPMDLLSYFKQPVAATRTVVRAADYMHVALGLLEEKLQPQRSGPFNVTDV .:.: : :: .:::. : : .. ...:::. :.... ...:.. . . . ::. CCDS16 LKKR---GILSPAQLLSFSKLPEPTSGVIARAAEIMETSIQAMKRKVNLKTQQSQHPTDA 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 LTEPQLRLLSQASGCALRDQAERC-----SDKYRTITGRCNNKRRPLLGASNQALARWLP :.: : .... ::: .: ..::: ::: :::. .: :::: ::::::: CCDS16 LSEDLLSIIANMSGCLPYMLPPKCPNTCLANKYRPITGACNNRDHPRWGASNTALARWLP 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 AEYEDGLSLPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQWGQFID ::::.: : ::.:. ::: :: :: :. .... :: .:.: . ..: :::.:: CCDS16 PVYEDGFSQPRGWNPGFLYNGFPLPPVREVTRHVIQVSNEVVTDDDRYSDLLMAWGQYID 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 HDLDFSPESPARVAFTAGVDCERTCAQLPPCFPIKIPPNDPRIKNQRDCIPFFRSAPSCP ::. :.:.: ...:: .:.::. :: . :::::..: .. : :.::.::. .: CCDS16 HDIAFTPQSTSKAAFGGGADCQMTCENQNPCFPIQLP-EEARPAAGTACLPFYRSSAACG 240 250 260 270 280 290 300 310 320 330 340 pF1KE0 QNKNRV----------RNQINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLLAINQRFQ . . . :.:.:.::::.::: :::: .: .::: :. ::: .. :.. CCDS16 TGDQGALFGNLSTANPRQQMNGLTSFLDASTVYGSSPALERQLRNWTSAEGLLRVHARLR 300 310 320 330 340 350 350 360 370 380 390 pF1KE0 DNGRALLPF------DNLHDDPCLLTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHN :.::: ::: .: . .: ::::::: :..:.:.:.:.:::..:::: CCDS16 DSGRAYLPFVPPRAPAACAPEPGI--PGETRGPCFLAGDGRASEVPSLTALHTLWLREHN 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE0 RLATELRRLNPRWNGDKLYNEARKIMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCS :::. :. :: .:..: .:.::::..::. :::: ::..: .:: .. .: :.:: : CCDS16 RLAAALKALNAHWSADAVYQEARKVVGALHQIITLRDYIPRILGPEAFQQYVGPYEGYDS 420 430 440 450 460 470 460 470 480 490 500 510 pF1KE0 NVDPRVANVF-TLAFRFGHTMLQPFMFRLDSQYRASAPNSHVPLSSAFFASWRIVYEGGI ...: :.::: : ::::::. ..:.. :::.... . : .:::. : .. ::. CCDS16 TANPTVSNVFSTAAFRFGHATIHPLVRRLDASFQEHPDLPGLWLHQAFFSPWTLLRGGGL 480 490 500 510 520 530 520 530 540 550 560 570 pF1KE0 DPILRGLMATPAKLNRQDAMLVDELRDRLFRQVRRIGLDLAALNMQRSRDHGLPGYNAWR ::..:::.: ::::. :: .. .:: .::: ::::..:.::.::::::::: :: CCDS16 DPLIRGLLARPAKLQVQDQLMNEELTERLFVLSNSSTLDLASINLQRGRDHGLPGYNEWR 540 550 560 570 580 590 580 590 600 610 620 630 pF1KE0 RFCGLSQPRNLAQLSRVLKNQDLARKFLNLYGTPDNIDIWIGAIAEPLLPGARVGPLLAC .:::: . .. :.:: .. ....: :.:.:: :::::.:.:..:: .:: ::.:::.:: CCDS16 EFCGLPRLETPADLSTAIASRSVADKILDLYKHPDNIDVWLGGLAENFLPRARTGPLFAC 600 610 620 630 640 650 640 650 660 670 680 690 pF1KE0 LFENQFRRARDGDRFWWQKRGVFTKRQRKALSRISLSRIICDNTGITTVSRDIFRANIYP :. .:.. :::: :::.. ::: ::. : . ::::.::::::.: : : :... .: CCDS16 LIGKQMKALRDGDWFWWENSHVFTDAQRRELEKHSLSRVICDNTGLTRVPMDAFQVGKFP 660 670 680 690 700 710 700 710 pF1KE0 RGFVNCSRIPRLNLSAWRGT . : .:. : .:: ::: : CCDS16 EDFESCDSITGMNLEAWRETFPQDDKCGFPESVENGDFVHCEESGRRVLVYSCRHGYELQ 720 730 740 750 760 770 >>CCDS1646.1 TPO gene_id:7173|Hs108|chr2 (760 aa) initn: 1343 init1: 865 opt: 988 Z-score: 1167.1 bits: 226.6 E(32554): 1.1e-58 Smith-Waterman score: 1293; 34.7% identity (54.9% similar) in 694 aa overlap (29-715:32-562) 10 20 30 40 50 pF1KE0 MHLLPALAGVLATLVLAQPCEGTDPASPGAVETSVLRDCIAEAKLLVDAA-YNWTQKS : : : . . . :.: :::.: : :.. CCDS16 RALAVLSVTLVMACTEAFFPFISRGKELLWGKPEESRVSSVLEESKRLVDTAMYATMQRN 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE0 IKQRLRSGSASPMDLLSYFKQPVAATRTVVRAADYMHVALGLLEEKLQPQRSGPFNVTDV .:.: : :: .:::. : : .. ...:::. :.... ...:.. . . . ::. CCDS16 LKKR---GILSPAQLLSFSKLPEPTSGVIARAAEIMETSIQAMKRKVNLKTQQSQHPTDA 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 LTEPQLRLLSQASGCALRDQAERC-----SDKYRTITGRCNNKRRPLLGASNQALARWLP :.: : .... ::: .: ..::: ::: :::. .: :::: ::::::: CCDS16 LSEDLLSIIANMSGCLPYMLPPKCPNTCLANKYRPITGACNNRDHPRWGASNTALARWLP 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 AEYEDGLSLPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQWGQFID ::::.: : ::.:. ::: :: :: :. .... :: .:.: . ..: :::.:: CCDS16 PVYEDGFSQPRGWNPGFLYNGFPLPPVREVTRHVIQVSNEVVTDDDRYSDLLMAWGQYID 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 HDLDFSPESPARVAFTAGVDCERTCAQLPPCFPIKIPPNDPRIKNQRDCIPFFRSAPSCP ::. :.:.: ...:: .:.::. :: . ::::: CCDS16 HDIAFTPQSTSKAAFGGGADCQMTCENQNPCFPI-------------------------- 240 250 260 270 300 310 320 330 340 350 pF1KE0 QNKNRVRNQINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLLAINQRFQDNGRALLPFD CCDS16 ------------------------------------------------------------ 360 370 380 390 400 410 pF1KE0 NLHDDPCLLTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHNRLATELRRLNPRWNGD CCDS16 ------------------------------------------------------------ 420 430 440 450 460 470 pF1KE0 KLYNEARKIMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCSNVDPRVANVF-TLAFR :::: ::..: .:: .. .: :.:: :...: :.::: : ::: CCDS16 --------------QIITLRDYIPRILGPEAFQQYVGPYEGYDSTANPTVSNVFSTAAFR 280 290 300 310 480 490 500 510 520 530 pF1KE0 FGHTMLQPFMFRLDSQYRASAPNSHVPLSSAFFASWRIVYEGGIDPILRGLMATPAKLNR :::. ..:.. :::.... . : .:::. : .. ::.::..:::.: ::::. CCDS16 FGHATIHPLVRRLDASFQEHPDLPGLWLHQAFFSPWTLLRGGGLDPLIRGLLARPAKLQV 320 330 340 350 360 370 540 550 560 570 580 590 pF1KE0 QDAMLVDELRDRLFRQVRRIGLDLAALNMQRSRDHGLPGYNAWRRFCGLSQPRNLAQLSR :: .. .:: .::: ::::..:.::.::::::::: ::.:::: . .. :.:: CCDS16 QDQLMNEELTERLFVLSNSSTLDLASINLQRGRDHGLPGYNEWREFCGLPRLETPADLST 380 390 400 410 420 430 600 610 620 630 640 650 pF1KE0 VLKNQDLARKFLNLYGTPDNIDIWIGAIAEPLLPGARVGPLLACLFENQFRRARDGDRFW .. ....: :.:.:: :::::.:.:..:: .:: ::.:::.:::. .:.. :::: :: CCDS16 AIASRSVADKILDLYKHPDNIDVWLGGLAENFLPRARTGPLFACLIGKQMKALRDGDWFW 440 450 460 470 480 490 660 670 680 690 700 710 pF1KE0 WQKRGVFTKRQRKALSRISLSRIICDNTGITTVSRDIFRANIYPRGFVNCSRIPRLNLSA :.. ::: ::. : . ::::.::::::.: : : :... .:. : .:. : .:: : CCDS16 WENSHVFTDAQRRELEKHSLSRVICDNTGLTRVPMDAFQVGKFPEDFESCDSITGMNLEA 500 510 520 530 540 550 pF1KE0 WRGT :: : CCDS16 WRETFPQDDKCGFPESVENGDFVHCEESGRRVLVYSCRHGYELQGREQLTCTQEGWDFQP 560 570 580 590 600 610 >>CCDS1644.1 TPO gene_id:7173|Hs108|chr2 (876 aa) initn: 1668 init1: 533 opt: 533 Z-score: 626.4 bits: 126.7 E(32554): 1.4e-28 Smith-Waterman score: 1717; 40.3% identity (64.2% similar) in 710 aa overlap (29-715:32-678) 10 20 30 40 50 pF1KE0 MHLLPALAGVLATLVLAQPCEGTDPASPGAVETSVLRDCIAEAKLLVDAA-YNWTQKS : : : . . . :.: :::.: : :.. CCDS16 RALAVLSVTLVMACTEAFFPFISRGKELLWGKPEESRVSSVLEESKRLVDTAMYATMQRN 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE0 IKQRLRSGSASPMDLLSYFKQPVAATRTVVRAADYMHVALGLLEEKLQPQRSGPFNVTDV .:.: : :: .:::. : : .. ...:::. :.... ...:.. . . . ::. CCDS16 LKKR---GILSPAQLLSFSKLPEPTSGVIARAAEIMETSIQAMKRKVNLKTQQSQHPTDA 70 80 90 100 110 120 130 140 150 160 170 pF1KE0 LTEPQLRLLSQASGCALRDQAERC-----SDKYRTITGRCNNKRRPLLGASNQALARWLP :.: : .... ::: .: ..::: ::: :::. .: :::: ::::::: CCDS16 LSEDLLSIIANMSGCLPYMLPPKCPNTCLANKYRPITGACNNRDHPRWGASNTALARWLP 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE0 AEYEDGLSLPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQWGQFID ::::.: : ::.:. ::: :: :: :. .... :: .:.: . ..: :::.:: CCDS16 PVYEDGFSQPRGWNPGFLYNGFPLPPVREVTRHVIQVSNEVVTDDDRYSDLLMAWGQYID 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE0 HDLDFSPESPARVAFTAGVDCERTCAQLPPCFPIKIPPNDPRIKNQRDCIPFFRSAPSCP ::. :.:.: ...:: .:.::. :: . :::::..: .. : :.::.::. .: CCDS16 HDIAFTPQSTSKAAFGGGADCQMTCENQNPCFPIQLP-EEARPAAGTACLPFYRSSAACG 240 250 260 270 280 290 300 310 320 330 340 pF1KE0 QNKNRV----------RNQINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLLAINQRFQ . . . :.:.:.::::.::: :::: .: .::: :. ::: .. :.. CCDS16 TGDQGALFGNLSTANPRQQMNGLTSFLDASTVYGSSPALERQLRNWTSAEGLLRVHARLR 300 310 320 330 340 350 350 360 370 380 390 pF1KE0 DNGRALLPF------DNLHDDPCLLTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHN :.::: ::: .: . .: ::::::: :..:.:.:.:.:::..:::: CCDS16 DSGRAYLPFVPPRAPAACAPEPGI--PGETRGPCFLAGDGRASEVPSLTALHTLWLREHN 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE0 RLATELRRLNPRWNGDKLYNEARKIMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCS :::. :. :: .:..: .:.::::..::. :::: ::..: .:: .. .: :.:: : CCDS16 RLAAALKALNAHWSADAVYQEARKVVGALHQIITLRDYIPRILGPEAFQQYVGPYEGYDS 420 430 440 450 460 470 460 470 480 490 500 510 pF1KE0 NVDPRVANVF-TLAFRFGHTMLQPFMFRLDSQYRASAPNSHVPLSSAFFASWRIVYEGGI ...: :.::: : ::::::. ..:.. :::.... . : .:::. : . CCDS16 TANPTVSNVFSTAAFRFGHATIHPLVRRLDASFQEHPDLPGLWLHQAFFSPWTL------ 480 490 500 510 520 520 530 540 550 560 570 pF1KE0 DPILRGLMATPAKLNRQDAMLVDELRDRLFRQVRRIGLDLAALNMQRSRDHGLPGYNAWR ::: ::: :: CCDS16 ---LRG------------------------------------------------GYNEWR 530 580 590 600 610 620 630 pF1KE0 RFCGLSQPRNLAQLSRVLKNQDLARKFLNLYGTPDNIDIWIGAIAEPLLPGARVGPLLAC .:::: . .. :.:: .. ....: :.:.:: :::::.:.:..:: .:: ::.:::.:: CCDS16 EFCGLPRLETPADLSTAIASRSVADKILDLYKHPDNIDVWLGGLAENFLPRARTGPLFAC 540 550 560 570 580 590 640 650 660 670 680 690 pF1KE0 LFENQFRRARDGDRFWWQKRGVFTKRQRKALSRISLSRIICDNTGITTVSRDIFRANIYP :. .:.. :::: :::.. ::: ::. : . ::::.::::::.: : : :... .: CCDS16 LIGKQMKALRDGDWFWWENSHVFTDAQRRELEKHSLSRVICDNTGLTRVPMDAFQVGKFP 600 610 620 630 640 650 700 710 pF1KE0 RGFVNCSRIPRLNLSAWRGT . : .:. : .:: ::: : CCDS16 EDFESCDSITGMNLEAWRETFPQDDKCGFPESVENGDFVHCEESGRRVLVYSCRHGYELQ 660 670 680 690 700 710 >>CCDS32221.1 DUOX1 gene_id:53905|Hs108|chr15 (1551 aa) initn: 209 init1: 128 opt: 479 Z-score: 558.6 bits: 115.0 E(32554): 8.6e-25 Smith-Waterman score: 554; 29.3% identity (53.0% similar) in 570 aa overlap (150-694:34-557) 120 130 140 150 160 170 pF1KE0 EPQLRLLSQASGCALRDQAERCSDKYRTITGRCNNKRRPLLGASNQALARWLPAEYEDGL : :: . :.... : : .:: : ::. CCDS32 CLALAWTLLVGAWTPLGAQNPISWEVQRFDGWYNNLMEHRWGSKGSRLQRLVPASYADGV 10 20 30 40 50 60 180 190 200 210 220 230 pF1KE0 SLPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQWGQFIDHDLDFSP :.: : :: : .:: : : : :.: :.:... . .: . :: : CCDS32 YQPLG-EPH-------LPNPRDLSNTISRGPAG-LASLRNRTVLGVFFGYHVLSDL-VSV 70 80 90 100 110 240 250 260 270 280 290 pF1KE0 ESPARVAFTAGVDCERTCAQLPPCF-PIKIPPNDPRIK-NQR-DCI-PFFRSA--PSCPQ :.:. : : : :.:::.:: . .:: : . :: :: : . CCDS32 ETPG-------------C---PAEFLNIRIPPGDPMFDPDQRGDVVLPFQRSRWDPETGR 120 130 140 150 300 310 320 330 340 350 pF1KE0 NKNRVRNQINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLLAI--NQRF-QDNGRALLP . . :. : .:...:.: .::: : : ::. . : :: . : .:. :: CCDS32 SPSNPRDPANQVTGWLDGSAIYGSSHSWSDALRSFSR--GQLASGPDPAFPRDSQNPLLM 160 170 180 190 200 210 360 370 380 390 400 410 pF1KE0 FDNLHDDPCLLTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHNRLATELRRLNPRWN . :: : . : : :... : : :. :..: :: : .: : .: :. CCDS32 WAA--PDPATGQNGPRGLYAF--GAERGNREPFLQALGLLWFRYHNLWAQRLARQHPDWE 220 230 240 250 260 270 420 430 440 450 460 470 pF1KE0 GDKLYNEARKIMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCSNVDPRVANVFTLAF ..:...::: . : : :. ..:: : : :: .: :: .:: ... :. : CCDS32 DEELFQHARKRVIATYQNIAVYEWLPSFLQK-----TLPEYTGYRPFLDPSISSEFVAAS 280 290 300 310 320 480 490 500 510 520 pF1KE0 -RFGHTMLQPFMF-RLDSQYRASAPNSHVPLSSAFFAS---WRIVYEG-----GIDPILR .: ::. : .. : : . .. : . .: :. . : . . .: .: CCDS32 EQFLSTMVPPGVYMRNASCHFQGVINRNSSVSRALRVCNSYWSREHPSLQSAEDVDALLL 330 340 350 360 370 380 530 540 550 560 570 580 pF1KE0 GLMATPAKLNRQDAMLVDELRDRLFRQVRRIGLDLAALNMQRSRDHGLPGYNAWRRFCGL :. . :. :.: .::...:: .. : : .::.:: :::.:. : :: CCDS32 GMASQIAE--REDHVLVEDVRDFWPGPLKFSRTDHLASCLQRGRDLGLPSYTKARAALGL 390 400 410 420 430 440 590 600 610 620 630 pF1KE0 SQPRNLAQLSRVLK--NQDLARKFLNLYGTPDNIDI-WIGAIAEPLLPGAR-VGPLLACL : ... .:. :. . . :: : :. :. . :: . : :::.. . CCDS32 SPITRWQDINPALSRSNDTVLEATAALY----NQDLSWLELLPGGLLESHRDPGPLFSTI 450 460 470 480 490 500 640 650 660 670 680 690 pF1KE0 FENQFRRARDGDRFWWQ--KRGVFTKRQRKALSRISLSRIICDNTGITTVSRDIFRANIY .:: : :::::.:.. . :.:.:.. . . .:. .. ... ... . .. :.. CCDS32 VLEQFVRLRDGDRYWFENTRNGLFSKKEIEEIRNTTLQDVL---VAVINIDPSALQPNVF 510 520 530 540 550 700 710 pF1KE0 PRGFVNCSRIPRLNLSAWRGT CCDS32 VWHKGDPCPQPRQLSTEGLPACAPSVVRDYFEGSGFGFGVTIGTLCCFPLVSLLSAWIVA 560 570 580 590 600 610 715 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 06:57:07 2016 done: Fri Nov 4 06:57:08 2016 Total Scan time: 3.150 Total Display time: 0.180 Function used was FASTA [36.3.4 Apr, 2011]