FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4384, 870 aa 1>>>pF1KB4384 870 - 870 aa - 870 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.1555+/-0.000891; mu= 8.5853+/- 0.054 mean_var=155.4507+/-30.970, 0's: 0 Z-trim(112.1): 47 B-trim: 0 in 0/53 Lambda= 0.102867 statistics sampled from 12839 (12884) to 12839 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.73), E-opt: 0.2 (0.396), width: 16 Scan time: 4.920 The best scores are: opt bits E(32554) CCDS1825.1 EPAS1 gene_id:2034|Hs108|chr2 ( 870) 5916 890.2 0 CCDS9754.1 HIF1A gene_id:3091|Hs108|chr14 ( 735) 1854 287.3 6.6e-77 CCDS9753.1 HIF1A gene_id:3091|Hs108|chr14 ( 826) 1854 287.4 7.3e-77 CCDS58324.1 HIF1A gene_id:3091|Hs108|chr14 ( 850) 1848 286.5 1.4e-76 CCDS12682.1 HIF3A gene_id:64344|Hs108|chr19 ( 667) 1294 204.2 6.4e-52 CCDS12681.2 HIF3A gene_id:64344|Hs108|chr19 ( 669) 1293 204.1 7.1e-52 CCDS42580.2 HIF3A gene_id:64344|Hs108|chr19 ( 600) 864 140.4 9.4e-33 CCDS5045.1 SIM1 gene_id:6492|Hs108|chr6 ( 766) 835 136.1 2.3e-31 CCDS13646.1 SIM2 gene_id:6493|Hs108|chr21 ( 667) 818 133.6 1.2e-30 CCDS9645.1 NPAS3 gene_id:64067|Hs108|chr14 ( 901) 443 78.0 8.5e-14 CCDS55912.1 NPAS3 gene_id:64067|Hs108|chr14 ( 903) 443 78.0 8.5e-14 CCDS53892.1 NPAS3 gene_id:64067|Hs108|chr14 ( 920) 443 78.0 8.7e-14 CCDS53891.1 NPAS3 gene_id:64067|Hs108|chr14 ( 933) 443 78.0 8.8e-14 >>CCDS1825.1 EPAS1 gene_id:2034|Hs108|chr2 (870 aa) initn: 5916 init1: 5916 opt: 5916 Z-score: 4751.0 bits: 890.2 E(32554): 0 Smith-Waterman score: 5916; 100.0% identity (100.0% similar) in 870 aa overlap (1-870:1-870) 10 20 30 40 50 60 pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 ISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISKFMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 ISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISKFMG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 LTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVTNRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 LTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVTNRG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB4 RTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGYKEPLLSCLIIMCEPIQHPSHMDIPLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 RTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGYKEPLLSCLIIMCEPIQHPSHMDIPLD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB4 SKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQNLCTKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 SKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQNLCTKG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB4 QVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFSMDQTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 QVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFSMDQTE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB4 SLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAIISLDFGNQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 SLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAIISLDFGNQN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB4 FEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTPSATSSSSSCS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 FEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTPSATSSSSSCS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB4 TPNSPEDYYTSLDNDLKIEVIEKLFAMDTEAKDQCSTQTDFNELDLETLAPYIPMDGEDF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 TPNSPEDYYTSLDNDLKIEVIEKLFAMDTEAKDQCSTQTDFNELDLETLAPYIPMDGEDF 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB4 QLSPICPEERLLAENPQSTPQHCFSAMTNIFQPLAPVAPHSPFLLDKFQQQLESKKTEPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 QLSPICPEERLLAENPQSTPQHCFSAMTNIFQPLAPVAPHSPFLLDKFQQQLESKKTEPE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB4 HRPMSSIFFDAGSKASLPPCCGQASTPLSSMGGRSNTQWPPDPPLHFGPTKWAVGDQRTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 HRPMSSIFFDAGSKASLPPCCGQASTPLSSMGGRSNTQWPPDPPLHFGPTKWAVGDQRTE 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB4 FLGAAPLGPPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKLKLKRQLEYEEQAFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 FLGAAPLGPPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKLKLKRQLEYEEQAFQ 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB4 DLSGGDPPGGSTSHLMWKRMKNLRGGSCPLMPDKPLSANVPNDKFTQNPMRGLGHPLRHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 DLSGGDPPGGSTSHLMWKRMKNLRGGSCPLMPDKPLSANVPNDKFTQNPMRGLGHPLRHL 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB4 PLPQPPSAISPGENSKSRFPPQCYATQYQDYSLSSAHKVSGMASRLLGPSFESYLLPELT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 PLPQPPSAISPGENSKSRFPPQCYATQYQDYSLSSAHKVSGMASRLLGPSFESYLLPELT 790 800 810 820 830 840 850 860 870 pF1KB4 RYDCEVNVPVLGSSTLLQGGDLLRALDQAT :::::::::::::::::::::::::::::: CCDS18 RYDCEVNVPVLGSSTLLQGGDLLRALDQAT 850 860 870 >>CCDS9754.1 HIF1A gene_id:3091|Hs108|chr14 (735 aa) initn: 1411 init1: 811 opt: 1854 Z-score: 1494.2 bits: 287.3 E(32554): 6.6e-77 Smith-Waterman score: 2058; 48.7% identity (70.7% similar) in 764 aa overlap (6-720:9-730) 10 20 30 40 50 pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIM .::. :::::::::::::: :::::.::::::::.:::::.:::::::::.: CCDS97 MEGAGGANDKKKISSERRKEKSRDAARSRRSKESEVFYELAHQLPLPHNVSSHLDKASVM 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB4 RLAISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISK ::.::.::..:::.. . :.. .: ::. .:::::.::. :.:.:::::..:.:..: CCDS97 RLTISYLRVRKLLDAGDLDIEDDMKA--QMNCFYLKALDGFVMVLTDDGDMIYISDNVNK 70 80 90 100 110 120 130 140 150 160 170 pF1KB4 FMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVT .::::: ::::::.:::::::::::.:: :. .:: . ::.:...:.:.::.:::::.: CCDS97 YMGLTQFELTGHSVFDFTHPCDHEEMREMLTHRNG--LVKKGKEQNTQRSFFLRMKCTLT 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB4 NRGRTVNLKSATWKVLHCTGQVKVY--NNCPPHNSLCGYKEPLLSCLIIMCEPIQHPSHM .::::.:.::::::::::::...:: :. :. ::::.: ..::...:::: :::.. CCDS97 SRGRTMNIKSATWKVLHCTGHIHVYDTNSNQPQ---CGYKKPPMTCLVLICEPIPHPSNI 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB4 DIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQN .:::::::::::::.::::.:::.:::::.::.:::::::: ::.::::::...::.:.. CCDS97 EIPLDSKTFLSRHSLDMKFSYCDERITELMGYEPEELLGRSIYEYYHALDSDHLTKTHHD 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB4 LCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFS . :::::..::::::::.:::::.:::.::::: .: :::::.:::::.: : ..:..:: CCDS97 MFTKGQVTTGQYRMLAKRGGYVWVETQATVIYNTKNSQPQCIVCVNYVVSGIIQHDLIFS 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB4 MDQTESLFKP---HLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAII ..::: ..:: : :...: . . :: .. :: :::.::. :. :::. ::.:: CCDS97 LQQTECVLKPVESSDMKMTQLFTK----VESEDTSSLFDKLKKEPDALTLLAPAAGDTII 360 370 380 390 400 420 430 440 pF1KB4 SLDFG-------NQNFEESSAYGKAILP-PSQ----------PWATE-----LRSHS--- ::::: .:..:: :. ..:: :.. : : ::: . CCDS97 SLDFGSNDTETDDQQLEEVPLYNDVMLPSPNEKLQNINLAMSPLPTAETPKPLRSSADPA 410 420 430 440 450 460 450 460 470 480 490 pF1KB4 -TQSEAGSL-P-------AFTVPQAAAPGSTTPSATSSSSSCSTPNSPEDYYTSLDNDL- .: : .: : .::.:: . .:: :. .: :::: .: .:.:. CCDS97 LNQEVALKLEPNPESLELSFTMPQIQ-DQTPSPSDGSTRQSSPEPNSPSEYCFYVDSDMV 470 480 490 500 510 520 500 510 520 530 540 550 pF1KB4 ---KIEVIEKLFAMDTEAKDQCSTQTDFNELDLETLAPYIPMDGEDFQL---SPICPEER :.:..::::: :::::. ::: ..:::: :::::::: .:::: . . : : CCDS97 NEFKLELVEKLFAEDTEAKNPFSTQD--TDLDLEMLAPYIPMD-DDFQLRSFDQLSPLES 530 540 550 560 570 580 560 570 580 590 600 pF1KB4 LLAENPQSTPQHCFSAM--TNIFQPLAPVAPHSPFLLDKFQQQLESKKTEPEHRPMSSIF : ...:: ... :.: .: : : . :.. :: . : : .: CCDS97 SSASPESASPQSTVTVFQQTQIQEPTAN-ATTTTATTDEL-------KTVTKDR-MEDIK 590 600 610 620 630 610 620 630 640 650 660 pF1KB4 FDAGSKASLPPCCGQASTPLSSMGGRSNTQWPPDPPLHFGPTKWAVGDQRTEFLGAAPLG . .: . : . .: .: : .:: : . : : .. ..:: . : . CCDS97 ILIASPS--PTHIHKETTSATSSPYR-DTQSRTASPNRAG--KGVI--EQTE--KSHPRS 640 650 660 670 680 670 680 690 700 710 720 pF1KB4 PPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKLKLKRQLEYEEQAFQDLSGGDPP : : .: : . :.: ..::.: . ::..:.. . :: CCDS97 PNVLSVALSQRTTVPE--------EELNPKILALQNAQR-KRKMEHDGSLFQAVGII 690 700 710 720 730 730 740 750 760 770 780 pF1KB4 GGSTSHLMWKRMKNLRGGSCPLMPDKPLSANVPNDKFTQNPMRGLGHPLRHLPLPQPPSA >>CCDS9753.1 HIF1A gene_id:3091|Hs108|chr14 (826 aa) initn: 1595 init1: 811 opt: 1854 Z-score: 1493.4 bits: 287.4 E(32554): 7.3e-77 Smith-Waterman score: 2163; 45.4% identity (66.0% similar) in 917 aa overlap (6-868:9-824) 10 20 30 40 50 pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIM .::. :::::::::::::: :::::.::::::::.:::::.:::::::::.: CCDS97 MEGAGGANDKKKISSERRKEKSRDAARSRRSKESEVFYELAHQLPLPHNVSSHLDKASVM 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB4 RLAISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISK ::.::.::..:::.. . :.. .: ::. .:::::.::. :.:.:::::..:.:..: CCDS97 RLTISYLRVRKLLDAGDLDIEDDMKA--QMNCFYLKALDGFVMVLTDDGDMIYISDNVNK 70 80 90 100 110 120 130 140 150 160 170 pF1KB4 FMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVT .::::: ::::::.:::::::::::.:: :. .:: . ::.:...:.:.::.:::::.: CCDS97 YMGLTQFELTGHSVFDFTHPCDHEEMREMLTHRNG--LVKKGKEQNTQRSFFLRMKCTLT 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB4 NRGRTVNLKSATWKVLHCTGQVKVY--NNCPPHNSLCGYKEPLLSCLIIMCEPIQHPSHM .::::.:.::::::::::::...:: :. :. ::::.: ..::...:::: :::.. CCDS97 SRGRTMNIKSATWKVLHCTGHIHVYDTNSNQPQ---CGYKKPPMTCLVLICEPIPHPSNI 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB4 DIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQN .:::::::::::::.::::.:::.:::::.::.:::::::: ::.::::::...::.:.. CCDS97 EIPLDSKTFLSRHSLDMKFSYCDERITELMGYEPEELLGRSIYEYYHALDSDHLTKTHHD 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB4 LCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFS . :::::..::::::::.:::::.:::.::::: .: :::::.:::::.: : ..:..:: CCDS97 MFTKGQVTTGQYRMLAKRGGYVWVETQATVIYNTKNSQPQCIVCVNYVVSGIIQHDLIFS 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB4 MDQTESLFKP---HLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAII ..::: ..:: : :...: . . :: .. :: :::.::. :. :::. ::.:: CCDS97 LQQTECVLKPVESSDMKMTQLFTK----VESEDTSSLFDKLKKEPDALTLLAPAAGDTII 360 370 380 390 400 420 430 440 pF1KB4 SLDFG-------NQNFEESSAYGKAILP-PSQ----------PWATE-----LRSHS--- ::::: .:..:: :. ..:: :.. : : ::: . CCDS97 SLDFGSNDTETDDQQLEEVPLYNDVMLPSPNEKLQNINLAMSPLPTAETPKPLRSSADPA 410 420 430 440 450 460 450 460 470 480 490 pF1KB4 -TQSEAGSL-P-------AFTVPQAAAPGSTTPSATSSSSSCSTPNSPEDYYTSLDNDL- .: : .: : .::.:: . .:: :. .: :::: .: .:.:. CCDS97 LNQEVALKLEPNPESLELSFTMPQIQ-DQTPSPSDGSTRQSSPEPNSPSEYCFYVDSDMV 470 480 490 500 510 520 500 510 520 530 540 550 pF1KB4 ---KIEVIEKLFAMDTEAKDQCSTQTDFNELDLETLAPYIPMDGEDFQL---SPICPEER :.:..::::: :::::. ::: ..:::: :::::::: .:::: . . : : CCDS97 NEFKLELVEKLFAEDTEAKNPFSTQD--TDLDLEMLAPYIPMD-DDFQLRSFDQLSPLES 530 540 550 560 570 580 560 570 580 590 600 pF1KB4 LLAENPQSTPQHCFSAM--TNIFQPLAPVAPHSPFLLDKFQQQLESKKTEPEHRPMSSIF : ...:: ... :.: .: : : . :.. :: . : : .: CCDS97 SSASPESASPQSTVTVFQQTQIQEPTAN-ATTTTATTDEL-------KTVTKDR-MEDIK 590 600 610 620 630 610 620 630 640 650 660 pF1KB4 FDAGSKASLPPCCGQASTPLSSMGGRSNTQWPPDPPLHFGPTKWAVGDQRTEFLGAAPLG . .: . : . .: .: : .:: : . : : .. ..:: . : . CCDS97 ILIASPS--PTHIHKETTSATSSPYR-DTQSRTASPNRAG--KGVI--EQTE--KSHPRS 640 650 660 670 680 670 680 690 700 710 720 pF1KB4 PPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKLKLKRQLEYEEQAFQDLSGG--- : : .: : . :.: ..::.: . ::..:.. . :: .. : CCDS97 PNVLSVALSQRTTVP--------EEELNPKILALQNAQR-KRKMEHDGSLFQAVGIGTLL 690 700 710 720 730 730 740 750 760 770 780 pF1KB4 DPPG--GSTSHLMWKRMKNLRGGSCPLMPDKPLSANVPNDKFTQNPMRGLGHPLRHLPLP . : ..:. : :::.:. ... :: :. CCDS97 QQPDDHAATTSLSWKRVKGCKSSE-------------------QNGME------------ 740 750 760 790 800 810 820 830 840 pF1KB4 QPPSAISPGENSKSRFPPQCYATQYQDYSLSSAHKVSGMASRLLGPSFESYLLPELTRYD : . : : .: :::: :.. ::.:: :: CCDS97 QKTIILIP----------------------------SDLACRLLGQSMDESGLPQLTSYD 770 780 790 850 860 870 pF1KB4 CEVNVPVLGSSTLLQGGDLLRALDQAT ::::.:. :: .:::: .::::::: CCDS97 CEVNAPIQGSRNLLQGEELLRALDQVN 800 810 820 >>CCDS58324.1 HIF1A gene_id:3091|Hs108|chr14 (850 aa) initn: 1595 init1: 811 opt: 1848 Z-score: 1488.4 bits: 286.5 E(32554): 1.4e-76 Smith-Waterman score: 2157; 45.4% identity (65.9% similar) in 917 aa overlap (6-868:33-848) 10 20 30 pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFY :. : :::::::::::::: :::::.:::: CCDS58 SQCRSLENKFVFLKEGLGNSKPEELEEIRIENGRISSERRKEKSRDAARSRRSKESEVFY 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB4 ELAHELPLPHSVSSHLDKASIMRLAISFLRTHKLLSSVCSENESEAEADQQMDNLYLKAL ::::.:::::.:::::::::.:::.::.::..:::.. . :.. .: ::. .::::: CCDS58 ELAHQLPLPHNVSSHLDKASVMRLTISYLRVRKLLDAGDLDIEDDMKA--QMNCFYLKAL 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB4 EGFIAVVTQDGDMIFLSENISKFMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGF .::. :.:.:::::..:.:..:.::::: ::::::.:::::::::::.:: :. .:: . CCDS58 DGFVMVLTDDGDMIYISDNVNKYMGLTQFELTGHSVFDFTHPCDHEEMREMLTHRNG--L 130 140 150 160 170 160 170 180 190 200 210 pF1KB4 GKKSKDMSTERDFFMRMKCTVTNRGRTVNLKSATWKVLHCTGQVKVY--NNCPPHNSLCG ::.:...:.:.::.:::::.:.::::.:.::::::::::::...:: :. :. :: CCDS58 VKKGKEQNTQRSFFLRMKCTLTSRGRTMNIKSATWKVLHCTGHIHVYDTNSNQPQ---CG 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB4 YKEPLLSCLIIMCEPIQHPSHMDIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELL ::.: ..::...:::: :::...:::::::::::::.::::.:::.:::::.::.::::: CCDS58 YKKPPMTCLVLICEPIPHPSNIEIPLDSKTFLSRHSLDMKFSYCDERITELMGYEPEELL 240 250 260 270 280 290 280 290 300 310 320 330 pF1KB4 GRSAYEFYHALDSENMTKSHQNLCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQ ::: ::.::::::...::.:... :::::..::::::::.:::::.:::.::::: .: : CCDS58 GRSIYEYYHALDSDHLTKTHHDMFTKGQVTTGQYRMLAKRGGYVWVETQATVIYNTKNSQ 300 310 320 330 340 350 340 350 360 370 380 390 pF1KB4 PQCIMCVNYVLSEIEKNDVVFSMDQTESLFKP---HLMAMNSIFDSSGKGAVSEKSNFLF ::::.:::::.: : ..:..::..::: ..:: : :...: . . :: .. :: CCDS58 PQCIVCVNYVVSGIIQHDLIFSLQQTECVLKPVESSDMKMTQLFTK----VESEDTSSLF 360 370 380 390 400 410 400 410 420 430 pF1KB4 TKLKEEPEELAQLAPTPGDAIISLDFG-------NQNFEESSAYGKAILP-PSQ------ :::.::. :. :::. ::.::::::: .:..:: :. ..:: :.. CCDS58 DKLKKEPDALTLLAPAAGDTIISLDFGSNDTETDDQQLEEVPLYNDVMLPSPNEKLQNIN 420 430 440 450 460 470 440 450 460 470 pF1KB4 ----PWATE-----LRSHS----TQSEAGSL-P-------AFTVPQAAAPGSTTPSATSS : : ::: . .: : .: : .::.:: . .:: :. CCDS58 LAMSPLPTAETPKPLRSSADPALNQEVALKLEPNPESLELSFTMPQIQ-DQTPSPSDGST 480 490 500 510 520 530 480 490 500 510 520 530 pF1KB4 SSSCSTPNSPEDYYTSLDNDL----KIEVIEKLFAMDTEAKDQCSTQTDFNELDLETLAP .: :::: .: .:.:. :.:..::::: :::::. ::: ..:::: ::: CCDS58 RQSSPEPNSPSEYCFYVDSDMVNEFKLELVEKLFAEDTEAKNPFSTQD--TDLDLEMLAP 540 550 560 570 580 540 550 560 570 580 pF1KB4 YIPMDGEDFQL---SPICPEERLLAENPQSTPQHCFSAM--TNIFQPLAPVAPHSPFLLD ::::: .:::: . . : : : ...:: ... :.: .: : : . : CCDS58 YIPMD-DDFQLRSFDQLSPLESSSASPESASPQSTVTVFQQTQIQEPTAN-ATTTTATTD 590 600 610 620 630 640 590 600 610 620 630 640 pF1KB4 KFQQQLESKKTEPEHRPMSSIFFDAGSKASLPPCCGQASTPLSSMGGRSNTQWPPDPPLH .. :: . : : .: . .: . : . .: .: : .:: : . CCDS58 EL-------KTVTKDR-MEDIKILIASPS--PTHIHKETTSATSSPYR-DTQSRTASPNR 650 660 670 680 690 650 660 670 680 690 700 pF1KB4 FGPTKWAVGDQRTEFLGAAPLGPPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKL : : .. ..:: . : .: : .: : . :.: ..::.: CCDS58 AG--KGVI--EQTE--KSHPRSPNVLSVALSQRTTVP--------EEELNPKILALQNAQ 700 710 720 730 740 710 720 730 740 750 760 pF1KB4 KLKRQLEYEEQAFQDLSGG---DPPG--GSTSHLMWKRMKNLRGGSCPLMPDKPLSANVP . ::..:.. . :: .. : . : ..:. : :::.:. ... CCDS58 R-KRKMEHDGSLFQAVGIGTLLQQPDDHAATTSLSWKRVKGCKSSE-------------- 750 760 770 780 770 780 790 800 810 820 pF1KB4 NDKFTQNPMRGLGHPLRHLPLPQPPSAISPGENSKSRFPPQCYATQYQDYSLSSAHKVSG :: :. : . : : CCDS58 -----QNGME------------QKTIILIP----------------------------SD 790 800 830 840 850 860 870 pF1KB4 MASRLLGPSFESYLLPELTRYDCEVNVPVLGSSTLLQGGDLLRALDQAT .: :::: :.. ::.:: ::::::.:. :: .:::: .::::::: CCDS58 LACRLLGQSMDESGLPQLTSYDCEVNAPIQGSRNLLQGEELLRALDQVN 810 820 830 840 850 >>CCDS12682.1 HIF3A gene_id:64344|Hs108|chr19 (667 aa) initn: 1351 init1: 577 opt: 1294 Z-score: 1045.7 bits: 204.2 E(32554): 6.4e-52 Smith-Waterman score: 1384; 38.4% identity (64.1% similar) in 711 aa overlap (4-690:2-660) 10 20 30 40 50 60 pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA : . .::..: :::::::::: :::.::::.:.::: ::. ..::.::::::::::. CCDS12 MDWQDHRSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLT 10 20 30 40 50 70 80 90 100 110 120 pF1KB4 ISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISKFMG ::.:: :.: .. .: .. . . . .: ::::::::. :.: .::: .::::.:: .: CCDS12 ISYLRMHRLCAA--GEWNQVGAGGEPLDACYLKALEGFVMVLTAEGDMAYLSENVSKHLG 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB4 LTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVTNRG :.:.:: ::::::: ::::.::... :. .. ..... . ::: : .::: :.:.:: CCDS12 LSQLELIGHSIFDFIHPCDQEELQDALTPQQT--LSRRKVEAPTERCFSLRMKSTLTSRG 120 130 140 150 160 170 190 200 210 220 230 pF1KB4 RTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGY--KEPLLSCLIIMCEPIQHPSHMDIP ::.:::.::::::.:.:....:. : ..: : .:: :.::...:: : ::. .. : CCDS12 RTLNLKAATWKVLNCSGHMRAYKP-PAQTSPAGSPDSEPPLQCLVLICEAIPHPGSLEPP 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB4 LDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQNLCT : .::::::.:::::::::::.:. :: :..:.: ::::. :::::. ..:: ..: . CCDS12 LGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKSIHTLLS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB4 KGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFSMDQ :::.:.::::.::. :::.: .::.::. . :. : . :.::....:..:.. ::.:..: CCDS12 KGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGVVLSLEQ 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB4 TESLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAIISLDFGN ::. . .. .:: :.:.. :.::: ::: . CCDS12 TEQHSRRPIQ----------RGAPSQKDT-----------------PNPGD---SLDTPG 360 370 380 420 430 440 450 460 470 pF1KB4 QNFEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTPSATSSSSS . :. . ::: :. : . . . .: . : :... .. :. . CCDS12 PRIL---AF---LHPPSLSEAA-LAADPRRFCSPDLRRLLGP--ILDGASVAATPSTPLA 390 400 410 420 430 480 490 500 510 520 530 pF1KB4 CSTPNSPEDYYTSLDNDLKI--EVIEKLFAM--DTEA-KDQCSTQTDFNELDLETLAPYI :.:: . ..: ..: . : ...::. :::: . . . : . :::: ::::: CCDS12 TRHPQSPLS--ADLPDELPVGTENVHRLFTSGKDTEAVETDLDIAQDADALDLEMLAPYI 440 450 460 470 480 490 540 550 560 570 580 590 pF1KB4 PMDGEDFQLSPICPEERLLAENPQSTPQHCFSAMTNIFQPLAPVAPHSPFLLDKFQQQLE :: .::::. : . ..:. . :. :.: : : :: .. .. . CCDS12 SMD-DDFQLNASEQLPRAYHRPLGAVPR----PRARSFHGLSPPA-LEPSLLPRWGSDPR 500 510 520 530 540 600 610 620 630 640 pF1KB4 SKKTEPEH-RPMSSIFFDAGSKASLPPCCGQASTPLSSMGGRSNTQWP-PDP------PL . . : . : .: . .. : .: . . . .: : . : :. :: CCDS12 LSCSSPSRGDPSASSPMAGARKRTLAQSSEDEDEGVELLGVRPPKRSPSPEHENFLLFPL 550 560 570 580 590 600 650 660 670 680 690 pF1KB4 HF------GPTKWAVGDQRTEFLG-AAPLG--PPVSPPHVSTFKTRSAKGFGARGPDVLS . ::. .. : : .:. ::: : . :. . :. . : : CCDS12 SLSFLLTGGPAPGSLQDPSTPLLNLNEPLGLGPSLLSPYSDEDTTQPGGPFQPRAGSAQA 610 620 630 640 650 660 700 710 720 730 740 750 pF1KB4 PAMVALSNKLKLKRQLEYEEQAFQDLSGGDPPGGSTSHLMWKRMKNLRGGSCPLMPDKPL CCDS12 D >>CCDS12681.2 HIF3A gene_id:64344|Hs108|chr19 (669 aa) initn: 1351 init1: 577 opt: 1293 Z-score: 1044.8 bits: 204.1 E(32554): 7.1e-52 Smith-Waterman score: 1383; 38.2% identity (64.0% similar) in 714 aa overlap (1-690:1-662) 10 20 30 40 50 60 pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA :. .. ::..: :::::::::: :::.::::.:.::: ::. ..::.::::::::::. CCDS12 MALGLQRARSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 ISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISKFMG ::.:: :.: .. .: .. . . . .: ::::::::. :.: .::: .::::.:: .: CCDS12 ISYLRMHRLCAA--GEWNQVGAGGEPLDACYLKALEGFVMVLTAEGDMAYLSENVSKHLG 70 80 90 100 110 130 140 150 160 170 180 pF1KB4 LTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVTNRG :.:.:: ::::::: ::::.::... :. .. ..... . ::: : .::: :.:.:: CCDS12 LSQLELIGHSIFDFIHPCDQEELQDALTPQQT--LSRRKVEAPTERCFSLRMKSTLTSRG 120 130 140 150 160 170 190 200 210 220 230 pF1KB4 RTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGY--KEPLLSCLIIMCEPIQHPSHMDIP ::.:::.::::::.:.:....:. : ..: : .:: :.::...:: : ::. .. : CCDS12 RTLNLKAATWKVLNCSGHMRAYKP-PAQTSPAGSPDSEPPLQCLVLICEAIPHPGSLEPP 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB4 LDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQNLCT : .::::::.:::::::::::.:. :: :..:.: ::::. :::::. ..:: ..: . CCDS12 LGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKSIHTLLS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB4 KGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFSMDQ :::.:.::::.::. :::.: .::.::. . :. : . :.::....:..:.. ::.:..: CCDS12 KGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGVVLSLEQ 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB4 TESLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAIISLDFGN ::. . .. .:: :.:.. :.::: ::: . CCDS12 TEQHSRRPIQ----------RGAPSQKDT-----------------PNPGD---SLDTPG 360 370 380 420 430 440 450 460 470 pF1KB4 QNFEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTPSATSSSSS . :. . ::: :. : . . . .: . : :... .. :. . CCDS12 PRIL---AF---LHPPSLSEAA-LAADPRRFCSPDLRRLLGP--ILDGASVAATPSTPLA 390 400 410 420 430 480 490 500 510 520 530 pF1KB4 CSTPNSPEDYYTSLDNDLKI--EVIEKLFAM--DTEA-KDQCSTQTDFNELDLETLAPYI :.:: . ..: ..: . : ...::. :::: . . . : . :::: ::::: CCDS12 TRHPQSPLS--ADLPDELPVGTENVHRLFTSGKDTEAVETDLDIAQDADALDLEMLAPYI 440 450 460 470 480 490 540 550 560 570 580 590 pF1KB4 PMDGEDFQLSPICPEERLLAENPQSTPQHCFSAMTNIFQPLAPVAPHSPFLLDKFQQQLE :: .::::. : . ..:. . :. :.: : : :: .. .. . CCDS12 SMD-DDFQLNASEQLPRAYHRPLGAVPR----PRARSFHGLSPPA-LEPSLLPRWGSDPR 500 510 520 530 540 600 610 620 630 640 pF1KB4 SKKTEPEH-RPMSSIFFDAGSKASLPPCCGQASTPLSSMGGRSNTQWP-PDP------PL . . : . : .: . .. : .: . . . .: : . : :. :: CCDS12 LSCSSPSRGDPSASSPMAGARKRTLAQSSEDEDEGVELLGVRPPKRSPSPEHENFLLFPL 550 560 570 580 590 600 650 660 670 680 690 pF1KB4 HF------GPTKWAVGDQRTEFLG-AAPLG--PPVSPPHVSTFKTRSAKGFGARGPDVLS . ::. .. : : .:. ::: : . :. . :. . : : CCDS12 SLSFLLTGGPAPGSLQDPSTPLLNLNEPLGLGPSLLSPYSDEDTTQPGGPFQPRAGSAQA 610 620 630 640 650 660 700 710 720 730 740 750 pF1KB4 PAMVALSNKLKLKRQLEYEEQAFQDLSGGDPPGGSTSHLMWKRMKNLRGGSCPLMPDKPL CCDS12 D >>CCDS42580.2 HIF3A gene_id:64344|Hs108|chr19 (600 aa) initn: 924 init1: 577 opt: 864 Z-score: 701.5 bits: 140.4 E(32554): 9.4e-33 Smith-Waterman score: 954; 34.6% identity (60.6% similar) in 592 aa overlap (123-690:52-593) 100 110 120 130 140 150 pF1KB4 KALEGFIAVVTQDGDMIFLSENISKFMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNG :.:: ::::::: ::::.::... :. .. CCDS42 PSPAASAPTWTRPLSCASPSATCACTASAPQLELIGHSIFDFIHPCDQEELQDALTPQQT 30 40 50 60 70 80 160 170 180 190 200 210 pF1KB4 SGFGKKSKDMSTERDFFMRMKCTVTNRGRTVNLKSATWKVLHCTGQVKVYNNCPPHNSLC ..... . ::: : .::: :.:.::::.:::.::::::.:.:....:. : ..: CCDS42 --LSRRKVEAPTERCFSLRMKSTLTSRGRTLNLKAATWKVLNCSGHMRAYKP-PAQTSPA 90 100 110 120 130 220 230 240 250 260 270 pF1KB4 GY--KEPLLSCLIIMCEPIQHPSHMDIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPE : .:: :.::...:: : ::. .. :: .::::::.:::::::::::.:. :: :. CCDS42 GSPDSEPPLQCLVLICEAIPHPGSLEPPLGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPD 140 150 160 170 180 190 280 290 300 310 320 330 pF1KB4 ELLGRSAYEFYHALDSENMTKSHQNLCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPR .:.: ::::. :::::. ..:: ..: .:::.:.::::.::. :::.: .::.::. . : CCDS42 DLIGCSAYEYIHALDSDAVSKSIHTLLSKGQAVTGQYRFLARSGGYLWTQTQATVVSGGR 200 210 220 230 240 250 340 350 360 370 380 390 pF1KB4 NLQPQCIMCVNYVLSEIEKNDVVFSMDQTESLFKPHLMAMNSIFDSSGKGAVSEKSNFLF . : . :.::....:..:.. ::.:..:::. . .. .:: :.:.. CCDS42 GPQSESIVCVHFLISQVEETGVVLSLEQTEQHSRRPIQ----------RGAPSQKDT--- 260 270 280 290 300 400 410 420 430 440 450 pF1KB4 TKLKEEPEELAQLAPTPGDAIISLDFGNQNFEESSAYGKAILPPSQPWATELRSHSTQSE :.::: ::: . . :. . ::: :. : . . CCDS42 --------------PNPGD---SLDTPGPRIL---AF---LHPPSLSEAA-LAADPRRFC 310 320 330 340 460 470 480 490 500 pF1KB4 AGSLPAFTVPQAAAPGSTTPSATSSSSSCSTPNSPEDYYTSLDNDLKI--EVIEKLFAM- . .: . : :... .. :. . :.:: . ..: ..: . : ...::. CCDS42 SPDLRRLLGP--ILDGASVAATPSTPLATRHPQSPLS--ADLPDELPVGTENVHRLFTSG 350 360 370 380 390 510 520 530 540 550 560 pF1KB4 -DTEA-KDQCSTQTDFNELDLETLAPYIPMDGEDFQLSPICPEERLLAENPQSTPQHCFS :::: . . . : . :::: ::::: :: .::::. : . ..:. CCDS42 KDTEAVETDLDIAQDADALDLEMLAPYISMD-DDFQLNASEQLPRAYHRPLGAVPR---- 400 410 420 430 440 450 570 580 590 600 610 620 pF1KB4 AMTNIFQPLAPVAPHSPFLLDKFQQQLESKKTEPEH-RPMSSIFFDAGSKASLPPCCGQA . :. :.: : . : :: .. .. . . . : . : .: . .. : .: . CCDS42 PRARSFHGLSPPALE-PSLLPRWGSDPRLSCSSPSRGDPSASSPMAGARKRTLAQSSEDE 460 470 480 490 500 510 630 640 650 660 pF1KB4 STPLSSMGGRSNTQWP-PDP------PLHF------GPTKWAVGDQRTEFLG-AAPLG-- . . .: : . : :. :: . ::. .. : : .:. ::: CCDS42 DEGVELLGVRPPKRSPSPEHENFLLFPLSLSFLLTGGPAPGSLQDPSTPLLNLNEPLGLG 520 530 540 550 560 570 670 680 690 700 710 720 pF1KB4 PPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKLKLKRQLEYEEQAFQDLSGGDPP : . :. . :. . : : CCDS42 PSLLSPYSDEDTTQPGGPFQPRAGSAQAD 580 590 600 >>CCDS5045.1 SIM1 gene_id:6492|Hs108|chr6 (766 aa) initn: 842 init1: 378 opt: 835 Z-score: 676.6 bits: 136.1 E(32554): 2.3e-31 Smith-Waterman score: 835; 36.6% identity (68.8% similar) in 382 aa overlap (16-387:2-377) 10 20 30 40 50 60 pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA ::::..::: :: ::. :::::. :::: ...:.::::::.::. CCDS50 MKEKSKNAARTRREKENSEFYELAKLLPLPSAITSQLDKASIIRLT 10 20 30 40 70 80 90 100 110 pF1KB4 ISFLRTHKLLSSVCSENESEAEADQQMDNL-------YLKALEGFIAVVTQDGDMIFLSE :.:. . .. .: ... . .::. :..:.::: ::. :: ....:: CCDS50 TSYLKMRVVFPEGLGEAWGHSSRTSPLDNVGRELGSHLLQTLDGFIFVVAPDGKIMYISE 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB4 NISKFMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMK . : .::.::::::.::... :: ::.:. :. .. .. ... ::.::.::: CCDS50 TASVHLGLSQVELTGNSIYEYIHPADHDEMTAVLTAHQ-PYHSHFVQEYEIERSFFLRMK 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB4 CTVTNRGRTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGYKEPLLSCLIIMCEPIQHPS :....:. ..: . .::.::.: .:. . . . : . . :. . . . . CCDS50 CVLAKRN--AGLTCGGYKVIHCSGYLKIRQYSLDMSPFDGCYQNV--GLVAVGHSLPPSA 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB4 HMDIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSH .: : :. :. : :.:::. . :.:..:: ::.:..:. .. :. :. :. .. .: CCDS50 VTEIKLHSNMFMFRASLDMKLIFLDSRVAELTGYEPQDLIEKTLYHHVHGCDTFHLRCAH 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB4 QNLCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVV . : .::::.. ::.::::::.::... .:...: :. .:.::. :::::.. : . . CCDS50 HLLLVKGQVTTKYYRFLAKHGGWVWVQSYATIVHNSRSSRPHCIVSVNYVLTDTEYKGLQ 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB4 FSMDQTESLFKPHLMAMNS---IFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDA .:.:: : :: . .: . .. ::: :. :. CCDS50 LSLDQI-SASKPAFSYTSSSTPTMTDNRKGAKSRLSSSKSKSRTSPYPQYSGFHTERSES 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB4 IISLDFGNQNFEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTP CCDS50 DHDSQWGGSPLTDTASPQLLDPADRPGSQHDASCAYRQFSDRSSLCYGFALDHSRLVEER 410 420 430 440 450 460 >>CCDS13646.1 SIM2 gene_id:6493|Hs108|chr21 (667 aa) initn: 820 init1: 382 opt: 818 Z-score: 663.9 bits: 133.6 E(32554): 1.2e-30 Smith-Waterman score: 847; 29.4% identity (58.4% similar) in 632 aa overlap (16-627:2-586) 10 20 30 40 50 60 pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA ::::..::. :: ::. :::::. :::: ...:.::::::.::. CCDS13 MKEKSKNAAKTRREKENGEFYELAKLLPLPSAITSQLDKASIIRLT 10 20 30 40 70 80 90 100 110 pF1KB4 ISFLRTHKLLSSVCSENESEAEADQQMDNL-------YLKALEGFIAVVTQDGDMIFLSE :.:. . .. .. .. .:.. :..:.::. ::..:: ....:: CCDS13 TSYLKMRAVFPEGLGDAWGQPSRAGPLDGVAKELGSHLLQTLDGFVFVVASDGKIMYISE 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB4 NISKFMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMK . : .::.::::::.::... :: ::.:. :. .. . ... ::.::.::: CCDS13 TASVHLGLSQVELTGNSIYEYIHPSDHDEMTAVLTAHQPLHH-HLLQEYEIERSFFLRMK 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB4 CTVTNRGRTVNLKSATWKVLHCTGQVKVYN---NCPPHNSLCGYKEPLLSCLIIMCEPIQ :....:. ..: . .::.::.: .:. . . ..: : :. . :. . . . CCDS13 CVLAKRN--AGLTCSGYKVIHCSGYLKIRQYMLDMSLYDS-C-YQ---IVGLVAVGQSLP 170 180 190 200 210 240 250 260 270 280 290 pF1KB4 HPSHMDIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMT . .: : :. :. : :.:.:. . :.:.::. ::.:..:. .. :. :. : .. CCDS13 PSAITEIKLYSNMFMFRASLDLKLIFLDSRVTEVTGYEPQDLIEKTLYHHVHGCDVFHLR 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB4 KSHQNLCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKN .:. : .::::.. ::.:.:.::.::... .::..: :. .:.::. :::::.::: . CCDS13 YAHHLLLVKGQVTTKYYRLLSKRGGWVWVQSYATVVHNSRSSRPHCIVSVNYVLTEIEYK 280 290 300 310 320 330 360 370 380 390 400 pF1KB4 DVVFSMDQTESLFKPHLMAMNSIFDSS-GKGAVSEKSNFLFTKLKEEPEELAQLAPTPGD .. .:..:. : : . ... :. . :. :.. . :::. .: : . : CCDS13 ELQLSLEQV-STAKSQDSWRTALSTSQETRKLVKPKNTKMKTKLRTNPYPPQQYSSFQMD 340 350 360 370 380 390 410 420 430 440 450 460 pF1KB4 AIISLDFGNQNFEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTT . ..:: ..: ..: :: ::. :: .:. :....: . : CCDS13 KLECGQLGNW---RASPPASAAAPP------ELQPHSESSDLLYTPSYSLPFSYHYGHF- 400 410 420 430 440 470 480 490 500 510 520 pF1KB4 PSATSSSSSCSTPNSPEDYYTSLDNDLKIEVIEKLFAMDTEAKDQCSTQTDFNELDLETL : . :: . : : . . .. ..: :. .: : . . CCDS13 PLDSHVFSS-KKPMLPAKFGQPQGSPCEV---ARFFLSTLPASGEC--QWHYAN------ 450 460 470 480 490 530 540 550 560 570 580 pF1KB4 APYIPMDGEDFQLSPICPEERLLAENPQSTPQHCFSAMTNIFQPLAPVAPHSPFLLDKFQ : .: .. . : : : .: .: ... .. ::.: : : CCDS13 -PLVPSSSSPAKNPP---------EPPANTARH---SLVPSYE--APAAAVRRFGEDTAP 500 510 520 530 540 590 600 610 620 630 640 pF1KB4 QQLES---KKTEPEHRPMSSIFFDA--GSKASL----PPCCGQASTPLSSMGGRSNTQWP .. : . :: : .. : :.. .: : ::. :: CCDS13 PSFPSCGHYREEPALGPAKAARQAARDGARLALARAAPECCAPP-TPEAPGAPAQLPFVL 550 560 570 580 590 650 660 670 680 690 700 pF1KB4 PDPPLHFGPTKWAVGDQRTEFLGAAPLGPPVSPPHVSTFKTRSAKGFGARGPDVLSPAMV CCDS13 LNYHRVLARRGPLGGAAPAASGLACAPGGPEAATGALRLRHPSPAATSPPGAPLPHYLGA 600 610 620 630 640 650 >>CCDS9645.1 NPAS3 gene_id:64067|Hs108|chr14 (901 aa) initn: 823 init1: 324 opt: 443 Z-score: 361.1 bits: 78.0 E(32554): 8.5e-14 Smith-Waterman score: 727; 33.3% identity (62.1% similar) in 406 aa overlap (19-367:26-419) 10 20 30 40 50 pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDK :::::: ::.::. :::::. :::: ...:.::: CCDS96 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK 10 20 30 40 50 60 60 70 80 pF1KB4 ASIMRLAISFLRTHKLL-----------------SSVCSENESEAEA-------DQQMDN :::.::.::.:. . . .:: . .. .. . . .. . CCDS96 ASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVKGAQRRRSPSALAIEVFEAHLGS 70 80 90 100 110 120 90 100 110 120 130 140 pF1KB4 LYLKALEGFIAVVTQDGDMIFLSENISKFMGLTQVELTGHSIFDFTHPCDHEEIRENLSL :..:.::. ...:.: ....::..: ..::.:::::: :.::..:: :: :. :.:.. CCDS96 HILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQLGM 130 140 150 160 170 180 150 160 170 pF1KB4 KNGSGFGKKSK--------------------------------DMSTERDFFMRMKCTVT : : : :. : . ::.::.::: :.: CCDS96 KLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKSTLT 190 200 210 220 230 240 180 190 200 210 220 230 pF1KB4 NRGRTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGYKEP-LLSCLIIMCEPIQHPSHMD .:: :..::. .::.: ::.... . : : : . :... . . :. . CCDS96 KRG--VHIKSSGYKVIHITGRLRLRVSLS-H----GRTVPSQIMGLVVVAHALPPPTINE 250 260 270 280 290 240 250 260 270 280 290 pF1KB4 IPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQNL . .: . :..: .::... ::..::.. . : ...:. :.: :: : :.. .:: .: CCDS96 VRIDCHMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDL 300 310 320 330 340 350 300 310 320 330 340 350 pF1KB4 CTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFSM .::: :. :: . :.:::.:.....:. : .: . . :. :::.::. : .:. ... CCDS96 LNKGQCVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDI 360 370 380 390 400 410 360 370 380 390 400 410 pF1KB4 DQTESLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAIISLDF : ::: CCDS96 AQL-----PHLPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENSEDPEPDR 420 430 440 450 460 870 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 14:53:20 2016 done: Thu Nov 3 14:53:21 2016 Total Scan time: 4.920 Total Display time: 0.250 Function used was FASTA [36.3.4 Apr, 2011]