FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9765, 903 aa 1>>>pF1KB9765 903 - 903 aa - 903 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.0157+/-0.00108; mu= 6.7261+/- 0.065 mean_var=278.8550+/-57.898, 0's: 0 Z-trim(112.6): 50 B-trim: 0 in 0/51 Lambda= 0.076804 statistics sampled from 13278 (13317) to 13278 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.717), E-opt: 0.2 (0.409), width: 16 Scan time: 3.670 The best scores are: opt bits E(32554) CCDS55912.1 NPAS3 gene_id:64067|Hs108|chr14 ( 903) 5987 677.6 2.8e-194 CCDS9645.1 NPAS3 gene_id:64067|Hs108|chr14 ( 901) 5963 674.9 1.8e-193 CCDS53891.1 NPAS3 gene_id:64067|Hs108|chr14 ( 933) 5871 664.8 2.1e-190 CCDS53892.1 NPAS3 gene_id:64067|Hs108|chr14 ( 920) 5339 605.8 1.2e-172 CCDS12694.1 NPAS1 gene_id:4861|Hs108|chr19 ( 590) 579 78.2 5.1e-14 CCDS5045.1 SIM1 gene_id:6492|Hs108|chr6 ( 766) 553 75.4 4.5e-13 CCDS13646.1 SIM2 gene_id:6493|Hs108|chr21 ( 667) 543 74.2 8.7e-13 >>CCDS55912.1 NPAS3 gene_id:64067|Hs108|chr14 (903 aa) initn: 5987 init1: 5987 opt: 5987 Z-score: 3601.5 bits: 677.6 E(32554): 2.8e-194 Smith-Waterman score: 5987; 100.0% identity (100.0% similar) in 903 aa overlap (1-903:1-903) 10 20 30 40 50 60 pF1KB9 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 ASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVKVIGAQRRRSPSALAIEVFEAHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVKVIGAQRRRSPSALAIEVFEAHL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 GSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 GMKLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GMKLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKST 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 LTKRGVHIKSSGYKVIHITGRLRLRVSLSHGRTVPSQIMGLVVVAHALPPPTINEVRIDC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LTKRGVHIKSSGYKVIHITGRLRLRVSLSHGRTVPSQIMGLVVVAHALPPPTINEVRIDC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 HMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDLLNKGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 HMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDLLNKGQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 CVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDIAQLPH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 CVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDIAQLPH 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 LPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENSEDPEPDRKKSGNACDND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENSEDPEPDRKKSGNACDND 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 MNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAMQIKVERYVESESDLRLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAMQIKVERYVESESDLRLQ 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB9 NCESLTSDSAKDSDSAGEAGAQASSKHQKRKKRRKRQKGGSASRRRLSSASSPGGLDAGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NCESLTSDSAKDSDSAGEAGAQASSKHQKRKKRRKRQKGGSASRRRLSSASSPGGLDAGL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB9 VEPPRLLSSPNSASVLKIKTEISEPINFDNDSSIWNYPPNREISRNESPYSMTKPPSSEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VEPPRLLSSPNSASVLKIKTEISEPINFDNDSSIWNYPPNREISRNESPYSMTKPPSSEH 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB9 FPSPQGGGGGGGGGGGLHVAIPDSVLTPPGADGAAARKTQFGASATAALAPVASDPLSPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 FPSPQGGGGGGGGGGGLHVAIPDSVLTPPGADGAAARKTQFGASATAALAPVASDPLSPP 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB9 LSASPRDKHPGNGGGGGGGGGGAGGGGPSASNSLLYTGDLEALQRLQAGNVVLPLVHRVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LSASPRDKHPGNGGGGGGGGGGAGGGGPSASNSLLYTGDLEALQRLQAGNVVLPLVHRVT 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB9 GTLAATSTAAQRVYTTGTIRYAPAEVTLAMQSNLLPNAHAVNFVDVNSPGFGLDPKTPME :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GTLAATSTAAQRVYTTGTIRYAPAEVTLAMQSNLLPNAHAVNFVDVNSPGFGLDPKTPME 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB9 MLYHHVHRLNMSGPFGGAVSAASLTQMPAGNVFTTAEGLFSTLPFPVYSNGIHAAQTLER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MLYHHVHRLNMSGPFGGAVSAASLTQMPAGNVFTTAEGLFSTLPFPVYSNGIHAAQTLER 850 860 870 880 890 900 pF1KB9 KED ::: CCDS55 KED >>CCDS9645.1 NPAS3 gene_id:64067|Hs108|chr14 (901 aa) initn: 5335 init1: 5335 opt: 5963 Z-score: 3587.1 bits: 674.9 E(32554): 1.8e-193 Smith-Waterman score: 5963; 99.8% identity (99.8% similar) in 903 aa overlap (1-903:1-901) 10 20 30 40 50 60 pF1KB9 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 ASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVKVIGAQRRRSPSALAIEVFEAHL :::::::::::::::::::::::::::::::::::::: :::::::::::::::::::: CCDS96 ASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVK--GAQRRRSPSALAIEVFEAHL 70 80 90 100 110 130 140 150 160 170 180 pF1KB9 GSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 GSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB9 GMKLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 GMKLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKST 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB9 LTKRGVHIKSSGYKVIHITGRLRLRVSLSHGRTVPSQIMGLVVVAHALPPPTINEVRIDC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 LTKRGVHIKSSGYKVIHITGRLRLRVSLSHGRTVPSQIMGLVVVAHALPPPTINEVRIDC 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB9 HMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDLLNKGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 HMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDLLNKGQ 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB9 CVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDIAQLPH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 CVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDIAQLPH 360 370 380 390 400 410 430 440 450 460 470 480 pF1KB9 LPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENSEDPEPDRKKSGNACDND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 LPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENSEDPEPDRKKSGNACDND 420 430 440 450 460 470 490 500 510 520 530 540 pF1KB9 MNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAMQIKVERYVESESDLRLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 MNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAMQIKVERYVESESDLRLQ 480 490 500 510 520 530 550 560 570 580 590 600 pF1KB9 NCESLTSDSAKDSDSAGEAGAQASSKHQKRKKRRKRQKGGSASRRRLSSASSPGGLDAGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 NCESLTSDSAKDSDSAGEAGAQASSKHQKRKKRRKRQKGGSASRRRLSSASSPGGLDAGL 540 550 560 570 580 590 610 620 630 640 650 660 pF1KB9 VEPPRLLSSPNSASVLKIKTEISEPINFDNDSSIWNYPPNREISRNESPYSMTKPPSSEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 VEPPRLLSSPNSASVLKIKTEISEPINFDNDSSIWNYPPNREISRNESPYSMTKPPSSEH 600 610 620 630 640 650 670 680 690 700 710 720 pF1KB9 FPSPQGGGGGGGGGGGLHVAIPDSVLTPPGADGAAARKTQFGASATAALAPVASDPLSPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 FPSPQGGGGGGGGGGGLHVAIPDSVLTPPGADGAAARKTQFGASATAALAPVASDPLSPP 660 670 680 690 700 710 730 740 750 760 770 780 pF1KB9 LSASPRDKHPGNGGGGGGGGGGAGGGGPSASNSLLYTGDLEALQRLQAGNVVLPLVHRVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 LSASPRDKHPGNGGGGGGGGGGAGGGGPSASNSLLYTGDLEALQRLQAGNVVLPLVHRVT 720 730 740 750 760 770 790 800 810 820 830 840 pF1KB9 GTLAATSTAAQRVYTTGTIRYAPAEVTLAMQSNLLPNAHAVNFVDVNSPGFGLDPKTPME :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 GTLAATSTAAQRVYTTGTIRYAPAEVTLAMQSNLLPNAHAVNFVDVNSPGFGLDPKTPME 780 790 800 810 820 830 850 860 870 880 890 900 pF1KB9 MLYHHVHRLNMSGPFGGAVSAASLTQMPAGNVFTTAEGLFSTLPFPVYSNGIHAAQTLER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS96 MLYHHVHRLNMSGPFGGAVSAASLTQMPAGNVFTTAEGLFSTLPFPVYSNGIHAAQTLER 840 850 860 870 880 890 pF1KB9 KED ::: CCDS96 KED 900 >>CCDS53891.1 NPAS3 gene_id:64067|Hs108|chr14 (933 aa) initn: 5871 init1: 5871 opt: 5871 Z-score: 3531.8 bits: 664.8 E(32554): 2.1e-190 Smith-Waterman score: 5917; 96.8% identity (96.8% similar) in 933 aa overlap (1-903:1-933) 10 20 30 pF1KB9 MAPTKPSFQQDPSRRER------------------------------LQALRKEKSRDAA ::::::::::::::::: ::::::::::::: CCDS53 MAPTKPSFQQDPSRRERITAQHPLPNQSECRKIYRYDGIYCESTYQNLQALRKEKSRDAA 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB9 RSRRGKENFEFYELAKLLPLPAAITSQLDKASIIRLTISYLKMRDFANQGDPPWNLRMEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 RSRRGKENFEFYELAKLLPLPAAITSQLDKASIIRLTISYLKMRDFANQGDPPWNLRMEG 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB9 PPPNTSVKVIGAQRRRSPSALAIEVFEAHLGSHILQSLDGFVFALNQEGKFLYISETVSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 PPPNTSVKVIGAQRRRSPSALAIEVFEAHLGSHILQSLDGFVFALNQEGKFLYISETVSI 130 140 150 160 170 180 160 170 180 190 200 210 pF1KB9 YLGLSQVELTGSSVFDYVHPGDHVEMAEQLGMKLPPGRGLLSQGTAEDGASSASSSSQSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 YLGLSQVELTGSSVFDYVHPGDHVEMAEQLGMKLPPGRGLLSQGTAEDGASSASSSSQSE 190 200 210 220 230 240 220 230 240 250 260 270 pF1KB9 TPEPVESTSPSLLTTDNTLERSFFIRMKSTLTKRGVHIKSSGYKVIHITGRLRLRVSLSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 TPEPVESTSPSLLTTDNTLERSFFIRMKSTLTKRGVHIKSSGYKVIHITGRLRLRVSLSH 250 260 270 280 290 300 280 290 300 310 320 330 pF1KB9 GRTVPSQIMGLVVVAHALPPPTINEVRIDCHMFVTRVNMDLNIIYCENRISDYMDLTPVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GRTVPSQIMGLVVVAHALPPPTINEVRIDCHMFVTRVNMDLNIIYCENRISDYMDLTPVD 310 320 330 340 350 360 340 350 360 370 380 390 pF1KB9 IVGKRCYHFIHAEDVEGIRHSHLDLLNKGQCVTKYYRWMQKNGGYIWIQSSATIAINAKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 IVGKRCYHFIHAEDVEGIRHSHLDLLNKGQCVTKYYRWMQKNGGYIWIQSSATIAINAKN 370 380 390 400 410 420 400 410 420 430 440 450 pF1KB9 ANEKNIIWVNYLLSNPEYKDTPMDIAQLPHLPEKTSESSETSDSESDSKDTSGITEDNEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 ANEKNIIWVNYLLSNPEYKDTPMDIAQLPHLPEKTSESSETSDSESDSKDTSGITEDNEN 430 440 450 460 470 480 460 470 480 490 500 510 pF1KB9 SKSDEKGNQSENSEDPEPDRKKSGNACDNDMNCNDDGHSSSNPDSRDSDDSFEHSDFENP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SKSDEKGNQSENSEDPEPDRKKSGNACDNDMNCNDDGHSSSNPDSRDSDDSFEHSDFENP 490 500 510 520 530 540 520 530 540 550 560 570 pF1KB9 KAGEDGFGALGAMQIKVERYVESESDLRLQNCESLTSDSAKDSDSAGEAGAQASSKHQKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KAGEDGFGALGAMQIKVERYVESESDLRLQNCESLTSDSAKDSDSAGEAGAQASSKHQKR 550 560 570 580 590 600 580 590 600 610 620 630 pF1KB9 KKRRKRQKGGSASRRRLSSASSPGGLDAGLVEPPRLLSSPNSASVLKIKTEISEPINFDN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KKRRKRQKGGSASRRRLSSASSPGGLDAGLVEPPRLLSSPNSASVLKIKTEISEPINFDN 610 620 630 640 650 660 640 650 660 670 680 690 pF1KB9 DSSIWNYPPNREISRNESPYSMTKPPSSEHFPSPQGGGGGGGGGGGLHVAIPDSVLTPPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 DSSIWNYPPNREISRNESPYSMTKPPSSEHFPSPQGGGGGGGGGGGLHVAIPDSVLTPPG 670 680 690 700 710 720 700 710 720 730 740 750 pF1KB9 ADGAAARKTQFGASATAALAPVASDPLSPPLSASPRDKHPGNGGGGGGGGGGAGGGGPSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 ADGAAARKTQFGASATAALAPVASDPLSPPLSASPRDKHPGNGGGGGGGGGGAGGGGPSA 730 740 750 760 770 780 760 770 780 790 800 810 pF1KB9 SNSLLYTGDLEALQRLQAGNVVLPLVHRVTGTLAATSTAAQRVYTTGTIRYAPAEVTLAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SNSLLYTGDLEALQRLQAGNVVLPLVHRVTGTLAATSTAAQRVYTTGTIRYAPAEVTLAM 790 800 810 820 830 840 820 830 840 850 860 870 pF1KB9 QSNLLPNAHAVNFVDVNSPGFGLDPKTPMEMLYHHVHRLNMSGPFGGAVSAASLTQMPAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 QSNLLPNAHAVNFVDVNSPGFGLDPKTPMEMLYHHVHRLNMSGPFGGAVSAASLTQMPAG 850 860 870 880 890 900 880 890 900 pF1KB9 NVFTTAEGLFSTLPFPVYSNGIHAAQTLERKED ::::::::::::::::::::::::::::::::: CCDS53 NVFTTAEGLFSTLPFPVYSNGIHAAQTLERKED 910 920 930 >>CCDS53892.1 NPAS3 gene_id:64067|Hs108|chr14 (920 aa) initn: 5339 init1: 5339 opt: 5339 Z-score: 3213.3 bits: 605.8 E(32554): 1.2e-172 Smith-Waterman score: 5943; 98.2% identity (98.2% similar) in 920 aa overlap (1-903:1-920) 10 20 30 40 50 60 pF1KB9 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK 10 20 30 40 50 60 70 80 90 100 pF1KB9 ASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVK-----------------VIGAQ :::::::::::::::::::::::::::::::::::::: ::::: CCDS53 ASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVKGIQMWKSELCMRKTPCEVIGAQ 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB9 RRRSPSALAIEVFEAHLGSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 RRRSPSALAIEVFEAHLGSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSS 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB9 VFDYVHPGDHVEMAEQLGMKLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 VFDYVHPGDHVEMAEQLGMKLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLL 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB9 TTDNTLERSFFIRMKSTLTKRGVHIKSSGYKVIHITGRLRLRVSLSHGRTVPSQIMGLVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 TTDNTLERSFFIRMKSTLTKRGVHIKSSGYKVIHITGRLRLRVSLSHGRTVPSQIMGLVV 250 260 270 280 290 300 290 300 310 320 330 340 pF1KB9 VAHALPPPTINEVRIDCHMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 VAHALPPPTINEVRIDCHMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAE 310 320 330 340 350 360 350 360 370 380 390 400 pF1KB9 DVEGIRHSHLDLLNKGQCVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 DVEGIRHSHLDLLNKGQCVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLL 370 380 390 400 410 420 410 420 430 440 450 460 pF1KB9 SNPEYKDTPMDIAQLPHLPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SNPEYKDTPMDIAQLPHLPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENS 430 440 450 460 470 480 470 480 490 500 510 520 pF1KB9 EDPEPDRKKSGNACDNDMNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 EDPEPDRKKSGNACDNDMNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAM 490 500 510 520 530 540 530 540 550 560 570 580 pF1KB9 QIKVERYVESESDLRLQNCESLTSDSAKDSDSAGEAGAQASSKHQKRKKRRKRQKGGSAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 QIKVERYVESESDLRLQNCESLTSDSAKDSDSAGEAGAQASSKHQKRKKRRKRQKGGSAS 550 560 570 580 590 600 590 600 610 620 630 640 pF1KB9 RRRLSSASSPGGLDAGLVEPPRLLSSPNSASVLKIKTEISEPINFDNDSSIWNYPPNREI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 RRRLSSASSPGGLDAGLVEPPRLLSSPNSASVLKIKTEISEPINFDNDSSIWNYPPNREI 610 620 630 640 650 660 650 660 670 680 690 700 pF1KB9 SRNESPYSMTKPPSSEHFPSPQGGGGGGGGGGGLHVAIPDSVLTPPGADGAAARKTQFGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SRNESPYSMTKPPSSEHFPSPQGGGGGGGGGGGLHVAIPDSVLTPPGADGAAARKTQFGA 670 680 690 700 710 720 710 720 730 740 750 760 pF1KB9 SATAALAPVASDPLSPPLSASPRDKHPGNGGGGGGGGGGAGGGGPSASNSLLYTGDLEAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SATAALAPVASDPLSPPLSASPRDKHPGNGGGGGGGGGGAGGGGPSASNSLLYTGDLEAL 730 740 750 760 770 780 770 780 790 800 810 820 pF1KB9 QRLQAGNVVLPLVHRVTGTLAATSTAAQRVYTTGTIRYAPAEVTLAMQSNLLPNAHAVNF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 QRLQAGNVVLPLVHRVTGTLAATSTAAQRVYTTGTIRYAPAEVTLAMQSNLLPNAHAVNF 790 800 810 820 830 840 830 840 850 860 870 880 pF1KB9 VDVNSPGFGLDPKTPMEMLYHHVHRLNMSGPFGGAVSAASLTQMPAGNVFTTAEGLFSTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 VDVNSPGFGLDPKTPMEMLYHHVHRLNMSGPFGGAVSAASLTQMPAGNVFTTAEGLFSTL 850 860 870 880 890 900 890 900 pF1KB9 PFPVYSNGIHAAQTLERKED :::::::::::::::::::: CCDS53 PFPVYSNGIHAAQTLERKED 910 920 >>CCDS12694.1 NPAS1 gene_id:4861|Hs108|chr19 (590 aa) initn: 1443 init1: 528 opt: 579 Z-score: 365.2 bits: 78.2 E(32554): 5.1e-14 Smith-Waterman score: 1568; 52.7% identity (76.3% similar) in 465 aa overlap (18-466:42-483) 10 20 30 40 pF1KB9 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKL ::: ::::::.::::::::::.::.::::: CCDS12 SEVKCVGGRGASVPWDFLPGLMVKAPSGPCLQAQRKEKSRNAARSRRGKENLEFFELAKL 20 30 40 50 60 70 50 60 70 80 90 100 pF1KB9 LPLPAAITSQLDKASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVKVIGAQRRRS ::::.::.::::::::.::...::..: :: : :::.:: ::: . : ::. CCDS12 LPLPGAISSQLDKASIVRLSVTYLRLRRFAALGAPPWGLRAAGPPAGL------APGRRG 80 90 100 110 120 110 120 130 140 150 160 pF1KB9 PSALAIEVFEAHLGSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDY :.::. :::: :::.::::::::::::::::::::::::::::::::::::.:::::::: CCDS12 PAALVSEVFEQHLGGHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVEMTGSSVFDY 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB9 VHPGDHVEMAEQLGMKLP-PGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTD .::::: :. ::::.. : :: ..::.:::: ..::: .:.. .. .. CCDS12 IHPGDHSEVLEQLGLRTPTPG----PPTPPSVSSSSSSSSSLADTPE-IEASLTKVPPSS 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB9 NTLERSFFIRMKSTLTKRGVHIKSSGYKVIHITGRLRLRVSLSHGRTVPSQIMGLVVVAH . :::::.::::::::::.:.:.:::::::.::::: .:. .:::...: CCDS12 LVQERSFFVRMKSTLTKRGLHVKASGYKVIHVTGRLR-----AHA-------LGLVALGH 250 260 270 280 290 300 310 320 330 340 pF1KB9 ALPPPTINEVRIDCHMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVE .::: . :. . ::.: :... :.:. ::.:.::.::: : ..::. ::.:.:..:. CCDS12 TLPPAPLAELPLHGHMIVFRLSLGLTILACESRVSDHMDLGPSELVGRSCYQFVHGQDAT 290 300 310 320 330 340 350 360 370 380 390 400 pF1KB9 GIRHSHLDLLNKGQCVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNP ::.::.:::.::: .: ::::.:. ::..:.:: ::.: ..:. .:....::...::. CCDS12 RIRQSHVDLLDKGQVMTGYYRWLQRAGGFVWLQSVATVAGSGKSPGEHHVLWVSHVLSQA 350 360 370 380 390 400 410 420 430 440 450 pF1KB9 EYKDTPMDIAQLPHL---------------PEKTSESSETSDSESDSKDTSGITEDNENS : .::.: ::: :: .:..... .:... .:.: : . CCDS12 EGGQTPLDAFQLPASVACEEASSPGPEPTEPEPPTEGKQAAPAENEAPQTQGKRIKVEPG 410 420 430 440 450 460 460 470 480 490 500 510 pF1KB9 KSDEKGNQSENSEDPEPDRKKSGNACDNDMNCNDDGHSSSNPDSRDSDDSFEHSDFENPK . ::... ..::: CCDS12 PRETKGSEDSGDEDPSSHPATPRPEFTSVIRAGVLKQDPVRPWGLAPPGDPPPTLLHAGF 470 480 490 500 510 520 >>CCDS5045.1 SIM1 gene_id:6492|Hs108|chr6 (766 aa) initn: 1080 init1: 425 opt: 553 Z-score: 348.2 bits: 75.4 E(32554): 4.5e-13 Smith-Waterman score: 996; 34.3% identity (59.2% similar) in 650 aa overlap (23-663:2-562) 10 20 30 40 50 60 pF1KB9 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK ::::..:::.:: ::: ::::::::::::.:::::::: CCDS50 MKEKSKNAARTRREKENSEFYELAKLLPLPSAITSQLDK 10 20 30 70 80 90 100 110 pF1KB9 ASIIRLTISYLKMRDFANQG-DPPWNLRMEGPPPNTSVKVIGAQRRRSPSALAIEVFEAH ::::::: :::::: .: : : . : :: .. . CCDS50 ASIIRLTTSYLKMRVVFPEGLGEAW----------------GHSSRTSP----LDNVGRE 40 50 60 70 120 130 140 150 160 170 pF1KB9 LGSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQ ::::.::.::::.:.. .::..:::::.:..::::::::::.:...:.::.:: ::. CCDS50 LGSHLLQTLDGFIFVVAPDGKIMYISETASVHLGLSQVELTGNSIYEYIHPADHDEMTAV 80 90 100 110 120 130 180 190 200 210 220 230 pF1KB9 LGMKLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKS : ::. .: .: .. . .:::::.::: CCDS50 L--------------TAH---------------QPYHSH----FVQEYEIERSFFLRMKC 140 150 160 240 250 260 270 280 290 pF1KB9 TLTKRGVHIKSSGYKVIHITGRLRLR-VSLSHGRTVPS-QIMGLVVVAHALPPPTINEVR .:.::.. . .:::::: .: :..: ::. . : .:::.:.:.::: ...:.. CCDS50 VLAKRNAGLTCGGYKVIHCSGYLKIRQYSLDMSPFDGCYQNVGLVAVGHSLPPSAVTEIK 170 180 190 200 210 220 300 310 320 330 340 350 pF1KB9 IDCHMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDLLN . .::. :...:...:. ..:... : :.. : :: .:. :. .: .: :: CCDS50 LHSNMFMFRASLDMKLIFLDSRVAELTGYEPQDLIEKTLYHHVHGCDTFHLRCAHHLLLV 230 240 250 260 270 280 360 370 380 390 400 410 pF1KB9 KGQCVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDIAQ ::: .:::::.. :.::..:.:: :::. :.... . :. :::.:.. ::: ... : CCDS50 KGQVTTKYYRFLAKHGGWVWVQSYATIVHNSRSSRPHCIVSVNYVLTDTEYKGLQLSLDQ 290 300 310 320 330 340 420 430 440 450 460 470 pF1KB9 LPHLPEKTSESSETSDSESDSKDTSGITEDNENSKS------DEKGNQSENSEDPEPDRK . : .: .. . .:.. . .. .::: . .: ..: ::. . : . CCDS50 ISASKPAFSYTSSSTPTMTDNRKGAKSRLSSSKSKSRTSPYPQYSGFHTERSES-DHDSQ 350 360 370 380 390 400 480 490 500 510 520 530 pF1KB9 KSGNACDNDMNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAMQIKVERYV .:. .: . .. : :. : : . .: . .. :: :: .. ::. CCDS50 WGGSPL-TDTASPQLLDPADRPGSQH-DASCAYRQFSDRSSLCYGF-ALDHSRLVEERHF 410 420 430 440 450 460 540 550 560 570 580 590 pF1KB9 ESESDLRLQNCESLTSDSAKDSDSAGEAGAQASSKHQKRKKRRKRQKGGSASRRRLSSAS .. : ::. .... .. .:: .. :: . :..:: CCDS50 HT------QACEGGRCEAGRYFLGTPQAG--------------REPWWGSRAALPLTKAS 470 480 490 500 600 610 620 630 640 650 pF1KB9 SPGGLDAGLVEPPRLLSSPNSASVLKIKTEISEPINFDNDSSIWNYPPNREISRNESPYS : . .: : : :. ::: .:. . ..:.:: . . :. :.. . : CCDS50 -PESREA--YEN----SMPHIASVHRIHGRG----HWDEDSVVSSPDPGSA-SESGDRYR 510 520 530 540 550 660 670 680 690 700 710 pF1KB9 MTKPPSSEHFPSPQGGGGGGGGGGGLHVAIPDSVLTPPGADGAAARKTQFGASATAALAP . :: : :: CCDS50 TEQYQSSPHEPSKIETLIRATQQMIKEEENRLQLRKAPSDQLASINGAGKKHSLCFANYQ 560 570 580 590 600 610 >>CCDS13646.1 SIM2 gene_id:6493|Hs108|chr21 (667 aa) initn: 992 init1: 419 opt: 543 Z-score: 343.0 bits: 74.2 E(32554): 8.7e-13 Smith-Waterman score: 994; 39.0% identity (64.8% similar) in 474 aa overlap (23-493:2-411) 10 20 30 40 50 60 pF1KB9 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK ::::..::..:: ::: ::::::::::::.:::::::: CCDS13 MKEKSKNAAKTRREKENGEFYELAKLLPLPSAITSQLDK 10 20 30 70 80 90 100 110 pF1KB9 ASIIRLTISYLKMRDFANQG-DPPWNLRMEGPPPNTSVKVIGAQRRRSPSALAIEVFEAH ::::::: :::::: .: : : : : .: .. . CCDS13 ASIIRLTTSYLKMRAVFPEGLGDAW-----GQPS-----------RAGP----LDGVAKE 40 50 60 70 120 130 140 150 160 170 pF1KB9 LGSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQ ::::.::.::::::.. ..::..:::::.:..::::::::::.:...:.::.:: ::. CCDS13 LGSHLLQTLDGFVFVVASDGKIMYISETASVHLGLSQVELTGNSIYEYIHPSDHDEMTAV 80 90 100 110 120 130 180 190 200 210 220 230 pF1KB9 LGMKLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKS : . : . ::.. .:::::.::: CCDS13 LTAHQPLHHHLLQE---------------------------------YEIERSFFLRMKC 140 150 160 240 250 260 270 280 290 pF1KB9 TLTKRGVHIKSSGYKVIHITGRLRLRVSLSHGRTVPS--QIMGLVVVAHALPPPTINEVR .:.::.. . ::::::: .: :..: . : ::.:::.:...::: .:.:.. CCDS13 VLAKRNAGLTCSGYKVIHCSGYLKIRQYMLDMSLYDSCYQIVGLVAVGQSLPPSAITEIK 170 180 190 200 210 220 300 310 320 330 340 350 pF1KB9 IDCHMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDLLN . .::. :...::..:. ..:... : :.. : :: .:. :: .:..: :: CCDS13 LYSNMFMFRASLDLKLIFLDSRVTEVTGYEPQDLIEKTLYHHVHGCDVFHLRYAHHLLLV 230 240 250 260 270 280 360 370 380 390 400 410 pF1KB9 KGQCVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDIAQ ::: .::::: ..: ::..:.:: ::.. :.... . :. :::.:.. :::. ... : CCDS13 KGQVTTKYYRLLSKRGGWVWVQSYATVVHNSRSSRPHCIVSVNYVLTEIEYKELQLSLEQ 290 300 310 320 330 340 420 430 440 450 460 470 pF1KB9 LPHLPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENSEDPEPDRKKSGNAC . :...: .:. : :..: ... .:.: ... .: : .. :. CCDS13 VS--TAKSQDSWRTA--LSTSQETRKLVKP-KNTKM-----KTKLRTNPYPPQQYSSFQM 350 360 370 380 390 480 490 500 510 520 530 pF1KB9 DNDMNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAMQIKVERYVESESDL :. ..:.. :. ..: CCDS13 DK-LECGQLGNWRASPPASAAAPPELQPHSESSDLLYTPSYSLPFSYHYGHFPLDSHVFS 400 410 420 430 440 450 903 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 00:56:53 2016 done: Sat Nov 5 00:56:53 2016 Total Scan time: 3.670 Total Display time: 0.150 Function used was FASTA [36.3.4 Apr, 2011]