FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0199, 1106 aa
1>>>pF1KE0199 1106 - 1106 aa - 1106 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.4204+/-0.00111; mu= -9.0356+/- 0.066
mean_var=542.6293+/-116.184, 0's: 0 Z-trim(115.9): 635 B-trim: 0 in 0/52
Lambda= 0.055058
statistics sampled from 15754 (16489) to 15754 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.79), E-opt: 0.2 (0.507), width: 16
Scan time: 4.770
The best scores are: opt bits E(32554)
CCDS8940.1 GLI1 gene_id:2735|Hs108|chr12 (1106) 7851 639.5 1.3e-182
CCDS53806.1 GLI1 gene_id:2735|Hs108|chr12 (1065) 7320 597.3 6.1e-170
CCDS53807.1 GLI1 gene_id:2735|Hs108|chr12 ( 978) 6974 569.7 1.1e-161
CCDS5465.1 GLI3 gene_id:2737|Hs108|chr7 (1580) 1285 118.1 1.6e-25
CCDS33283.1 GLI2 gene_id:2736|Hs108|chr2 (1586) 1207 111.9 1.2e-23
CCDS6451.1 GLIS3 gene_id:169792|Hs108|chr9 ( 775) 783 77.9 1e-13
CCDS43784.1 GLIS3 gene_id:169792|Hs108|chr9 ( 930) 783 78.0 1.1e-13
CCDS582.1 GLIS1 gene_id:148979|Hs108|chr1 ( 620) 767 76.5 2.1e-13
CCDS10511.1 GLIS2 gene_id:84662|Hs108|chr16 ( 524) 696 70.8 9.3e-12
>>CCDS8940.1 GLI1 gene_id:2735|Hs108|chr12 (1106 aa)
initn: 7851 init1: 7851 opt: 7851 Z-score: 3392.2 bits: 639.5 E(32554): 1.3e-182
Smith-Waterman score: 7851; 100.0% identity (100.0% similar) in 1106 aa overlap (1-1106:1-1106)
10 20 30 40 50 60
pF1KE0 MFNSMTPPPISSYGEPCCLRPLPSQGAPSVGTEGLSGPPFCHQANLMSGPHSYGPARETN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 MFNSMTPPPISSYGEPCCLRPLPSQGAPSVGTEGLSGPPFCHQANLMSGPHSYGPARETN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 SCTEGPLFSSPRSAVKLTKKRALSISPLSDASLDLQTVIRTSPSSLVAFINSRCTSPGGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 SCTEGPLFSSPRSAVKLTKKRALSISPLSDASLDLQTVIRTSPSSLVAFINSRCTSPGGS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 YGHLSIGTMSPSLGFPAQMNHQKGPSPSFGVQPCGPHDSARGGMIPHPQSRGPFPTCQLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 YGHLSIGTMSPSLGFPAQMNHQKGPSPSFGVQPCGPHDSARGGMIPHPQSRGPFPTCQLK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 SELDMLVGKCREEPLEGDMSSPNSTGIQDPLLGMLDGREDLEREEKREPESVYETDCRWD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 SELDMLVGKCREEPLEGDMSSPNSTGIQDPLLGMLDGREDLEREEKREPESVYETDCRWD
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 GCSQEFDSQEQLVHHINSEHIHGERKEFVCHWGGCSRELRPFKAQYMLVVHMRRHTGEKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 GCSQEFDSQEQLVHHINSEHIHGERKEFVCHWGGCSRELRPFKAQYMLVVHMRRHTGEKP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 HKCTFEGCRKSYSRLENLKTHLRSHTGEKPYMCEHEGCSKAFSNASDRAKHQNRTHSNEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 HKCTFEGCRKSYSRLENLKTHLRSHTGEKPYMCEHEGCSKAFSNASDRAKHQNRTHSNEK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 PYVCKLPGCTKRYTDPSSLRKHVKTVHGPDAHVTKRHRGDGPLPRAPSISTVEPKREREG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 PYVCKLPGCTKRYTDPSSLRKHVKTVHGPDAHVTKRHRGDGPLPRAPSISTVEPKREREG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE0 GPIREESRLTVPEGAMKPQPSPGAQSSCSSDHSPAGSAANTDSGVEMTGNAGGSTEDLSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 GPIREESRLTVPEGAMKPQPSPGAQSSCSSDHSPAGSAANTDSGVEMTGNAGGSTEDLSS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE0 LDEGPCIAGTGLSTLRRLENLRLDQLHQLRPIGTRGLKLPSLSHTGTTVSRRVGPPVSLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 LDEGPCIAGTGLSTLRRLENLRLDQLHQLRPIGTRGLKLPSLSHTGTTVSRRVGPPVSLE
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE0 RRSSSSSSISSAYTVSRRSSLASPFPPGSPPENGASSLPGLMPAQHYLLRARYASARGGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 RRSSSSSSISSAYTVSRRSSLASPFPPGSPPENGASSLPGLMPAQHYLLRARYASARGGG
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE0 TSPTAASSLDRIGGLPMPPWRSRAEYPGYNPNAGVTRRASDPAQAADRPAPARVQRFKSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 TSPTAASSLDRIGGLPMPPWRSRAEYPGYNPNAGVTRRASDPAQAADRPAPARVQRFKSL
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE0 GCVHTPPTVAGGGQNFDPYLPTSVYSPQPPSITENAAMDARGLQEEPEVGTSMVGSGLNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 GCVHTPPTVAGGGQNFDPYLPTSVYSPQPPSITENAAMDARGLQEEPEVGTSMVGSGLNP
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE0 YMDFPPTDTLGYGGPEGAAAEPYGARGPGSLPLGPGPPTNYGPNPCPQQASYPDPTQETW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 YMDFPPTDTLGYGGPEGAAAEPYGARGPGSLPLGPGPPTNYGPNPCPQQASYPDPTQETW
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE0 GEFPSHSGLYPGPKALGGTYSQCPRLEHYGQVQVKPEQGCPVGSDSTGLAPCLNAHPSEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 GEFPSHSGLYPGPKALGGTYSQCPRLEHYGQVQVKPEQGCPVGSDSTGLAPCLNAHPSEG
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE0 PPHPQPLFSHYPQPSPPQYLQSGPYTQPPPDYLPSEPRPCLDFDSPTHSTGQLKAQLVCN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 PPHPQPLFSHYPQPSPPQYLQSGPYTQPPPDYLPSEPRPCLDFDSPTHSTGQLKAQLVCN
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE0 YVQSQQELLWEGGGREDAPAQEPSYQSPKFLGGSQVSPSRAKAPVNTYGPGFGPNLPNHK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 YVQSQQELLWEGGGREDAPAQEPSYQSPKFLGGSQVSPSRAKAPVNTYGPGFGPNLPNHK
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE0 SGSYPTPSPCHENFVVGANRASHRAAAPPRLLPPLPTCYGPLKVGGTNPSCGHPEVGRLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 SGSYPTPSPCHENFVVGANRASHRAAAPPRLLPPLPTCYGPLKVGGTNPSCGHPEVGRLG
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE0 GGPALYPPPEGQVCNPLDSLDLDNTQLDFVAILDEPQGLSPPPSHDQRGSSGHTPPPSGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 GGPALYPPPEGQVCNPLDSLDLDNTQLDFVAILDEPQGLSPPPSHDQRGSSGHTPPPSGP
1030 1040 1050 1060 1070 1080
1090 1100
pF1KE0 PNMAVGNMSVLLRSLPGETEFLNSSA
::::::::::::::::::::::::::
CCDS89 PNMAVGNMSVLLRSLPGETEFLNSSA
1090 1100
>>CCDS53806.1 GLI1 gene_id:2735|Hs108|chr12 (1065 aa)
initn: 7310 init1: 7310 opt: 7320 Z-score: 3164.4 bits: 597.3 E(32554): 6.1e-170
Smith-Waterman score: 7460; 96.3% identity (96.3% similar) in 1106 aa overlap (1-1106:1-1065)
10 20 30 40 50 60
pF1KE0 MFNSMTPPPISSYGEPCCLRPLPSQGAPSVGTEGLSGPPFCHQANLMSGPHSYGPARETN
:::::::::::::::::::::::::::::::::
CCDS53 MFNSMTPPPISSYGEPCCLRPLPSQGAPSVGTE---------------------------
10 20 30
70 80 90 100 110 120
pF1KE0 SCTEGPLFSSPRSAVKLTKKRALSISPLSDASLDLQTVIRTSPSSLVAFINSRCTSPGGS
::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 --------------VKLTKKRALSISPLSDASLDLQTVIRTSPSSLVAFINSRCTSPGGS
40 50 60 70
130 140 150 160 170 180
pF1KE0 YGHLSIGTMSPSLGFPAQMNHQKGPSPSFGVQPCGPHDSARGGMIPHPQSRGPFPTCQLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 YGHLSIGTMSPSLGFPAQMNHQKGPSPSFGVQPCGPHDSARGGMIPHPQSRGPFPTCQLK
80 90 100 110 120 130
190 200 210 220 230 240
pF1KE0 SELDMLVGKCREEPLEGDMSSPNSTGIQDPLLGMLDGREDLEREEKREPESVYETDCRWD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SELDMLVGKCREEPLEGDMSSPNSTGIQDPLLGMLDGREDLEREEKREPESVYETDCRWD
140 150 160 170 180 190
250 260 270 280 290 300
pF1KE0 GCSQEFDSQEQLVHHINSEHIHGERKEFVCHWGGCSRELRPFKAQYMLVVHMRRHTGEKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GCSQEFDSQEQLVHHINSEHIHGERKEFVCHWGGCSRELRPFKAQYMLVVHMRRHTGEKP
200 210 220 230 240 250
310 320 330 340 350 360
pF1KE0 HKCTFEGCRKSYSRLENLKTHLRSHTGEKPYMCEHEGCSKAFSNASDRAKHQNRTHSNEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 HKCTFEGCRKSYSRLENLKTHLRSHTGEKPYMCEHEGCSKAFSNASDRAKHQNRTHSNEK
260 270 280 290 300 310
370 380 390 400 410 420
pF1KE0 PYVCKLPGCTKRYTDPSSLRKHVKTVHGPDAHVTKRHRGDGPLPRAPSISTVEPKREREG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PYVCKLPGCTKRYTDPSSLRKHVKTVHGPDAHVTKRHRGDGPLPRAPSISTVEPKREREG
320 330 340 350 360 370
430 440 450 460 470 480
pF1KE0 GPIREESRLTVPEGAMKPQPSPGAQSSCSSDHSPAGSAANTDSGVEMTGNAGGSTEDLSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GPIREESRLTVPEGAMKPQPSPGAQSSCSSDHSPAGSAANTDSGVEMTGNAGGSTEDLSS
380 390 400 410 420 430
490 500 510 520 530 540
pF1KE0 LDEGPCIAGTGLSTLRRLENLRLDQLHQLRPIGTRGLKLPSLSHTGTTVSRRVGPPVSLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LDEGPCIAGTGLSTLRRLENLRLDQLHQLRPIGTRGLKLPSLSHTGTTVSRRVGPPVSLE
440 450 460 470 480 490
550 560 570 580 590 600
pF1KE0 RRSSSSSSISSAYTVSRRSSLASPFPPGSPPENGASSLPGLMPAQHYLLRARYASARGGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 RRSSSSSSISSAYTVSRRSSLASPFPPGSPPENGASSLPGLMPAQHYLLRARYASARGGG
500 510 520 530 540 550
610 620 630 640 650 660
pF1KE0 TSPTAASSLDRIGGLPMPPWRSRAEYPGYNPNAGVTRRASDPAQAADRPAPARVQRFKSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TSPTAASSLDRIGGLPMPPWRSRAEYPGYNPNAGVTRRASDPAQAADRPAPARVQRFKSL
560 570 580 590 600 610
670 680 690 700 710 720
pF1KE0 GCVHTPPTVAGGGQNFDPYLPTSVYSPQPPSITENAAMDARGLQEEPEVGTSMVGSGLNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GCVHTPPTVAGGGQNFDPYLPTSVYSPQPPSITENAAMDARGLQEEPEVGTSMVGSGLNP
620 630 640 650 660 670
730 740 750 760 770 780
pF1KE0 YMDFPPTDTLGYGGPEGAAAEPYGARGPGSLPLGPGPPTNYGPNPCPQQASYPDPTQETW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 YMDFPPTDTLGYGGPEGAAAEPYGARGPGSLPLGPGPPTNYGPNPCPQQASYPDPTQETW
680 690 700 710 720 730
790 800 810 820 830 840
pF1KE0 GEFPSHSGLYPGPKALGGTYSQCPRLEHYGQVQVKPEQGCPVGSDSTGLAPCLNAHPSEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GEFPSHSGLYPGPKALGGTYSQCPRLEHYGQVQVKPEQGCPVGSDSTGLAPCLNAHPSEG
740 750 760 770 780 790
850 860 870 880 890 900
pF1KE0 PPHPQPLFSHYPQPSPPQYLQSGPYTQPPPDYLPSEPRPCLDFDSPTHSTGQLKAQLVCN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PPHPQPLFSHYPQPSPPQYLQSGPYTQPPPDYLPSEPRPCLDFDSPTHSTGQLKAQLVCN
800 810 820 830 840 850
910 920 930 940 950 960
pF1KE0 YVQSQQELLWEGGGREDAPAQEPSYQSPKFLGGSQVSPSRAKAPVNTYGPGFGPNLPNHK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 YVQSQQELLWEGGGREDAPAQEPSYQSPKFLGGSQVSPSRAKAPVNTYGPGFGPNLPNHK
860 870 880 890 900 910
970 980 990 1000 1010 1020
pF1KE0 SGSYPTPSPCHENFVVGANRASHRAAAPPRLLPPLPTCYGPLKVGGTNPSCGHPEVGRLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SGSYPTPSPCHENFVVGANRASHRAAAPPRLLPPLPTCYGPLKVGGTNPSCGHPEVGRLG
920 930 940 950 960 970
1030 1040 1050 1060 1070 1080
pF1KE0 GGPALYPPPEGQVCNPLDSLDLDNTQLDFVAILDEPQGLSPPPSHDQRGSSGHTPPPSGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GGPALYPPPEGQVCNPLDSLDLDNTQLDFVAILDEPQGLSPPPSHDQRGSSGHTPPPSGP
980 990 1000 1010 1020 1030
1090 1100
pF1KE0 PNMAVGNMSVLLRSLPGETEFLNSSA
::::::::::::::::::::::::::
CCDS53 PNMAVGNMSVLLRSLPGETEFLNSSA
1040 1050 1060
>>CCDS53807.1 GLI1 gene_id:2735|Hs108|chr12 (978 aa)
initn: 6974 init1: 6974 opt: 6974 Z-score: 3016.3 bits: 569.7 E(32554): 1.1e-161
Smith-Waterman score: 6974; 100.0% identity (100.0% similar) in 978 aa overlap (129-1106:1-978)
100 110 120 130 140 150
pF1KE0 IRTSPSSLVAFINSRCTSPGGSYGHLSIGTMSPSLGFPAQMNHQKGPSPSFGVQPCGPHD
::::::::::::::::::::::::::::::
CCDS53 MSPSLGFPAQMNHQKGPSPSFGVQPCGPHD
10 20 30
160 170 180 190 200 210
pF1KE0 SARGGMIPHPQSRGPFPTCQLKSELDMLVGKCREEPLEGDMSSPNSTGIQDPLLGMLDGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SARGGMIPHPQSRGPFPTCQLKSELDMLVGKCREEPLEGDMSSPNSTGIQDPLLGMLDGR
40 50 60 70 80 90
220 230 240 250 260 270
pF1KE0 EDLEREEKREPESVYETDCRWDGCSQEFDSQEQLVHHINSEHIHGERKEFVCHWGGCSRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 EDLEREEKREPESVYETDCRWDGCSQEFDSQEQLVHHINSEHIHGERKEFVCHWGGCSRE
100 110 120 130 140 150
280 290 300 310 320 330
pF1KE0 LRPFKAQYMLVVHMRRHTGEKPHKCTFEGCRKSYSRLENLKTHLRSHTGEKPYMCEHEGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LRPFKAQYMLVVHMRRHTGEKPHKCTFEGCRKSYSRLENLKTHLRSHTGEKPYMCEHEGC
160 170 180 190 200 210
340 350 360 370 380 390
pF1KE0 SKAFSNASDRAKHQNRTHSNEKPYVCKLPGCTKRYTDPSSLRKHVKTVHGPDAHVTKRHR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SKAFSNASDRAKHQNRTHSNEKPYVCKLPGCTKRYTDPSSLRKHVKTVHGPDAHVTKRHR
220 230 240 250 260 270
400 410 420 430 440 450
pF1KE0 GDGPLPRAPSISTVEPKREREGGPIREESRLTVPEGAMKPQPSPGAQSSCSSDHSPAGSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GDGPLPRAPSISTVEPKREREGGPIREESRLTVPEGAMKPQPSPGAQSSCSSDHSPAGSA
280 290 300 310 320 330
460 470 480 490 500 510
pF1KE0 ANTDSGVEMTGNAGGSTEDLSSLDEGPCIAGTGLSTLRRLENLRLDQLHQLRPIGTRGLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ANTDSGVEMTGNAGGSTEDLSSLDEGPCIAGTGLSTLRRLENLRLDQLHQLRPIGTRGLK
340 350 360 370 380 390
520 530 540 550 560 570
pF1KE0 LPSLSHTGTTVSRRVGPPVSLERRSSSSSSISSAYTVSRRSSLASPFPPGSPPENGASSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LPSLSHTGTTVSRRVGPPVSLERRSSSSSSISSAYTVSRRSSLASPFPPGSPPENGASSL
400 410 420 430 440 450
580 590 600 610 620 630
pF1KE0 PGLMPAQHYLLRARYASARGGGTSPTAASSLDRIGGLPMPPWRSRAEYPGYNPNAGVTRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PGLMPAQHYLLRARYASARGGGTSPTAASSLDRIGGLPMPPWRSRAEYPGYNPNAGVTRR
460 470 480 490 500 510
640 650 660 670 680 690
pF1KE0 ASDPAQAADRPAPARVQRFKSLGCVHTPPTVAGGGQNFDPYLPTSVYSPQPPSITENAAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ASDPAQAADRPAPARVQRFKSLGCVHTPPTVAGGGQNFDPYLPTSVYSPQPPSITENAAM
520 530 540 550 560 570
700 710 720 730 740 750
pF1KE0 DARGLQEEPEVGTSMVGSGLNPYMDFPPTDTLGYGGPEGAAAEPYGARGPGSLPLGPGPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 DARGLQEEPEVGTSMVGSGLNPYMDFPPTDTLGYGGPEGAAAEPYGARGPGSLPLGPGPP
580 590 600 610 620 630
760 770 780 790 800 810
pF1KE0 TNYGPNPCPQQASYPDPTQETWGEFPSHSGLYPGPKALGGTYSQCPRLEHYGQVQVKPEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TNYGPNPCPQQASYPDPTQETWGEFPSHSGLYPGPKALGGTYSQCPRLEHYGQVQVKPEQ
640 650 660 670 680 690
820 830 840 850 860 870
pF1KE0 GCPVGSDSTGLAPCLNAHPSEGPPHPQPLFSHYPQPSPPQYLQSGPYTQPPPDYLPSEPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GCPVGSDSTGLAPCLNAHPSEGPPHPQPLFSHYPQPSPPQYLQSGPYTQPPPDYLPSEPR
700 710 720 730 740 750
880 890 900 910 920 930
pF1KE0 PCLDFDSPTHSTGQLKAQLVCNYVQSQQELLWEGGGREDAPAQEPSYQSPKFLGGSQVSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PCLDFDSPTHSTGQLKAQLVCNYVQSQQELLWEGGGREDAPAQEPSYQSPKFLGGSQVSP
760 770 780 790 800 810
940 950 960 970 980 990
pF1KE0 SRAKAPVNTYGPGFGPNLPNHKSGSYPTPSPCHENFVVGANRASHRAAAPPRLLPPLPTC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SRAKAPVNTYGPGFGPNLPNHKSGSYPTPSPCHENFVVGANRASHRAAAPPRLLPPLPTC
820 830 840 850 860 870
1000 1010 1020 1030 1040 1050
pF1KE0 YGPLKVGGTNPSCGHPEVGRLGGGPALYPPPEGQVCNPLDSLDLDNTQLDFVAILDEPQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 YGPLKVGGTNPSCGHPEVGRLGGGPALYPPPEGQVCNPLDSLDLDNTQLDFVAILDEPQG
880 890 900 910 920 930
1060 1070 1080 1090 1100
pF1KE0 LSPPPSHDQRGSSGHTPPPSGPPNMAVGNMSVLLRSLPGETEFLNSSA
::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LSPPPSHDQRGSSGHTPPPSGPPNMAVGNMSVLLRSLPGETEFLNSSA
940 950 960 970
>>CCDS5465.1 GLI3 gene_id:2737|Hs108|chr7 (1580 aa)
initn: 1493 init1: 1138 opt: 1285 Z-score: 571.5 bits: 118.1 E(32554): 1.6e-25
Smith-Waterman score: 1805; 37.5% identity (55.5% similar) in 1145 aa overlap (20-952:220-1322)
10 20 30 40
pF1KE0 MFNSMTPPPISSYGEPCCLRPLPSQGAPSVGTEGLSGPPFCHQANLMSG
: : :: . :.: . :: :..:
CCDS54 FSPPHPYINPYMDYIRSLHSSPSLSMISATRGLSPTDAPHA---GVSPAEYYHQMALLTG
190 200 210 220 230 240
50 60 70 80 90
pF1KE0 PHS-YG---PARETNSC----------TEGPLFSSPRSAVKLTKKRALSISPLSDASLDL
.: :. :. : . .. ::::: ... ..::.:::::::: :.::
CCDS54 QRSPYADIIPSAATAGTGAIHMEYLHAMDSTRFSSPRLSARPSRKRTLSISPLSDHSFDL
250 260 270 280 290 300
100 110 120 130 140
pF1KE0 QTVIRTSPSSLVAFIN-SRCTSPG-GSYGHLSIGTMSPSLGF-----PAQMN-HQK----
::.:::::.:::...: :: .: . ::::::: ...::.:.: :.... ::.
CCDS54 QTMIRTSPNSLVTILNNSRSSSSASGSYGHLSASAISPALSFTYSSAPVSLHMHQQILSR
310 320 330 340 350 360
150 160 170 180
pF1KE0 --------GPSPSFGVQPCGPHDSARG--G----MIPHPQSRGPFPTCQLKSELDMLVG-
: :: . ..: . : : . : : :: . : : . :.
CCDS54 QQSLGSAFGHSPPL-IHPAPTFPTQRPIPGIPTVLNPVQVSSGPSESSQNKPTSESAVSS
370 380 390 400 410 420
190 200 210 220 230
pF1KE0 --------KCREEPLEGDMSSPNSTGIQDPLLGMLDGREDLEREE-KREPESVYETDCRW
. . .: : :. ::.. : :. : .:. ...: :.::: .:::.:.:
CCDS54 TGDPMHNKRSKIKPDE-DLPSPGARGQQEQPEGTTLVKEEGDKDESKQEPEVIYETNCHW
430 440 450 460 470 480
240 250 260 270 280 290
pF1KE0 DGCSQEFDSQEQLVHHINSEHIHGERKEFVCHWGGCSRELRPFKAQYMLVVHMRRHTGEK
.::..:::.:::::::::..:::::.:::::.: :::: .:::::::::::::::::::
CCDS54 EGCAREFDTQEQLVHHINNDHIHGEKKEFVCRWLDCSREQKPFKAQYMLVVHMRRHTGEK
490 500 510 520 530 540
300 310 320 330 340 350
pF1KE0 PHKCTFEGCRKSYSRLENLKTHLRSHTGEKPYMCEHEGCSKAFSNASDRAKHQNRTHSNE
::::::::: :.::::::::::::::::::::.::::::.::::::::::::::::::::
CCDS54 PHKCTFEGCTKAYSRLENLKTHLRSHTGEKPYVCEHEGCNKAFSNASDRAKHQNRTHSNE
550 560 570 580 590 600
360 370 380 390 400 410
pF1KE0 KPYVCKLPGCTKRYTDPSSLRKHVKTVHGPDAHVTKRHRGD-GPLPRAPSISTVEPKRER
::::::.:::::::::::::::::::::::.:::::..::: : : : : . . .
CCDS54 KPYVCKIPGCTKRYTDPSSLRKHVKTVHGPEAHVTKKQRGDIHPRPPPPRDSGSHSQSRS
610 620 630 640 650 660
420 430 440 450
pF1KE0 EGGPI----------------REES---RLTVPEGAMKPQPSPGAQSSCSSDHSPAGSAA
: : ::: . . : : :::::.::::::..:: .. .
CCDS54 PGRPTQGALGEQQDLSNTTSKREECLQVKTVKAEKPMTSQPSPGGQSSCSSQQSPISNYS
670 680 690 700 710 720
460 470 480 490 500
pF1KE0 NTDSGVEMTGNAGGSTEDLSSLDEGPCI------AGTGLSTLRR--------LENLRLDQ
: ::.:. . ::: :::..:: : . : :.:. : .:...:..
CCDS54 N--SGLELPLTDGGSIGDLSAIDETPIMDSTISTATTALALQARRNPAGTKWMEHVKLER
730 740 750 760 770 780
510 520 530
pF1KE0 LHQ-------LRPI--------------GTRGLKLPSLSHTGTTVSRRV---GPPVS---
:.: : :: ::.. . ::. : . : : :.
CCDS54 LKQVNGMFPRLNPILPPKAPAVSPLIGNGTQSNNTCSLGGPMTLLPGRSDLSGVDVTMLN
790 800 810 820 830 840
540 550 560 570
pF1KE0 -LERRSSSSSSISSAYTVSRRSSLASP-------------------------FPPGSPPE
:.::.::.:.::::: ::::: :: . : :
CCDS54 MLNRRDSSASTISSAYLSSRRSSGISPCFSSRRSSEASQAEGRPQNVSVADSYDPISTDA
850 860 870 880 890 900
580 590 600 610
pF1KE0 NGASS-------LPGLM---PAQHYLLRARYASARGGGTSPTAASSLDRIG---------
. :: ::.:. :::.: :.:.::.: :: :: ...:..
CCDS54 SRRSSEASQSDGLPSLLSLTPAQQYRLKAKYAAATGG-PPPTPLPNMERMSLKTRLALLG
910 920 930 940 950 960
620 630 640 650
pF1KE0 -----GLPMPPWRS--------------RAEYPGYNPNAGVTRRASDPAQAADRP-APAR
:. .:: .. : : :. :: ::::::...... : :
CCDS54 DALEPGVALPPVHAPRRCSDGGAHGYGRRHLQPHDAPGHGV-RRASDPVRTGSEGLALPR
970 980 990 1000 1010 1020
660 670 680 690 700
pF1KE0 VQRFKSLG-CVHTPPTVAGGG-------QNFD-PYLPTSVY---SPQPPSITENAAMDAR
: ::.::. : .::..: .. ::. : : :: :::::::.....
CCDS54 VPRFSSLSSC--NPPAMATSAEKRSLVLQNYTRPEGGQSRNFHSSPCPPSITENVTLESL
1030 1040 1050 1060 1070
710 720 730 740 750
pF1KE0 GLQEEPEVGTSMVGSGLNPYMDFPPTDTLGYGGPEGAAAE----PYGARGPGSLPLGPG-
.. . ..:: :: : :.. : . .. :. : . ...: :::
CCDS54 TMDAD---------ANLNDE-DFLPDDVVQYLNSQNQAGYEQHFPSALPDDSKVPHGPGD
1080 1090 1100 1110 1120
760 770 780 790 800
pF1KE0 ------PPTNYGPN------PCPQQASYPDPTQETWGEFPSHSGLYPGPKALGGTYSQCP
: .. : . :::. .. : : :.: : :. . : : :
CCDS54 FDAPGLPDSHAGQQFHALEQPCPEGSKTDLPIQ--WNEVSSGSADLSSSKLKCGPRPAVP
1130 1140 1150 1160 1170 1180
810 820 830 840 850
pF1KE0 RLEHYG---QVQVKPEQGCPVGSDSTGLAPCL--NAHPSEGPPHPQPLFSHYPQPSPPQY
. . .: . :.:.. :. : .: : :..: :: : :. : . :
CCDS54 QTRAFGFCNGMVVHPQN--PLRSGPAGGYQTLGENSNPYGGPEH---LMLH----NSPGS
1190 1200 1210 1220 1230
860 870 880 890 900 910
pF1KE0 LQSGPYTQPPPDYLPSEPRPCLDFD--SPTHSTGQLKAQLVCNYVQSQQELLWEGGGRED
:: . : :. ::. . .: : : . . ..: . .::. .
CCDS54 GTSGNAFHEQPCKAPQYGN-CLNRQPVAPGALDGACGAGIQASKLKSTP--MQGSGGQLN
1240 1250 1260 1270 1280 1290
920 930 940 950 960 970
pF1KE0 APAQEPSYQSPKFLGGSQVSPSRAKAPVNTYGPGFGPNLPNHKSGSYPTPSPCHENFVVG
: .:. .::.:. . . :: : :.
CCDS54 FGL--PV--APNESAGSMVNGMQNQDPV---GQGYLAHQLLGDSMQHPGAGRPGQQMLGQ
1300 1310 1320 1330 1340
980 990 1000 1010 1020 1030
pF1KE0 ANRASHRAAAPPRLLPPLPTCYGPLKVGGTNPSCGHPEVGRLGGGPALYPPPEGQVCNPL
CCDS54 ISATSHINIYQGPESCLPGAHGMGSQPSSLAVVRGYQPCASFGGSRRQAMPRDSLALQSG
1350 1360 1370 1380 1390 1400
>>CCDS33283.1 GLI2 gene_id:2736|Hs108|chr2 (1586 aa)
initn: 1817 init1: 1096 opt: 1207 Z-score: 538.0 bits: 111.9 E(32554): 1.2e-23
Smith-Waterman score: 1894; 38.0% identity (55.6% similar) in 1195 aa overlap (40-1001:176-1322)
10 20 30 40 50 60
pF1KE0 ISSYGEPCCLRPLPSQGAPSVGTEGLSGPPFCHQANLMSG-PHSYGPA-RETNSCTEGPL
. :: .:..: : :: .... . .:
CCDS33 RGLSPADVAQEHLKERGLFGLPAPGTTPSDYYHQMTLVAGHPAPYGDLLMQSGGAASAPH
150 160 170 180 190 200
70 80 90 100 110
pF1KE0 ------------FSSPRSAVKLTKKRALSISPLSDASLDLQTVIRTSPSSLVAFIN-SRC
::::: . .:..::::::::::::::::: .:::::.::::.:: ::
CCDS33 LHDYLNPVDVSRFSSPRVTPRLSRKRALSISPLSDASLDLQRMIRTSPNSLVAYINNSRS
210 220 230 240 250 260
120 130 140 150
pF1KE0 TSPG-GSYGHLSIGTMSPSLGFPAQMN---------HQKGPSPSFG-----VQPC----G
.: . ::::::: :..::.. :: .: .:.: . .:: .:: .
CCDS33 SSAASGSYGHLSAGALSPAFTFPHPINPVAYQQILSQQRGLGSAFGHTPPLIQPSPTFLA
270 280 290 300 310 320
160 170 180 190
pF1KE0 PHDSARGGMIPHPQSRGPFPTC-----QLKSELDMLVG------------KCREEP----
. : .. : . . .: : :. . :. : . ::
CCDS33 QQPMALTSINATPTQLSSSSNCLSDTNQNKQSSESAVSSTVNPVAIHKRSKVKTEPEGLR
330 340 350 360 370 380
200 210 220 230 240
pF1KE0 -------LEGDMSSPNSTGIQDPLLG--MLDGREDLEREE-KREPESV-YETDCRWDGCS
.:..:. .: : :: . : .:::.:.. :.: : : :::.:.:. :.
CCDS33 PASPLALTQGQVSGHGSCGCALPLSQEQLADLKEDLDRDDCKQEAEVVIYETNCHWEDCT
390 400 410 420 430 440
250 260 270 280 290 300
pF1KE0 QEFDSQEQLVHHINSEHIHGERKEFVCHWGGCSRELRPFKAQYMLVVHMRRHTGEKPHKC
.:.:.:::::::::.::::::.:::::.: .:.:: .:::::::::::::::::::::::
CCDS33 KEYDTQEQLVHHINNEHIHGEKKEFVCRWQACTREQKPFKAQYMLVVHMRRHTGEKPHKC
450 460 470 480 490 500
310 320 330 340 350 360
pF1KE0 TFEGCRKSYSRLENLKTHLRSHTGEKPYMCEHEGCSKAFSNASDRAKHQNRTHSNEKPYV
::::: :.::::::::::::::::::::.::::::.:::::::::::::::::::::::.
CCDS33 TFEGCSKAYSRLENLKTHLRSHTGEKPYVCEHEGCNKAFSNASDRAKHQNRTHSNEKPYI
510 520 530 540 550 560
370 380 390 400 410 420
pF1KE0 CKLPGCTKRYTDPSSLRKHVKTVHGPDAHVTKRHRGDGPLPRAPSISTVEPKRE--REGG
::.:::::::::::::::::::::::::::::..:.: : :.: .. .. . ::
CCDS33 CKIPGCTKRYTDPSSLRKHVKTVHGPDAHVTKKQRNDVHL-RTPLLKENGDSEAGTEPGG
570 580 590 600 610 620
430 440 450 460
pF1KE0 PIREES-------------RLTVPEGAMKPQPSPGAQSSCSSDHSPAGSAANTDSGVEMT
: :. : :.. : ::::::::::. :: ::: :.::::::
CCDS33 PESTEASSTSQAVEDCLHVRAIKTESSGLCQSSPGAQSSCSSEPSPLGSAPNNDSGVEMP
630 640 650 660 670 680
470 480 490 500 510
pF1KE0 GNAGGSTEDLSSLDEGPCIAGT---------GL------STLRRLENLRLDQLHQLR---
:.. :: ::..::. : : : :: .:..:.:.:. ..:..:.
CCDS33 GTGPGSLGDLTALDDTPPGADTSALAAPSAGGLQLRKHMTTMHRFEQLKKEKLKSLKDSC
690 700 710 720 730 740
520 530 540
pF1KE0 ----PIG-TRGLKLPSLSHTGTTVSRRVGP----PVSL---------------------E
: ::. ::: : .:. . : :..: :
CCDS33 SWAGPTPHTRNTKLPPLPGSGSILENFSGSGGGGPAGLLPNPRLSELSASEVTMLSQLQE
750 760 770 780 790 800
550 560 570
pF1KE0 RRSSSSSSISSAYTVSRRSSLASPF------PPGSP-----PEN----------------
::.::.:..::::::::::: ::. .:: :.:
CCDS33 RRDSSTSTVSSAYTVSRRSSGISPYFSSRRSSEASPLGAGRPHNASSADSYDPISTDASR
810 820 830 840 850 860
580 590 600 610
pF1KE0 ---------GASSLPGLMPAQHYLLRARYASARGGGTSPTAASSLDRIG-----------
:.:.: .: :::.: :::.::.: :: :: .:.:..
CCDS33 RSSEASQCSGGSGLLNLTPAQQYSLRAKYAAATGG-PPPTPLPGLERMSLRTRLALLDAP
870 880 890 900 910 920
620 630 640 650
pF1KE0 ------GLPMP--PWRSR-------------AEYPGYNPNAGVTRRASDPAQAADRPAPA
: : : : :. .: :..:. ::::::.. : .
CCDS33 ERTLPAGCPRPLGPRRGSDGPTYGHGHAGAAPAFPHEAPGGGA-RRASDPVRRPDALSLP
930 940 950 960 970 980
660 670 680 690 700
pF1KE0 RVQRFKSLGCVHT---PPTVAGGGQNF------DPYLPTSVYSPQPPSITENAAMDARGL
:::::.: :. :: . : . : : ..:::.::::.::.::.:
CCDS33 RVQRFHSTHNVNPGPLPPCADRRGLRLQSHPSTDGGLARGAYSPRPPSISENVAMEA---
990 1000 1010 1020 1030
710 720 730 740 750 760
pF1KE0 QEEPEVGTSMVGSGLNPYMDFPPTD-TLGYGGPEGAAAEPYGARGPGSLPLGPGPPTNYG
:.... :.: . . .: : .: . :. :: :. . : :...
CCDS33 -----VAAGVDGAGPEADLGLPEDDLVLPDDVVQYIKAHASGALDEGTGQVYPTESTGFS
1040 1050 1060 1070 1080 1090
770 780 790 800 810 820
pF1KE0 PNPCPQQASYPDPTQETWGEF-PSHSGLYPGPKALGGTYSQCPRLEHYGQVQVKPEQGCP
:: :.: . .. . :.. :. ::: : .: . ... :
CCDS33 DNP-----RLPSPGLHGQRRMVAADSNVGPSAPMLGG----CQL--GFGAPSSLNKNNMP
1100 1110 1120 1130 1140
830 840 850 860
pF1KE0 VGSD--STGLAPCLNAHPSEGPPHPQ---------PLFSHYPQPSPPQYLQSGP----YT
: . :.: . : : . :: :: : :..:: :: : ::..: :
CCDS33 VQWNEVSSGTVDAL-ASQVKPPPFPQGNLAVVQQKPAFGQYPGYSP-QGLQASPGGLDST
1150 1160 1170 1180 1190 1200
870 880 890 900 910 920
pF1KE0 QPPPDYLPSEPRPCLDFDSPTHSTGQLKAQLVCNYVQSQQELLWEGGGREDAPAQEPSYQ
:: .: .:: .:... .. ::.: .: .: . :.. ..
CCDS33 QP---HL--QPRS----GAPSQGIPRV------NYMQ---QLRQPVAGSQ-CPGMTTTM-
1210 1220 1230 1240
930 940 950 960 970 980
pF1KE0 SPKFLGGS---QVSPSRAKAPVNTYGPGFGPNLPNHKSG--SYPTPSPCHENFVVGANRA
::. :. :.::: .. .: . : :.: : : ..: . . .. .::
CCDS33 SPHACYGQVHPQLSPSTISGALNQF-PQSCSNMPA-KPGHLGHPQQTEVAPDPTTMGNR-
1250 1260 1270 1280 1290
990 1000 1010 1020 1030
pF1KE0 SHRA-AAPPRLL----PPLPTCYGPLKVGGTNPSCGHPEVGRLGGGPALYPPPEGQVCNP
:: ..: : :: :. :
CCDS33 -HRELGVPDSALAGVPPPHPVQSYPQQSHHLAASMSQEGYHQVPSLLPARQPGFMEPQTG
1300 1310 1320 1330 1340 1350
>>CCDS6451.1 GLIS3 gene_id:169792|Hs108|chr9 (775 aa)
initn: 843 init1: 489 opt: 783 Z-score: 359.8 bits: 77.9 E(32554): 1e-13
Smith-Waterman score: 942; 34.8% identity (58.1% similar) in 621 aa overlap (24-587:87-683)
10 20 30 40 50
pF1KE0 MFNSMTPPPISSYGEPCCLRPLPSQGAPSVGTEGLSGPP-FCHQANLMSG--P
::.. ..: . :: :: ..: .:. :
CCDS64 LSLTESQSASSMKQEWSQGYRALPSLSNHGSQNGLDLG-DLLSLPPGTSMSSNSVSNSLP
60 70 80 90 100 110
60 70 80 90 100
pF1KE0 HSYGPARETNSCTEGPLFSSPRSAVKLTKKRALSISPLSDA-SLDLQTVIRTSPSSLVAF
.. ..: .: :: :: .::::::.:::::. ..:..:.:::::.::::.
CCDS64 SYLFGTESSHSPYPSPRHSSTRSHSARSKKRALSLSPLSDGIGIDFNTIIRTSPTSLVAY
120 130 140 150 160 170
110 120 130 140 150
pF1KE0 INSRCTSPGG------SYGHLSIGTMSPSLGFPAQM-NHQKG----PS----PSFGVQPC
::. .::.. :::. .:. . . : . . ::: :. :..: .
CCDS64 INGSRASPANLSPQPEVYGHF-LGVRGSCIPQPRPVPGSQKGVLVAPGGLALPAYGEDGA
180 190 200 210 220 230
160 170 180 190
pF1KE0 GPHDSAR----GGMIP----HP--QSRGPFPTCQ----LKSE-LDMLVGKCREEPLEGDM
:. . ::. : : : : : : .:.: :. . :. . : .
CCDS64 LEHERMQQLEHGGLQPGLVNHMVVQHGLPGPDSQSAGLFKTERLEEFPGSTVDLPPAPPL
240 250 260 270 280 290
200 210 220 230 240
pF1KE0 SS-PNSTGIQDPLLGMLD-GREDL--EREEKREPESVYETD-----------CRWDGCSQ
: : : . . .: . .. :... . : ::: ::
CCDS64 PPLPPPPGPPPPYHAHAHLHHPELGPHAQQLALPQATLDDDGEMDGIGGKHCCRWIDCSA
300 310 320 330 340 350
250 260 270 280 290 300
pF1KE0 EFDSQEQLVHHINSEHIHGERKE-FVCHWGGCSRELRPFKAQYMLVVHMRRHTGEKPHKC
.:.::.::.::.. :: .. : :.: :.:: :. .::.:.: :..::: :.::::.::
CCDS64 LYDQQEELVRHIEKVHIDQRKGEDFTCFWAGCPRRYKPFNARYKLLIHMRVHSGEKPNKC
360 370 380 390 400 410
310 320 330 340 350 360
pF1KE0 TFEGCRKSYSRLENLKTHLRSHTGEKPYMCEHEGCSKAFSNASDRAKHQNRTHSNEKPYV
:::::.:..::::::: :::::::::::.:.: ::.:::::.::::::: ::: . :::.
CCDS64 TFEGCEKAFSRLENLKIHLRSHTGEKPYLCQHPGCQKAFSNSSDRAKHQ-RTHLDTKPYA
420 430 440 450 460 470
370 380 390 400 410 420
pF1KE0 CKLPGCTKRYTDPSSLRKHVKTVHGPDAHVTKRHRGDGPLPRAPSISTVEPKREREGGPI
:..::::::::::::::::::. . . .. :. :.. : :.. : . . :
CCDS64 CQIPGCTKRYTDPSSLRKHVKAHSSKEQQARKKLRSSTEL--HPDLLT-DCLTVQSLQPA
480 490 500 510 520 530
430 440 450 460 470 480
pF1KE0 REESRLTVPEGAMKPQPSPGAQSSCSSDHSPAGSAANTDSGVEMTGNAGGST---EDLSS
: .. ::.. .:.:: . .: ..: .: .:.:.:.. . .:
CCDS64 TSP-RDAAAEGTVGRSPGPGPDL-----YSAPIFSSNYSS---RSGTAAGAVPPPHPVSH
540 550 560 570 580
490 500 510 520 530
pF1KE0 LDEGPCIAGTGLSTLRRLENLRLDQLHQLRPIGTRGLKL-PSLSHTGTTVSRRVGPPVSL
. : . :. . .:: : . . . .. :: ::: : :.
CCDS64 PSPGHNVQGSPHNPS--------SQLPPLTAVDAGAERFAPSAPSPHHISPRRVPAPSSI
590 600 610 620 630
540 550 560 570 580 590
pF1KE0 ERRSSS--SSSISSAYTVSRRSSLASPFPPGSPPENG-ASSLPGLMPAQHYLLRARYASA
.:.. ... :... : . : : :.. .: ..: . : ::
CCDS64 LQRTQPPYTQQPSGSHLKSYQPETNSSFQPNGIHVHGFYGQLQKFCPP-HYPDSQRIVPP
640 650 660 670 680 690
600 610 620 630 640 650
pF1KE0 RGGGTSPTAASSLDRIGGLPMPPWRSRAEYPGYNPNAGVTRRASDPAQAADRPAPARVQR
CCDS64 VSSCSVVPSFEDCLVPTSMGQASFDVFHRAFSTHSGITVYDLPSSSSSLFGESLRSGAED
700 710 720 730 740 750
>>CCDS43784.1 GLIS3 gene_id:169792|Hs108|chr9 (930 aa)
initn: 843 init1: 489 opt: 783 Z-score: 358.9 bits: 78.0 E(32554): 1.1e-13
Smith-Waterman score: 942; 34.8% identity (58.1% similar) in 621 aa overlap (24-587:242-838)
10 20 30 40 50
pF1KE0 MFNSMTPPPISSYGEPCCLRPLPSQGAPSVGTEGLSGPP-FCHQANLMSG--P
::.. ..: . :: :: ..: .:. :
CCDS43 LSLTESQSASSMKQEWSQGYRALPSLSNHGSQNGLDLG-DLLSLPPGTSMSSNSVSNSLP
220 230 240 250 260 270
60 70 80 90 100
pF1KE0 HSYGPARETNSCTEGPLFSSPRSAVKLTKKRALSISPLSDA-SLDLQTVIRTSPSSLVAF
.. ..: .: :: :: .::::::.:::::. ..:..:.:::::.::::.
CCDS43 SYLFGTESSHSPYPSPRHSSTRSHSARSKKRALSLSPLSDGIGIDFNTIIRTSPTSLVAY
280 290 300 310 320 330
110 120 130 140 150
pF1KE0 INSRCTSPGG------SYGHLSIGTMSPSLGFPAQM-NHQKG----PS----PSFGVQPC
::. .::.. :::. .:. . . : . . ::: :. :..: .
CCDS43 INGSRASPANLSPQPEVYGHF-LGVRGSCIPQPRPVPGSQKGVLVAPGGLALPAYGEDGA
340 350 360 370 380
160 170 180 190
pF1KE0 GPHDSAR----GGMIP----HP--QSRGPFPTCQ----LKSE-LDMLVGKCREEPLEGDM
:. . ::. : : : : : : .:.: :. . :. . : .
CCDS43 LEHERMQQLEHGGLQPGLVNHMVVQHGLPGPDSQSAGLFKTERLEEFPGSTVDLPPAPPL
390 400 410 420 430 440
200 210 220 230 240
pF1KE0 SS-PNSTGIQDPLLGMLD-GREDL--EREEKREPESVYETD-----------CRWDGCSQ
: : : . . .: . .. :... . : ::: ::
CCDS43 PPLPPPPGPPPPYHAHAHLHHPELGPHAQQLALPQATLDDDGEMDGIGGKHCCRWIDCSA
450 460 470 480 490 500
250 260 270 280 290 300
pF1KE0 EFDSQEQLVHHINSEHIHGERKE-FVCHWGGCSRELRPFKAQYMLVVHMRRHTGEKPHKC
.:.::.::.::.. :: .. : :.: :.:: :. .::.:.: :..::: :.::::.::
CCDS43 LYDQQEELVRHIEKVHIDQRKGEDFTCFWAGCPRRYKPFNARYKLLIHMRVHSGEKPNKC
510 520 530 540 550 560
310 320 330 340 350 360
pF1KE0 TFEGCRKSYSRLENLKTHLRSHTGEKPYMCEHEGCSKAFSNASDRAKHQNRTHSNEKPYV
:::::.:..::::::: :::::::::::.:.: ::.:::::.::::::: ::: . :::.
CCDS43 TFEGCEKAFSRLENLKIHLRSHTGEKPYLCQHPGCQKAFSNSSDRAKHQ-RTHLDTKPYA
570 580 590 600 610 620
370 380 390 400 410 420
pF1KE0 CKLPGCTKRYTDPSSLRKHVKTVHGPDAHVTKRHRGDGPLPRAPSISTVEPKREREGGPI
:..::::::::::::::::::. . . .. :. :.. : :.. : . . :
CCDS43 CQIPGCTKRYTDPSSLRKHVKAHSSKEQQARKKLRSSTEL--HPDLLT-DCLTVQSLQPA
630 640 650 660 670 680
430 440 450 460 470 480
pF1KE0 REESRLTVPEGAMKPQPSPGAQSSCSSDHSPAGSAANTDSGVEMTGNAGGST---EDLSS
: .. ::.. .:.:: . .: ..: .: .:.:.:.. . .:
CCDS43 TSP-RDAAAEGTVGRSPGPGPDL-----YSAPIFSSNYSS---RSGTAAGAVPPPHPVSH
690 700 710 720 730
490 500 510 520 530
pF1KE0 LDEGPCIAGTGLSTLRRLENLRLDQLHQLRPIGTRGLKL-PSLSHTGTTVSRRVGPPVSL
. : . :. . .:: : . . . .. :: ::: : :.
CCDS43 PSPGHNVQGSPHNPS--------SQLPPLTAVDAGAERFAPSAPSPHHISPRRVPAPSSI
740 750 760 770 780
540 550 560 570 580 590
pF1KE0 ERRSSS--SSSISSAYTVSRRSSLASPFPPGSPPENG-ASSLPGLMPAQHYLLRARYASA
.:.. ... :... : . : : :.. .: ..: . : ::
CCDS43 LQRTQPPYTQQPSGSHLKSYQPETNSSFQPNGIHVHGFYGQLQKFCPP-HYPDSQRIVPP
790 800 810 820 830 840
600 610 620 630 640 650
pF1KE0 RGGGTSPTAASSLDRIGGLPMPPWRSRAEYPGYNPNAGVTRRASDPAQAADRPAPARVQR
CCDS43 VSSCSVVPSFEDCLVPTSMGQASFDVFHRAFSTHSGITVYDLPSSSSSLFGESLRSGAED
850 860 870 880 890 900
>>CCDS582.1 GLIS1 gene_id:148979|Hs108|chr1 (620 aa)
initn: 572 init1: 481 opt: 767 Z-score: 354.2 bits: 76.5 E(32554): 2.1e-13
Smith-Waterman score: 821; 32.9% identity (52.0% similar) in 611 aa overlap (18-587:12-570)
10 20 30 40 50
pF1KE0 MFNSMTPPPISSYGEPCCLRPLPSQGAPSVGTEG--LSGP-PFCHQANLMSGPHSYGPAR
: :: . :.. : :. : : :. : : : : .
CCDS58 MAEARTSLSAHCRGPLATGLHPDLDLPGRSLATPAPSCYL--LGSEPSSGLGLQ
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 ETNSCTEGPLFSSPRSAV-KLTKKRALSISPLSDASLDLQTVIRTSPSSLVAFINSRCTS
. :: : : : : : :: :: :. ..::.: .:::. .:. .
CCDS58 PETHLPEGSL---KRCCVLGLPPTSPASSSPC--ASSDVTSIIRSSQTSLVTCVNGLRSP
60 70 80 90 100
120 130 140 150 160 170
pF1KE0 PGGSYGHLSIGTMSPSLGFPAQMNHQKGPSPSFGVQPCGPHDSARGGMIPHPQSRGPFPT
: .. .:: :.. . ::. . :: .:.. . .. :
CCDS58 P-----------LTGDLGGPSK-RARPGPAST---------DSHEGSLQLEACRKASFLK
110 120 130 140
180 190 200 210 220 230
pF1KE0 CQLKSELDMLVGKCREE-PLEGDMSS-PNSTGIQDPLLGMLDGREDLEREEKREPESVYE
. .:.. : : .. : .:. : . .. :: : :: :.
CCDS58 QEPADEFSELFGPHQQGLPPPYPLSQLPPGPSLGGLGLG-LAGRVVAGRQA---------
150 160 170 180 190
240 250 260 270 280 290
pF1KE0 TDCRWDGCSQEFDSQEQLVHHINSEHIHGERKE-FVCHWGGCSRELRPFKAQYMLVVHMR
::: : ...::.::.::.. :: .. : :.: :.:: :. .::.:.: :..:::
CCDS58 --CRWVDCCAAYEQQEELVRHIEKSHIDQRKGEDFTCFWAGCVRRYKPFNARYKLLIHMR
200 210 220 230 240 250
300 310 320 330 340 350
pF1KE0 RHTGEKPHKCTFEGCRKSYSRLENLKTHLRSHTGEKPYMCEHEGCSKAFSNASDRAKHQN
:.::::.:: :::: :..::::::: :::::::::::.:.: ::.:::::.:::::::
CCDS58 VHSGEKPNKCMFEGCSKAFSRLENLKIHLRSHTGEKPYLCQHPGCQKAFSNSSDRAKHQ-
260 270 280 290 300 310
360 370 380 390 400
pF1KE0 RTHSNEKPYVCKLPGCTKRYTDPSSLRKHVKTVHGPDAHVTKRHRGDGPLPRAPSI----
::: . :::.:..:::.::::::::::::::. . . .: :. .. :: .: .
CCDS58 RTHLDTKPYACQIPGCSKRYTDPSSLRKHVKAHSAKEQQVRKKLHA-GPDTEADVLTECL
320 330 340 350 360 370
410 420 430 440 450
pF1KE0 -------STVEPKREREGG-PIREESRLTVPEGAMKPQPS------PGAQSSCSSDHSPA
:: . .:: . .: : :.. :. . : :.. : : :
CCDS58 VLQQLHTSTQLAASDGKGGCGLGQELLPGVYPGSITPHNGLASGLLPPAHD-VPSRHHPL
380 390 400 410 420 430
460 470 480 490 500 510
pF1KE0 GSAANTDSGVEMTGNAGGSTEDLSSLDEGPCIAGTGLSTLRRLENLRLDQLHQLRPIGTR
..... . : .. . : :: . . .: :. : : : . :
CCDS58 DATTSSHHHLSPLPMAESTRDGL-----GPGLLSPIVSPLKGLGPPPLPPSSQSHSPG--
440 450 460 470 480
520 530 540 550 560
pF1KE0 GLKLPSLSHTGTTVSRRVGPPVSL---ERRSSSSSSISSAYTVSRRSSLASP--------
: .:.: . . :: : . ..: ::.: . . .: :
CCDS58 GQPFPTLPSKPSYPPFQSPPPPPLPSPQGYQGSFHSIQSCFPYGDCYRMAEPAAGGDGLV
490 500 510 520 530 540
570 580 590 600 610
pF1KE0 -----FPPGSPPENGASSLPGLMPAQHYLLRARYASARGGGTSPTAASSLDRIGGLPMPP
: : : :: :: .:: :
CCDS58 GETHGFNPLRP--NGYHSLSTPLPATGYEALAEASCPTALPQQPSEDVVSSGPEDCGFFP
550 560 570 580 590 600
>>CCDS10511.1 GLIS2 gene_id:84662|Hs108|chr16 (524 aa)
initn: 486 init1: 237 opt: 696 Z-score: 324.6 bits: 70.8 E(32554): 9.3e-12
Smith-Waterman score: 720; 34.1% identity (55.7% similar) in 499 aa overlap (116-583:46-506)
90 100 110 120 130 140
pF1KE0 SPLSDASLDLQTVIRTSPSSLVAFINSRCTSPG-GSYGHLSIGTMSPSLGFPAQMNHQKG
:: :: : : . : :: ... . .
CCDS10 KLRAAREKRERTLGVVRPRALHRELGLVDDSPTPGSPGSPPSGFLLNS-KFPEKVEGRFS
20 30 40 50 60 70
150 160 170 180 190 200
pF1KE0 PSP--SFGVQPCGPHDSARGG--MIPHPQSRGPFPTCQLKSELDMLVGKCREEPLEGDMS
.: .....: . :: :. . :. :. : .: :... : . :.: :
CCDS10 AAPLVDLSLSPPSGLDSPNGSSSLSPERQGNGDLPPVPSASDFQPL------RYLDGVPS
80 90 100 110 120
210 220 230 240 250
pF1KE0 S-----PNSTG--IQDPLLGMLDGRED-LEREEKREPESVYETDCRWDGCSQEFDSQEQL
: : ..: .. : ..: .: . :... ::: :.: :. ..:
CCDS10 SFQFFLPLGSGGALHLPASSFLTPPKDKCLSPDLPLPKQLV---CRWAKCNQLFELLQDL
130 140 150 160 170 180
260 270 280 290 300 310
pF1KE0 VHHINSEHIHGERKE-FVCHWGGCSRELRPFKAQYMLVVHMRRHTGEKPHKCTFEGCRKS
: :.:. :.. :. . ::: ::.:. : :.:.: ...:.: ::.::::.: : ::
CCDS10 VDHVNDYHVKPEKDAGYCCHWEGCARHGRGFNARYKMLIHIRTHTNEKPHRCPT--CSKS
190 200 210 220 230 240
320 330 340 350 360 370
pF1KE0 YSRLENLKTHLRSHTGEKPYMCEHEGCSKAFSNASDRAKHQNRTHSNEKPYVCKLPGCTK
.::::::: : :::::::::.: .:::.: .::.::: :: .::: .::: ::.::: :
CCDS10 FSRLENLKIHNRSHTGEKPYVCPYEGCNKRYSNSSDRFKH-TRTHYVDKPYYCKMPGCHK
250 260 270 280 290 300
380 390 400 410 420 430
pF1KE0 RYTDPSSLRKHVKTVHGP-DAHVTKRHRGDGPLPRAPSISTVEPKREREGGPIREESRLT
:::::::::::.:. :: .: .. : :. : . : .::: ...
CCDS10 RYTDPSSLRKHIKA-HGHFVSHEQQELLQLRPPPKPPLPA---P----DGGPYVSGAQII
310 320 330 340 350
440 450 460 470 480
pF1KE0 VPE-GAMKPQPS-PGAQSSCSSDHSPAGSAANTDSGVEMTGNAGGSTEDLSSLDEGPCIA
.:. .:. :. :: . .: : .. ::.::: .. :: .
CCDS10 IPNPAALFGGPGLPGLPLPLAP--GP------LDLSALACGNGGGSG---GGGGMGPGLP
360 370 380 390 400
490 500 510 520 530 540
pF1KE0 GTGLSTLRRLENLRLDQLHQLRPIGTRGLKLPSLSH-TGTTVSRRVG-------PPVSLE
: : :: . : :.:. :: :: .: .:.. .. : : .:
CCDS10 GPVLPL-----NLAKNPLLP-SPFGAGGLGLPVVSLLAGAAGGKAEGEKGRGSVPTRALG
410 420 430 440 450
550 560 570 580 590
pF1KE0 RRSSSSSSISSAYTVSRRSSLASPFPPG-----SPPENGASSLP-GLMPAQHYLLRARYA
.. .. . . :: : . :. :: : :.:.: : .: :
CCDS10 MEGHKTPLERTESSCSRPSPDGLPLLPGTVLDLSTGVNSAASSPEALAPGWVVIPPGSVL
460 470 480 490 500 510
600 610 620 630 640 650
pF1KE0 SARGGGTSPTAASSLDRIGGLPMPPWRSRAEYPGYNPNAGVTRRASDPAQAADRPAPARV
CCDS10 LKPAVVN
520
1106 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 01:50:17 2016 done: Sat Nov 5 01:50:18 2016
Total Scan time: 4.770 Total Display time: 0.320
Function used was FASTA [36.3.4 Apr, 2011]