FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0297, 1586 aa
1>>>pF1KE0297 1586 - 1586 aa - 1586 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.3590+/-0.00117; mu= -9.0643+/- 0.069
mean_var=420.6933+/-91.362, 0's: 0 Z-trim(114.3): 703 B-trim: 866 in 1/51
Lambda= 0.062530
statistics sampled from 14084 (14914) to 14084 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.747), E-opt: 0.2 (0.458), width: 16
Scan time: 5.520
The best scores are: opt bits E(32554)
CCDS33283.1 GLI2 gene_id:2736|Hs108|chr2 (1586) 10843 994.0 0
CCDS5465.1 GLI3 gene_id:2737|Hs108|chr7 (1580) 2500 241.4 1.8e-62
CCDS53807.1 GLI1 gene_id:2735|Hs108|chr12 ( 978) 1207 124.6 1.6e-27
CCDS53806.1 GLI1 gene_id:2735|Hs108|chr12 (1065) 1207 124.6 1.7e-27
CCDS8940.1 GLI1 gene_id:2735|Hs108|chr12 (1106) 1207 124.6 1.8e-27
CCDS43784.1 GLIS3 gene_id:169792|Hs108|chr9 ( 930) 991 105.0 1.1e-21
CCDS6451.1 GLIS3 gene_id:169792|Hs108|chr9 ( 775) 976 103.6 2.5e-21
CCDS582.1 GLIS1 gene_id:148979|Hs108|chr1 ( 620) 775 85.4 6.1e-16
CCDS10511.1 GLIS2 gene_id:84662|Hs108|chr16 ( 524) 695 78.2 8e-14
CCDS9495.1 ZIC2 gene_id:7546|Hs108|chr13 ( 532) 619 71.3 9.4e-12
CCDS43160.1 ZIC4 gene_id:84107|Hs108|chr3 ( 334) 613 70.6 9.6e-12
CCDS54653.1 ZIC4 gene_id:84107|Hs108|chr3 ( 372) 613 70.6 1e-11
CCDS54652.1 ZIC4 gene_id:84107|Hs108|chr3 ( 384) 613 70.7 1.1e-11
CCDS9494.2 ZIC5 gene_id:85416|Hs108|chr13 ( 663) 615 71.0 1.4e-11
CCDS14663.1 ZIC3 gene_id:7547|Hs108|chrX ( 467) 603 69.8 2.3e-11
CCDS83494.1 ZIC3 gene_id:7547|Hs108|chrX ( 457) 598 69.4 3.1e-11
CCDS3136.1 ZIC1 gene_id:7545|Hs108|chr3 ( 447) 596 69.2 3.5e-11
>>CCDS33283.1 GLI2 gene_id:2736|Hs108|chr2 (1586 aa)
initn: 10843 init1: 10843 opt: 10843 Z-score: 5302.6 bits: 994.0 E(32554): 0
Smith-Waterman score: 10843; 99.9% identity (100.0% similar) in 1586 aa overlap (1-1586:1-1586)
10 20 30 40 50 60
pF1KE0 METSASATASEKQEAKSGILEAAGFPDPGKKASPLVVAAAAAAAVAAQGVPQHLLPPFHA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 METSASATASEKQEAKSGILEAAGFPDPGKKASPLVVAAAAAAAVAAQGVPQHLLPPFHA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 PLPIDMRHQEGRYHYEPHSVHGVHGPPALSGSPVISDISLIRLSPHPAGPGESPFNAPHP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PLPIDMRHQEGRYHYEPHSVHGVHGPPALSGSPVISDISLIRLSPHPAGPGESPFNAPHP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 YVNPHMEHYLRSVHSSPTLSMISAARGLSPADVAQEHLKERGLFGLPAPGTTPSDYYHQM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 YVNPHMEHYLRSVHSSPTLSMISAARGLSPADVAQEHLKERGLFGLPAPGTTPSDYYHQM
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 TLVAGHPAPYGDLLMQSGGAASAPHLHDYLNPVDVSRFSSPRVTPRLSRKRALSISPLSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TLVAGHPAPYGDLLMQSGGAASAPHLHDYLNPVDVSRFSSPRVTPRLSRKRALSISPLSD
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 ASLDLQRMIRTSPNSLVAYINNSRSSSAASGSYGHLSAGALSPAFTFPHPINPVAYQQIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ASLDLQRMIRTSPNSLVAYINNSRSSSAASGSYGHLSAGALSPAFTFPHPINPVAYQQIL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 SQQRGLGSAFGHTPPLIQPSPTFLAQQPMALTSINATPTQLSSSSNCLSDTNQNKQSSES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SQQRGLGSAFGHTPPLIQPSPTFLAQQPMALTSINATPTQLSSSSNCLSDTNQNKQSSES
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 AVSSTVNPVAIHKRSKVKTEPEGLRPASPLALTQGQVSGHGSCGCALPLSQEQLADLKED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 AVSSTVNPVAIHKRSKVKTEPEGLRPASPLALTQGQVSGHGSCGCALPLSQEQLADLKED
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE0 LDRDDCKQEAEVVIYETNCHWEDCTKEYDTQEQLVHHINNEHIHGEKKEFVCRWQACTRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LDRDDCKQEAEVVIYETNCHWEDCTKEYDTQEQLVHHINNEHIHGEKKEFVCRWQACTRE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE0 QKPFKAQYMLVVHMRRHTGEKPHKCTFEGCSKAYSRLENLKTHLRSHTGEKPYVCEHEGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QKPFKAQYMLVVHMRRHTGEKPHKCTFEGCSKAYSRLENLKTHLRSHTGEKPYVCEHEGC
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE0 NKAFSNASDRAKHQNRTHSNEKPYICKIPGCTKRYTDPSSLRKHVKTVHGPDAHVTKKQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NKAFSNASDRAKHQNRTHSNEKPYICKIPGCTKRYTDPSSLRKHVKTVHGPDAHVTKKQR
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE0 NDVHLRTPLLKENGDSEAGTEPGGPESTEASSTSQAVEDCLHVRAIKTESSGLCQSSPGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NDVHLRTPLLKENGDSEAGTEPGGPESTEASSTSQAVEDCLHVRAIKTESSGLCQSSPGA
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE0 QSSCSSEPSPLGSAPNNDSGVEMPGTGPGSLGDLTALDDTPPGADTSALAAPSAGGLQLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QSSCSSEPSPLGSAPNNDSGVEMPGTGPGSLGDLTALDDTPPGADTSALAAPSAGGLQLR
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE0 KHMTTMHRFEQLKKEKLKSLKDSCSWAGPTPHTRNTKLPPLPGSGSILENFSGSGGGGPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KHMTTMHRFEQLKKEKLKSLKDSCSWAGPTPHTRNTKLPPLPGSGSILENFSGSGGGGPA
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE0 GLLPNPRLSELSASEVTMLSQLQERRDSSTSTVSSAYTVSRRSSGISPYFSSRRSSEASP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GLLPNPRLSELSASEVTMLSQLQERRDSSTSTVSSAYTVSRRSSGISPYFSSRRSSEASP
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE0 LGAGRPHNASSADSYDPISTDASRRSSEASQCSGGSGLLNLTPAQQYSLRAKYAAATGGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LGAGRPHNASSADSYDPISTDASRRSSEASQCSGGSGLLNLTPAQQYSLRAKYAAATGGP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE0 PPTPLPGLERMSLRTRLALLDAPERTLPAGCPRPLGPRRGSDGPTYGHGHAGAAPAFPHE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PPTPLPGLERMSLRTRLALLDAPERTLPAGCPRPLGPRRGSDGPTYGHGHAGAAPAFPHE
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE0 APGGGARRASDPVRRPDALSLPRVQRFHSTHNVNPGPLPPCADRRGLRLQSHPSTDGGLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 APGGGARRASDPVRRPDALSLPRVQRFHSTHNVNPGPLPPCADRRGLRLQSHPSTDGGLA
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE0 RGAYSPRPPSISENVAMEAVAAGVDGAGPEADLGLPEDDLVLPDDVVQYIKAHASGALDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RGAYSPRPPSISENVAMEAVAAGVDGAGPEADLGLPEDDLVLPDDVVQYIKAHASGALDE
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE0 GTGQVYPTESTGFSDNPRLPSPGLHGQRRMVAADSNVGPSAPMLGGCQLGFGAPSSLNKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GTGQVYPTESTGFSDNPRLPSPGLHGQRRMVAADSNVGPSAPMLGGCQLGFGAPSSLNKN
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE0 NMPVQWNEVSSGTVDSLASQVKPPPFPQGNLAVVQQKPAFGQYPGYSPQGLQASPGGLDS
:::::::::::::::.::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NMPVQWNEVSSGTVDALASQVKPPPFPQGNLAVVQQKPAFGQYPGYSPQGLQASPGGLDS
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE0 TQPHLQPRSGAPSQGIPRVNYMQQLRQPVAGSQCPGMTTTMSPHACYGQVHPQLSPSTIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TQPHLQPRSGAPSQGIPRVNYMQQLRQPVAGSQCPGMTTTMSPHACYGQVHPQLSPSTIS
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE0 GALNQFPQSCSNMPAKPGHLGHPQQTEVAPDPTTMGNRHRELGVPNSALAGVPPPHPVQS
:::::::::::::::::::::::::::::::::::::::::::::.::::::::::::::
CCDS33 GALNQFPQSCSNMPAKPGHLGHPQQTEVAPDPTTMGNRHRELGVPDSALAGVPPPHPVQS
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE0 YPQQSHHLAASMSQEGYHQVPSLLPARQPGFMEPQTGPMGVATAGFGLVQPRPPLEPSPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 YPQQSHHLAASMSQEGYHQVPSLLPARQPGFMEPQTGPMGVATAGFGLVQPRPPLEPSPT
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE0 GRHRGVRAVQQQLAYARATGHAMAAMPSSQETAEAVPKGAMGNMGSVPPQPPPQDAGGAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GRHRGVRAVQQQLAYARATGHAMAAMPSSQETAEAVPKGAMGNMGSVPPQPPPQDAGGAP
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE0 DHSMLYYYGQIHMYEQDGGLENLGSCQVMRSQPPQPQACQDSIQPQPLPSPGVNQVSSTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 DHSMLYYYGQIHMYEQDGGLENLGSCQVMRSQPPQPQACQDSIQPQPLPSPGVNQVSSTV
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE0 DSQLLEAPQIDFDAIMDDGDHSSLFSGALSPSLLHSLSQNSSRLTTPRNSLTLPSIPAGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 DSQLLEAPQIDFDAIMDDGDHSSLFSGALSPSLLHSLSQNSSRLTTPRNSLTLPSIPAGI
1510 1520 1530 1540 1550 1560
1570 1580
pF1KE0 SNMAVGDMSSMLTSLAEESKFLNMMT
::::::::::::::::::::::::::
CCDS33 SNMAVGDMSSMLTSLAEESKFLNMMT
1570 1580
>>CCDS5465.1 GLI3 gene_id:2737|Hs108|chr7 (1580 aa)
initn: 3350 init1: 1220 opt: 2500 Z-score: 1235.0 bits: 241.4 E(32554): 1.8e-62
Smith-Waterman score: 4182; 48.3% identity (69.0% similar) in 1583 aa overlap (51-1585:124-1579)
30 40 50 60 70 80
pF1KE0 EAAGFPDPGKKASPLVVAAAAAAAVAAQGVPQHLLPPFHAPLPIDMRHQEGRYHYEPHSV
: ::.: :: :.::: ::.::::::.: .
CCDS54 LPHVAEPSVPYRGTVFAMDPRNGYMEPHYHPPHLFPAFHPPVPIDARHHEGRYHYDPSPI
100 110 120 130 140 150
90 100 110 120 130
pF1KE0 HGVHGPPALSGSPVISDISLIRLSPH--PAGPGESPFNAPHPYVNPHMEHYLRSVHSSPT
.: :::.::. :. .::.::: :.. .::::. ::::.::.:. :.::.::::.
CCDS54 PPLHMTSALSSSPTYPDLPFIRISPHRNPTAASESPFSPPHPYINPYMD-YIRSLHSSPS
160 170 180 190 200 210
140 150 160 170 180 190
pF1KE0 LSMISAARGLSPADVAQEHLKERGLFGLPAPGTTPSDYYHQMTLVAGHPAPYGDLLMQSG
::::::.:::::.:. : :..:..:::::.:..:. .::.:.. ...
CCDS54 LSMISATRGLSPTDA-------------PHAGVSPAEYYHQMALLTGQRSPYADIIPSAA
220 230 240 250
200 210 220 230 240 250
pF1KE0 GAASAPHLHDYLNPVDVSRFSSPRVTPRLSRKRALSISPLSDASLDLQRMIRTSPNSLVA
:... .::. .: .::::::.. : ::::.:::::::: :.::: ::::::::::.
CCDS54 TAGTGAIHMEYLHAMDSTRFSSPRLSARPSRKRTLSISPLSDHSFDLQTMIRTSPNSLVT
260 270 280 290 300 310
260 270 280 290 300 310
pF1KE0 YINNSRSSSAASGSYGHLSAGALSPAFTFPHPINPVA---YQQILSQQRGLGSAFGHTPP
.:::::::.::::::::::.:.:::..: . ::. .:::::.:..:::::::.::
CCDS54 ILNNSRSSSSASGSYGHLSASAISPALSFTYSSAPVSLHMHQQILSRQQSLGSAFGHSPP
320 330 340 350 360 370
320 330 340 350 360 370
pF1KE0 LIQPSPTFLAQQPMALTSINATPTQLSSSSNCLSDTNQNKQSSESAVSSTVNPVAIHKRS
::.:.::: .:.:. .:.:.::. :...::: .:::::::: .:. .:::
CCDS54 LIHPAPTFPTQRPIPGIPTVLNPVQVSSGP---SESSQNKPTSESAVSSTGDPMH-NKRS
380 390 400 410 420 430
380 390 400 410 420 430
pF1KE0 KVKTEPEGLRPASPLALTQGQVSGHGSCGCALPLSQEQLADLKEDLDRDDCKQEAEVVIY
:.: :. : :: : .:: . : . .::. :.:. ::: :: ::
CCDS54 KIK--PDEDLP-SPGA--RGQQE-----------QPEGTTLVKEEGDKDESKQEPEV-IY
440 450 460 470
440 450 460 470 480 490
pF1KE0 ETNCHWEDCTKEYDTQEQLVHHINNEHIHGEKKEFVCRWQACTREQKPFKAQYMLVVHMR
::::::: :..:.::::::::::::.::::::::::::: :.:::::::::::::::::
CCDS54 ETNCHWEGCAREFDTQEQLVHHINNDHIHGEKKEFVCRWLDCSREQKPFKAQYMLVVHMR
480 490 500 510 520 530
500 510 520 530 540 550
pF1KE0 RHTGEKPHKCTFEGCSKAYSRLENLKTHLRSHTGEKPYVCEHEGCNKAFSNASDRAKHQN
:::::::::::::::.::::::::::::::::::::::::::::::::::::::::::::
CCDS54 RHTGEKPHKCTFEGCTKAYSRLENLKTHLRSHTGEKPYVCEHEGCNKAFSNASDRAKHQN
540 550 560 570 580 590
560 570 580 590 600 610
pF1KE0 RTHSNEKPYICKIPGCTKRYTDPSSLRKHVKTVHGPDAHVTKKQRNDVHLRTPLLKENGD
:::::::::.::::::::::::::::::::::::::.::::::::.:.: : : ...:.
CCDS54 RTHSNEKPYVCKIPGCTKRYTDPSSLRKHVKTVHGPEAHVTKKQRGDIHPRPPPPRDSGS
600 610 620 630 640 650
620 630 640 650 660
pF1KE0 SEAGTEPGGP------ESTEASSTSQAVEDCLHVRAIKTESSGLCQSSPGAQSSCSSEPS
. :: : :. . :.:.. :.::.:...:.:. : :::.::::::. :
CCDS54 HSQSRSPGRPTQGALGEQQDLSNTTSKREECLQVKTVKAEKPMTSQPSPGGQSSCSSQQS
660 670 680 690 700 710
670 680 690 700 710 720
pF1KE0 PLGSAPNNDSGVEMPGTGPGSLGDLTALDDTPPGADTSALAAPSAGGLQLRKHMTTMHRF
:... : ::.:.: : ::.:::.:.:.:: :.. .: .: .:: :.. . . .
CCDS54 PISNYSN--SGLELPLTDGGSIGDLSAIDETPI-MDSTISTATTALALQARRNPAGTKWM
720 730 740 750 760 770
730 740 750 760 770 780
pF1KE0 EQLKKEKLKSLKDSCSWAGPTPHTRNTKLPPLPGSGSILENFSGSGGGGPAGLLPNPRLS
:..: :.::... .: . . :: :.:. .: . :: : :::. : :
CCDS54 EHVKLERLKQVNGMFPRLNPILPPKAPAVSPLIGNGTQSNNTCSLGG--PMTLLPG-R-S
780 790 800 810 820 830
790 800 810 820 830 840
pF1KE0 ELSASEVTMLSQLQERRDSSTSTVSSAYTVSRRSSGISPYFSSRRSSEASPLGAGRPHNA
.::. .::::..:. :::::.::.:::: ::::::::: :::::::::: . :::.:.
CCDS54 DLSGVDVTMLNMLN-RRDSSASTISSAYLSSRRSSGISPCFSSRRSSEASQ-AEGRPQNV
840 850 860 870 880
850 860 870 880 890 900
pF1KE0 SSADSYDPISTDASRRSSEASQCSGGSGLLNLTPAQQYSLRAKYAAATGGPPPTPLPGLE
: :::::::::::::::::::: .: .::.::::::: :.::::::::::::::::..:
CCDS54 SVADSYDPISTDASRRSSEASQSDGLPSLLSLTPAQQYRLKAKYAAATGGPPPTPLPNME
890 900 910 920 930 940
910 920 930 940 950 960
pF1KE0 RMSLRTRLALL-DA--PERTLPAGCPRPL-GPRRGSDGPTYGHGHAGAAPAFPHEAPGGG
::::.:::::: :: : .:: :. .::: ::: ..:.:. : :.::: :
CCDS54 RMSLKTRLALLGDALEPGVALP-----PVHAPRRCSDGGAHGYGRRHLQP---HDAPGHG
950 960 970 980 990 1000
970 980 990 1000 1010 1020
pF1KE0 ARRASDPVRR-PDALSLPRVQRFHSTHNVNPGPLPPCADRRGLRLQSHPSTDGGLARGAY
.:::::::: ..:.:::: :: : . :: . :..:.: ::.. .:: .:. .
CCDS54 VRRASDPVRTGSEGLALPRVPRFSSLSSCNPPAMATSAEKRSLVLQNYTRPEGGQSRNFH
1010 1020 1030 1040 1050 1060
1030 1040 1050 1060 1070 1080
pF1KE0 S-PRPPSISENVAMEAVAAGVDGAGPEADLGLPEDDLVLPDDVVQYIKAHASGALDEGTG
: : ::::.:::..:... .:: .: ..:. ::::::::.... .. :
CCDS54 SSPCPPSITENVTLESLTM-------DADANLNDEDF-LPDDVVQYLNSQNQA----GYE
1070 1080 1090 1100
1090 1100 1110 1120 1130 1140
pF1KE0 QVYPTESTGFSDNPRLP-SPGLHGQRRMVAADSNVGPSAPML-GGCQLGFGAPSSLNKNN
: .: ... :. ..: .:: . ::..: . : : : .:..
CCDS54 QHFP---SALPDDSKVPHGPGDFDAPGL--PDSHAGQQFHALEQPCPEG-------SKTD
1110 1120 1130 1140 1150
1150 1160 1170 1180 1190
pF1KE0 MPVQWNEVSSGTVDSLASQVK--P-PPFPQ-------GNLAVVQQKPAF-GQYPGYSPQG
.:.::::::::..: .:..: : : :: ....: :.: : ::. :
CCDS54 LPIQWNEVSSGSADLSSSKLKCGPRPAVPQTRAFGFCNGMVVHPQNPLRSGPAGGYQTLG
1160 1170 1180 1190 1200 1210
1200 1210 1220 1230 1240
pF1KE0 LQASP-GGLDSTQPHLQPRSGAPS-----QGIPRVNYMQQL-RQPVAGSQCPGMTTTMSP
...: :: . . : .: ::. . : .: . : ::::: ::
CCDS54 ENSNPYGGPEHLMLHNSPGSGTSGNAFHEQPCKAPQYGNCLNRQPVA----PGALD----
1220 1230 1240 1250 1260
1250 1260 1270 1280 1290 1300
pF1KE0 HACYGQVHP-QLSPSTISGALNQFPQSCSNMPAKP-GHLGHPQQTEVAPDPTTMGN-RHR
:: . .. .:. . ..:. .:. . : . : . . .:.. ::. .: :.
CCDS54 GACGAGIQASKLKSTPMQGSGGQLNFGLPVAPNESAGSMVNGMQNQ---DPVGQGYLAHQ
1270 1280 1290 1300 1310 1320
1310 1320 1330 1340 1350
pF1KE0 ELGVPNSALAGVPPPHPVQSYP-QQSHHLAASMSQEGYHQVP-SLLPARQPGFMEPQTGP
:: .: :: . : :: .. :. . .: : : ::. . :
CCDS54 LLG--DSM------QHPGAGRPGQQMLGQISATSHINIYQGPESCLPGAH--------G-
1330 1340 1350 1360
1360 1370 1380 1390 1400 1410
pF1KE0 MGVATAGFGLVQPRPPLEPSPTGRHRGVRAVQQQLAYARATGHAMAAMPSSQETAEAVPK
:: .....:. : : : .: :. : . :. :.: . .
CCDS54 MGSQPSSLAVVRGYQPCA-SFGGSRRQ--------AMPRDS----LALQSGQLSDTSQTC
1370 1380 1390 1400 1410
1420 1430 1440 1450 1460 1470
pF1KE0 GAMGNMGSVPPQPPPQDAGGAPDHSMLYYYGQIHMYEQDGGLENLGSCQVMRSQPPQPQA
. : . :: : .. ..: .: . . .:: . :: .. . .
CCDS54 RVNGIKMEMKGQPHPL-CSNLQNYSGQFYDQTVGFSQQD---TKAGSFSI------SDAS
1420 1430 1440 1450 1460
1480 1490 1500 1510 1520 1530
pF1KE0 CQ---DSIQPQPLPSPGVNQVSSTVDS---QLLEAPQIDFDAIMDDGDHSSLFSGALSPS
: : . . : :::.:::.::::: . ::. :::::::.::::::::.:::::::
CCDS54 CLLQGTSAKNSELLSPGANQVTSTVDSLDSHDLEGVQIDFDAIIDDGDHSSLMSGALSPS
1470 1480 1490 1500 1510 1520
1540 1550 1560 1570 1580
pF1KE0 LLHSLSQNSSRLTTPRNSLTLPSIPAGISNMAVGDMSSMLTSLAEESKFLNMMT
....::..:::::::: :: .:.. . .:::.:::::.::::::::::: .:
CCDS54 IIQNLSHSSSRLTTPRASLPFPALSMSTTNMAIGDMSSLLTSLAEESKFLAVMQ
1530 1540 1550 1560 1570 1580
>>CCDS53807.1 GLI1 gene_id:2735|Hs108|chr12 (978 aa)
initn: 1618 init1: 1096 opt: 1207 Z-score: 607.5 bits: 124.6 E(32554): 1.6e-27
Smith-Waterman score: 1725; 36.1% identity (53.1% similar) in 1201 aa overlap (394-1583:68-975)
370 380 390 400 410 420
pF1KE0 STVNPVAIHKRSKVKTEPEGLRPASPLALTQGQVSGHGSCGCALPLSQEQLADLKEDLDR
.:..:. .: : :: . : .:::.:
CCDS53 PHPQSRGPFPTCQLKSELDMLVGKCREEPLEGDMSSPNSTGIQDPLLG--MLDGREDLER
40 50 60 70 80 90
430 440 450 460 470 480
pF1KE0 DDCKQEAEVVIYETNCHWEDCTKEYDTQEQLVHHINNEHIHGEKKEFVCRWQACTREQKP
.. :.: : : :::.:.:. :..:.:.:::::::::.::::::.:::::.: .:.:: .:
CCDS53 EE-KREPESV-YETDCRWDGCSQEFDSQEQLVHHINSEHIHGERKEFVCHWGGCSRELRP
100 110 120 130 140 150
490 500 510 520 530 540
pF1KE0 FKAQYMLVVHMRRHTGEKPHKCTFEGCSKAYSRLENLKTHLRSHTGEKPYVCEHEGCNKA
::::::::::::::::::::::::::: :.::::::::::::::::::::.::::::.::
CCDS53 FKAQYMLVVHMRRHTGEKPHKCTFEGCRKSYSRLENLKTHLRSHTGEKPYMCEHEGCSKA
160 170 180 190 200 210
550 560 570 580 590 600
pF1KE0 FSNASDRAKHQNRTHSNEKPYICKIPGCTKRYTDPSSLRKHVKTVHGPDAHVTKKQRNDV
:::::::::::::::::::::.::.:::::::::::::::::::::::::::::..:.:
CCDS53 FSNASDRAKHQNRTHSNEKPYVCKLPGCTKRYTDPSSLRKHVKTVHGPDAHVTKRHRGDG
220 230 240 250 260 270
610 620 630 640 650 660
pF1KE0 HL-RTPLLKENGDSEAGTE-PGGPESTEASSTSQAVEDCLHVRAIKTESSGLCQSSPGAQ
: :.: .. : : ::: :. : :.. : :::::
CCDS53 PLPRAPSIST---VEPKREREGGPIREES-------------RLTVPEGAMKPQPSPGAQ
280 290 300 310
670 680 690 700 710 720
pF1KE0 SSCSSEPSPLGSAPNNDSGVEMPGTGPGSLGDLTALDDTPPGADTSALAAPSAGGLQLRK
:::::. :: ::: :.:::::: :.. :: ::..::. : : :.
CCDS53 SSCSSDHSPAGSAANTDSGVEMTGNAGGSTEDLSSLDEGPCIAGTG--------------
320 330 340 350 360
730 740 750 760 770 780
pF1KE0 HMTTMHRFEQLKKEKLKSLKDSCSWAGPTPHTRNTKLPPLPGSGSILENFSGSGGGGPAG
..:..:.:.:. ..:..:. : ::. ::: : .:. . : :..
CCDS53 -LSTLRRLENLRLDQLHQLR-------PIG-TRGLKLPSLSHTGTTVSRRVGP----PVS
370 380 390 400 410
790 800 810 820 830 840
pF1KE0 LLPNPRLSELSASEVTMLSQLQERRDSSTSTVSSAYTVSRRSSGISPYFSSRRSSEASPL
: :::.::.:..::::::::::: ::. :
CCDS53 L---------------------ERRSSSSSSISSAYTVSRRSSLASPF----------PP
420 430
850 860 870 880 890 900
pF1KE0 GAGRPHNASSADSYDPISTDASRRSSEASQCSGGSGLLNLTPAQQYSLRAKYAAATGG-P
:. :.: :.:.: .: :::.: :::.::.: ::
CCDS53 GSP-PEN-------------------------GASSLPGLMPAQHYLLRARYASARGGGT
440 450 460 470
910 920 930 940 950 960
pF1KE0 PPTPLPGLERMSLRTRLALLDAPERTLPAGCPRPLGPRRGSDGPTYGHGHAGAAPAFPHE
:: .:.:.. : : : : :. .:
CCDS53 SPTAASSLDRIG-----------------GLPMP--PWRSR-------------AEYPGY
480 490 500
970 980 990 1000 1010
pF1KE0 APGGGA-RRASDPVRRPDALSLPRVQRFHSTHNVNPGPLPPCADRRGLRLQSHPSTDGGL
:..:. ::::::.. : . :::::.: :. :: . : . : :
CCDS53 NPNAGVTRRASDPAQAADRPAPARVQRFKSLGCVH---TPPTVAGGGQNF------DPYL
510 520 530 540 550
1020 1030 1040 1050 1060 1070
pF1KE0 ARGAYSPRPPSISENVAMEAVAAGVDGAGPEADLGLPEDDLVLPDDVVQYIKAHASGALD
..:::.::::.::.::.: :: :. :. .... . . .:
CCDS53 PTSVYSPQPPSITENAAMDAR-------------GLQEE----PEVGTSMVGSGLNPYMD
560 570 580 590
1080 1090 1100 1110 1120 1130
pF1KE0 EGTGQVYPTESTGFSDNPRLPSPGLHGQRRMVAADSNVGPSAPMLGGCQLGFGAPSSLNK
::.. :.. .:. . .: : :: :. :: : :.. .
CCDS53 -----FPPTDTLGYG-GPEGAAAEPYGAR---------GP-----GSLPLGPGPPTNYGP
600 610 620 630
1140 1150 1160 1170 1180 1190
pF1KE0 NNMPVQWNEVSSGTVDSLASQVKPPPFPQGNLAVVQQKPAF-GQYPGYSPQGLQASPGGL
: : : :: : :.. :. : ::: :..: ::
CCDS53 NPCPQQ------------ASYPDPTQETWGEF------PSHSGLYPG--PKAL----GGT
640 650 660 670
1200 1210 1220 1230 1240 1250
pF1KE0 DSTQPHLQPRSGA---PSQGIPRVNYMQQLRQPVAGSQCPGMTTTMSPHACYGQVHPQLS
: :.:. . . : :: : .::. :.. .. : : :::
CCDS53 YSQCPRLEHYGQVQVKPEQGCP------------VGSDSTGLAPCLNAHPSEGPPHPQ--
680 690 700 710
1260 1270 1280 1290 1300 1310
pF1KE0 PSTISGALNQFPQSCSNMPAKPGHLGHPQQTEVAPDPTTMGNRHR---ELGVPNSALAGV
: ....:: :. : .: :. : : . .. : .. :. . .:
CCDS53 P-----LFSHYPQ-----PSPPQYLQSGPYTQ--PPPDYLPSEPRPCLDFDSPTHS-TGQ
720 730 740 750 760
1320 1330 1340 1350 1360 1370
pF1KE0 PPPHPVQSYPQQSHHLAASMSQEGYHQVPSLLPARQPGFMEPQTGPMGVATAGFGLVQPR
. : .: :....: :: . . ::..:... :. .: :
CCDS53 LKAQLVCNYVQSQQELL----WEGGGREDA--PAQEPSYQSPKF---------LGGSQVS
770 780 790 800
1380 1390 1400 1410 1420 1430
pF1KE0 PPLEPSPTGRHRGVRAVQQQLAYARATGHAMAAMPSSQETAEAVPKGAMGNMGSVPPQPP
: .:.. . : . .: .: ...:. . : :: : .: :
CCDS53 PSRAKAPVNTY-GP-GFGPNLP-----NHKSGSYPTPSPCHENFVVGA--NRASHRAAAP
810 820 830 840 850 860
1440 1450 1460 1470 1480 1490
pF1KE0 PQDAGGAPDHSMLYYYGQIHMYEQDGGLENLGSCQVMRSQPPQPQACQDSIQPQPLPSPG
:. : :: ... :: . :: .:.. . . : : :
CCDS53 PRLLPPLPTC-----YGPLKV----GGTN--PSCG-------HPEVGRLGGGPALYPPPE
870 880 890 900
1500 1510 1520 1530 1540 1550
pF1KE0 VNQVSSTVDSQLLEAPQIDFDAIMDDGDHSSLFSGALSPSLLHSLSQNSSRLTTPRNSLT
.:: . .:: :. :.:: ::.:. . .::: :. : .: ::
CCDS53 -GQVCNPLDSLDLDNTQLDFVAILDEPQ-------GLSPPPSHD--QRGSSGHTP-----
910 920 930 940
1560 1570 1580
pF1KE0 LPSIPAGISNMAVGDMSSMLTSLAEESKFLNMMT
: :.: :::::.:: .: :: :..:::
CCDS53 -P--PSGPPNMAVGNMSVLLRSLPGETEFLNSSA
950 960 970
>>CCDS53806.1 GLI1 gene_id:2735|Hs108|chr12 (1065 aa)
initn: 1771 init1: 1096 opt: 1207 Z-score: 607.0 bits: 124.6 E(32554): 1.7e-27
Smith-Waterman score: 1937; 35.9% identity (52.7% similar) in 1398 aa overlap (202-1583:6-1062)
180 190 200 210 220
pF1KE0 TPSDYYHQMTLVAGHPAPYGDLLMQSGGAASAPHLHDYLNPVDVSRFSS---PRVTP--R
. : . .: .: . . : : : .
CCDS53 MFNSMTPPPISSYGEPCCLRPLPSQGAPSVGTEVK
10 20 30
230 240 250 260 270 280
pF1KE0 LSRKRALSISPLSDASLDLQRMIRTSPNSLVAYINNSRSSSAASGSYGHLSAGALSPAFT
:..::::::::::::::::: .:::::.::::.:: :: .: . ::::::: :..::..
CCDS53 LTKKRALSISPLSDASLDLQTVIRTSPSSLVAFIN-SRCTSPG-GSYGHLSIGTMSPSLG
40 50 60 70 80 90
290 300 310 320 330 340
pF1KE0 FPHPINPVAYQQILSQQRGLGSAFGHTPPLIQPSPTFLAQQPMALTSINATPTQLSSSSN
:: .: .:.: . .:: .:: . . : .. : . . .
CCDS53 FPAQMN---------HQKGPSPSFG-----VQPC----GPHDSARGGMIPHPQSRGPFPT
100 110 120 130
350 360 370 380 390 400
pF1KE0 CLSDTNQNKQSSESAVSSTVNPVAIHKRSKVKTEPEGLRPASPLALTQGQVSGHGSCGCA
: : :. . :. : . :: .:..:. .: :
CCDS53 C-----QLKSELDMLVG------------KCREEP-----------LEGDMSSPNSTGIQ
140 150 160
410 420 430 440 450 460
pF1KE0 LPLSQEQLADLKEDLDRDDCKQEAEVVIYETNCHWEDCTKEYDTQEQLVHHINNEHIHGE
:: . : .:::.:.. :.: : : :::.:.:. :..:.:.:::::::::.::::::
CCDS53 DPLLG--MLDGREDLEREE-KREPESV-YETDCRWDGCSQEFDSQEQLVHHINSEHIHGE
170 180 190 200 210 220
470 480 490 500 510 520
pF1KE0 KKEFVCRWQACTREQKPFKAQYMLVVHMRRHTGEKPHKCTFEGCSKAYSRLENLKTHLRS
.:::::.: .:.:: .:::::::::::::::::::::::::::: :.:::::::::::::
CCDS53 RKEFVCHWGGCSRELRPFKAQYMLVVHMRRHTGEKPHKCTFEGCRKSYSRLENLKTHLRS
230 240 250 260 270 280
530 540 550 560 570 580
pF1KE0 HTGEKPYVCEHEGCNKAFSNASDRAKHQNRTHSNEKPYICKIPGCTKRYTDPSSLRKHVK
:::::::.::::::.:::::::::::::::::::::::.::.::::::::::::::::::
CCDS53 HTGEKPYMCEHEGCSKAFSNASDRAKHQNRTHSNEKPYVCKLPGCTKRYTDPSSLRKHVK
290 300 310 320 330 340
590 600 610 620 630 640
pF1KE0 TVHGPDAHVTKKQRNDVHL-RTPLLKENGDSEAGTE-PGGPESTEASSTSQAVEDCLHVR
:::::::::::..:.: : :.: .. : : ::: :. :
CCDS53 TVHGPDAHVTKRHRGDGPLPRAPSIS---TVEPKREREGGPIREES-------------R
350 360 370 380
650 660 670 680 690 700
pF1KE0 AIKTESSGLCQSSPGAQSSCSSEPSPLGSAPNNDSGVEMPGTGPGSLGDLTALDDTPPGA
:.. : ::::::::::. :: ::: :.:::::: :.. :: ::..::. : :
CCDS53 LTVPEGAMKPQPSPGAQSSCSSDHSPAGSAANTDSGVEMTGNAGGSTEDLSSLDEGPCIA
390 400 410 420 430 440
710 720 730 740 750 760
pF1KE0 DTSALAAPSAGGLQLRKHMTTMHRFEQLKKEKLKSLKDSCSWAGPTPHTRNTKLPPLPGS
: :: .:..:.:.:. ..:..:. : ::. ::: : .
CCDS53 GT---------GL------STLRRLENLRLDQLHQLR-------PIG-TRGLKLPSLSHT
450 460 470 480
770 780 790 800 810 820
pF1KE0 GSILENFSGSGGGGPAGLLPNPRLSELSASEVTMLSQLQERRDSSTSTVSSAYTVSRRSS
:. . : :..: :::.::.:..:::::::::::
CCDS53 GTTVSRRVGP----PVSL---------------------ERRSSSSSSISSAYTVSRRSS
490 500 510
830 840 850 860 870 880
pF1KE0 GISPYFSSRRSSEASPLGAGRPHNASSADSYDPISTDASRRSSEASQCSGGSGLLNLTPA
::. .:: :.: :.:.: .: ::
CCDS53 LASPF------PPGSP-----PEN-------------------------GASSLPGLMPA
520 530 540
890 900 910 920 930 940
pF1KE0 QQYSLRAKYAAATGG-PPPTPLPGLERMSLRTRLALLDAPERTLPAGCPRPLGPRRGSDG
:.: :::.::.: :: :: .:.:.. : : : : :.
CCDS53 QHYLLRARYASARGGGTSPTAASSLDRIG-----------------GLPMP--PWRSR--
550 560 570 580
950 960 970 980 990 1000
pF1KE0 PTYGHGHAGAAPAFPHEAPGGGA-RRASDPVRRPDALSLPRVQRFHSTHNVNPGPLPPCA
.: :..:. ::::::.. : . :::::.: :. :: .
CCDS53 -----------AEYPGYNPNAGVTRRASDPAQAADRPAPARVQRFKSLGCVHT---PPTV
590 600 610 620
1010 1020 1030 1040 1050 1060
pF1KE0 DRRGLRLQSHPSTDGGLARGAYSPRPPSISENVAMEAVAAGVDGAGPEADLGLPEDDLVL
: . : : ..:::.::::.::.::.: :: :.
CCDS53 AGGGQNF------DPYLPTSVYSPQPPSITENAAMDAR-------------GLQEE----
630 640 650 660
1070 1080 1090 1100 1110 1120
pF1KE0 PDDVVQYIKAHASGALDEGTGQVYPTESTGFSDNPRLPSPGLHGQRRMVAADSNVGPSAP
:. .... . . .: ::.. :.. : .: :: : .:
CCDS53 PEVGTSMVGSGLNPYMD-----FPPTDTLGYG--------GPEG-----AAAEPYGARGP
670 680 690 700
1130 1140 1150 1160 1170 1180
pF1KE0 MLGGCQLGFGAPSSLNKNNMPVQWNEVSSGTVDSLASQVKPPPFPQGNLAVVQQKPAF-G
:. :: : :.. . : : : :: : :.. :. :
CCDS53 --GSLPLGPGPPTNYGPNPCPQQ------------ASYPDPTQETWGEF------PSHSG
710 720 730 740
1190 1200 1210 1220 1230
pF1KE0 QYPGYSPQGLQASPGGLDSTQPHLQPRSGA---PSQGIPRVNYMQQLRQPVAGSQCPGMT
::: :..: :: : :.:. . . : :: : .::. :..
CCDS53 LYPG--PKAL----GGTYSQCPRLEHYGQVQVKPEQGCP------------VGSDSTGLA
750 760 770 780
1240 1250 1260 1270 1280 1290
pF1KE0 TTMSPHACYGQVHPQLSPSTISGALNQFPQSCSNMPAKPGHLGHPQQTEVAPDPTTMGNR
.. : : ::: : ....:: :. : .: :. : : . ..
CCDS53 PCLNAHPSEGPPHPQ--P-----LFSHYPQ-----PSPPQYLQSGPYTQ--PPPDYLPSE
790 800 810 820 830
1300 1310 1320 1330 1340 1350
pF1KE0 HR---ELGVPNSALAGVPPPHPVQSYPQQSHHLAASMSQEGYHQVPSLLPARQPGFMEPQ
: .. :. . .: . : .: :....: :: . . ::..:... :.
CCDS53 PRPCLDFDSPTHS-TGQLKAQLVCNYVQSQQELL----WEGGGREDA--PAQEPSYQSPK
840 850 860 870 880
1360 1370 1380 1390 1400 1410
pF1KE0 TGPMGVATAGFGLVQPRPPLEPSPTGRHRGVRAVQQQLAYARATGHAMAAMPSSQETAEA
.: : : .:.. . . .: .: ...:. . :
CCDS53 F---------LGGSQVSPSRAKAPVNTYGP--GFGPNLP-----NHKSGSYPTPSPCHEN
890 900 910 920 930
1420 1430 1440 1450 1460 1470
pF1KE0 VPKGAMGNMGSVPPQPPPQDAGGAPDHSMLYYYGQIHMYEQDGGLENLGSCQVMRSQPPQ
:: : .: ::. : :: ... :: . :: .
CCDS53 FVVGA--NRASHRAAAPPRLLPPLPTC-----YGPLKV----GGTN--PSCG-------H
940 950 960 970
1480 1490 1500 1510 1520 1530
pF1KE0 PQACQDSIQPQPLPSPGVNQVSSTVDSQLLEAPQIDFDAIMDDGDHSSLFSGALSPSLLH
:.. . . : : : .:: . .:: :. :.:: ::.:. . .::: :
CCDS53 PEVGRLGGGPALYPPPE-GQVCNPLDSLDLDNTQLDFVAILDEPQ-------GLSPPPSH
980 990 1000 1010 1020
1540 1550 1560 1570 1580
pF1KE0 SLSQNSSRLTTPRNSLTLPSIPAGISNMAVGDMSSMLTSLAEESKFLNMMT
. : .: :: : :.: :::::.:: .: :: :..:::
CCDS53 D--QRGSSGHTP------P--PSGPPNMAVGNMSVLLRSLPGETEFLNSSA
1030 1040 1050 1060
>>CCDS8940.1 GLI1 gene_id:2735|Hs108|chr12 (1106 aa)
initn: 1814 init1: 1096 opt: 1207 Z-score: 606.7 bits: 124.6 E(32554): 1.8e-27
Smith-Waterman score: 1975; 35.7% identity (52.9% similar) in 1432 aa overlap (165-1583:26-1103)
140 150 160 170 180 190
pF1KE0 SSPTLSMISAARGLSPADVAQEHLKERGLFGLPAPGT---TPSDYYHQMTLVAGHPAPYG
: :. :: . . :: .:..: : ::
CCDS89 MFNSMTPPPISSYGEPCCLRPLPSQGAPSVGTEGLSGPPFCHQANLMSG-PHSYG
10 20 30 40 50
200 210 220 230 240 250
pF1KE0 DLLMQSGGAASAPHLHDYLNPVDVSRFSSPRVTPRLSRKRALSISPLSDASLDLQRMIRT
.... . .: ::::: . .:..::::::::::::::::: .:::
CCDS89 PA-RETNSCTEGPL------------FSSPRSAVKLTKKRALSISPLSDASLDLQTVIRT
60 70 80 90 100
260 270 280 290 300 310
pF1KE0 SPNSLVAYINNSRSSSAASGSYGHLSAGALSPAFTFPHPINPVAYQQILSQQRGLGSAFG
::.::::.:: :: .: . ::::::: :..::.. :: .: .:.: . .::
CCDS89 SPSSLVAFIN-SRCTSPG-GSYGHLSIGTMSPSLGFPAQMN---------HQKGPSPSFG
110 120 130 140 150
320 330 340 350 360 370
pF1KE0 HTPPLIQPSPTFLAQQPMALTSINATPTQLSSSSNCLSDTNQNKQSSESAVSSTVNPVAI
.:: . . : .. : . . .: : :. . :.
CCDS89 -----VQPC----GPHDSARGGMIPHPQSRGPFPTC-----QLKSELDMLVG--------
160 170 180
380 390 400 410 420 430
pF1KE0 HKRSKVKTEPEGLRPASPLALTQGQVSGHGSCGCALPLSQEQLADLKEDLDRDDCKQEAE
: . :: .:..:. .: : :: . : .:::.:.. :.: :
CCDS89 ----KCREEP-----------LEGDMSSPNSTGIQDPLL--GMLDGREDLEREE-KREPE
190 200 210 220 230
440 450 460 470 480 490
pF1KE0 VVIYETNCHWEDCTKEYDTQEQLVHHINNEHIHGEKKEFVCRWQACTREQKPFKAQYMLV
: :::.:.:. :..:.:.:::::::::.::::::.:::::.: .:.:: .:::::::::
CCDS89 SV-YETDCRWDGCSQEFDSQEQLVHHINSEHIHGERKEFVCHWGGCSRELRPFKAQYMLV
240 250 260 270 280
500 510 520 530 540 550
pF1KE0 VHMRRHTGEKPHKCTFEGCSKAYSRLENLKTHLRSHTGEKPYVCEHEGCNKAFSNASDRA
::::::::::::::::::: :.::::::::::::::::::::.::::::.::::::::::
CCDS89 VHMRRHTGEKPHKCTFEGCRKSYSRLENLKTHLRSHTGEKPYMCEHEGCSKAFSNASDRA
290 300 310 320 330 340
560 570 580 590 600 610
pF1KE0 KHQNRTHSNEKPYICKIPGCTKRYTDPSSLRKHVKTVHGPDAHVTKKQRNDVHL-RTPLL
:::::::::::::.::.:::::::::::::::::::::::::::::..:.: : :.: .
CCDS89 KHQNRTHSNEKPYVCKLPGCTKRYTDPSSLRKHVKTVHGPDAHVTKRHRGDGPLPRAPSI
350 360 370 380 390 400
620 630 640 650 660 670
pF1KE0 KENGDSEAGTEPGGPESTEASSTSQAVEDCLHVRAIKTESSGLCQSSPGAQSSCSSEPSP
. .. . ::: :. : :.. : ::::::::::. ::
CCDS89 STVEPKR--EREGGPIREES-------------RLTVPEGAMKPQPSPGAQSSCSSDHSP
410 420 430 440 450
680 690 700 710 720 730
pF1KE0 LGSAPNNDSGVEMPGTGPGSLGDLTALDDTPPGADTSALAAPSAGGLQLRKHMTTMHRFE
::: :.:::::: :.. :: ::..::. : : : :: .:..:.:
CCDS89 AGSAANTDSGVEMTGNAGGSTEDLSSLDEGPCIAGT---------GL------STLRRLE
460 470 480 490
740 750 760 770 780 790
pF1KE0 QLKKEKLKSLKDSCSWAGPTPHTRNTKLPPLPGSGSILENFSGSGGGGPAGLLPNPRLSE
.:. ..:..:. : ::. ::: : .:. . : :..:
CCDS89 NLRLDQLHQLR-------PIG-TRGLKLPSLSHTGTTVSRRVGP----PVSL--------
500 510 520 530
800 810 820 830 840 850
pF1KE0 LSASEVTMLSQLQERRDSSTSTVSSAYTVSRRSSGISPYFSSRRSSEASPLGAGRPHNAS
:::.::.:..::::::::::: ::. : :. :.:
CCDS89 -------------ERRSSSSSSISSAYTVSRRSSLASPF----------PPGSP-PEN--
540 550 560 570
860 870 880 890 900
pF1KE0 SADSYDPISTDASRRSSEASQCSGGSGLLNLTPAQQYSLRAKYAAATGG-PPPTPLPGLE
:.:.: .: :::.: :::.::.: :: :: .:.
CCDS89 -----------------------GASSLPGLMPAQHYLLRARYASARGGGTSPTAASSLD
580 590 600 610
910 920 930 940 950 960
pF1KE0 RMSLRTRLALLDAPERTLPAGCPRPLGPRRGSDGPTYGHGHAGAAPAFPHEAPGGGA-RR
:.. : : : : :. .: :..:. ::
CCDS89 RIG-----------------GLPMP--PWRSR-------------AEYPGYNPNAGVTRR
620 630
970 980 990 1000 1010 1020
pF1KE0 ASDPVRRPDALSLPRVQRFHSTHNVNPGPLPPCADRRGLRLQSHPSTDGGLARGAYSPRP
::::.. : . :::::.: :. :: . : . : : ..:::.:
CCDS89 ASDPAQAADRPAPARVQRFKSLGCVHT---PPTVAGGGQNF------DPYLPTSVYSPQP
640 650 660 670 680
1030 1040 1050 1060 1070 1080
pF1KE0 PSISENVAMEAVAAGVDGAGPEADLGLPEDDLVLPDDVVQYIKAHASGALDEGTGQVYPT
:::.::.::.: :: :. :. .... . . .: ::
CCDS89 PSITENAAMDAR-------------GLQEE----PEVGTSMVGSGLNPYMD-----FPPT
690 700 710 720
1090 1100 1110 1120 1130 1140
pF1KE0 ESTGFSDNPRLPSPGLHGQRRMVAADSNVGPSAPMLGGCQLGFGAPSSLNKNNMPVQWNE
.. :.. .:. . .: : :: :. :: : :.. . : : :
CCDS89 DTLGYG-GPEGAAAEPYGAR---------GP-----GSLPLGPGPPTNYGPNPCPQQ---
730 740 750 760
1150 1160 1170 1180 1190 1200
pF1KE0 VSSGTVDSLASQVKPPPFPQGNLAVVQQKPAF-GQYPGYSPQGLQASPGGLDSTQPHLQP
:: : :.. :. : ::: :..: :: : :.:.
CCDS89 ---------ASYPDPTQETWGEF------PSHSGLYPG--PKAL----GGTYSQCPRLEH
770 780 790 800
1210 1220 1230 1240 1250 1260
pF1KE0 RSGA---PSQGIPRVNYMQQLRQPVAGSQCPGMTTTMSPHACYGQVHPQLSPSTISGALN
. . : :: : .::. :.. .. : : ::: : ..
CCDS89 YGQVQVKPEQGCP------------VGSDSTGLAPCLNAHPSEGPPHPQ--P-----LFS
810 820 830 840
1270 1280 1290 1300 1310 1320
pF1KE0 QFPQSCSNMPAKPGHLGHPQQTEVAPDPTTMGNRHR---ELGVPNSALAGVPPPHPVQSY
..:: :. : .: :. : : . .. : .. :. . .: . : .:
CCDS89 HYPQ-----PSPPQYLQSGPYTQ--PPPDYLPSEPRPCLDFDSPTHS-TGQLKAQLVCNY
850 860 870 880 890 900
1330 1340 1350 1360 1370 1380
pF1KE0 PQQSHHLAASMSQEGYHQVPSLLPARQPGFMEPQTGPMGVATAGFGLVQPRPPLEPSPTG
:....: :: . . ::..:... :. .: : : .:..
CCDS89 VQSQQELL----WEGGGREDA--PAQEPSYQSPKF---------LGGSQVSPSRAKAPVN
910 920 930 940
1390 1400 1410 1420 1430 1440
pF1KE0 RHRGVRAVQQQLAYARATGHAMAAMPSSQETAEAVPKGAMGNMGSVPPQPPPQDAGGAPD
. : . .: .: ...:. . : :: : .: ::. :
CCDS89 TY-GP-GFGPNLP-----NHKSGSYPTPSPCHENFVVGA--NRASHRAAAPPRLLPPLPT
950 960 970 980 990
1450 1460 1470 1480 1490 1500
pF1KE0 HSMLYYYGQIHMYEQDGGLENLGSCQVMRSQPPQPQACQDSIQPQPLPSPGVNQVSSTVD
:: ... :: . :: .:.. . . : : : .:: . .:
CCDS89 C-----YGPLKV----GGTNP--SCG-------HPEVGRLGGGPALYPPPE-GQVCNPLD
1000 1010 1020 1030
1510 1520 1530 1540 1550 1560
pF1KE0 SQLLEAPQIDFDAIMDDGDHSSLFSGALSPSLLHSLSQNSSRLTTPRNSLTLPSIPAGIS
: :. :.:: ::.:. . .::: :. : .: :: : :.:
CCDS89 SLDLDNTQLDFVAILDEPQ-------GLSPPPSHD--QRGSSGHTP------P--PSGPP
1040 1050 1060 1070 1080
1570 1580
pF1KE0 NMAVGDMSSMLTSLAEESKFLNMMT
:::::.:: .: :: :..:::
CCDS89 NMAVGNMSVLLRSLPGETEFLNSSA
1090 1100
>>CCDS43784.1 GLIS3 gene_id:169792|Hs108|chr9 (930 aa)
initn: 694 init1: 482 opt: 991 Z-score: 502.5 bits: 105.0 E(32554): 1.1e-21
Smith-Waterman score: 1025; 34.9% identity (56.6% similar) in 705 aa overlap (53-721:110-781)
30 40 50 60 70
pF1KE0 AGFPDPGKKASPLVVAAAAAAAVAAQGVPQHLLPP----FHAPLPIDMRHQEGRYHYEPH
: : : : .:.: . .: . :.
CCDS43 HLPALSPRRQMLTNGKPRFQVTQAGGMSGSHTLKPKQQEFGSPFPPN--PGKGALGFGPQ
80 90 100 110 120 130
80 90 100 110 120 130
pF1KE0 --SV-HGVHGPPALSGSPV-ISDISLIRLSPHPAGPGESPFNAPHPYVNPHMEHYLRSVH
:. .: . ....::. .. ..:: :: ::. . : : .. :. ..
CCDS43 CKSIGKGSCNNLVVTSSPMMVQRLGLI--SP-PASQVSTACNQISPSLQRAMNAANLNIP
140 150 160 170 180 190
140 150 160 170 180
pF1KE0 SSPTLSMIS------AARGLSPADVAQEHLKE--RGLFGLPAPGTTPSDYYHQMTLVAGH
: : :.:: .. .:. .. :. .: .: .:: . :.. : : :
CCDS43 PSDTRSLISRESLASTTLSLTESQSASSMKQEWSQGYRALP----SLSNHGSQNGLDLGD
200 210 220 230 240 250
190 200 210 220 230 240
pF1KE0 --PAPYGDLLMQSGGAASAPHL----HDYLNPVDVSRFSSPRVTPRLSRKRALSISPLSD
: : . ... . : : .. .: : :: : :.:::::.:::::
CCDS43 LLSLPPGTSMSSNSVSNSLPSYLFGTESSHSPYPSPRHSSTRSHSARSKKRALSLSPLSD
260 270 280 290 300 310
250 260 270 280 290
pF1KE0 A-SLDLQRMIRTSPNSLVAYINNSRSSSAASGS----YGHLSAGALSPAFTFPHPINPVA
. ..:.. .:::::.:::::::.::.: : . :::. :. . . :.:. : .
CCDS43 GIGIDFNTIIRTSPTSLVAYINGSRASPANLSPQPEVYGHF-LGVRGSCIPQPRPV-PGS
320 330 340 350 360
300 310 320 330 340
pF1KE0 YQQILSQQRGLG-SAFGHTPPLIQPSPTFLAQQPMALTSINATPTQLS-----SSSNCLS
. .: ::. :.:. : . : . . .: .: . :.: :
CCDS43 QKGVLVAPGGLALPAYGEDGALEHERMQQLEHGGLQPGLVNHMVVQHGLPGPDSQSAGLF
370 380 390 400 410 420
350 360 370 380 390 400
pF1KE0 DTNQNKQSSESAVSSTVNPVAIHKRSKVKTEPEGLRPASPLALTQGQVSGHGSCGCALPL
:.. .. :.:. : : :. : : : :
CCDS43 KTERLEEFPGSTVDLPPAP---------PLPPLPPPPGPPPPYHAHAHLHHPELG---PH
430 440 450 460 470
410 420 430 440 450 460
pF1KE0 SQEQLADLKEDLDRDDCKQEAEVVIYETNCHWEDCTKEYDTQEQLVHHINNEHIHGEKKE
.: ::: . :: : : . . . :.: ::. :: ::.::.::.. :: .: :
CCDS43 AQ-QLALPQATLDDDG---EMDGIGGKHCCRWIDCSALYDQQEELVRHIEKVHIDQRKGE
480 490 500 510 520 530
470 480 490 500 510 520
pF1KE0 -FVCRWQACTREQKPFKAQYMLVVHMRRHTGEKPHKCTFEGCSKAYSRLENLKTHLRSHT
:.: : .: :. :::.:.: :..::: :.::::.::::::: ::.::::::: ::::::
CCDS43 DFTCFWAGCPRRYKPFNARYKLLIHMRVHSGEKPNKCTFEGCEKAFSRLENLKIHLRSHT
540 550 560 570 580 590
530 540 550 560 570 580
pF1KE0 GEKPYVCEHEGCNKAFSNASDRAKHQNRTHSNEKPYICKIPGCTKRYTDPSSLRKHVKTV
:::::.:.: ::.:::::.::::::: ::: . ::: :.:::::::::::::::::::.
CCDS43 GEKPYLCQHPGCQKAFSNSSDRAKHQ-RTHLDTKPYACQIPGCTKRYTDPSSLRKHVKAH
600 610 620 630 640 650
590 600 610 620 630 640
pF1KE0 HGPDAHVTKKQRNDVHLRTPLLKENGDSEAGTEPGGPESTEASST-SQAVEDCLHVRAIK
. . .. :: :....:. :: . .. .:... : .: ... . .
CCDS43 SSKEQQARKKLRSSTELHPDLLTDCLTVQSLQPATSPRDAAAEGTVGRSPGPGPDLYSAP
660 670 680 690 700 710
650 660 670 680 690 700
pF1KE0 TESSGLCQSSPGAQSSCSSEPSPLGSAPNNDSGVEMPGTGPGS-LGDLTALDDTPPGADT
::. .: :. .. : :. : :. .:. .:.: : :::.: ::.
CCDS43 IFSSNY-SSRSGTAAGAVPPPHPV-SHPSPGHNVQGSPHNPSSQLPPLTAVD---AGAER
720 730 740 750 760
710 720 730 740 750 760
pF1KE0 SALAAPSAGGLQLRKHMTTMHRFEQLKKEKLKSLKDSCSWAGPTPHTRNTKLPPLPGSGS
: .::: .. :.
CCDS43 FAPSAPSPHHISPRRVPAPSSILQRTQPPYTQQPSGSHLKSYQPETNSSFQPNGIHVHGF
770 780 790 800 810 820
>>CCDS6451.1 GLIS3 gene_id:169792|Hs108|chr9 (775 aa)
initn: 694 init1: 482 opt: 976 Z-score: 496.3 bits: 103.6 E(32554): 2.5e-21
Smith-Waterman score: 1010; 35.9% identity (56.9% similar) in 647 aa overlap (103-721:9-626)
80 90 100 110 120 130
pF1KE0 YHYEPHSVHGVHGPPALSGSPVISDISLIRLSPHPAGPGESPFNAPHPYVNPHMEHYLRS
.:: ::. . : : .. :. .
CCDS64 MMVQRLGLISP-PASQVSTACNQISPSLQRAMNAANLN
10 20 30
140 150 160 170 180
pF1KE0 VHSSPTLSMIS------AARGLSPADVAQEHLKE--RGLFGLPAPGTTPSDYYHQMTLVA
. : : :.:: .. .:. .. :. .: .: .:: . :.. : :
CCDS64 IPPSDTRSLISRESLASTTLSLTESQSASSMKQEWSQGYRALP----SLSNHGSQNGLDL
40 50 60 70 80 90
190 200 210 220 230
pF1KE0 GH--PAPYGDLLMQSGGAASAPHL----HDYLNPVDVSRFSSPRVTPRLSRKRALSISPL
: : : . ... . : : .. .: : :: : :.:::::.:::
CCDS64 GDLLSLPPGTSMSSNSVSNSLPSYLFGTESSHSPYPSPRHSSTRSHSARSKKRALSLSPL
100 110 120 130 140 150
240 250 260 270 280 290
pF1KE0 SDA-SLDLQRMIRTSPNSLVAYINNSRSSSAASGS----YGHLSAGALSPAFTFPHPINP
::. ..:.. .:::::.:::::::.::.: : . :::. :. . . :.:. :
CCDS64 SDGIGIDFNTIIRTSPTSLVAYINGSRASPANLSPQPEVYGHF-LGVRGSCIPQPRPV-P
160 170 180 190 200 210
300 310 320 330 340
pF1KE0 VAYQQILSQQRGLG-SAFGHTPPLIQPSPTFLAQQPMALTSINATPTQLS-----SSSNC
. . .: ::. :.:. : . : . . .: .: . :.:
CCDS64 GSQKGVLVAPGGLALPAYGEDGALEHERMQQLEHGGLQPGLVNHMVVQHGLPGPDSQSAG
220 230 240 250 260 270
350 360 370 380 390 400
pF1KE0 LSDTNQNKQSSESAVSSTVNPVAIHKRSKVKTEPEGLRPASPLALTQGQVSGHGSCGCAL
: :.. .. :.:. : : :. : : :
CCDS64 LFKTERLEEFPGSTVDLPPAP---------PLPPLPPPPGPPPPYHAHAHLHHPELG---
280 290 300 310
410 420 430 440 450 460
pF1KE0 PLSQEQLADLKEDLDRDDCKQEAEVVIYETNCHWEDCTKEYDTQEQLVHHINNEHIHGEK
: .: ::: . :: : : . . . :.: ::. :: ::.::.::.. :: .:
CCDS64 PHAQ-QLALPQATLDDDG---EMDGIGGKHCCRWIDCSALYDQQEELVRHIEKVHIDQRK
320 330 340 350 360 370
470 480 490 500 510 520
pF1KE0 KE-FVCRWQACTREQKPFKAQYMLVVHMRRHTGEKPHKCTFEGCSKAYSRLENLKTHLRS
: :.: : .: :. :::.:.: :..::: :.::::.::::::: ::.::::::: ::::
CCDS64 GEDFTCFWAGCPRRYKPFNARYKLLIHMRVHSGEKPNKCTFEGCEKAFSRLENLKIHLRS
380 390 400 410 420 430
530 540 550 560 570 580
pF1KE0 HTGEKPYVCEHEGCNKAFSNASDRAKHQNRTHSNEKPYICKIPGCTKRYTDPSSLRKHVK
:::::::.:.: ::.:::::.::::::: ::: . ::: :.:::::::::::::::::::
CCDS64 HTGEKPYLCQHPGCQKAFSNSSDRAKHQ-RTHLDTKPYACQIPGCTKRYTDPSSLRKHVK
440 450 460 470 480 490
590 600 610 620 630 640
pF1KE0 TVHGPDAHVTKKQRNDVHLRTPLLKENGDSEAGTEPGGPESTEASST-SQAVEDCLHVRA
. . . .. :: :....:. :: . .. .:... : .: ... . .
CCDS64 AHSSKEQQARKKLRSSTELHPDLLTDCLTVQSLQPATSPRDAAAEGTVGRSPGPGPDLYS
500 510 520 530 540 550
650 660 670 680 690 700
pF1KE0 IKTESSGLCQSSPGAQSSCSSEPSPLGSAPNNDSGVEMPGTGPGS-LGDLTALDDTPPGA
::. . : :. .. : :. : :. .:. .:.: : :::.: ::
CCDS64 APIFSSNYSSRS-GTAAGAVPPPHPV-SHPSPGHNVQGSPHNPSSQLPPLTAVD---AGA
560 570 580 590 600
710 720 730 740 750 760
pF1KE0 DTSALAAPSAGGLQLRKHMTTMHRFEQLKKEKLKSLKDSCSWAGPTPHTRNTKLPPLPGS
. : .::: .. :.
CCDS64 ERFAPSAPSPHHISPRRVPAPSSILQRTQPPYTQQPSGSHLKSYQPETNSSFQPNGIHVH
610 620 630 640 650 660
>>CCDS582.1 GLIS1 gene_id:148979|Hs108|chr1 (620 aa)
initn: 653 init1: 483 opt: 775 Z-score: 399.6 bits: 85.4 E(32554): 6.1e-16
Smith-Waterman score: 810; 33.1% identity (54.2% similar) in 649 aa overlap (260-869:1-572)
230 240 250 260 270 280
pF1KE0 KRALSISPLSDASLDLQRMIRTSPNSLVAYINNSRSSSAASGSYGHLSAGALSPAFTFPH
. ..:.: .: : :..: : : . .:
CCDS58 MAEARTSLSAH-CRGPLATG-LHPDLDLPG
10 20
290 300 310 320 330 340
pF1KE0 P--INPVAYQQILSQQRGLGSAFGHTPPLIQPSPTFLAQQPMALTSINATPTQLSSSSNC
.:. .:... . : .: : : .. ..: ::. .::: :
CCDS58 RSLATPAPSCYLLGSEPSSG--LGLQPETHLPEGSLKRCCVLGLP-----PTSPASSSPC
30 40 50 60 70 80
350 360 370 380
pF1KE0 LS-DTNQNKQSSESAVSSTVN-----PVA-----IHKRSK---VKTEP-------EGLRP
: :... .::.... . :: :.. ::.. ..:. :. :
CCDS58 ASSDVTSIIRSSQTSLVTCVNGLRSPPLTGDLGGPSKRARPGPASTDSHEGSLQLEACRK
90 100 110 120 130 140
390 400 410 420 430 440
pF1KE0 ASPL----ALTQGQVSGHGSCGCALPLSQEQLADLKEDLDRDDCKQEAEVVIYETNCHWE
:: : : ... : . : : :: .: ..:: . :.:
CCDS58 ASFLKQEPADEFSELFGPHQQGLPPPYPLSQLPP-GPSLGGLGLGLAGRVVAGRQACRWV
150 160 170 180 190 200
450 460 470 480 490 500
pF1KE0 DCTKEYDTQEQLVHHINNEHIHGEKKE-FVCRWQACTREQKPFKAQYMLVVHMRRHTGEK
:: :. ::.::.::.. :: .: : :.: : .:.:. :::.:.: :..::: :.:::
CCDS58 DCCAAYEQQEELVRHIEKSHIDQRKGEDFTCFWAGCVRRYKPFNARYKLLIHMRVHSGEK
210 220 230 240 250 260
510 520 530 540 550 560
pF1KE0 PHKCTFEGCSKAYSRLENLKTHLRSHTGEKPYVCEHEGCNKAFSNASDRAKHQNRTHSNE
:.:: :::::::.::::::: :::::::::::.:.: ::.:::::.::::::: ::: .
CCDS58 PNKCMFEGCSKAFSRLENLKIHLRSHTGEKPYLCQHPGCQKAFSNSSDRAKHQ-RTHLDT
270 280 290 300 310
570 580 590 600 610 620
pF1KE0 KPYICKIPGCTKRYTDPSSLRKHVKTVHGPDAHVTKKQRNDVHLRTPLLKENGDSEAGTE
::: :.::::.:::::::::::::: :: .:.:. .: :
CCDS58 KPYACQIPGCSKRYTDPSSLRKHVK------AHSAKEQQ----VRKKL------------
320 330 340 350
630 640 650 660 670 680
pF1KE0 PGGPESTEASSTSQAVEDCLHVRAIKTESSGLCQSSPGAQSSCSSEPSPLGSAPNNDSGV
.::. :::. .. .:: .. ..: :. : :. ....:. ::.
CCDS58 HAGPD-TEAD----VLTECLVLQQLHT-STQLAASD--GKGGCG-----LGQE-------
360 370 380 390
690 700 710 720 730
pF1KE0 EMPGTGPGSLGDLTALDD--TPPGADTSALAAPSAGGLQLRKHMTTMHRFEQLKKEKLKS
.::. :::. ..: . ::. :. . : . . ..:.. . : :
CCDS58 LLPGVYPGSITPHNGLASGLLPPAHDVPSRHHPLDATTSSHHHLSPLPMAE--------S
400 410 420 430 440
740 750 760 770 780 790
pF1KE0 LKDSCSWAGPTPHTRNTKL---PPLPGSGSILENFSGSGGGGPAGLLPN-PRLSELSASE
.:. . . .: . : :::: :.. : : :: : ::. : ...
CCDS58 TRDGLGPGLLSPIVSPLKGLGPPPLPPSSQ-----SHSPGGQPFPTLPSKPSYPPFQSPP
450 460 470 480 490 500
800 810 820 830 840 850
pF1KE0 VTMLSQLQERRDSSTSTVSSAYTVSRRSSGISPYFSSRRSSEASPLG---AGRPH--NAS
: . : . : : ..: . :: . : .: . : .:. : :
CCDS58 PPPLPSPQGYQGSFHS-IQSCF----------PYGDCYRMAEPAAGGDGLVGETHGFNPL
510 520 530 540 550
860 870 880 890 900 910
pF1KE0 SADSYDPISTDASRRSSEASQCSGGSGLLNLTPAQQYSLRAKYAAATGGPPPTPLPGLER
..: .:: . ::
CCDS58 RPNGYHSLSTPLPATGYEALAEASCPTALPQQPSEDVVSSGPEDCGFFPNGAFDHCLGHI
560 570 580 590 600 610
>>CCDS10511.1 GLIS2 gene_id:84662|Hs108|chr16 (524 aa)
initn: 464 init1: 249 opt: 695 Z-score: 361.6 bits: 78.2 E(32554): 8e-14
Smith-Waterman score: 709; 36.5% identity (57.7% similar) in 381 aa overlap (423-784:154-506)
400 410 420 430 440 450
pF1KE0 TQGQVSGHGSCGCALPLSQEQLADLKEDLDRDDCKQEAEVVIYETNCHWEDCTKEYDTQE
.: : . . . :.: :.. .. .
CCDS10 DGVPSSFQFFLPLGSGGALHLPASSFLTPPKDKCLSPDLPLPKQLVCRWAKCNQLFELLQ
130 140 150 160 170 180
460 470 480 490 500 510
pF1KE0 QLVHHINNEHIHGEKKE-FVCRWQACTREQKPFKAQYMLVVHMRRHTGEKPHKCTFEGCS
.:: :.:. :.. :: . :.:..:.:. . :.:.: ...:.: ::.::::.: ::
CCDS10 DLVDHVNDYHVKPEKDAGYCCHWEGCARHGRGFNARYKMLIHIRTHTNEKPHRCPT--CS
190 200 210 220 230 240
520 530 540 550 560 570
pF1KE0 KAYSRLENLKTHLRSHTGEKPYVCEHEGCNKAFSNASDRAKHQNRTHSNEKPYICKIPGC
:..::::::: : ::::::::::: .::::: .::.::: :: .::: .::: ::.:::
CCDS10 KSFSRLENLKIHNRSHTGEKPYVCPYEGCNKRYSNSSDRFKH-TRTHYVDKPYYCKMPGC
250 260 270 280 290 300
580 590 600 610 620 630
pF1KE0 TKRYTDPSSLRKHVKTVHGPDAHVTKKQRNDVHLRTPLLKENGDSEAGTEPGGPESTEAS
::::::::::::.:. :: :...:.. ..:: : . ::: . :
CCDS10 HKRYTDPSSLRKHIKA-HGH--FVSHEQQELLQLRPP-----PKPPLPAPDGGPYVSGA-
310 320 330 340 350
640 650 660 670 680
pF1KE0 STSQAVEDCLHVRAIKTESSGLCQSSPGAQSSCSSEPSPLGSAPNNDSGVEMPG--TGPG
: . . : . :: :: . : :.. ...: : :::
CCDS10 ---QII---IPNPAALFGGPGL----PGLPLPLAPGPLDLSALACGNGGGSGGGGGMGPG
360 370 380 390 400
690 700 710 720 730
pF1KE0 SLGDLTALD-------DTPPGAD------TSALAAPSAG---GLQLRKHMTTMHRFEQLK
: . :. .: :: .: ::. ..: : . : . : . .
CCDS10 LPGPVLPLNLAKNPLLPSPFGAGGLGLPVVSLLAGAAGGKAEGEKGRGSVPTRALGMEGH
410 420 430 440 450 460
740 750 760 770 780 790
pF1KE0 KEKLKSLKDSCSWAGPTPHTRNTKLPPLPGSGSILENFSGSGGGGPAGLLPNPRLSELSA
: :. ..::: :.: :: :::. : . .:....: .: :
CCDS10 KTPLERTESSCSR--PSP----DGLPLLPGTVLDLSTGVNSAASSPEALAPGWVVIPPGS
470 480 490 500 510
800 810 820 830 840 850
pF1KE0 SEVTMLSQLQERRDSSTSTVSSAYTVSRRSSGISPYFSSRRSSEASPLGAGRPHNASSAD
CCDS10 VLLKPAVVN
520
>>CCDS9495.1 ZIC2 gene_id:7546|Hs108|chr13 (532 aa)
initn: 672 init1: 412 opt: 619 Z-score: 324.5 bits: 71.3 E(32554): 9.4e-12
Smith-Waterman score: 623; 37.9% identity (66.3% similar) in 285 aa overlap (431-697:250-523)
410 420 430 440 450
pF1KE0 GSCGCALPLSQEQLADLKEDLDRDDCKQEAEVVIYETNCHWED----------CTKEYDT
. . : :.: : :.: ..:
CCDS94 NMGMNMAAAAAHHHHHHHHHPGAFFRYMRQQCIKQELICKWIDPEQLSNPKKSCNKTFST
220 230 240 250 260 270
460 470 480 490 500
pF1KE0 QEQLVHHINNEHIHG-EKKEFVCRWQACTREQKPFKAQYMLVVHMRRHTGEKPHKCTFEG
...:: :.. ::. : :... :: :. : :: :::::.: :: :.: :::::: : : :
CCDS94 MHELVTHVSVEHVGGPEQSNHVCFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPG
280 290 300 310 320 330
510 520 530 540 550 560
pF1KE0 CSKAYSRLENLKTHLRSHTGEKPYVCEHEGCNKAFSNASDRAKHQNRTHSNEKPYICKIP
:.:...: :::: : :.::::::. :: :::.. :.:.::: ::.. .:...:::.::.
CCDS94 CGKVFARSENLKIHKRTHTGEKPFQCEFEGCDRRFANSSDRKKHMH-VHTSDKPYLCKM-
340 350 360 370 380 390
570 580 590 600 610 620
pF1KE0 GCTKRYTDPSSLRKHVKTVH--GPD-AHVTKKQRNDVHLRTP--LLKENGDSEAGTE--P
: : :: :::::::.: :: .:. .. . . . :: :.. ... ..... :
CCDS94 -CDKSYTHPSSLRKHMK-VHESSPQGSESSPAASSGYESSTPPGLVSPSAEPQSSSNLSP
400 410 420 430 440 450
630 640 650 660 670 680
pF1KE0 GGPESTEASSTSQAVEDCLHVRAIKTESSGLCQSSPGAQSSCSSEPSPLGSAPNNDSGVE
.. .. :.... :. . .: :. . :.: .: :...: .. :.: .. .:
CCDS94 AAAAAAAAAAAAAAAVSAVH-RGGGSGSGGAGGGSGGGSGSGGGG----GGAGGGGGGSS
460 470 480 490 500 510
690 700 710 720 730 740
pF1KE0 MPGTGPGSLGDLTALDDTPPGADTSALAAPSAGGLQLRKHMTTMHRFEQLKKEKLKSLKD
: : :. : ..:
CCDS94 --GGGSGTAGGHSGLSSNFNEWYV
520 530
1586 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 01:53:13 2016 done: Sat Nov 5 01:53:14 2016
Total Scan time: 5.520 Total Display time: 0.610
Function used was FASTA [36.3.4 Apr, 2011]