FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB8405, 804 aa
1>>>pF1KB8405 804 - 804 aa - 804 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 11.5709+/-0.00113; mu= -8.5696+/- 0.067
mean_var=287.9050+/-58.514, 0's: 0 Z-trim(111.8): 78 B-trim: 0 in 0/54
Lambda= 0.075587
statistics sampled from 12560 (12632) to 12560 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.715), E-opt: 0.2 (0.388), width: 16
Scan time: 4.780
The best scores are: opt bits E(32554)
CCDS53605.1 SOX6 gene_id:55553|Hs108|chr11 ( 804) 5326 594.8 1.9e-169
CCDS53604.1 SOX6 gene_id:55553|Hs108|chr11 ( 801) 5304 592.4 9.9e-169
CCDS7821.1 SOX6 gene_id:55553|Hs108|chr11 ( 808) 3630 409.8 8.9e-114
CCDS44844.1 SOX5 gene_id:6660|Hs108|chr12 ( 750) 1112 135.2 3.8e-31
CCDS58217.1 SOX5 gene_id:6660|Hs108|chr12 ( 753) 1112 135.2 3.8e-31
CCDS8699.1 SOX5 gene_id:6660|Hs108|chr12 ( 763) 1112 135.2 3.9e-31
CCDS41761.1 SOX5 gene_id:6660|Hs108|chr12 ( 377) 1090 132.7 1.1e-30
CCDS58216.1 SOX5 gene_id:6660|Hs108|chr12 ( 642) 1091 132.9 1.6e-30
CCDS81672.1 SOX5 gene_id:6660|Hs108|chr12 ( 728) 1091 132.9 1.8e-30
CCDS44299.1 SOX13 gene_id:9580|Hs108|chr1 ( 622) 739 94.5 5.7e-19
>>CCDS53605.1 SOX6 gene_id:55553|Hs108|chr11 (804 aa)
initn: 5326 init1: 5326 opt: 5326 Z-score: 3155.7 bits: 594.8 E(32554): 1.9e-169
Smith-Waterman score: 5326; 100.0% identity (100.0% similar) in 804 aa overlap (1-804:1-804)
10 20 30 40 50 60
pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MGRMSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB8 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB8 KPGDNYPVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTPQPPNTAGTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KPGDNYPVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTPQPPNTAGTV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB8 SPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB8 PNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVMKAIQEAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVMKAIQEAR
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB8 KMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLG
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB8 PGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRP
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB8 MNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEK
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB8 YPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 YPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYP
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB8 GAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMY
730 740 750 760 770 780
790 800
pF1KB8 DDYEDDPKSDYSSENEAPEAVSAN
::::::::::::::::::::::::
CCDS53 DDYEDDPKSDYSSENEAPEAVSAN
790 800
>>CCDS53604.1 SOX6 gene_id:55553|Hs108|chr11 (801 aa)
initn: 5304 init1: 5304 opt: 5304 Z-score: 3142.8 bits: 592.4 E(32554): 9.9e-169
Smith-Waterman score: 5304; 100.0% identity (100.0% similar) in 801 aa overlap (4-804:1-801)
10 20 30 40 50 60
pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP
10 20 30 40 50
70 80 90 100 110 120
pF1KB8 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB8 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB8 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB8 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB8 KPGDNYPVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTPQPPNTAGTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KPGDNYPVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTPQPPNTAGTV
300 310 320 330 340 350
370 380 390 400 410 420
pF1KB8 SPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNL
360 370 380 390 400 410
430 440 450 460 470 480
pF1KB8 PNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVMKAIQEAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVMKAIQEAR
420 430 440 450 460 470
490 500 510 520 530 540
pF1KB8 KMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLG
480 490 500 510 520 530
550 560 570 580 590 600
pF1KB8 PGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRP
540 550 560 570 580 590
610 620 630 640 650 660
pF1KB8 MNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEK
600 610 620 630 640 650
670 680 690 700 710 720
pF1KB8 YPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 YPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYP
660 670 680 690 700 710
730 740 750 760 770 780
pF1KB8 GAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMY
720 730 740 750 760 770
790 800
pF1KB8 DDYEDDPKSDYSSENEAPEAVSAN
::::::::::::::::::::::::
CCDS53 DDYEDDPKSDYSSENEAPEAVSAN
780 790 800
>>CCDS7821.1 SOX6 gene_id:55553|Hs108|chr11 (808 aa)
initn: 3671 init1: 2133 opt: 3630 Z-score: 2156.1 bits: 409.8 E(32554): 8.9e-114
Smith-Waterman score: 4879; 91.1% identity (91.1% similar) in 842 aa overlap (4-804:1-808)
10 20 30 40 50 60
pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 MSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP
10 20 30 40 50
70 80 90 100 110 120
pF1KB8 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB8 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB8 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB8 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY
240 250 260 270 280 290
310 320
pF1KB8 KPGDNYPVQFIPSTMAAAAASGLSPLQLQ-------------------------------
:::::::::::::::::::::::::::::
CCDS78 KPGDNYPVQFIPSTMAAAAASGLSPLQLQKGHVSHPQINQRLKGLSDRFGRNLDTFEHGG
300 310 320 330 340 350
330 340 350 360 370
pF1KB8 ----------QLYAAQLASMQVSPGAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVK
::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 GHSYNHKQIEQLYAAQLASMQVSPGAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVK
360 370 380 390 400 410
380 390 400 410 420 430
pF1KB8 DEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 DEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSS
420 430 440 450 460 470
440 450 460 470 480 490
pF1KB8 LGKWKSQHQEETYELDILSSLNSPALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVD
::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 --------------LDILSSLNSPALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVD
480 490 500 510 520
500 510 520 530 540 550
pF1KB8 GKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMN
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 GKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLGPGVIDLTRPEDAEG-----
530 540 550 560 570
560 570 580 590 600 610
pF1KB8 GSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAF
:::::::::::::::::::::::::::::::::::::::::::::
CCDS78 ---------------GATVAEARVYRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAF
580 590 600 610 620
620 630 640 650 660 670
pF1KB8 PDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 PDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGK
630 640 650 660 670 680
680 690 700 710 720 730
pF1KB8 KLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 KLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCS
690 700 710 720 730 740
740 750 760 770 780 790
pF1KB8 STSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMYDDYEDDPKSDYSSENEAPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 STSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMYDDYEDDPKSDYSSENEAPE
750 760 770 780 790 800
800
pF1KB8 AVSAN
:::::
CCDS78 AVSAN
>>CCDS44844.1 SOX5 gene_id:6660|Hs108|chr12 (750 aa)
initn: 2204 init1: 867 opt: 1112 Z-score: 672.6 bits: 135.2 E(32554): 3.8e-31
Smith-Waterman score: 2874; 59.5% identity (78.8% similar) in 812 aa overlap (4-804:1-750)
10 20 30 40 50
pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHPIMHNKPHSEE
::::. .::.. :::: :: .:::.: :: :: : ::::: . :::::::
CCDS44 MSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHVSFPNKPHSEE
10 20 30 40 50
60 70 80 90 100 110
pF1KB8 LPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDR-EIMTS
. . :. . :... :: ..::. : .. .:.::::.: .::.:. : ..:
CCDS44 FQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQSGESLSS
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB8 VTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELL
...:::::::::::::::::::.:.::. ..: :.. .:::::::::.:. ......
CCDS44 TALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNF-
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB8 GEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQ
::::::::::::::::: ::.:: ::::::::::::::::::::::::::::.::.:::
CCDS44 GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQ
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB8 EQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPG
::::::::::::::::::::::::::::..::::::.:: :::::::: ::::::.:::
CCDS44 EQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAA--AQQGFLLPPG
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB8 ITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSPGAKMPSTPQP
..:: : : ::::.::.:::::::. ::.:::::::::::::.::::::.:.:. ::
CCDS44 FSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQG
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB8 PNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPAS
: ...::::.:...: .:: . :::.: ::::::..:::.. :::::::. .::
CCDS44 -NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPTSPTSPHMPAL
360 370 380 390 400
420 430 440 450 460 470
pF1KB8 KTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVM
. . : :.:.:. ... .: :..: :: :.:.:
CCDS44 RINSGAGPLKASVPAALASPSARVSTIGY-----------------LN------DHDAVT
410 420 430 440
480 490 500 510 520 530
pF1KB8 KAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKS
:::::::.:.::..:::: .:::.. .:..:::.::.:::.: .:.: ::. :.
CCDS44 KAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQ
450 460 470 480 490
540 550 560 570 580 590
pF1KB8 NEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASS
::.::.. ...:.. :..:: : :.:.:.::..:::.:.
CCDS44 NEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRIYRESRGRGSN
500 510 520 530
600 610 620 630 640 650
pF1KB8 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARL
:::::::::::::::::::::::::::::::::::::::::::.:.: ::::::::::::
CCDS44 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARL
540 550 560 570 580 590
660 670 680 690 700 710
pF1KB8 SKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITT
:: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:::: ::::.:
CCDS44 SKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQAQIPIAT
600 610 620 630 640 650
720 730 740 750 760 770
pF1KB8 GTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMING
. ::::::::.:: :::.. :. ::.:.::::..::::::::.: . . .: :..
CCDS44 A-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHI--KEEIQA
660 670 680 690 700 710
780 790 800
pF1KB8 ED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
:: . :.::.: :::: ::.:..: : .::
CCDS44 EDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
720 730 740 750
>>CCDS58217.1 SOX5 gene_id:6660|Hs108|chr12 (753 aa)
initn: 2204 init1: 867 opt: 1112 Z-score: 672.6 bits: 135.2 E(32554): 3.8e-31
Smith-Waterman score: 2878; 59.5% identity (78.9% similar) in 815 aa overlap (1-804:1-753)
10 20 30 40 50
pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHPIMHNKPHSEE
:. ::::. .::.. :::: :: .:::.: :: :: : ::::: . :::::::
CCDS58 MSVMSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHVSFPNKPHSEE
10 20 30 40 50
60 70 80 90 100 110
pF1KB8 LPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDR-EIMTS
. . :. . :... :: ..::. : .. .:.::::.: .::.:. : ..:
CCDS58 FQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQSGESLSS
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB8 VTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELL
...:::::::::::::::::::.:.::. ..: :.. .:::::::::.:. ......
CCDS58 TALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNF-
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB8 GEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQ
::::::::::::::::: ::.:: ::::::::::::::::::::::::::::.::.:::
CCDS58 GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQ
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB8 EQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPG
::::::::::::::::::::::::::::..::::::.:: ::::::::: :::::.:::
CCDS58 EQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA--QQGFLLPPG
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB8 ITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSPGAKMPSTPQP
..:: : : ::::.::.:::::::. ::.:::::::::::::.::::::.:.:. ::
CCDS58 FSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQG
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB8 PNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPAS
: ...::::.:...: .:: . :::.: ::::::..:::.. :::::::. .::
CCDS58 -NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPTSPTSPHMPAL
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB8 KTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVM
. . : :.:.:. ... .: :..: : :: :.:.:
CCDS58 RINSGAGPLKASVPAALASPSARVSTIG----------Y-------LN------DHDAVT
420 430 440
480 490 500 510 520 530
pF1KB8 KAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKS
:::::::.:.::..:::: .:::.. .:..:::.::.:::.: .:.: ::. :.
CCDS58 KAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQ
450 460 470 480 490 500
540 550 560 570 580 590
pF1KB8 NEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASS
::.::.. ...:.. :..:: : :.:.:.::..:::.:.
CCDS58 NEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRIYRESRGRGSN
510 520 530 540
600 610 620 630 640 650
pF1KB8 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARL
:::::::::::::::::::::::::::::::::::::::::::.:.: ::::::::::::
CCDS58 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARL
550 560 570 580 590 600
660 670 680 690 700 710
pF1KB8 SKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITT
:: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:::: ::::.:
CCDS58 SKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQAQIPIAT
610 620 630 640 650 660
720 730 740 750 760 770
pF1KB8 GTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMING
. ::::::::.:: :::.. :. ::.:.::::..::::::::.: . . .: :..
CCDS58 A-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHI--KEEIQA
670 680 690 700 710
780 790 800
pF1KB8 ED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
:: . :.::.: :::: ::.:..: : .::
CCDS58 EDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
720 730 740 750
>>CCDS8699.1 SOX5 gene_id:6660|Hs108|chr12 (763 aa)
initn: 2204 init1: 867 opt: 1112 Z-score: 672.5 bits: 135.2 E(32554): 3.9e-31
Smith-Waterman score: 2881; 59.5% identity (78.8% similar) in 813 aa overlap (3-804:13-763)
10 20 30 40
pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHP
:::::. .::.. :::: :: .:::.: :: :: : :::::
CCDS86 MLTDPDLPQEFERMSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHV
10 20 30 40 50
50 60 70 80 90 100
pF1KB8 IMHNKPHSEELPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEG
. :::::::. . :. . :... :: ..::. : .. .:.::::.: .::
CCDS86 SFPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEG
60 70 80 90 100 110
110 120 130 140 150 160
pF1KB8 SRDR-EIMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEK
.:. : ..:...:::::::::::::::::::.:.::. ..: :.. .:::::::::.:
CCDS86 GRQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDK
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB8 MERLNTSELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQR
. ...... ::::::::::::::::: ::.:: :::::::::::::::::::::::::
CCDS86 LLAMGSGNF-GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQR
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB8 QQMDLARQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAA
:::.::.:::::::::::::::::::::::::::::::..::::::.:: :::::::::
CCDS86 QQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA-
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB8 AQQGFLFPPGITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSP
:::::.:::..:: : : ::::.::.:::::::. ::.:::::::::::::.:::::
CCDS86 -QQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSP
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB8 GAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPT
:.:.:. :: : ...::::.:...: .:: . :::.: ::::::..:::.. ::::
CCDS86 GGKLPGIPQG-NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPT
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB8 SPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSP
:::. .:: . . : :.:.:. ... .: :..: ::
CCDS86 SPTSPHMPALRINSGAGPLKASVPAALASPSARVSTIGY-----------------LN--
420 430 440 450
470 480 490 500 510 520
pF1KB8 ALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFE
:.:.: :::::::.:.::..:::: .:::.. .:..:::.::.:::.: .:
CCDS86 ----DHDAVTKAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLE
460 470 480 490 500
530 540 550 560 570 580
pF1KB8 NLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARV
.: ::. :.::.::.. ...:.. :..:: : :.:.:.
CCDS86 SLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRI
510 520 530 540
590 600 610 620 630 640
pF1KB8 YRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEK
::..:::.:.:::::::::::::::::::::::::::::::::::::::::::.:.: ::
CCDS86 YRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEK
550 560 570 580 590 600
650 660 670 680 690 700
pF1KB8 QPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTV
:::::::::::: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:
CCDS86 QPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNV
610 620 630 640 650 660
710 720 730 740 750 760
pF1KB8 GQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGG
::: ::::.:. ::::::::.:: :::.. :. ::.:.::::..::::::::.: .
CCDS86 GQQAQIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
670 680 690 700 710 720
770 780 790 800
pF1KB8 SLAGNEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
. .: :..:: . :.::.: :::: ::.:..: : .::
CCDS86 HI--KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
730 740 750 760
>>CCDS41761.1 SOX5 gene_id:6660|Hs108|chr12 (377 aa)
initn: 1071 init1: 867 opt: 1090 Z-score: 664.4 bits: 132.7 E(32554): 1.1e-30
Smith-Waterman score: 1412; 55.5% identity (75.6% similar) in 431 aa overlap (378-804:1-377)
350 360 370 380 390 400
pF1KB8 PSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQ
..::.: ::::::..:::.. :::::::.
CCDS41 MHDEVA-QPLNLSAKPKTSDG-KSPTSPTS
10 20
410 420 430 440 450 460
pF1KB8 NLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFG
.:: . . : :.:.:. ... .: :..: ::
CCDS41 PHMPALRINSGAGPLKASVPAALASPSARVSTIGY-----------------LN------
30 40 50 60
470 480 490 500 510 520
pF1KB8 DQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGP
:.:.: :::::::.:.::..:::: .:::.. .:..:::.::.:::.: .:.:
CCDS41 DHDAVTKAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLESLTQ
70 80 90 100 110 120
530 540 550 560 570 580
pF1KB8 QLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDA
::. :.::.::.. ...:.. :..:: : :.:.:.::..
CCDS41 QLAVKQNEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRIYRES
130 140 150 160
590 600 610 620 630 640
pF1KB8 RGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYY
:::.:.:::::::::::::::::::::::::::::::::::::::::::.:.: ::::::
CCDS41 RGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYY
170 180 190 200 210 220
650 660 670 680 690 700
pF1KB8 EEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQP
:::::::: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.::::
CCDS41 EEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQA
230 240 250 260 270 280
710 720 730 740 750 760
pF1KB8 QIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAG
::::.:. ::::::::.:: :::.. :. ::.:.::::..::::::::.: . .
CCDS41 QIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHI--
290 300 310 320 330
770 780 790 800
pF1KB8 NEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
.: :..:: . :.::.: :::: ::.:..: : .::
CCDS41 KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
340 350 360 370
>>CCDS58216.1 SOX5 gene_id:6660|Hs108|chr12 (642 aa)
initn: 1682 init1: 867 opt: 1091 Z-score: 661.3 bits: 132.9 E(32554): 1.6e-30
Smith-Waterman score: 2316; 52.7% identity (68.0% similar) in 812 aa overlap (4-804:1-642)
10 20 30 40 50
pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHPIMHNKPHSEE
::::. .::.. :::: :: .:::.: :: :: : ::::: . :::::::
CCDS58 MSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHVSFPNKPHSEE
10 20 30 40 50
60 70 80 90 100 110
pF1KB8 LPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDR-EIMTS
. . :. . :... :: ..::. : .. .:.::::.: .::.:. : ..:
CCDS58 FQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQSGESLSS
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB8 VTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELL
...:::::::::::::::::::.:.::. ..: :.. .:::::::::.:. ......
CCDS58 TALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNF-
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB8 GEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQ
::::::::::::::::: ::.:: ::::::::::::::::::::::::::::.::.:::
CCDS58 GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQ
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB8 EQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPG
::::::::::::::::::::::::::::..::::::.:: ::::::::: :::::.:::
CCDS58 EQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA--QQGFLLPPG
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB8 ITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSPGAKMPSTPQP
..:: : : ::::.::.:::::::. ::.:::::::::::::.::::::.:.:. ::
CCDS58 FSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQG
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB8 PNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPAS
: ...::::.:...: .::
CCDS58 -NLGAAVSPTSIHTDKSTNSP---------------------------------------
360 370
420 430 440 450 460 470
pF1KB8 KTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVM
: ::
CCDS58 -------PPKS-------------------------------------------------
480 490 500 510 520 530
pF1KB8 KAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKS
::.: .:.: ::. :.
CCDS58 -------------------------------------------KEKTTLESLTQQLAVKQ
380 390
540 550 560 570 580 590
pF1KB8 NEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASS
::.::.. ...:.. :..:: : :.:.:.::..:::.:.
CCDS58 NEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRIYRESRGRGSN
400 410 420 430
600 610 620 630 640 650
pF1KB8 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARL
:::::::::::::::::::::::::::::::::::::::::::.:.: ::::::::::::
CCDS58 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARL
440 450 460 470 480 490
660 670 680 690 700 710
pF1KB8 SKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITT
:: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:::: ::::.:
CCDS58 SKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQAQIPIAT
500 510 520 530 540 550
720 730 740 750 760 770
pF1KB8 GTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMING
. ::::::::.:: :::.. :. ::.:.::::..::::::::.: . . .: :..
CCDS58 A-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHI--KEEIQA
560 570 580 590 600
780 790 800
pF1KB8 ED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
:: . :.::.: :::: ::.:..: : .::
CCDS58 EDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
610 620 630 640
>>CCDS81672.1 SOX5 gene_id:6660|Hs108|chr12 (728 aa)
initn: 2156 init1: 867 opt: 1091 Z-score: 660.5 bits: 132.9 E(32554): 1.8e-30
Smith-Waterman score: 2755; 58.3% identity (76.6% similar) in 813 aa overlap (3-804:13-728)
10 20 30 40
pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHP
:::::. .::.. :::: :: .:::.: :: :: : :::::
CCDS81 MLTDPDLPQEFERMSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLH-
10 20 30 40 50
50 60 70 80 90 100
pF1KB8 IMHNKPHSEELPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEG
: ..::. : .. .:.::::.: .::
CCDS81 ----------------------------------EVDGNKVMSSFAPHNSSTSPQKAEEG
60 70 80
110 120 130 140 150 160
pF1KB8 SRDR-EIMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEK
.:. : ..:...:::::::::::::::::::.:.::. ..: :.. .:::::::::.:
CCDS81 GRQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDK
90 100 110 120 130 140
170 180 190 200 210 220
pF1KB8 MERLNTSELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQR
. ...... ::::::::::::::::: ::.:: :::::::::::::::::::::::::
CCDS81 LLAMGSGNF-GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQR
150 160 170 180 190 200
230 240 250 260 270 280
pF1KB8 QQMDLARQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAA
:::.::.:::::::::::::::::::::::::::::::..::::::.:: :::::::::
CCDS81 QQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA-
210 220 230 240 250
290 300 310 320 330 340
pF1KB8 AQQGFLFPPGITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSP
:::::.:::..:: : : ::::.::.:::::::. ::.:::::::::::::.:::::
CCDS81 -QQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSP
260 270 280 290 300 310
350 360 370 380 390 400
pF1KB8 GAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPT
:.:.:. :: : ...::::.:...: .:: . :::.: ::::::..:::.. ::::
CCDS81 GGKLPGIPQG-NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPT
320 330 340 350 360 370
410 420 430 440 450 460
pF1KB8 SPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSP
:::. .:: . . : :.:.:. ... .: :..: ::
CCDS81 SPTSPHMPALRINSGAGPLKASVPAALASPSARVSTIGY-----------------LN--
380 390 400 410
470 480 490 500 510 520
pF1KB8 ALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFE
:.:.: :::::::.:.::..:::: .:::.. .:..:::.::.:::.: .:
CCDS81 ----DHDAVTKAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLE
420 430 440 450 460
530 540 550 560 570 580
pF1KB8 NLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARV
.: ::. :.::.::.. ...:.. :..:: : :.:.:.
CCDS81 SLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRI
470 480 490 500
590 600 610 620 630 640
pF1KB8 YRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEK
::..:::.:.:::::::::::::::::::::::::::::::::::::::::::.:.: ::
CCDS81 YRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEK
510 520 530 540 550 560
650 660 670 680 690 700
pF1KB8 QPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTV
:::::::::::: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:
CCDS81 QPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNV
570 580 590 600 610 620
710 720 730 740 750 760
pF1KB8 GQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGG
::: ::::.:. ::::::::.:: :::.. :. ::.:.::::..::::::::.: .
CCDS81 GQQAQIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
630 640 650 660 670 680
770 780 790 800
pF1KB8 SLAGNEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
. .: :..:: . :.::.: :::: ::.:..: : .::
CCDS81 HI--KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
690 700 710 720
>>CCDS44299.1 SOX13 gene_id:9580|Hs108|chr1 (622 aa)
initn: 1248 init1: 694 opt: 739 Z-score: 454.1 bits: 94.5 E(32554): 5.7e-19
Smith-Waterman score: 1237; 39.7% identity (58.7% similar) in 702 aa overlap (99-790:58-614)
70 80 90 100 110 120
pF1KB8 DADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGS-RDREIMTSVTF-GTPERR
:..:. : .:. : .: :.:: .
CCDS44 EKKEPCHEAPQGSATAAEPQPGDPARASQDSADPQAPAQGNFRGSWDCSSPEGNGSPEPK
30 40 50 60 70 80
130 140 150 160 170 180
pF1KB8 KGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEIKGTPES
. ...... . .:.::. ..:. .: .:::::.::::.. :. : ..::: ::
CCDS44 RPGVSEAA-SGSQEKLD-FNRNLKEVVPAIEKLLSSDWKERFLGRNSMEA-KDVKGTQES
90 100 110 120 130 140
190 200 210 220 230 240
pF1KB8 LAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQIARQQQQ
::::: :: .:: :: .::.:::.::.:::..:: .:::.:::.::::::::::.::::
CCDS44 LAEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELARQQQEQIAKQQQQ
150 160 170 180 190 200
250 260 270 280 290 300
pF1KB8 LLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITYKPGDNY
:.:::::::::::::: : .:: .::: :: ... : .. .: .. . : : :: . :
CCDS44 LIQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALPIQP-IPCKPVE-Y
210 220 230 240 250 260
310 320 330 340 350 360
pF1KB8 PVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTP-QPPNTAGTVSPTGI
:.:.. : : .. ::: : : :.
CCDS44 PLQLLHSPPAPVVKR---------------------PGAMATHHPLQEPS----------
270 280 290
370 380 390 400 410 420
pF1KB8 KNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNLPNKSS
:::::...::. : .: ...:: .: .:
CCDS44 -------------------QPLNLTAKPKAPE------------LPNTSSSP-SLKMSSC
300 310
430 440 450 460 470 480
pF1KB8 IPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNS-PALF-GDQDTVMKAIQEARKMR
.: : .: : :. :: : : : :. :.: ::::.::..
CCDS44 VPRP---------------PSHGGPTR--DLQSSPPSLPLGFLGEGDAVTKAIQDARQL-
320 330 340 350 360
490 500 510 520 530 540
pF1KB8 EQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLGPGV
... ..::. .. : : . . :.: :: . :
CCDS44 -------LHSHSGALDGSPNTPFRKDLISLDSSPAKERLE------------DGCVHPL-
370 380 390 400
550 560 570 580 590 600
pF1KB8 IDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRPMNA
:.: : :.:: : . ..:. . ::::::::
CCDS44 ------EEAMLSCDMDGS--------------------RHFPESRNSS----HIKRPMNA
410 420 430
610 620 630 640 650 660
pF1KB8 FMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEKYPN
::::::::::::::::::::::.::::::::::::.:::::::::::::::. ::::::.
CCDS44 FMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARLSRQHLEKYPD
440 450 460 470 480 490
670 680 690 700 710 720
pF1KB8 YKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQP-QIPITTGTGVVYPGA
:::::::::::::.::.::.:::: :::.:::. :: ... : :. ... . :.:: :
CCDS44 YKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMSS-SDVLYPRA
500 510 520 530 540
730 740 750 760 770 780
pF1KB8 ITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDG-GSLAGNEMINGEDEMEMYD
: . : . . : .:..::: .: ... .: :. . . .:: : :.
CCDS44 AGMPLAQPLVEHY-----VPRSLDPNMPVIVNTCSLREEGEGTDDRHSVADGE--MYRYS
550 560 570 580 590 600
790 800
pF1KB8 DYED---DPKSDYSSENEAPEAVSAN
. :: . :::
CCDS44 EDEDSEGEEKSDGELVVLTD
610 620
804 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 12:39:29 2016 done: Fri Nov 4 12:39:30 2016
Total Scan time: 4.780 Total Display time: 0.250
Function used was FASTA [36.3.4 Apr, 2011]