FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3072, 622 aa
1>>>pF1KB3072 622 - 622 aa - 622 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.5046+/-0.000997; mu= -2.5081+/- 0.060
mean_var=313.9237+/-64.070, 0's: 0 Z-trim(114.7): 77 B-trim: 524 in 1/55
Lambda= 0.072387
statistics sampled from 15181 (15254) to 15181 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.777), E-opt: 0.2 (0.469), width: 16
Scan time: 4.240
The best scores are: opt bits E(32554)
CCDS44299.1 SOX13 gene_id:9580|Hs108|chr1 ( 622) 4224 454.8 1.5e-127
CCDS81672.1 SOX5 gene_id:6660|Hs108|chr12 ( 728) 836 101.1 5.6e-21
CCDS44844.1 SOX5 gene_id:6660|Hs108|chr12 ( 750) 836 101.1 5.7e-21
CCDS58217.1 SOX5 gene_id:6660|Hs108|chr12 ( 753) 836 101.1 5.8e-21
CCDS8699.1 SOX5 gene_id:6660|Hs108|chr12 ( 763) 836 101.1 5.8e-21
CCDS58216.1 SOX5 gene_id:6660|Hs108|chr12 ( 642) 820 99.3 1.6e-20
CCDS41761.1 SOX5 gene_id:6660|Hs108|chr12 ( 377) 813 98.4 1.8e-20
CCDS53604.1 SOX6 gene_id:55553|Hs108|chr11 ( 801) 739 91.0 6.8e-18
CCDS53605.1 SOX6 gene_id:55553|Hs108|chr11 ( 804) 739 91.0 6.8e-18
CCDS7821.1 SOX6 gene_id:55553|Hs108|chr11 ( 808) 739 91.0 6.8e-18
>>CCDS44299.1 SOX13 gene_id:9580|Hs108|chr1 (622 aa)
initn: 4224 init1: 4224 opt: 4224 Z-score: 2403.2 bits: 454.8 E(32554): 1.5e-127
Smith-Waterman score: 4224; 100.0% identity (100.0% similar) in 622 aa overlap (1-622:1-622)
10 20 30 40 50 60
pF1KB3 MSMRSPISAQLALDGVGTMVNCTIKSEEKKEPCHEAPQGSATAAEPQPGDPARASQDSAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MSMRSPISAQLALDGVGTMVNCTIKSEEKKEPCHEAPQGSATAAEPQPGDPARASQDSAD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 PQAPAQGNFRGSWDCSSPEGNGSPEPKRPGVSEAASGSQEKLDFNRNLKEVVPAIEKLLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PQAPAQGNFRGSWDCSSPEGNGSPEPKRPGVSEAASGSQEKLDFNRNLKEVVPAIEKLLS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 SDWKERFLGRNSMEAKDVKGTQESLAEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAML
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SDWKERFLGRNSMEAKDVKGTQESLAEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAML
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 FEKQQQQMELARQQQEQIAKQQQQLIQQQHKINLLQQQIQQVNMPYVMIPAFPPSHQPLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 FEKQQQQMELARQQQEQIAKQQQQLIQQQHKINLLQQQIQQVNMPYVMIPAFPPSHQPLP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 VTPDSQLALPIQPIPCKPVEYPLQLLHSPPAPVVKRPGAMATHHPLQEPSQPLNLTAKPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VTPDSQLALPIQPIPCKPVEYPLQLLHSPPAPVVKRPGAMATHHPLQEPSQPLNLTAKPK
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 APELPNTSSSPSLKMSSCVPRPPSHGGPTRDLQSSPPSLPLGFLGEGDAVTKAIQDARQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 APELPNTSSSPSLKMSSCVPRPPSHGGPTRDLQSSPPSLPLGFLGEGDAVTKAIQDARQL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 LHSHSGALDGSPNTPFRKDLISLDSSPAKERLEDGCVHPLEEAMLSCDMDGSRHFPESRN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LHSHSGALDGSPNTPFRKDLISLDSSPAKERLEDGCVHPLEEAMLSCDMDGSRHFPESRN
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB3 SSHIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SSHIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB3 SRQHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SRQHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMS
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB3 SSDVLYPRAAGMPLAQPLVEHYVPRSLDPNMPVIVNTCSLREEGEGTDDRHSVADGEMYR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SSDVLYPRAAGMPLAQPLVEHYVPRSLDPNMPVIVNTCSLREEGEGTDDRHSVADGEMYR
550 560 570 580 590 600
610 620
pF1KB3 YSEDEDSEGEEKSDGELVVLTD
::::::::::::::::::::::
CCDS44 YSEDEDSEGEEKSDGELVVLTD
610 620
>>CCDS81672.1 SOX5 gene_id:6660|Hs108|chr12 (728 aa)
initn: 1270 init1: 679 opt: 836 Z-score: 490.1 bits: 101.1 E(32554): 5.6e-21
Smith-Waterman score: 1476; 44.8% identity (65.2% similar) in 652 aa overlap (58-616:72-720)
30 40 50 60 70 80
pF1KB3 EKKEPCHEAPQGSATAAEPQPGDPARASQDSADPQAPAQGNFRGSWDCSSPEGNGSPEPK
:..:: .:. : : . : . :.:: .
CCDS81 EESDGLPAFHLPLHEVDGNKVMSSFAPHNSSTSPQKAEEGG-RQSGESLSSTALGTPERR
50 60 70 80 90 100
90 100 110 120 130 140
pF1KB3 RPGVSEAASG-SQEKLD-FNRNLKEVVPAIEKLLSSDWKERFLGRNSMEAKDVKGTQESL
. ....... .:.:.. . .: : .:.::::::.:::...:. .: . ..::: :::
CCDS81 KGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNFGEIKGTPESL
110 120 130 140 150 160
150 160 170 180 190 200
pF1KB3 AEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELARQQQEQIAKQQQQL
:::: ::. ::.::..::.:::.::.:::..:: .:::.::::::.:::::::.:::::
CCDS81 AEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQEQIARQQQQL
170 180 190 200 210 220
210 220 230 240 250
pF1KB3 IQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALP--------------
.:::::::::::::: : ..: .:::.:::... : .. .. . ::
CCDS81 LQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLLPPGFSYKAGCSDPYP
230 240 250 260 270 280
260 270
pF1KB3 IQPIPCK--------PVEYPLQLLHSPPA--------PVVKRPGA---------------
.: :: : :::: . : : : ::
CCDS81 VQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQGNLGAAVSPTSIH
290 300 310 320 330 340
280 290 300 310 320
pF1KB3 --MATHHP----LQEPSQPLNLTAKPK-----APELPNTSSSPSLKMSSCVPRPPSHGGP
.:. : .: .:::::.:::: .: :.. :.:...: . : . . :
CCDS81 TDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPALRINSGAG-PLKASVP
350 360 370 380 390
330 340 350 360 370
pF1KB3 TRDLQSSPPSLPLGFLGEGDAVTKAIQDARQL---LHSHSGALDGS---------PNTPF
. . : .:.:.. ::::::::.:::. :. .. .:::. :
CCDS81 AALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGKVAVVNSLGLNNCRT
400 410 420 430 440 450
380 390 400 410 420
pF1KB3 RKDLISLDSSP----AKERLEDGCVHPLEEAMLSCDMDGSRHFPESR----------NSS
.:. .:.: .:. : : . . :: : ::: ::: :
CCDS81 EKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSESRIYRESRGRGSNEP
460 470 480 490 500 510
430 440 450 460 470 480
pF1KB3 HIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARLSR
::::::::::::::::::::::::::::::.::::::::::.::: :::::::::::::.
CCDS81 HIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARLSK
520 530 540 550 560 570
490 500 510 520 530 540
pF1KB3 QHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMSSS
:::::::::::::::::::.:.::.::.:::::.::.:::. :: . . :: :. ....
CCDS81 QHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQA-QIPIATA
580 590 600 610 620 630
550 560 570 580 590
pF1KB3 DVLYPRA---AGMPLAQPLVEHY-VPRSLDPNMPVIVNTCSLREEGEGTDDRHSVAD--G
:.:: : :::: . :: : : .:.:::: .: ... : .. .. : :
CCDS81 GVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHIKEEIQAEDING
640 650 660 670 680 690
600 610 620
pF1KB3 EMY-RYSEDEDSEG-EEKSDGELVVLTD
:.: .:.:.::. . ::.:
CCDS81 EIYDEYDEEEDDPDVDYGSDSENHIAGQAN
700 710 720
>>CCDS44844.1 SOX5 gene_id:6660|Hs108|chr12 (750 aa)
initn: 1270 init1: 679 opt: 836 Z-score: 489.9 bits: 101.1 E(32554): 5.7e-21
Smith-Waterman score: 1476; 44.8% identity (65.2% similar) in 652 aa overlap (58-616:94-742)
30 40 50 60 70 80
pF1KB3 EKKEPCHEAPQGSATAAEPQPGDPARASQDSADPQAPAQGNFRGSWDCSSPEGNGSPEPK
:..:: .:. : : . : . :.:: .
CCDS44 TCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGG-RQSGESLSSTALGTPERR
70 80 90 100 110 120
90 100 110 120 130 140
pF1KB3 RPGVSEAASG-SQEKLD-FNRNLKEVVPAIEKLLSSDWKERFLGRNSMEAKDVKGTQESL
. ....... .:.:.. . .: : .:.::::::.:::...:. .: . ..::: :::
CCDS44 KGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNFGEIKGTPESL
130 140 150 160 170 180
150 160 170 180 190 200
pF1KB3 AEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELARQQQEQIAKQQQQL
:::: ::. ::.::..::.:::.::.:::..:: .:::.::::::.:::::::.:::::
CCDS44 AEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQEQIARQQQQL
190 200 210 220 230 240
210 220 230 240 250
pF1KB3 IQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALP--------------
.:::::::::::::: : ..: .:::.:::... : .. .. . ::
CCDS44 LQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLLPPGFSYKAGCSDPYP
250 260 270 280 290 300
260 270
pF1KB3 IQPIPCK--------PVEYPLQLLHSPPA--------PVVKRPGA---------------
.: :: : :::: . : : : ::
CCDS44 VQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQGNLGAAVSPTSIH
310 320 330 340 350 360
280 290 300 310 320
pF1KB3 --MATHHP----LQEPSQPLNLTAKPK-----APELPNTSSSPSLKMSSCVPRPPSHGGP
.:. : .: .:::::.:::: .: :.. :.:...: . : . . :
CCDS44 TDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPALRINSGAG-PLKASVP
370 380 390 400 410 420
330 340 350 360 370
pF1KB3 TRDLQSSPPSLPLGFLGEGDAVTKAIQDARQL---LHSHSGALDGS---------PNTPF
. . : .:.:.. ::::::::.:::. :. .. .:::. :
CCDS44 AALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGKVAVVNSLGLNNCRT
430 440 450 460 470 480
380 390 400 410 420
pF1KB3 RKDLISLDSSP----AKERLEDGCVHPLEEAMLSCDMDGSRHFPESR----------NSS
.:. .:.: .:. : : . . :: : ::: ::: :
CCDS44 EKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSESRIYRESRGRGSNEP
490 500 510 520 530 540
430 440 450 460 470 480
pF1KB3 HIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARLSR
::::::::::::::::::::::::::::::.::::::::::.::: :::::::::::::.
CCDS44 HIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARLSK
550 560 570 580 590 600
490 500 510 520 530 540
pF1KB3 QHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMSSS
:::::::::::::::::::.:.::.::.:::::.::.:::. :: . . :: :. ....
CCDS44 QHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQA-QIPIATA
610 620 630 640 650 660
550 560 570 580 590
pF1KB3 DVLYPRA---AGMPLAQPLVEHY-VPRSLDPNMPVIVNTCSLREEGEGTDDRHSVAD--G
:.:: : :::: . :: : : .:.:::: .: ... : .. .. : :
CCDS44 GVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHIKEEIQAEDING
670 680 690 700 710 720
600 610 620
pF1KB3 EMY-RYSEDEDSEG-EEKSDGELVVLTD
:.: .:.:.::. . ::.:
CCDS44 EIYDEYDEEEDDPDVDYGSDSENHIAGQAN
730 740 750
>>CCDS58217.1 SOX5 gene_id:6660|Hs108|chr12 (753 aa)
initn: 1270 init1: 679 opt: 836 Z-score: 489.9 bits: 101.1 E(32554): 5.8e-21
Smith-Waterman score: 1476; 44.8% identity (65.2% similar) in 652 aa overlap (58-616:97-745)
30 40 50 60 70 80
pF1KB3 EKKEPCHEAPQGSATAAEPQPGDPARASQDSADPQAPAQGNFRGSWDCSSPEGNGSPEPK
:..:: .:. : : . : . :.:: .
CCDS58 TCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGG-RQSGESLSSTALGTPERR
70 80 90 100 110 120
90 100 110 120 130 140
pF1KB3 RPGVSEAASG-SQEKLD-FNRNLKEVVPAIEKLLSSDWKERFLGRNSMEAKDVKGTQESL
. ....... .:.:.. . .: : .:.::::::.:::...:. .: . ..::: :::
CCDS58 KGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNFGEIKGTPESL
130 140 150 160 170 180
150 160 170 180 190 200
pF1KB3 AEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELARQQQEQIAKQQQQL
:::: ::. ::.::..::.:::.::.:::..:: .:::.::::::.:::::::.:::::
CCDS58 AEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQEQIARQQQQL
190 200 210 220 230 240
210 220 230 240 250
pF1KB3 IQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALP--------------
.:::::::::::::: : ..: .:::.:::... : .. .. . ::
CCDS58 LQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLLPPGFSYKAGCSDPYP
250 260 270 280 290 300
260 270
pF1KB3 IQPIPCK--------PVEYPLQLLHSPPA--------PVVKRPGA---------------
.: :: : :::: . : : : ::
CCDS58 VQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQGNLGAAVSPTSIH
310 320 330 340 350 360
280 290 300 310 320
pF1KB3 --MATHHP----LQEPSQPLNLTAKPK-----APELPNTSSSPSLKMSSCVPRPPSHGGP
.:. : .: .:::::.:::: .: :.. :.:...: . : . . :
CCDS58 TDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPALRINSGAG-PLKASVP
370 380 390 400 410 420
330 340 350 360 370
pF1KB3 TRDLQSSPPSLPLGFLGEGDAVTKAIQDARQL---LHSHSGALDGS---------PNTPF
. . : .:.:.. ::::::::.:::. :. .. .:::. :
CCDS58 AALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGKVAVVNSLGLNNCRT
430 440 450 460 470 480
380 390 400 410 420
pF1KB3 RKDLISLDSSP----AKERLEDGCVHPLEEAMLSCDMDGSRHFPESR----------NSS
.:. .:.: .:. : : . . :: : ::: ::: :
CCDS58 EKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSESRIYRESRGRGSNEP
490 500 510 520 530 540
430 440 450 460 470 480
pF1KB3 HIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARLSR
::::::::::::::::::::::::::::::.::::::::::.::: :::::::::::::.
CCDS58 HIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARLSK
550 560 570 580 590 600
490 500 510 520 530 540
pF1KB3 QHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMSSS
:::::::::::::::::::.:.::.::.:::::.::.:::. :: . . :: :. ....
CCDS58 QHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQA-QIPIATA
610 620 630 640 650 660
550 560 570 580 590
pF1KB3 DVLYPRA---AGMPLAQPLVEHY-VPRSLDPNMPVIVNTCSLREEGEGTDDRHSVAD--G
:.:: : :::: . :: : : .:.:::: .: ... : .. .. : :
CCDS58 GVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHIKEEIQAEDING
670 680 690 700 710 720
600 610 620
pF1KB3 EMY-RYSEDEDSEG-EEKSDGELVVLTD
:.: .:.:.::. . ::.:
CCDS58 EIYDEYDEEEDDPDVDYGSDSENHIAGQAN
730 740 750
>>CCDS8699.1 SOX5 gene_id:6660|Hs108|chr12 (763 aa)
initn: 1270 init1: 679 opt: 836 Z-score: 489.8 bits: 101.1 E(32554): 5.8e-21
Smith-Waterman score: 1476; 44.8% identity (65.2% similar) in 652 aa overlap (58-616:107-755)
30 40 50 60 70 80
pF1KB3 EKKEPCHEAPQGSATAAEPQPGDPARASQDSADPQAPAQGNFRGSWDCSSPEGNGSPEPK
:..:: .:. : : . : . :.:: .
CCDS86 TCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGG-RQSGESLSSTALGTPERR
80 90 100 110 120 130
90 100 110 120 130 140
pF1KB3 RPGVSEAASG-SQEKLD-FNRNLKEVVPAIEKLLSSDWKERFLGRNSMEAKDVKGTQESL
. ....... .:.:.. . .: : .:.::::::.:::...:. .: . ..::: :::
CCDS86 KGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNFGEIKGTPESL
140 150 160 170 180 190
150 160 170 180 190 200
pF1KB3 AEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELARQQQEQIAKQQQQL
:::: ::. ::.::..::.:::.::.:::..:: .:::.::::::.:::::::.:::::
CCDS86 AEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQEQIARQQQQL
200 210 220 230 240 250
210 220 230 240 250
pF1KB3 IQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALP--------------
.:::::::::::::: : ..: .:::.:::... : .. .. . ::
CCDS86 LQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLLPPGFSYKAGCSDPYP
260 270 280 290 300 310
260 270
pF1KB3 IQPIPCK--------PVEYPLQLLHSPPA--------PVVKRPGA---------------
.: :: : :::: . : : : ::
CCDS86 VQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQGNLGAAVSPTSIH
320 330 340 350 360 370
280 290 300 310 320
pF1KB3 --MATHHP----LQEPSQPLNLTAKPK-----APELPNTSSSPSLKMSSCVPRPPSHGGP
.:. : .: .:::::.:::: .: :.. :.:...: . : . . :
CCDS86 TDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPALRINSGAG-PLKASVP
380 390 400 410 420 430
330 340 350 360 370
pF1KB3 TRDLQSSPPSLPLGFLGEGDAVTKAIQDARQL---LHSHSGALDGS---------PNTPF
. . : .:.:.. ::::::::.:::. :. .. .:::. :
CCDS86 AALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGKVAVVNSLGLNNCRT
440 450 460 470 480 490
380 390 400 410 420
pF1KB3 RKDLISLDSSP----AKERLEDGCVHPLEEAMLSCDMDGSRHFPESR----------NSS
.:. .:.: .:. : : . . :: : ::: ::: :
CCDS86 EKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSESRIYRESRGRGSNEP
500 510 520 530 540 550
430 440 450 460 470 480
pF1KB3 HIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARLSR
::::::::::::::::::::::::::::::.::::::::::.::: :::::::::::::.
CCDS86 HIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARLSK
560 570 580 590 600 610
490 500 510 520 530 540
pF1KB3 QHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMSSS
:::::::::::::::::::.:.::.::.:::::.::.:::. :: . . :: :. ....
CCDS86 QHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQA-QIPIATA
620 630 640 650 660 670
550 560 570 580 590
pF1KB3 DVLYPRA---AGMPLAQPLVEHY-VPRSLDPNMPVIVNTCSLREEGEGTDDRHSVAD--G
:.:: : :::: . :: : : .:.:::: .: ... : .. .. : :
CCDS86 GVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHIKEEIQAEDING
680 690 700 710 720 730
600 610 620
pF1KB3 EMY-RYSEDEDSEG-EEKSDGELVVLTD
:.: .:.:.::. . ::.:
CCDS86 EIYDEYDEEEDDPDVDYGSDSENHIAGQAN
740 750 760
>>CCDS58216.1 SOX5 gene_id:6660|Hs108|chr12 (642 aa)
initn: 1160 init1: 679 opt: 820 Z-score: 481.8 bits: 99.3 E(32554): 1.6e-20
Smith-Waterman score: 1421; 44.5% identity (67.1% similar) in 614 aa overlap (30-616:62-634)
10 20 30 40 50
pF1KB3 MSMRSPISAQLALDGVGTMVNCTIKSEEKKEPC-HEAPQGSATAAEPQPGDPARAS---
.: : :..: .. .. : . :. . .:
CCDS58 DGLPAFHLPLHVSFPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVD-GNKVMSSFAP
40 50 60 70 80 90
60 70 80 90 100 110
pF1KB3 -QDSADPQAPAQGNFRGSWDCSSPEGNGSPEPKRPGVSEAASG-SQEKLD-FNRNLKEVV
..:..:: .:. : : . : . :.:: .. ....... .:.:.. . .: : .
CCDS58 HNSSTSPQKAEEGG-RQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEET
100 110 120 130 140
120 130 140 150 160 170
pF1KB3 PAIEKLLSSDWKERFLGRNSMEAKDVKGTQESLAEKELQLLVMIHQLSTLRDQLLTAHSE
:.::::::.:::...:. .: . ..::: ::::::: ::. ::.::..::.:::.::.:
CCDS58 PSIEKLLSKDWKDKLLAMGSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDE
150 160 170 180 190 200
180 190 200 210 220 230
pF1KB3 QKNMAAMLFEKQQQQMELARQQQEQIAKQQQQLIQQQHKINLLQQQIQ-QVNMPYVMIPA
::..:: .:::.::::::.:::::::.:::::.:::::::::::::: : ..: .:::.
CCDS58 QKKLAASQIEKQRQQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPV
210 220 230 240 250 260
240 250 260 270 280 290
pF1KB3 FPPSHQPLPVTPDSQLALPIQPIPCKPVEYPLQLLHSPPAPVVKRPGAMATHHPLQEPSQ
:::... : .. .. . :: : . . : : :: : .::.
CCDS58 FPPDQRTLAAAAQQGFLLP-------P-GFSYKAGCSDPYPVQLIPTTMAAAAAATPGLG
270 280 290 300 310 320
300 310 320 330 340 350
pF1KB3 PLNLTAKPKAPELPNTSSSPSLKMSSCVPRPPSHGGPTRDLQSSPPSLPLGFLGEGDAVT
::.: . : .: . ::. :. :..: : :: . . :
CCDS58 PLQLQ-QLYAAQLAAMQVSPGGKL---------------------PGIPQGNLGAAVSPT
330 340 350
360 370 380 390 400 410
pF1KB3 KAIQDARQLLHSHSGALDGSPNTPFRKDLISLDSSPAKERLEDGCV-HPLEEAMLSCDMD
. .:. ... . :.. . : :: .. : .. :.: : . . :: : :
CCDS58 S--------IHTDKSTNSPPPKSKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSD
360 370 380 390 400 410
420 430 440 450 460
pF1KB3 GSRHFPESR----------NSSHIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGS
:: ::: : ::::::::::::::::::::::::::::::.:::::::
CCDS58 GSAGVSESRIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGS
420 430 440 450 460 470
470 480 490 500 510 520
pF1KB3 RWKSMTNQEKQPYYEEQARLSRQHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTR
:::.::: :::::::::::::.:::::::::::::::::::.:.::.::.:::::.::.:
CCDS58 RWKAMTNLEKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNR
480 490 500 510 520 530
530 540 550 560 570
pF1KB3 RQDARQSYVIPPQAGQVQMSSSDVLYPRA---AGMPLAQPLVEHY-VPRSLDPNMPVIVN
::. :: . . :: :. .... :.:: : :::: . :: : : .:.:::: .
CCDS58 RQEMRQYFNVGQQA-QIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQS
540 550 560 570 580 590
580 590 600 610 620
pF1KB3 TCSLREEGEGTDDRHSVAD--GEMY-RYSEDEDSEG-EEKSDGELVVLTD
: ... : .. .. : ::.: .:.:.::. . ::.:
CCDS58 TYGVKGEEPHIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
600 610 620 630 640
>>CCDS41761.1 SOX5 gene_id:6660|Hs108|chr12 (377 aa)
initn: 817 init1: 679 opt: 813 Z-score: 481.0 bits: 98.4 E(32554): 1.8e-20
Smith-Waterman score: 946; 48.1% identity (66.8% similar) in 368 aa overlap (288-616:4-369)
260 270 280 290 300 310
pF1KB3 PVEYPLQLLHSPPAPVVKRPGAMATHHPLQEPSQPLNLTAKPK-----APELPNTSSSPS
: .:::::.:::: .: :.. :.
CCDS41 MHDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPA
10 20 30
320 330 340 350 360
pF1KB3 LKMSSCVPRPPSHGGPTRDLQSSPPSLPLGFLGEGDAVTKAIQDARQL---LHSHSGALD
:...: . : . . :. . : .:.:.. ::::::::.:::. :. .. .::
CCDS41 LRINSGAG-PLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLD
40 50 60 70 80 90
370 380 390 400 410
pF1KB3 GS---------PNTPFRKDLISLDSSP----AKERLEDGCVHPLEEAMLSCDMDGSRHFP
:. : .:. .:.: .:. : : . . :: : :::
CCDS41 GKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVS
100 110 120 130 140 150
420 430 440 450 460
pF1KB3 ESR----------NSSHIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMT
::: : ::::::::::::::::::::::::::::::.::::::::::.::
CCDS41 ESRIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMT
160 170 180 190 200 210
470 480 490 500 510 520
pF1KB3 NQEKQPYYEEQARLSRQHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQ
: :::::::::::::.:::::::::::::::::::.:.::.::.:::::.::.:::. ::
CCDS41 NLEKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQ
220 230 240 250 260 270
530 540 550 560 570 580
pF1KB3 SYVIPPQAGQVQMSSSDVLYPRA---AGMPLAQPLVEHY-VPRSLDPNMPVIVNTCSLRE
. . :: :. .... :.:: : :::: . :: : : .:.:::: .: ...
CCDS41 YFNVGQQA-QIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKG
280 290 300 310 320 330
590 600 610 620
pF1KB3 EGEGTDDRHSVAD--GEMY-RYSEDEDSEG-EEKSDGELVVLTD
: .. .. : ::.: .:.:.::. . ::.:
CCDS41 EEPHIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
340 350 360 370
>>CCDS53604.1 SOX6 gene_id:55553|Hs108|chr11 (801 aa)
initn: 1248 init1: 694 opt: 739 Z-score: 434.8 bits: 91.0 E(32554): 6.8e-18
Smith-Waterman score: 1208; 40.6% identity (58.6% similar) in 655 aa overlap (103-614:141-787)
80 90 100 110 120 130
pF1KB3 WDCSSPEGNGSPEPKRPGVSEAASGSQEKLDFNRNLKEVVPAIEKLLSSDWKERFLGRNS
...:. .: .:::::.::::.. :.
CCDS53 IMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNT
120 130 140 150 160 170
140 150 160 170 180 190
pF1KB3 MEA-KDVKGTQESLAEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELA
: ..::: ::::::: :: .:: :: .::.:::.::.:::..:: .:::.:::.::
CCDS53 SELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLA
180 190 200 210 220 230
200 210 220 230 240 250
pF1KB3 RQQQEQIAKQQQQLIQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALP
::::::::.:::::.:::::::::::::: : .:: .::: :: ... : .. .: ..
CCDS53 RQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFL
240 250 260 270 280 290
260 270 280
pF1KB3 IQP-IPCKPVE-YPLQLLHSPPAPVVKR---------------------PGAMATHHPLQ
. : : :: . ::.:.. : : .. ::: : :
CCDS53 FPPGITYKPGDNYPVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTP-Q
300 310 320 330 340
290 300
pF1KB3 EPS-----------------------------QPLNLTAKPKAPE------------LPN
:. :::::...::. : .:
CCDS53 PPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPA
350 360 370 380 390 400
310 320 330 340
pF1KB3 TSSSP-SLKMSSCVPRP---------------PSHGGPTR--DLQSSPPSLPLGFLGEGD
...:: .: .: .: : .: : :. :: : : ...:. :
CCDS53 SKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNS-P-ALFGDQD
410 420 430 440 450 460
350 360 370 380 390
pF1KB3 AVTKAIQDARQL--------LHSHSGALDGSPNTPFRKDLISLDSSPAKERLE-------
.: ::::.::.. ... ..::. .. : : . . :.:
CCDS53 TVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLT
470 480 490 500 510 520
400 410 420
pF1KB3 -----DGCVHPL-------EEAMLSCDMDGS--------------------RHFPESRNS
:: . : :.: : :.:: : . ..:.
CCDS53 GKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGR
530 540 550 560 570 580
430 440 450 460 470
pF1KB3 S----HIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQ
. ::::::::::::::::::::::::::::::.::::::::::::.:::::::::::
CCDS53 ASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQ
590 600 610 620 630 640
480 490 500 510 520 530
pF1KB3 ARLSRQHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQV
::::. ::::::.:::::::::::::.::.::.:::: :::.:::. :: ... : :.
CCDS53 ARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQP-QI
650 660 670 680 690 700
540 550 560 570 580 590
pF1KB3 QMSS-SDVLYPRAAGMPLAQPLVEHY-----VPRSLDPNMPVIVNTCSLREEGEGTDDRH
... . :.:: : : . : . . : .:..::: .: ... .: :. .
CCDS53 PITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDG-GSLAGN
710 720 730 740 750 760
600 610 620
pF1KB3 SVADGE--MYRYSEDEDSEGEEKSDGELVVLTD
. .:: : :.. :: . :::
CCDS53 EMINGEDEMEMYDDYED---DPKSDYSSENEAPEAVSAN
770 780 790 800
>>CCDS53605.1 SOX6 gene_id:55553|Hs108|chr11 (804 aa)
initn: 1248 init1: 694 opt: 739 Z-score: 434.8 bits: 91.0 E(32554): 6.8e-18
Smith-Waterman score: 1208; 40.6% identity (58.6% similar) in 655 aa overlap (103-614:144-790)
80 90 100 110 120 130
pF1KB3 WDCSSPEGNGSPEPKRPGVSEAASGSQEKLDFNRNLKEVVPAIEKLLSSDWKERFLGRNS
...:. .: .:::::.::::.. :.
CCDS53 IMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNT
120 130 140 150 160 170
140 150 160 170 180 190
pF1KB3 MEA-KDVKGTQESLAEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELA
: ..::: ::::::: :: .:: :: .::.:::.::.:::..:: .:::.:::.::
CCDS53 SELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLA
180 190 200 210 220 230
200 210 220 230 240 250
pF1KB3 RQQQEQIAKQQQQLIQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALP
::::::::.:::::.:::::::::::::: : .:: .::: :: ... : .. .: ..
CCDS53 RQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFL
240 250 260 270 280 290
260 270 280
pF1KB3 IQP-IPCKPVE-YPLQLLHSPPAPVVKR---------------------PGAMATHHPLQ
. : : :: . ::.:.. : : .. ::: : :
CCDS53 FPPGITYKPGDNYPVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTP-Q
300 310 320 330 340 350
290 300
pF1KB3 EPS-----------------------------QPLNLTAKPKAPE------------LPN
:. :::::...::. : .:
CCDS53 PPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPA
360 370 380 390 400 410
310 320 330 340
pF1KB3 TSSSP-SLKMSSCVPRP---------------PSHGGPTR--DLQSSPPSLPLGFLGEGD
...:: .: .: .: : .: : :. :: : : ...:. :
CCDS53 SKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNS-P-ALFGDQD
420 430 440 450 460 470
350 360 370 380 390
pF1KB3 AVTKAIQDARQL--------LHSHSGALDGSPNTPFRKDLISLDSSPAKERLE-------
.: ::::.::.. ... ..::. .. : : . . :.:
CCDS53 TVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLT
480 490 500 510 520 530
400 410 420
pF1KB3 -----DGCVHPL-------EEAMLSCDMDGS--------------------RHFPESRNS
:: . : :.: : :.:: : . ..:.
CCDS53 GKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGR
540 550 560 570 580 590
430 440 450 460 470
pF1KB3 S----HIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQ
. ::::::::::::::::::::::::::::::.::::::::::::.:::::::::::
CCDS53 ASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQ
600 610 620 630 640 650
480 490 500 510 520 530
pF1KB3 ARLSRQHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQV
::::. ::::::.:::::::::::::.::.::.:::: :::.:::. :: ... : :.
CCDS53 ARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQP-QI
660 670 680 690 700
540 550 560 570 580 590
pF1KB3 QMSS-SDVLYPRAAGMPLAQPLVEHY-----VPRSLDPNMPVIVNTCSLREEGEGTDDRH
... . :.:: : : . : . . : .:..::: .: ... .: :. .
CCDS53 PITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDG-GSLAGN
710 720 730 740 750 760
600 610 620
pF1KB3 SVADGE--MYRYSEDEDSEGEEKSDGELVVLTD
. .:: : :.. :: . :::
CCDS53 EMINGEDEMEMYDDYED---DPKSDYSSENEAPEAVSAN
770 780 790 800
>>CCDS7821.1 SOX6 gene_id:55553|Hs108|chr11 (808 aa)
initn: 1144 init1: 694 opt: 739 Z-score: 434.7 bits: 91.0 E(32554): 6.8e-18
Smith-Waterman score: 1184; 40.6% identity (57.8% similar) in 650 aa overlap (115-614:153-794)
90 100 110 120 130 140
pF1KB3 EPKRPGVSEAASGSQEKLDFNRNLKEVVPAIEKLLSSDWKERFLGRNSMEA-KDVKGTQE
.:::::.::::.. :. : ..::: :
CCDS78 RKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEIKGTPE
130 140 150 160 170 180
150 160 170 180 190 200
pF1KB3 SLAEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELARQQQEQIAKQQQ
:::::: :: .:: :: .::.:::.::.:::..:: .:::.:::.::::::::::.:::
CCDS78 SLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQIARQQQ
190 200 210 220 230 240
210 220 230 240 250 260
pF1KB3 QLIQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALPIQP-IPCKPVE-
::.:::::::::::::: : .:: .::: :: ... : .. .: .. . : : :: .
CCDS78 QLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITYKPGDN
250 260 270 280 290 300
270
pF1KB3 YPLQLLHSPPA-------------------PVVKR-------------------------
::.:.. : : : ...
CCDS78 YPVQFIPSTMAAAAASGLSPLQLQKGHVSHPQINQRLKGLSDRFGRNLDTFEHGGGHSYN
310 320 330 340 350 360
280 290
pF1KB3 ------------------PGAMATHHPLQEPS----------------------------
::: : : :.
CCDS78 HKQIEQLYAAQLASMQVSPGAKMPSTP-QPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAA
370 380 390 400 410 420
300 310 320 330
pF1KB3 -QPLNLTAKPKAPE------------LPNTSSSP-SLKMSSCVPRP--PSHG-GPTRDLQ
:::::...::. : .: ...:: .: .: .: : : : : . :.
CCDS78 AQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLDIL
430 440 450 460 470 480
340 350 360 370 380
pF1KB3 SSPPSLPLGFLGEGDAVTKAIQDARQL--------LHSHSGALDGSPNTPFRKDLISLDS
:: : : ...:. :.: ::::.::.. ... ..::. .. : : .
CCDS78 SSLNS-P-ALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRN
490 500 510 520 530
390 400 410 420
pF1KB3 SPAKERLE------------DGCVHP-LEEAMLSCDMDGSRHFPESR--------NSS--
. :.: :: . : . . : .:. :.: ::
CCDS78 EKERTRFENLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGGATVAEARVYRDARGRASSEP
540 550 560 570 580 590
430 440 450 460 470 480
pF1KB3 HIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARLSR
::::::::::::::::::::::::::::::.::::::::::::.:::::::::::::::.
CCDS78 HIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSK
600 610 620 630 640 650
490 500 510 520 530 540
pF1KB3 QHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMSS-
::::::.:::::::::::::.::.::.:::: :::.:::. :: ... : :. ...
CCDS78 IHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQP-QIPITTG
660 670 680 690 700 710
550 560 570 580 590
pF1KB3 SDVLYPRAAGMPLAQPLVEHY-----VPRSLDPNMPVIVNTCSLREEGEGTDDRHSVADG
. :.:: : : . : . . : .:..::: .: ... .: :. . . .:
CCDS78 TGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDG-GSLAGNEMING
720 730 740 750 760 770
600 610 620
pF1KB3 E--MYRYSEDEDSEGEEKSDGELVVLTD
: : :.. :: . :::
CCDS78 EDEMEMYDDYED---DPKSDYSSENEAPEAVSAN
780 790 800
622 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 22:01:58 2016 done: Sat Nov 5 22:01:58 2016
Total Scan time: 4.240 Total Display time: 0.170
Function used was FASTA [36.3.4 Apr, 2011]