FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8405, 804 aa 1>>>pF1KB8405 804 - 804 aa - 804 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.5709+/-0.00113; mu= -8.5696+/- 0.067 mean_var=287.9050+/-58.514, 0's: 0 Z-trim(111.8): 78 B-trim: 0 in 0/54 Lambda= 0.075587 statistics sampled from 12560 (12632) to 12560 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.715), E-opt: 0.2 (0.388), width: 16 Scan time: 4.780 The best scores are: opt bits E(32554) CCDS53605.1 SOX6 gene_id:55553|Hs108|chr11 ( 804) 5326 594.8 1.9e-169 CCDS53604.1 SOX6 gene_id:55553|Hs108|chr11 ( 801) 5304 592.4 9.9e-169 CCDS7821.1 SOX6 gene_id:55553|Hs108|chr11 ( 808) 3630 409.8 8.9e-114 CCDS44844.1 SOX5 gene_id:6660|Hs108|chr12 ( 750) 1112 135.2 3.8e-31 CCDS58217.1 SOX5 gene_id:6660|Hs108|chr12 ( 753) 1112 135.2 3.8e-31 CCDS8699.1 SOX5 gene_id:6660|Hs108|chr12 ( 763) 1112 135.2 3.9e-31 CCDS41761.1 SOX5 gene_id:6660|Hs108|chr12 ( 377) 1090 132.7 1.1e-30 CCDS58216.1 SOX5 gene_id:6660|Hs108|chr12 ( 642) 1091 132.9 1.6e-30 CCDS81672.1 SOX5 gene_id:6660|Hs108|chr12 ( 728) 1091 132.9 1.8e-30 CCDS44299.1 SOX13 gene_id:9580|Hs108|chr1 ( 622) 739 94.5 5.7e-19 >>CCDS53605.1 SOX6 gene_id:55553|Hs108|chr11 (804 aa) initn: 5326 init1: 5326 opt: 5326 Z-score: 3155.7 bits: 594.8 E(32554): 1.9e-169 Smith-Waterman score: 5326; 100.0% identity (100.0% similar) in 804 aa overlap (1-804:1-804) 10 20 30 40 50 60 pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MGRMSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB8 KPGDNYPVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTPQPPNTAGTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KPGDNYPVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTPQPPNTAGTV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB8 SPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB8 PNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVMKAIQEAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 PNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVMKAIQEAR 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB8 KMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB8 PGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 PGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRP 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB8 MNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEK 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB8 YPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 YPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYP 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB8 GAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMY 730 740 750 760 770 780 790 800 pF1KB8 DDYEDDPKSDYSSENEAPEAVSAN :::::::::::::::::::::::: CCDS53 DDYEDDPKSDYSSENEAPEAVSAN 790 800 >>CCDS53604.1 SOX6 gene_id:55553|Hs108|chr11 (801 aa) initn: 5304 init1: 5304 opt: 5304 Z-score: 3142.8 bits: 592.4 E(32554): 9.9e-169 Smith-Waterman score: 5304; 100.0% identity (100.0% similar) in 801 aa overlap (4-804:1-801) 10 20 30 40 50 60 pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP 10 20 30 40 50 70 80 90 100 110 120 pF1KB8 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB8 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB8 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB8 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB8 KPGDNYPVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTPQPPNTAGTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KPGDNYPVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTPQPPNTAGTV 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB8 SPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNL 360 370 380 390 400 410 430 440 450 460 470 480 pF1KB8 PNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVMKAIQEAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 PNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVMKAIQEAR 420 430 440 450 460 470 490 500 510 520 530 540 pF1KB8 KMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLG 480 490 500 510 520 530 550 560 570 580 590 600 pF1KB8 PGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 PGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRP 540 550 560 570 580 590 610 620 630 640 650 660 pF1KB8 MNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEK 600 610 620 630 640 650 670 680 690 700 710 720 pF1KB8 YPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 YPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYP 660 670 680 690 700 710 730 740 750 760 770 780 pF1KB8 GAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMY 720 730 740 750 760 770 790 800 pF1KB8 DDYEDDPKSDYSSENEAPEAVSAN :::::::::::::::::::::::: CCDS53 DDYEDDPKSDYSSENEAPEAVSAN 780 790 800 >>CCDS7821.1 SOX6 gene_id:55553|Hs108|chr11 (808 aa) initn: 3671 init1: 2133 opt: 3630 Z-score: 2156.1 bits: 409.8 E(32554): 8.9e-114 Smith-Waterman score: 4879; 91.1% identity (91.1% similar) in 842 aa overlap (4-804:1-808) 10 20 30 40 50 60 pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 MSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP 10 20 30 40 50 70 80 90 100 110 120 pF1KB8 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB8 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB8 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB8 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY 240 250 260 270 280 290 310 320 pF1KB8 KPGDNYPVQFIPSTMAAAAASGLSPLQLQ------------------------------- ::::::::::::::::::::::::::::: CCDS78 KPGDNYPVQFIPSTMAAAAASGLSPLQLQKGHVSHPQINQRLKGLSDRFGRNLDTFEHGG 300 310 320 330 340 350 330 340 350 360 370 pF1KB8 ----------QLYAAQLASMQVSPGAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVK :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 GHSYNHKQIEQLYAAQLASMQVSPGAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVK 360 370 380 390 400 410 380 390 400 410 420 430 pF1KB8 DEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 DEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSS 420 430 440 450 460 470 440 450 460 470 480 490 pF1KB8 LGKWKSQHQEETYELDILSSLNSPALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVD :::::::::::::::::::::::::::::::::::::::::::::: CCDS78 --------------LDILSSLNSPALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVD 480 490 500 510 520 500 510 520 530 540 550 pF1KB8 GKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMN ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 GKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLGPGVIDLTRPEDAEG----- 530 540 550 560 570 560 570 580 590 600 610 pF1KB8 GSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAF ::::::::::::::::::::::::::::::::::::::::::::: CCDS78 ---------------GATVAEARVYRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAF 580 590 600 610 620 620 630 640 650 660 670 pF1KB8 PDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 PDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGK 630 640 650 660 670 680 680 690 700 710 720 730 pF1KB8 KLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 KLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCS 690 700 710 720 730 740 740 750 760 770 780 790 pF1KB8 STSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMYDDYEDDPKSDYSSENEAPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 STSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMYDDYEDDPKSDYSSENEAPE 750 760 770 780 790 800 800 pF1KB8 AVSAN ::::: CCDS78 AVSAN >>CCDS44844.1 SOX5 gene_id:6660|Hs108|chr12 (750 aa) initn: 2204 init1: 867 opt: 1112 Z-score: 672.6 bits: 135.2 E(32554): 3.8e-31 Smith-Waterman score: 2874; 59.5% identity (78.8% similar) in 812 aa overlap (4-804:1-750) 10 20 30 40 50 pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHPIMHNKPHSEE ::::. .::.. :::: :: .:::.: :: :: : ::::: . ::::::: CCDS44 MSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHVSFPNKPHSEE 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 LPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDR-EIMTS . . :. . :... :: ..::. : .. .:.::::.: .::.:. : ..: CCDS44 FQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQSGESLSS 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 VTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELL ...:::::::::::::::::::.:.::. ..: :.. .:::::::::.:. ...... CCDS44 TALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNF- 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 GEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQ ::::::::::::::::: ::.:: ::::::::::::::::::::::::::::.::.::: CCDS44 GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQ 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 EQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPG ::::::::::::::::::::::::::::..::::::.:: :::::::: ::::::.::: CCDS44 EQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAA--AQQGFLLPPG 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 ITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSPGAKMPSTPQP ..:: : : ::::.::.:::::::. ::.:::::::::::::.::::::.:.:. :: CCDS44 FSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQG 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB8 PNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPAS : ...::::.:...: .:: . :::.: ::::::..:::.. :::::::. .:: CCDS44 -NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPTSPTSPHMPAL 360 370 380 390 400 420 430 440 450 460 470 pF1KB8 KTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVM . . : :.:.:. ... .: :..: :: :.:.: CCDS44 RINSGAGPLKASVPAALASPSARVSTIGY-----------------LN------DHDAVT 410 420 430 440 480 490 500 510 520 530 pF1KB8 KAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKS :::::::.:.::..:::: .:::.. .:..:::.::.:::.: .:.: ::. :. CCDS44 KAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQ 450 460 470 480 490 540 550 560 570 580 590 pF1KB8 NEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASS ::.::.. ...:.. :..:: : :.:.:.::..:::.:. CCDS44 NEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRIYRESRGRGSN 500 510 520 530 600 610 620 630 640 650 pF1KB8 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARL :::::::::::::::::::::::::::::::::::::::::::.:.: :::::::::::: CCDS44 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARL 540 550 560 570 580 590 660 670 680 690 700 710 pF1KB8 SKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITT :: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:::: ::::.: CCDS44 SKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQAQIPIAT 600 610 620 630 640 650 720 730 740 750 760 770 pF1KB8 GTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMING . ::::::::.:: :::.. :. ::.:.::::..::::::::.: . . .: :.. CCDS44 A-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHI--KEEIQA 660 670 680 690 700 710 780 790 800 pF1KB8 ED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN :: . :.::.: :::: ::.:..: : .:: CCDS44 EDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN 720 730 740 750 >>CCDS58217.1 SOX5 gene_id:6660|Hs108|chr12 (753 aa) initn: 2204 init1: 867 opt: 1112 Z-score: 672.6 bits: 135.2 E(32554): 3.8e-31 Smith-Waterman score: 2878; 59.5% identity (78.9% similar) in 815 aa overlap (1-804:1-753) 10 20 30 40 50 pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHPIMHNKPHSEE :. ::::. .::.. :::: :: .:::.: :: :: : ::::: . ::::::: CCDS58 MSVMSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHVSFPNKPHSEE 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 LPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDR-EIMTS . . :. . :... :: ..::. : .. .:.::::.: .::.:. : ..: CCDS58 FQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQSGESLSS 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 VTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELL ...:::::::::::::::::::.:.::. ..: :.. .:::::::::.:. ...... CCDS58 TALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNF- 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 GEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQ ::::::::::::::::: ::.:: ::::::::::::::::::::::::::::.::.::: CCDS58 GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQ 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 EQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPG ::::::::::::::::::::::::::::..::::::.:: ::::::::: :::::.::: CCDS58 EQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA--QQGFLLPPG 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 ITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSPGAKMPSTPQP ..:: : : ::::.::.:::::::. ::.:::::::::::::.::::::.:.:. :: CCDS58 FSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQG 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB8 PNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPAS : ...::::.:...: .:: . :::.: ::::::..:::.. :::::::. .:: CCDS58 -NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPTSPTSPHMPAL 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB8 KTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVM . . : :.:.:. ... .: :..: : :: :.:.: CCDS58 RINSGAGPLKASVPAALASPSARVSTIG----------Y-------LN------DHDAVT 420 430 440 480 490 500 510 520 530 pF1KB8 KAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKS :::::::.:.::..:::: .:::.. .:..:::.::.:::.: .:.: ::. :. CCDS58 KAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQ 450 460 470 480 490 500 540 550 560 570 580 590 pF1KB8 NEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASS ::.::.. ...:.. :..:: : :.:.:.::..:::.:. CCDS58 NEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRIYRESRGRGSN 510 520 530 540 600 610 620 630 640 650 pF1KB8 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARL :::::::::::::::::::::::::::::::::::::::::::.:.: :::::::::::: CCDS58 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARL 550 560 570 580 590 600 660 670 680 690 700 710 pF1KB8 SKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITT :: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:::: ::::.: CCDS58 SKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQAQIPIAT 610 620 630 640 650 660 720 730 740 750 760 770 pF1KB8 GTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMING . ::::::::.:: :::.. :. ::.:.::::..::::::::.: . . .: :.. CCDS58 A-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHI--KEEIQA 670 680 690 700 710 780 790 800 pF1KB8 ED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN :: . :.::.: :::: ::.:..: : .:: CCDS58 EDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN 720 730 740 750 >>CCDS8699.1 SOX5 gene_id:6660|Hs108|chr12 (763 aa) initn: 2204 init1: 867 opt: 1112 Z-score: 672.5 bits: 135.2 E(32554): 3.9e-31 Smith-Waterman score: 2881; 59.5% identity (78.8% similar) in 813 aa overlap (3-804:13-763) 10 20 30 40 pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHP :::::. .::.. :::: :: .:::.: :: :: : ::::: CCDS86 MLTDPDLPQEFERMSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHV 10 20 30 40 50 50 60 70 80 90 100 pF1KB8 IMHNKPHSEELPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEG . :::::::. . :. . :... :: ..::. : .. .:.::::.: .:: CCDS86 SFPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEG 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB8 SRDR-EIMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEK .:. : ..:...:::::::::::::::::::.:.::. ..: :.. .:::::::::.: CCDS86 GRQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDK 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB8 MERLNTSELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQR . ...... ::::::::::::::::: ::.:: ::::::::::::::::::::::::: CCDS86 LLAMGSGNF-GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQR 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB8 QQMDLARQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAA :::.::.:::::::::::::::::::::::::::::::..::::::.:: ::::::::: CCDS86 QQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA- 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB8 AQQGFLFPPGITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSP :::::.:::..:: : : ::::.::.:::::::. ::.:::::::::::::.::::: CCDS86 -QQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSP 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB8 GAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPT :.:.:. :: : ...::::.:...: .:: . :::.: ::::::..:::.. :::: CCDS86 GGKLPGIPQG-NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPT 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB8 SPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSP :::. .:: . . : :.:.:. ... .: :..: :: CCDS86 SPTSPHMPALRINSGAGPLKASVPAALASPSARVSTIGY-----------------LN-- 420 430 440 450 470 480 490 500 510 520 pF1KB8 ALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFE :.:.: :::::::.:.::..:::: .:::.. .:..:::.::.:::.: .: CCDS86 ----DHDAVTKAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLE 460 470 480 490 500 530 540 550 560 570 580 pF1KB8 NLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARV .: ::. :.::.::.. ...:.. :..:: : :.:.:. CCDS86 SLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRI 510 520 530 540 590 600 610 620 630 640 pF1KB8 YRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEK ::..:::.:.:::::::::::::::::::::::::::::::::::::::::::.:.: :: CCDS86 YRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEK 550 560 570 580 590 600 650 660 670 680 690 700 pF1KB8 QPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTV :::::::::::: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.: CCDS86 QPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNV 610 620 630 640 650 660 710 720 730 740 750 760 pF1KB8 GQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGG ::: ::::.:. ::::::::.:: :::.. :. ::.:.::::..::::::::.: . CCDS86 GQQAQIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP 670 680 690 700 710 720 770 780 790 800 pF1KB8 SLAGNEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN . .: :..:: . :.::.: :::: ::.:..: : .:: CCDS86 HI--KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN 730 740 750 760 >>CCDS41761.1 SOX5 gene_id:6660|Hs108|chr12 (377 aa) initn: 1071 init1: 867 opt: 1090 Z-score: 664.4 bits: 132.7 E(32554): 1.1e-30 Smith-Waterman score: 1412; 55.5% identity (75.6% similar) in 431 aa overlap (378-804:1-377) 350 360 370 380 390 400 pF1KB8 PSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQ ..::.: ::::::..:::.. :::::::. CCDS41 MHDEVA-QPLNLSAKPKTSDG-KSPTSPTS 10 20 410 420 430 440 450 460 pF1KB8 NLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFG .:: . . : :.:.:. ... .: :..: :: CCDS41 PHMPALRINSGAGPLKASVPAALASPSARVSTIGY-----------------LN------ 30 40 50 60 470 480 490 500 510 520 pF1KB8 DQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGP :.:.: :::::::.:.::..:::: .:::.. .:..:::.::.:::.: .:.: CCDS41 DHDAVTKAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLESLTQ 70 80 90 100 110 120 530 540 550 560 570 580 pF1KB8 QLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDA ::. :.::.::.. ...:.. :..:: : :.:.:.::.. CCDS41 QLAVKQNEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRIYRES 130 140 150 160 590 600 610 620 630 640 pF1KB8 RGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYY :::.:.:::::::::::::::::::::::::::::::::::::::::::.:.: :::::: CCDS41 RGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYY 170 180 190 200 210 220 650 660 670 680 690 700 pF1KB8 EEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQP :::::::: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:::: CCDS41 EEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQA 230 240 250 260 270 280 710 720 730 740 750 760 pF1KB8 QIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAG ::::.:. ::::::::.:: :::.. :. ::.:.::::..::::::::.: . . CCDS41 QIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHI-- 290 300 310 320 330 770 780 790 800 pF1KB8 NEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN .: :..:: . :.::.: :::: ::.:..: : .:: CCDS41 KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN 340 350 360 370 >>CCDS58216.1 SOX5 gene_id:6660|Hs108|chr12 (642 aa) initn: 1682 init1: 867 opt: 1091 Z-score: 661.3 bits: 132.9 E(32554): 1.6e-30 Smith-Waterman score: 2316; 52.7% identity (68.0% similar) in 812 aa overlap (4-804:1-642) 10 20 30 40 50 pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHPIMHNKPHSEE ::::. .::.. :::: :: .:::.: :: :: : ::::: . ::::::: CCDS58 MSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHVSFPNKPHSEE 10 20 30 40 50 60 70 80 90 100 110 pF1KB8 LPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDR-EIMTS . . :. . :... :: ..::. : .. .:.::::.: .::.:. : ..: CCDS58 FQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQSGESLSS 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB8 VTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELL ...:::::::::::::::::::.:.::. ..: :.. .:::::::::.:. ...... CCDS58 TALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNF- 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 GEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQ ::::::::::::::::: ::.:: ::::::::::::::::::::::::::::.::.::: CCDS58 GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQ 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB8 EQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPG ::::::::::::::::::::::::::::..::::::.:: ::::::::: :::::.::: CCDS58 EQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA--QQGFLLPPG 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB8 ITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSPGAKMPSTPQP ..:: : : ::::.::.:::::::. ::.:::::::::::::.::::::.:.:. :: CCDS58 FSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQG 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB8 PNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPAS : ...::::.:...: .:: CCDS58 -NLGAAVSPTSIHTDKSTNSP--------------------------------------- 360 370 420 430 440 450 460 470 pF1KB8 KTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVM : :: CCDS58 -------PPKS------------------------------------------------- 480 490 500 510 520 530 pF1KB8 KAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKS ::.: .:.: ::. :. CCDS58 -------------------------------------------KEKTTLESLTQQLAVKQ 380 390 540 550 560 570 580 590 pF1KB8 NEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASS ::.::.. ...:.. :..:: : :.:.:.::..:::.:. CCDS58 NEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRIYRESRGRGSN 400 410 420 430 600 610 620 630 640 650 pF1KB8 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARL :::::::::::::::::::::::::::::::::::::::::::.:.: :::::::::::: CCDS58 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARL 440 450 460 470 480 490 660 670 680 690 700 710 pF1KB8 SKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITT :: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:::: ::::.: CCDS58 SKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQAQIPIAT 500 510 520 530 540 550 720 730 740 750 760 770 pF1KB8 GTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMING . ::::::::.:: :::.. :. ::.:.::::..::::::::.: . . .: :.. CCDS58 A-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHI--KEEIQA 560 570 580 590 600 780 790 800 pF1KB8 ED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN :: . :.::.: :::: ::.:..: : .:: CCDS58 EDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN 610 620 630 640 >>CCDS81672.1 SOX5 gene_id:6660|Hs108|chr12 (728 aa) initn: 2156 init1: 867 opt: 1091 Z-score: 660.5 bits: 132.9 E(32554): 1.8e-30 Smith-Waterman score: 2755; 58.3% identity (76.6% similar) in 813 aa overlap (3-804:13-728) 10 20 30 40 pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHP :::::. .::.. :::: :: .:::.: :: :: : ::::: CCDS81 MLTDPDLPQEFERMSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLH- 10 20 30 40 50 50 60 70 80 90 100 pF1KB8 IMHNKPHSEELPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEG : ..::. : .. .:.::::.: .:: CCDS81 ----------------------------------EVDGNKVMSSFAPHNSSTSPQKAEEG 60 70 80 110 120 130 140 150 160 pF1KB8 SRDR-EIMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEK .:. : ..:...:::::::::::::::::::.:.::. ..: :.. .:::::::::.: CCDS81 GRQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDK 90 100 110 120 130 140 170 180 190 200 210 220 pF1KB8 MERLNTSELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQR . ...... ::::::::::::::::: ::.:: ::::::::::::::::::::::::: CCDS81 LLAMGSGNF-GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQR 150 160 170 180 190 200 230 240 250 260 270 280 pF1KB8 QQMDLARQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAA :::.::.:::::::::::::::::::::::::::::::..::::::.:: ::::::::: CCDS81 QQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA- 210 220 230 240 250 290 300 310 320 330 340 pF1KB8 AQQGFLFPPGITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSP :::::.:::..:: : : ::::.::.:::::::. ::.:::::::::::::.::::: CCDS81 -QQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSP 260 270 280 290 300 310 350 360 370 380 390 400 pF1KB8 GAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPT :.:.:. :: : ...::::.:...: .:: . :::.: ::::::..:::.. :::: CCDS81 GGKLPGIPQG-NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPT 320 330 340 350 360 370 410 420 430 440 450 460 pF1KB8 SPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSP :::. .:: . . : :.:.:. ... .: :..: :: CCDS81 SPTSPHMPALRINSGAGPLKASVPAALASPSARVSTIGY-----------------LN-- 380 390 400 410 470 480 490 500 510 520 pF1KB8 ALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFE :.:.: :::::::.:.::..:::: .:::.. .:..:::.::.:::.: .: CCDS81 ----DHDAVTKAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLE 420 430 440 450 460 530 540 550 560 570 580 pF1KB8 NLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARV .: ::. :.::.::.. ...:.. :..:: : :.:.:. CCDS81 SLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRI 470 480 490 500 590 600 610 620 630 640 pF1KB8 YRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEK ::..:::.:.:::::::::::::::::::::::::::::::::::::::::::.:.: :: CCDS81 YRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEK 510 520 530 540 550 560 650 660 670 680 690 700 pF1KB8 QPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTV :::::::::::: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.: CCDS81 QPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNV 570 580 590 600 610 620 710 720 730 740 750 760 pF1KB8 GQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGG ::: ::::.:. ::::::::.:: :::.. :. ::.:.::::..::::::::.: . CCDS81 GQQAQIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP 630 640 650 660 670 680 770 780 790 800 pF1KB8 SLAGNEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN . .: :..:: . :.::.: :::: ::.:..: : .:: CCDS81 HI--KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN 690 700 710 720 >>CCDS44299.1 SOX13 gene_id:9580|Hs108|chr1 (622 aa) initn: 1248 init1: 694 opt: 739 Z-score: 454.1 bits: 94.5 E(32554): 5.7e-19 Smith-Waterman score: 1237; 39.7% identity (58.7% similar) in 702 aa overlap (99-790:58-614) 70 80 90 100 110 120 pF1KB8 DADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGS-RDREIMTSVTF-GTPERR :..:. : .:. : .: :.:: . CCDS44 EKKEPCHEAPQGSATAAEPQPGDPARASQDSADPQAPAQGNFRGSWDCSSPEGNGSPEPK 30 40 50 60 70 80 130 140 150 160 170 180 pF1KB8 KGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEIKGTPES . ...... . .:.::. ..:. .: .:::::.::::.. :. : ..::: :: CCDS44 RPGVSEAA-SGSQEKLD-FNRNLKEVVPAIEKLLSSDWKERFLGRNSMEA-KDVKGTQES 90 100 110 120 130 140 190 200 210 220 230 240 pF1KB8 LAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQIARQQQQ ::::: :: .:: :: .::.:::.::.:::..:: .:::.:::.::::::::::.:::: CCDS44 LAEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELARQQQEQIAKQQQQ 150 160 170 180 190 200 250 260 270 280 290 300 pF1KB8 LLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITYKPGDNY :.:::::::::::::: : .:: .::: :: ... : .. .: .. . : : :: . : CCDS44 LIQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALPIQP-IPCKPVE-Y 210 220 230 240 250 260 310 320 330 340 350 360 pF1KB8 PVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTP-QPPNTAGTVSPTGI :.:.. : : .. ::: : : :. CCDS44 PLQLLHSPPAPVVKR---------------------PGAMATHHPLQEPS---------- 270 280 290 370 380 390 400 410 420 pF1KB8 KNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNLPNKSS :::::...::. : .: ...:: .: .: CCDS44 -------------------QPLNLTAKPKAPE------------LPNTSSSP-SLKMSSC 300 310 430 440 450 460 470 480 pF1KB8 IPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNS-PALF-GDQDTVMKAIQEARKMR .: : .: : :. :: : : : :. :.: ::::.::.. CCDS44 VPRP---------------PSHGGPTR--DLQSSPPSLPLGFLGEGDAVTKAIQDARQL- 320 330 340 350 360 490 500 510 520 530 540 pF1KB8 EQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLGPGV ... ..::. .. : : . . :.: :: . : CCDS44 -------LHSHSGALDGSPNTPFRKDLISLDSSPAKERLE------------DGCVHPL- 370 380 390 400 550 560 570 580 590 600 pF1KB8 IDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRPMNA :.: : :.:: : . ..:. . :::::::: CCDS44 ------EEAMLSCDMDGS--------------------RHFPESRNSS----HIKRPMNA 410 420 430 610 620 630 640 650 660 pF1KB8 FMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEKYPN ::::::::::::::::::::::.::::::::::::.:::::::::::::::. ::::::. CCDS44 FMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARLSRQHLEKYPD 440 450 460 470 480 490 670 680 690 700 710 720 pF1KB8 YKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQP-QIPITTGTGVVYPGA :::::::::::::.::.::.:::: :::.:::. :: ... : :. ... . :.:: : CCDS44 YKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMSS-SDVLYPRA 500 510 520 530 540 730 740 750 760 770 780 pF1KB8 ITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDG-GSLAGNEMINGEDEMEMYD : . : . . : .:..::: .: ... .: :. . . .:: : :. CCDS44 AGMPLAQPLVEHY-----VPRSLDPNMPVIVNTCSLREEGEGTDDRHSVADGE--MYRYS 550 560 570 580 590 600 790 800 pF1KB8 DYED---DPKSDYSSENEAPEAVSAN . :: . ::: CCDS44 EDEDSEGEEKSDGELVVLTD 610 620 804 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 12:39:29 2016 done: Fri Nov 4 12:39:30 2016 Total Scan time: 4.780 Total Display time: 0.250 Function used was FASTA [36.3.4 Apr, 2011]