FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9653, 276 aa 1>>>pF1KB9653 276 - 276 aa - 276 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.1396+/-0.000859; mu= 4.0049+/- 0.051 mean_var=202.3890+/-42.708, 0's: 0 Z-trim(114.0): 80 B-trim: 8 in 1/51 Lambda= 0.090153 statistics sampled from 14512 (14592) to 14512 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.777), E-opt: 0.2 (0.448), width: 16 Scan time: 2.570 The best scores are: opt bits E(32554) CCDS9473.1 SOX21 gene_id:11166|Hs108|chr13 ( 276) 1856 253.1 1.6e-67 CCDS3094.1 SOX14 gene_id:8403|Hs108|chr3 ( 240) 664 98.0 6.6e-21 CCDS3239.1 SOX2 gene_id:6657|Hs108|chr3 ( 317) 620 92.4 4.3e-19 CCDS9523.1 SOX1 gene_id:6656|Hs108|chr13 ( 391) 611 91.3 1.1e-18 CCDS14669.1 SOX3 gene_id:6658|Hs108|chrX ( 446) 602 90.2 2.8e-18 CCDS32549.1 SOX15 gene_id:6665|Hs108|chr17 ( 233) 471 72.9 2.3e-13 CCDS4547.1 SOX4 gene_id:6659|Hs108|chr6 ( 474) 456 71.3 1.5e-12 CCDS12995.1 SOX12 gene_id:6666|Hs108|chr20 ( 315) 439 68.9 5.2e-12 CCDS10428.1 SOX8 gene_id:30812|Hs108|chr16 ( 446) 428 67.6 1.8e-11 CCDS11689.1 SOX9 gene_id:6662|Hs108|chr17 ( 509) 423 67.0 3.1e-11 CCDS14772.1 SRY gene_id:6736|Hs108|chrY ( 204) 409 64.8 5.6e-11 CCDS1654.1 SOX11 gene_id:6664|Hs108|chr2 ( 441) 415 65.9 5.8e-11 CCDS13964.1 SOX10 gene_id:6663|Hs108|chr22 ( 466) 410 65.3 9.5e-11 >>CCDS9473.1 SOX21 gene_id:11166|Hs108|chr13 (276 aa) initn: 1856 init1: 1856 opt: 1856 Z-score: 1325.9 bits: 253.1 E(32554): 1.6e-67 Smith-Waterman score: 1856; 100.0% identity (100.0% similar) in 276 aa overlap (1-276:1-276) 10 20 30 40 50 60 pF1KB9 MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKMHNSEISKRLGAEWKLLTESEKRPFIDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKMHNSEISKRLGAEWKLLTESEKRPFIDE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 AKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFAFPVPYGLGGVADAEHPALKAGAGLHAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 AKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFAFPVPYGLGGVADAEHPALKAGAGLHAG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 AGGGLVPESLLANPEKAAAAAAAAAARVFFPQSAAAAAAAAAAAAAGSPYSLLDLGSKMA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 AGGGLVPESLLANPEKAAAAAAAAAARVFFPQSAAAAAAAAAAAAAGSPYSLLDLGSKMA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 EISSSSSGLPYASSLGYPTAGAGAFHGAAAAAAAAAAAAGGHTHSHPSPGNPGYMIPCNC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 EISSSSSGLPYASSLGYPTAGAGAFHGAAAAAAAAAAAAGGHTHSHPSPGNPGYMIPCNC 190 200 210 220 230 240 250 260 270 pF1KB9 SAWPSPGLQPPLAYILLPGMGKPQLDPYPAAYAAAL :::::::::::::::::::::::::::::::::::: CCDS94 SAWPSPGLQPPLAYILLPGMGKPQLDPYPAAYAAAL 250 260 270 >>CCDS3094.1 SOX14 gene_id:8403|Hs108|chr3 (240 aa) initn: 1046 init1: 627 opt: 664 Z-score: 488.8 bits: 98.0 E(32554): 6.6e-21 Smith-Waterman score: 978; 57.9% identity (73.7% similar) in 285 aa overlap (1-276:1-240) 10 20 30 40 50 60 pF1KB9 MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKMHNSEISKRLGAEWKLLTESEKRPFIDE :::: ::.::::::::::::.::::::::::::::::::::::::::::.:.::::.::: CCDS30 MSKPSDHIKRPMNAFMVWSRGQRRKMAQENPKMHNSEISKRLGAEWKLLSEAEKRPYIDE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 AKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFAFPVPYGLGGVADAEHPALKAGAGLHAG ::::::.:::::::::::::::::.:::::...::.:: :: :.. : ::: ::: .: CCDS30 AKRLRAQHMKEHPDYKYRPRRKPKNLLKKDRYVFPLPY-LG---DTD-P-LKA-AGLPVG 70 80 90 100 110 130 140 150 160 170 pF1KB9 AGGGLVPESLLANPEKAAAAAAAAAARVFFPQSAAAAAAAAAAAAAGSPYSLLDLGS--- :. :: :. :::: :.:.: ..: :::::: .. CCDS30 ASDGL-----LSAPEKA---------RAFLPPASA-------------PYSLLDPAQFSS 120 130 140 180 190 200 210 220 230 pF1KB9 ----KMAEISSS--SSGLPYASSLGYPTAGAGAFHGAAAAAAAAAAAAGGHTHSHPSPGN ::.:. . ...:::::.::: . ::: :. . . :::.:::: : CCDS30 SAIQKMGEVPHTLATGALPYASTLGYQN---GAF-GSLSCPSQ-------HTHTHPSPTN 150 160 170 180 190 240 250 260 270 pF1KB9 PGYMIPCNCSAWPSPGLQPPLAYILLPGMGKPQLDPYPAAYAAAL :::..::::.:: . ::::.::::.::: : .::: .:.:.:. CCDS30 PGYVVPCNCTAWSASTLQPPVAYILFPGMTKTGIDPYSSAHATAM 200 210 220 230 240 >>CCDS3239.1 SOX2 gene_id:6657|Hs108|chr3 (317 aa) initn: 624 init1: 569 opt: 620 Z-score: 456.3 bits: 92.4 E(32554): 4.3e-19 Smith-Waterman score: 620; 43.0% identity (62.9% similar) in 272 aa overlap (6-269:39-304) 10 20 30 pF1KB9 MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKMHN :.:::::::::::::.:::::::::::::: CCDS32 LKPPGPQQTSGGGGGNSTAAAAGGNQKNSPDRVKRPMNAFMVWSRGQRRKMAQENPKMHN 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB9 SEISKRLGAEWKLLTESEKRPFIDEAKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFAFP ::::::::::::::.:.::::::::::::::.::::::::::::::: :::.::::...: CCDS32 SEISKRLGAEWKLLSETEKRPFIDEAKRLRALHMKEHPDYKYRPRRKTKTLMKKDKYTLP 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB9 VPYGLGGVADAEHPALKAGAGLHAGAGGGLVP--ESLLANPEKAAAAAAAAAARVFFPQS ::. .. .:.:. :: :.:. .: . .. . .. .:: CCDS32 -----GGLLAPGGNSMASGVGVGAGLGAGVNQRMDSYAHMNGWSNGSYSMMQDQLGYPQH 130 140 150 160 170 180 160 170 180 190 200 pF1KB9 AAAAAAAAAAAAAGSPYSLLDLG-SKMAEISSSSSGLP-YA---SSLGYPTAGAGAFHGA . : .:: :.. : ..:. .. .: : :. :. : : . :.. :. CCDS32 PGLNAHGAAQMQPMHRYDVSALQYNSMTSSQTYMNGSPTYSMSYSQQGTPGMALGSM-GS 190 200 210 220 230 240 210 220 230 240 250 260 pF1KB9 AAAAAAAAAAAGGHTHSHP-SPGNPGYMIPCNCSAWPSPGLQPPLAYILLPGMGKPQLDP .. . :... . :: .: . : . :. . : : : . : : CCDS32 VVKSEASSSPPVVTSSSHSRAPCQAGDLRDMISMYLPGAEVPEPAAPSRLHMSQHYQSGP 250 260 270 280 290 300 270 pF1KB9 YPAAYAAAL : CCDS32 VPGTAINGTLPLSHM 310 >>CCDS9523.1 SOX1 gene_id:6656|Hs108|chr13 (391 aa) initn: 742 init1: 555 opt: 611 Z-score: 448.8 bits: 91.3 E(32554): 1.1e-18 Smith-Waterman score: 684; 46.2% identity (64.9% similar) in 305 aa overlap (6-258:49-349) 10 20 30 pF1KB9 MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKMHN :.:::::::::::::.:::::::::::::: CCDS95 PTNLSGPAGAGGGGGGGGGGGGGGGAKANQDRVKRPMNAFMVWSRGQRRKMAQENPKMHN 20 30 40 50 60 70 40 50 60 70 80 90 pF1KB9 SEISKRLGAEWKLLTESEKRPFIDEAKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFAFP ::::::::::::...:.::::::::::::::.::::::::::::::: ::::::::... CCDS95 SEISKRLGAEWKVMSEAEKRPFIDEAKRLRALHMKEHPDYKYRPRRKTKTLLKKDKYSLA 80 90 100 110 120 130 100 110 120 130 pF1KB9 ---VPYGLGGVADAEHPALKAGAGLHA----------GAGGGLVPESLLAN---PEKAAA . : :: . : .. .:.: : .:::: . . :: : ..:: CCDS95 GGLLAAGAGGGGAAVAMGVGVGVGAAAVGQRLESPGGAAGGGYAHVNGWANGAYPGSVAA 140 150 160 170 180 190 140 150 160 170 180 pF1KB9 AAAAAA----ARVFFPQSAAAAAAAAAAAAAG-------------SPYSLLDLGS-KMAE :::::: :.. . : .:..: : : .:. :.:. ... CCDS95 AAAAAAMMQEAQLAYGQHPGAGGAHPHAHPAHPHPHHPHAHPHNPQPMHRYDMGALQYSP 200 210 220 230 240 250 190 200 210 220 pF1KB9 ISSSSS----------GLPYASSLGYPTAGAGAFHGAAAAAAAAAAAA--------GGHT ::.:.. ::::... . .:..:: ...:.::::::::: :. . CCDS95 ISNSQGYMSASPSGYGGLPYGAAAAAAAAAGGAHQNSAVAAAAAAAAASSGALGALGSLV 260 270 280 290 300 310 230 240 250 260 270 pF1KB9 HSHPSPGNPGYMIPCNCSAWPSPGLQPPLAYILLPGMGKPQLDPYPAAYAAAL .:.:: . :. : . : : :: . . :: CCDS95 KSEPSGSPPA---PAHSRA-PCPGDLREMISMYLPAGEGGDPAAAAAAAAQSRLHSLPQH 320 330 340 350 360 370 CCDS95 YQGAGAGVNGTVPLTHI 380 390 >>CCDS14669.1 SOX3 gene_id:6658|Hs108|chrX (446 aa) initn: 565 init1: 565 opt: 602 Z-score: 441.7 bits: 90.2 E(32554): 2.8e-18 Smith-Waterman score: 612; 48.2% identity (66.3% similar) in 249 aa overlap (6-232:137-383) 10 20 30 pF1KB9 MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKMHN :.:::::::::::::.:::::: ::::::: CCDS14 GKSSANAAGGANSGGGSSGGASGGGGGTDQDRVKRPMNAFMVWSRGQRRKMALENPKMHN 110 120 130 140 150 160 40 50 60 70 80 90 pF1KB9 SEISKRLGAEWKLLTESEKRPFIDEAKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFAFP :::::::::.:::::..::::::::::::::.::::.:::::::::: ::::::::...: CCDS14 SEISKRLGADWKLLTDAEKRPFIDEAKRLRAVHMKEYPDYKYRPRRKTKTLLKKDKYSLP 170 180 190 200 210 220 100 110 120 130 140 150 pF1KB9 VPYGLGGVADAEHPALKAGAGLHAGAGGGLVPESLLANPEKAAAAAAAAAARVFFPQSAA :.: : : :.:. . .: : .. : .: . . .. . : . CCDS14 SGLLPPGAAAAAAAAAAAAAAASSPVGVGQRLDTYTHVNGWANGAYSLVQEQLGYAQPPS 230 240 250 260 270 280 160 170 180 190 200 pF1KB9 AAAAAAAAA--------AAGSPYS-LLDLGSK----MAEISSSSSGLPYASSLGYPTAGA .. : :: :: .. :.. .: ....:: :.. ::.: CCDS14 MSSPPPPPALPPMHRYDMAGLQYSPMMPPGAQSYMNVAAAAAAASG--YGGMAPSATAAA 290 300 310 320 330 340 210 220 230 240 250 pF1KB9 GAFHG---AAAAAAAAAAAA------GGHTHSHPSPGNPGYMIPCNCSAWPSPGLQPPLA .: .: :.:::::::::: :. ..:.:: : CCDS14 AAAYGQQPATAAAAAAAAAAMSLGPMGSVVKSEPSSPPPAIASHSQRACLGDLRDMISMY 350 360 370 380 390 400 260 270 pF1KB9 YILLPGMGKPQLDPYPAAYAAAL CCDS14 LPPGGDAADAASPLPGGRLHGVHQHYQGAGTAVNGTVPLTHI 410 420 430 440 >>CCDS32549.1 SOX15 gene_id:6665|Hs108|chr17 (233 aa) initn: 476 init1: 458 opt: 471 Z-score: 353.3 bits: 72.9 E(32554): 2.3e-13 Smith-Waterman score: 474; 43.6% identity (62.7% similar) in 204 aa overlap (4-202:45-226) 10 20 30 pF1KB9 MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKM :...:::::::::::: ::::.:::.:::: CCDS32 EPPAATAAASSSSGPQEREGAGSPAAPGTLPLEKVKRPMNAFMVWSSAQRRQMAQQNPKM 20 30 40 50 60 70 40 50 60 70 80 90 pF1KB9 HNSEISKRLGAEWKLLTESEKRPFIDEAKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFA :::::::::::.:::: :.:::::..::::::: :....:::::::::: :. CCDS32 HNSEISKRLGAQWKLLDEDEKRPFVEEAKRLRARHLRDYPDYKYRPRRKAKS-------- 80 90 100 110 120 100 110 120 130 140 150 pF1KB9 FPVPYGLGGVADAEHPALKAGAGLHAGAGGGLV--PESLLANPEKAAAAAAAAAARVFFP : : :. . : : :.:: . : ..: .. . . . ...: CCDS32 ----SGAG-------PS-RCGQGRGNLASGGPLWGPGYATTQPSRGFGYRPPSYSTAYLP 130 140 150 160 170 160 170 180 190 200 pF1KB9 QSAAAAAAAAAAAAAGS-PYSLLDLGSKMAEISSSSSGLPYASSLGY--PTAGAGAFHGA : ... : . : : : : ... . . . :: .: : : ::: CCDS32 GSYGSSHCKLEAPSPCSLPQSDPRLQGEL--LPTYTHYLPPGSPTPYNPPLAGAPMPLTH 180 190 200 210 220 230 210 220 230 240 250 260 pF1KB9 AAAAAAAAAAAGGHTHSHPSPGNPGYMIPCNCSAWPSPGLQPPLAYILLPGMGKPQLDPY CCDS32 L >>CCDS4547.1 SOX4 gene_id:6659|Hs108|chr6 (474 aa) initn: 505 init1: 393 opt: 456 Z-score: 338.7 bits: 71.3 E(32554): 1.5e-12 Smith-Waterman score: 464; 40.2% identity (65.2% similar) in 244 aa overlap (4-222:55-287) 10 20 30 pF1KB9 MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKM : :.:::::::::::. .:::. ...: : CCDS45 GLELGIASSPTPGSTASTGGKADDPSWCKTPSGHIKRPMNAFMVWSQIERRKIMEQSPDM 30 40 50 60 70 80 40 50 60 70 80 90 pF1KB9 HNSEISKRLGAEWKLLTESEKRPFIDEAKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFA ::.::::::: .:::: .:.: ::: ::.::: :: ..::::::::.: :. ... . CCDS45 HNAEISKRLGKRWKLLKDSDKIPFIREAERLRLKHMADYPDYKYRPRKKVKSGNANSSSS 90 100 110 120 130 140 100 110 120 130 pF1KB9 F-----PVPYG--LGGVADAEHPALKAGAGLHAGAGGGLV--------PESLLANPEKAA : : .:: . . : . .:.. .::.::: . : . . :.: CCDS45 AAASSKPGEKGDKVGGSGGGGHGGGGGGGSSNAGGGGGGASGGGANSKPAQKKSCGSKVA 150 160 170 180 190 200 140 150 160 170 180 pF1KB9 AAAAAAA----ARVFFP------QSAAAAAAAAAAAAAGSPYSLLDLGSKMAEISSSSSG ..:.... :.... ..::::::. :: ::. .:: ::. ... . CCDS45 GGAGGGVSKPHAKLILAGGGGGGKAAAAAAASFAAEQAGAA-ALLPLGA-----AADHHS 210 220 230 240 250 190 200 210 220 230 240 pF1KB9 LPYASSLGYPTAGAGAFHGAAAAAAAAAAAAGGHTHSHPSPGNPGYMIPCNCSAWPSPGL : : . :.:.:.: ..::.:.:: :: : : CCDS45 LYKART---PSASASA--SSAASASAALAAPGKHLAEKKVKRVYLFGGLGTSSSPVGGVG 260 270 280 290 300 310 250 260 270 pF1KB9 QPPLAYILLPGMGKPQLDPYPAAYAAAL CCDS45 AGADPSDPLGLYEEEGAGCSPDAPSLSGRSSAASSPAAGRSPADHRGYASLRAASPAPSS 320 330 340 350 360 370 >>CCDS12995.1 SOX12 gene_id:6666|Hs108|chr20 (315 aa) initn: 487 init1: 385 opt: 439 Z-score: 329.1 bits: 68.9 E(32554): 5.2e-12 Smith-Waterman score: 439; 34.4% identity (58.2% similar) in 273 aa overlap (4-265:36-295) 10 20 30 pF1KB9 MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKM : :.:::::::::::. .:::. .. : : CCDS12 GARAKRDGGPPPPGPGPAEEGAREPGWCKTPSGHIKRPMNAFMVWSQHERRKIMDQWPDM 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB9 HNSEISKRLGAEWKLLTESEKRPFIDEAKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFA ::.::::::: .:.:: .::: ::. ::.::: :: ..::::::::.: : : : CCDS12 HNAEISKRLGRRWQLLQDSEKIPFVREAERLRLKHMADYPDYKYRPRKKSKGAPAK---A 70 80 90 100 110 120 100 110 120 130 140 pF1KB9 FPVPYGLGGVADAEHPALK-AGAGLHAGAGGGL-----VPESLLANPEKAAAAA--AAAA : : : .: .. .:. . : : . .::: : .::. . .. . . . CCDS12 RPRPPGGSGGGSRLKPGPQLPGRGGRRAAGGPLGGGAAAPEDDDEDDDEELLEVRLVETP 130 140 150 160 170 180 150 160 170 180 190 200 pF1KB9 ARVFFPQSAAAAAAAAAAAAAGSPYSLLDLGSKMAEISSSSSGLPYASSLGYPTAGAGAF .: .. . :. :: . : : .: . .. : . : . : .:.: CCDS12 GRELWRMVPAGRAARGQAERAQGPSGEGAAAAAAASPTPSEDEEPEEEE----EEAAAAE 190 200 210 220 230 210 220 230 240 250 260 pF1KB9 HGAAAAAAAAAAAAGGHTHSHPSPGNPGYMIPCNCSAWP-SPGLQPP--LAYILLPGMGK .: ..:.. . : .. :.:.. .::: .: :::: ... .: . CCDS12 EGEEETVASGEESLGFLSRLPPGPAG------LDCSALDRDPDLQPPSGTSHFEFPDYCT 240 250 260 270 280 290 270 pF1KB9 PQLDPYPAAYAAAL :.. CCDS12 PEVTEMIAGDWRPSSIADLVFTY 300 310 >>CCDS10428.1 SOX8 gene_id:30812|Hs108|chr16 (446 aa) initn: 466 init1: 393 opt: 428 Z-score: 319.4 bits: 67.6 E(32554): 1.8e-11 Smith-Waterman score: 428; 34.4% identity (58.0% similar) in 262 aa overlap (2-247:98-346) 10 20 30 pF1KB9 MSKPVDHVKRPMNAFMVWSRAQRRKMAQENP .:: ::::::::::::..: :::.:.. : CCDS10 IRDAVSQVLKGYDWSLVPMPVRGGGGGALKAKP--HVKRPMNAFMVWAQAARRKLADQYP 70 80 90 100 110 120 40 50 60 70 80 pF1KB9 KMHNSEISKRLGAEWKLLTESEKRPFIDEAKRLRAMHMKEHPDYKYRPRRKPKTLL---K ..::.:.:: :: :.::.:::::::..::.:::..: :.::::::.:::. .. CCDS10 HLHNAELSKTLGKLWRLLSESEKRPFVEEAERLRVQHKKDHPDYKYQPRRRKSAKAGHSD 130 140 150 160 170 180 90 100 110 120 130 140 pF1KB9 KDKFAFPVPYGLGGVADAEHPALKAGA--GLHAGAGGGLVPESLLANPEKAAAAAAAAAA .:. : :. ::.. . .: : : :.: : : . ..:. :.: CCDS10 SDSGAELGPHPGGGAVYKAEAGLGDGHHHGDHTGQTHG--PPTPPTTPKTELQQAGAK-- 190 200 210 220 230 240 150 160 170 180 190 pF1KB9 RVFFPQSAAAAAAAAAAAAAGSPYSLLDLGSKMAEISSSSSGLPYAS-----SLGYPT-- :. . . .. . .: .:.. .:. .. ... :: :. CCDS10 ----PELKLEGRRPVDSGRQNIDFSNVDISELSSEVMGTMDAFDVHEFDQYLPLGGPAPP 250 260 270 280 290 200 210 220 230 240 250 pF1KB9 ----AGAGAFHGAAAAAAAAAAAAGGHTHSHPSPGNPGYMIPCNCSAWPSPGLQPPLAYI : .::. :.:. . : .: . . : : : : . :::: CCDS10 EPGQAYGGAYFHAGASPVWAHKSAPSASASPTETGPPR---PHIKTEQPSPGHYGDQPRG 300 310 320 330 340 350 260 270 pF1KB9 LLPGMGKPQLDPYPAAYAAAL CCDS10 SPDYGSCSGQSSATPAAPAGPFAGSQGDYGDLQASSYYGAYPGYAPGLYQYPCFHSPRRP 360 370 380 390 400 410 >>CCDS11689.1 SOX9 gene_id:6662|Hs108|chr17 (509 aa) initn: 422 init1: 396 opt: 423 Z-score: 315.1 bits: 67.0 E(32554): 3.1e-11 Smith-Waterman score: 433; 32.5% identity (55.4% similar) in 289 aa overlap (2-271:99-364) 10 20 30 pF1KB9 MSKPVDHVKRPMNAFMVWSRAQRRKMAQENP :: ::::::::::::..: :::.:.. : CCDS11 FPVCIREAVSQVLKGYDWTLVPMPVRVNGSSKNKPHVKRPMNAFMVWAQAARRKLADQYP 70 80 90 100 110 120 40 50 60 70 80 90 pF1KB9 KMHNSEISKRLGAEWKLLTESEKRPFIDEAKRLRAMHMKEHPDYKYRPRRKPKTLLKKDK ..::.:.:: :: :.::.:::::::..::.:::..: :.::::::.:::. :.. . . CCDS11 HLHNAELSKTLGKLWRLLNESEKRPFVEEAERLRVQHKKDHPDYKYQPRRR-KSVKNGQA 130 140 150 160 170 180 100 110 120 130 pF1KB9 FAFPV-------PYGLGGVADAEHPALKAGA------GLHAGAGGGLVPESLLANPEKAA : . : .. . .:. : ..: : :.: . : : . ..:. . CCDS11 EAEEATEQTHISPNAIFKALQADSPHSSSGMSEVHSPGEHSGQSQG--PPTPPTTPKTDV 190 200 210 220 230 240 140 150 160 170 180 190 pF1KB9 AAAAAAAARVFFPQSAAAAAAAAAAAAAGSPYSLLDLGSKMAEISSSSSGLP------YA . : : : .. . .:.: ... :. . : CCDS11 QPGKADLKREGRPLPEGGRQPPI-------DFRDVDIGELSSDVISNIETFDVNEFDQYL 250 260 270 280 290 200 210 220 230 240 250 pF1KB9 SSLGYPTAGAGAFHGAAAAAAAAAAAAGGHTHSHPSPGNPGYMIPCNCSAWPSPGLQPPL :.: :. : :: .. ... : . . .:.. :.. . .: : : ::: CCDS11 PPNGHP--GVPATHGQVTYTGSY-----GISSTAATPASAGHVWMSKQQAPPPPPQQPPQ 300 310 320 330 340 350 260 270 pF1KB9 AYILLPGMGKPQLDPYPAAYAAAL : :. :: : : : CCDS11 AP---PA---PQAPPQPQAAPPQQPAAPPQQPQAHTLTTLSSEPGQSQRTHIKTEQLSPS 360 370 380 390 400 276 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 17:59:13 2016 done: Fri Nov 4 17:59:14 2016 Total Scan time: 2.570 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]