FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7983, 422 aa 1>>>pF1KB7983 422 - 422 aa - 422 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.8105+/-0.00092; mu= 2.4064+/- 0.056 mean_var=219.8653+/-45.453, 0's: 0 Z-trim(113.0): 186 B-trim: 0 in 0/52 Lambda= 0.086496 statistics sampled from 13522 (13726) to 13522 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.762), E-opt: 0.2 (0.422), width: 16 Scan time: 3.410 The best scores are: opt bits E(32554) CCDS31451.1 PAX6 gene_id:5080|Hs108|chr11 ( 422) 2864 370.0 2.5e-102 CCDS31452.1 PAX6 gene_id:5080|Hs108|chr11 ( 436) 2546 330.3 2.2e-90 CCDS46398.1 PAX8 gene_id:7849|Hs108|chr2 ( 450) 791 111.3 1.9e-24 CCDS41561.1 PAX2 gene_id:5076|Hs108|chr10 ( 394) 786 110.6 2.7e-24 CCDS7499.1 PAX2 gene_id:5076|Hs108|chr10 ( 396) 786 110.6 2.7e-24 CCDS42735.1 PAX8 gene_id:7849|Hs108|chr2 ( 287) 758 107.0 2.4e-23 CCDS65047.1 PAX5 gene_id:5079|Hs108|chr9 ( 357) 759 107.2 2.6e-23 CCDS42736.1 PAX8 gene_id:7849|Hs108|chr2 ( 321) 758 107.1 2.6e-23 CCDS46399.1 PAX8 gene_id:7849|Hs108|chr2 ( 398) 758 107.1 3.1e-23 CCDS65044.1 PAX5 gene_id:5079|Hs108|chr9 ( 295) 755 106.7 3.1e-23 CCDS65045.1 PAX5 gene_id:5079|Hs108|chr9 ( 324) 755 106.7 3.4e-23 CCDS65046.1 PAX5 gene_id:5079|Hs108|chr9 ( 328) 755 106.7 3.4e-23 CCDS65048.1 PAX5 gene_id:5079|Hs108|chr9 ( 362) 755 106.7 3.7e-23 CCDS6607.1 PAX5 gene_id:5079|Hs108|chr9 ( 391) 755 106.8 3.9e-23 CCDS65042.1 PAX5 gene_id:5079|Hs108|chr9 ( 319) 683 97.7 1.7e-20 CCDS65043.1 PAX5 gene_id:5079|Hs108|chr9 ( 348) 683 97.7 1.8e-20 CCDS5797.1 PAX4 gene_id:5078|Hs108|chr7 ( 343) 630 91.1 1.8e-18 CCDS46522.1 PAX3 gene_id:5077|Hs108|chr2 ( 483) 624 90.5 3.8e-18 CCDS44075.1 PAX7 gene_id:5081|Hs108|chr1 ( 518) 619 89.9 6.2e-18 CCDS44074.1 PAX7 gene_id:5081|Hs108|chr1 ( 505) 614 89.3 9.4e-18 CCDS186.1 PAX7 gene_id:5081|Hs108|chr1 ( 520) 614 89.3 9.6e-18 CCDS42826.1 PAX3 gene_id:5077|Hs108|chr2 ( 479) 607 88.4 1.7e-17 CCDS9662.1 PAX9 gene_id:5083|Hs108|chr14 ( 341) 604 87.9 1.7e-17 CCDS42825.1 PAX3 gene_id:5077|Hs108|chr2 ( 484) 607 88.4 1.7e-17 CCDS2448.1 PAX3 gene_id:5077|Hs108|chr2 ( 505) 607 88.4 1.7e-17 CCDS74709.1 PAX1 gene_id:5075|Hs108|chr20 ( 457) 605 88.1 1.9e-17 CCDS13146.2 PAX1 gene_id:5075|Hs108|chr20 ( 534) 605 88.2 2.1e-17 CCDS2451.1 PAX3 gene_id:5077|Hs108|chr2 ( 206) 579 84.6 9.8e-17 CCDS46523.1 PAX3 gene_id:5077|Hs108|chr2 ( 215) 579 84.6 1e-16 CCDS2450.1 PAX3 gene_id:5077|Hs108|chr2 ( 403) 583 85.3 1.2e-16 CCDS2449.1 PAX3 gene_id:5077|Hs108|chr2 ( 407) 583 85.3 1.2e-16 >>CCDS31451.1 PAX6 gene_id:5080|Hs108|chr11 (422 aa) initn: 2864 init1: 2864 opt: 2864 Z-score: 1950.7 bits: 370.0 E(32554): 2.5e-102 Smith-Waterman score: 2864; 100.0% identity (100.0% similar) in 422 aa overlap (1-422:1-422) 10 20 30 40 50 60 pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQVSNGCVSKILGRY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQVSNGCVSKILGRY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 YETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLSEGVCTNDNIPSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 YETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLSEGVCTNDNIPSV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 SSINRVLRNLASEKQQMGADGMYDKLRMLNGQTGSWGTRPGWYPGTSVPGQPTQDGCQQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SSINRVLRNLASEKQQMGADGMYDKLRMLNGQTGSWGTRPGWYPGTSVPGQPTQDGCQQQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 EGGGENTNSISSNGEDSDEAQMRLQLKRKLQRNRTSFTQEQIEALEKEFERTHYPDVFAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EGGGENTNSISSNGEDSDEAQMRLQLKRKLQRNRTSFTQEQIEALEKEFERTHYPDVFAR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 ERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQASNTPSHIPISSSFSTSVYQPIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQASNTPSHIPISSSFSTSVYQPIP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 QPTTPVSSFTSGSMLGRTDTALTNTYSALPPMPSFTMANNLPMQPPVPSQTSSYSCMLPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QPTTPVSSFTSGSMLGRTDTALTNTYSALPPMPSFTMANNLPMQPPVPSQTSSYSCMLPT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 SPSVNGRSYDTYTPPHMQTHMNSQPMGTSGTTSTGLISPGVSVPVQVPGSEPDMSQYWPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SPSVNGRSYDTYTPPHMQTHMNSQPMGTSGTTSTGLISPGVSVPVQVPGSEPDMSQYWPR 370 380 390 400 410 420 pF1KB7 LQ :: CCDS31 LQ >>CCDS31452.1 PAX6 gene_id:5080|Hs108|chr11 (436 aa) initn: 2546 init1: 2546 opt: 2546 Z-score: 1736.0 bits: 330.3 E(32554): 2.2e-90 Smith-Waterman score: 2826; 96.8% identity (96.8% similar) in 436 aa overlap (1-422:1-436) 10 20 30 40 pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQ------------- ::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQTHADAKVQVLDNQ 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB7 -VSNGCVSKILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRL ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 NVSNGCVSKILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRL 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB7 LSEGVCTNDNIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNGQTGSWGTRPGWYPGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LSEGVCTNDNIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNGQTGSWGTRPGWYPGT 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB7 SVPGQPTQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKLQRNRTSFTQEQIEALE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SVPGQPTQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKLQRNRTSFTQEQIEALE 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB7 KEFERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQASNTPSHIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KEFERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQASNTPSHIP 250 260 270 280 290 300 290 300 310 320 330 340 pF1KB7 ISSSFSTSVYQPIPQPTTPVSSFTSGSMLGRTDTALTNTYSALPPMPSFTMANNLPMQPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ISSSFSTSVYQPIPQPTTPVSSFTSGSMLGRTDTALTNTYSALPPMPSFTMANNLPMQPP 310 320 330 340 350 360 350 360 370 380 390 400 pF1KB7 VPSQTSSYSCMLPTSPSVNGRSYDTYTPPHMQTHMNSQPMGTSGTTSTGLISPGVSVPVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 VPSQTSSYSCMLPTSPSVNGRSYDTYTPPHMQTHMNSQPMGTSGTTSTGLISPGVSVPVQ 370 380 390 400 410 420 410 420 pF1KB7 VPGSEPDMSQYWPRLQ :::::::::::::::: CCDS31 VPGSEPDMSQYWPRLQ 430 >>CCDS46398.1 PAX8 gene_id:7849|Hs108|chr2 (450 aa) initn: 730 init1: 652 opt: 791 Z-score: 552.3 bits: 111.3 E(32554): 1.9e-24 Smith-Waterman score: 791; 36.1% identity (62.3% similar) in 438 aa overlap (1-418:6-417) 10 20 30 40 50 pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQVSNGCVSK ....:.:.:::::.::::::::. .::.::.:::.:.::::::: :.::.::::: CCDS46 MPHNSIRSGHGGLNQLGGAFVNGRPLPEVVRQRIVDLAHQGVRPCDISRQLRVSHGCVSK 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 ILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLSEGVCTND ::::::::::::: .::::::.::::.:: ::..:::. :..::::::::::.:::: :: CCDS46 ILGRYYETGSIRPGVIGGSKPKVATPKVVEKIGDYKRQNPTMFAWEIRDRLLAEGVCDND 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB7 NIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNGQT--GSWGTRPGWYPGTSVPGQP- ..::::::::..:. ... .. :. . :.: : .. : : .. :. CCDS46 TVPSVSSINRIIRTKVQQPFNLPMDSCVATKSLSPGHTLIPSSAVTPPESPQSDSLGSTY 130 140 150 160 170 180 180 190 200 210 220 pF1KB7 TQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKLQRN--RT-SFTQEQIEALEKEF . .: : . ..... .:: . .. : . . :. :: .:.:...: :: : CCDS46 SINGLLGIAQPGSDKRKMDDSDQDSCRLSIDSQSSSSGPRKHLRTDAFSQHHLEPLECPF 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB7 ERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQASNTPSHIPISS :: :::...: .. .. . . : : . . :. :::. :.. CCDS46 ERQHYPEAYASP---SHTKGEQGLYPLPLLNST--------LDDGK--ATLTPSNTPLGR 250 260 270 280 290 300 310 320 330 pF1KB7 SFST-SVYQPIPQPTTPV-----------SSFTSGSMLGRTDTALTNTYSALPPMPSFTM ..:: ..: . .: .: :: : .:. . . : .. :..::. .: CCDS46 NLSTHQTYPVVADPHSPFAIKQETPEVSSSSSTPSSLSSSAFLDLQQVGSGVPPFNAFPH 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB7 ANNLPMQPPVPSQTSSYSCMLPTSPSVNGRSYDTYTPPHMQTHMNSQPMGTSGTTSTGLI : .. : . :. . :: :. :::. : . .:. .... . . CCDS46 AASVYGQFTGQALLSGREMVGPTLPGY---------PPHIPT----SGQGSYASSAIAGM 350 360 370 380 390 400 410 420 pF1KB7 SPGVSVPVQVPGSEP--DMSQYWPRLQ : .. : : ..:. : CCDS46 VAGSEYSGNAYGHTPYSSYSEAWRFPNSSLLSSPYYYSSTSRPSAPPTTATAFDHL 400 410 420 430 440 450 >>CCDS41561.1 PAX2 gene_id:5076|Hs108|chr10 (394 aa) initn: 799 init1: 704 opt: 786 Z-score: 549.7 bits: 110.6 E(32554): 2.7e-24 Smith-Waterman score: 798; 39.1% identity (64.6% similar) in 396 aa overlap (1-372:13-394) 10 20 30 40 pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQV :. .:.::::::::::::::::: .::.::::::.:.::::::: :.: CCDS41 MDMHCKADPFSAMHPGHGGVNQLGGVFVNGRPLPDVVRQRIVELAHQGVRPCDISRQLRV 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB7 SNGCVSKILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLS :.::::::::::::::::.: .::::::.::::.::.:::.:::. :..::::::::::. CCDS41 SHGCVSKILGRYYETGSIKPGVIGGSKPKVATPKVVDKIAEYKRQNPTMFAWEIRDRLLA 70 80 90 100 110 120 110 120 130 140 150 pF1KB7 EGVCTNDNIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNGQT----------GSWGT ::.: ::..::::::::..:. ... . :: . :.: .: .. CCDS41 EGICDNDTVPSVSSINRIIRTKVQQPFHPTPDGAGTGVTA-PGHTIVPSTASPPVSSASN 130 140 150 160 170 160 170 180 190 200 210 pF1KB7 RP-GWYPGTSVPGQPTQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKLQRNRTSF : : : ... : : ..: .... . .:. .. .: ..: .:. .: CCDS41 DPVGSYSINGILGIPRSNGEKRKRDEDVSEGSVPNGDSQSGVDSLRKHLRAD------TF 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB7 TQEQIEALEKEFERTHYPDVF-ARERLAAK----IDLPEARIQVWFSNRRAKWRREEKLR ::.:.:::.. ::: ::::: : :.. .. .:: . . . . .: CCDS41 TQQQLEALDRVFERPSYPDVFQASEHIKSEQGNEYSLPALTPGLDEVKSSLSASTNPELG 240 250 260 270 280 290 280 290 300 310 320 pF1KB7 NQRRQASNTPSHIPISSSFSTSVYQPIPQPTTPVS---SFTSGSMLGRTDTALTNTYSAL . ..:.: .. ... .:. : : .: . :. .... : . . .:. CCDS41 S---NVSGTQTYPVVTGRDMASTTLPGYPPHVPPTGQGSYPTSTLAGMVP---GSEFSGN 300 310 320 330 340 330 340 350 360 370 380 pF1KB7 P-PMPSFTMANNLPMQPPVPSQTSS--YSCMLP--TSPSVNGRSYDTYTPPHMQTHMNSQ : :..: : : . :. :: : : ..:.. . .:: . CCDS41 PYSHPQYT-AYNEAWRFSNPALLSSPYYYSAAPRGSAPAAAAAAYDRH 350 360 370 380 390 390 400 410 420 pF1KB7 PMGTSGTTSTGLISPGVSVPVQVPGSEPDMSQYWPRLQ >>CCDS7499.1 PAX2 gene_id:5076|Hs108|chr10 (396 aa) initn: 799 init1: 704 opt: 786 Z-score: 549.7 bits: 110.6 E(32554): 2.7e-24 Smith-Waterman score: 839; 39.9% identity (66.9% similar) in 396 aa overlap (1-376:13-396) 10 20 30 40 pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQV :. .:.::::::::::::::::: .::.::::::.:.::::::: :.: CCDS74 MDMHCKADPFSAMHPGHGGVNQLGGVFVNGRPLPDVVRQRIVELAHQGVRPCDISRQLRV 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB7 SNGCVSKILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLS :.::::::::::::::::.: .::::::.::::.::.:::.:::. :..::::::::::. CCDS74 SHGCVSKILGRYYETGSIKPGVIGGSKPKVATPKVVDKIAEYKRQNPTMFAWEIRDRLLA 70 80 90 100 110 120 110 120 130 140 150 pF1KB7 EGVCTNDNIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNGQT----------GSWGT ::.: ::..::::::::..:. ... . :: . :.: .: .. CCDS74 EGICDNDTVPSVSSINRIIRTKVQQPFHPTPDGAGTGVTA-PGHTIVPSTASPPVSSASN 130 140 150 160 170 160 170 180 190 200 210 pF1KB7 RP-GWYPGTSVPGQPTQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKLQRNRTSF : : : ... : : ..: .... . .:. ::.... .. .:...:. . .: CCDS74 DPVGSYSINGILGIPRSNGEKRKRDEDVSEGSVP-NGDSQSGVD---SLRKHLRAD--TF 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB7 TQEQIEALEKEFERTHYPDVF-ARERLAAK----IDLPEARIQVWFSNRRAKWRREEKLR ::.:.:::.. ::: ::::: : :.. .. .:: . . . . .: CCDS74 TQQQLEALDRVFERPSYPDVFQASEHIKSEQGNEYSLPALTPGLDEVKSSLSASTNPELG 240 250 260 270 280 290 280 290 300 310 320 pF1KB7 NQRRQASNTPSHIPISSSFSTSVYQPIPQPTTPVS---SFTSGSMLGRTDTALTNTYSAL . ..:.: .. ... .:. : : .: . :. .... : . : .. :.: CCDS74 S---NVSGTQTYPVVTGRDMASTTLPGYPPHVPPTGQGSYPTSTLAGMVPEAAVGPSSSL 300 310 320 330 340 350 330 340 350 360 370 380 pF1KB7 PPMPSFTMANNLP-MQPPVPSQTSSYSCMLPTSPSVNGRSYDTYTPPHMQTHMNSQPMGT :. .:. : .:: :. .. . : :.. : :. :::. CCDS74 MSKPGRKLAEVPPCVQPTGASSPATRTATPSTRPTT--RLGDSATPPY 360 370 380 390 390 400 410 420 pF1KB7 SGTTSTGLISPGVSVPVQVPGSEPDMSQYWPRLQ >>CCDS42735.1 PAX8 gene_id:7849|Hs108|chr2 (287 aa) initn: 737 init1: 652 opt: 758 Z-score: 532.7 bits: 107.0 E(32554): 2.4e-23 Smith-Waterman score: 758; 49.4% identity (75.9% similar) in 245 aa overlap (1-239:6-250) 10 20 30 40 50 pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQVSNGCVSK ....:.:.:::::.::::::::. .::.::.:::.:.::::::: :.::.::::: CCDS42 MPHNSIRSGHGGLNQLGGAFVNGRPLPEVVRQRIVDLAHQGVRPCDISRQLRVSHGCVSK 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 ILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLSEGVCTND ::::::::::::: .::::::.::::.:: ::..:::. :..::::::::::.:::: :: CCDS42 ILGRYYETGSIRPGVIGGSKPKVATPKVVEKIGDYKRQNPTMFAWEIRDRLLAEGVCDND 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB7 NIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNGQT--GSWGTRPGWYPGTSVPGQP- ..::::::::..:. ... .. :. . :.: : .. : : .. :. CCDS42 TVPSVSSINRIIRTKVQQPFNLPMDSCVATKSLSPGHTLIPSSAVTPPESPQSDSLGSTY 130 140 150 160 170 180 180 190 200 210 220 pF1KB7 TQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKLQRN--RT-SFTQEQIEALEKEF . .: : . ..... .:: . .. : . . :. :: .:.:...: :: : CCDS42 SINGLLGIAQPGSDKRKMDDSDQDSCRLSIDSQSSSSGPRKHLRTDAFSQHHLEPLECPF 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB7 ERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQASNTPSHIPISS :: :::...: CCDS42 ERQHYPEAYASPSHTKGEQEVNTLAMPMATPPTPPTARPGASPTPAC 250 260 270 280 >>CCDS65047.1 PAX5 gene_id:5079|Hs108|chr9 (357 aa) initn: 695 init1: 695 opt: 759 Z-score: 532.1 bits: 107.2 E(32554): 2.6e-23 Smith-Waterman score: 761; 42.5% identity (66.8% similar) in 346 aa overlap (2-331:14-348) 10 20 30 40 pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQV ...:.::::::::::::::::: .::.::::::.:.::::::: :.: CCDS65 MDLEKNYPTPRTSRTGHGGVNQLGGVFVNGRPLPDVVRQRIVELAHQGVRPCDISRQLRV 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB7 SNGCVSKILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLS :.::::::::::::::::.: .::::::.::::.:: :::.:::. :..::::::::::. CCDS65 SHGCVSKILGRYYETGSIKPGVIGGSKPKVATPKVVEKIAEYKRQNPTMFAWEIRDRLLA 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB7 EGVCTNDNIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNG--QTGSWGTRPGW--YP : :: ::..::::::::..:. ... .. . . .. .. :..: .: . : CCDS65 ERVCDNDTVPSVSSINRIIRTKVQQPPNQPVPASSHSIVSTGSVTQVSSVSTDSAGSSYS 130 140 150 160 170 180 170 180 190 200 210 pF1KB7 GTSVPG--QPTQDGCQQQ--EGGGENT--NSISSNGEDSDEAQMRLQLKRKLQRNRTSFT ... : .:. : ... :: :. :. : :.: . ::: .: :: CCDS65 ISGILGITSPSADTNKRKRDEGIQESPVPNGHSLPGRDFLRKQMRGDL----------FT 190 200 210 220 230 220 230 240 250 260 270 pF1KB7 QEQIEALEKEFERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQA :.:.:.:.. ::: :: :.:. . . : .. ... . . . . CCDS65 QQQLEVLDRVFERQHYSDIFTTTEPIKPEQTTEYSAMASLAGGLDDMKANLASPTPADIG 240 250 260 270 280 290 280 290 300 310 320 330 pF1KB7 SNTPS--HIPI--SSSFSTSVYQPIPQPTTPVSS--FTSGSMLGRTDTALTNTYSALPPM :..:. :: .: :: : :. :: .. .: : . ..:: . . .: :: CCDS65 SSVPGPQSYPIVTGSEFSGSPYSH-PQYSSYNDSWRFPNPGLLGSPYYYSAAARGAAPPA 300 310 320 330 340 340 350 360 370 380 390 pF1KB7 PSFTMANNLPMQPPVPSQTSSYSCMLPTSPSVNGRSYDTYTPPHMQTHMNSQPMGTSGTT CCDS65 AATAYDRH 350 >>CCDS42736.1 PAX8 gene_id:7849|Hs108|chr2 (321 aa) initn: 764 init1: 679 opt: 758 Z-score: 532.0 bits: 107.1 E(32554): 2.6e-23 Smith-Waterman score: 758; 49.4% identity (75.9% similar) in 245 aa overlap (1-239:6-250) 10 20 30 40 50 pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQVSNGCVSK ....:.:.:::::.::::::::. .::.::.:::.:.::::::: :.::.::::: CCDS42 MPHNSIRSGHGGLNQLGGAFVNGRPLPEVVRQRIVDLAHQGVRPCDISRQLRVSHGCVSK 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 ILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLSEGVCTND ::::::::::::: .::::::.::::.:: ::..:::. :..::::::::::.:::: :: CCDS42 ILGRYYETGSIRPGVIGGSKPKVATPKVVEKIGDYKRQNPTMFAWEIRDRLLAEGVCDND 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB7 NIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNGQT--GSWGTRPGWYPGTSVPGQP- ..::::::::..:. ... .. :. . :.: : .. : : .. :. CCDS42 TVPSVSSINRIIRTKVQQPFNLPMDSCVATKSLSPGHTLIPSSAVTPPESPQSDSLGSTY 130 140 150 160 170 180 180 190 200 210 220 pF1KB7 TQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKLQRN--RT-SFTQEQIEALEKEF . .: : . ..... .:: . .. : . . :. :: .:.:...: :: : CCDS42 SINGLLGIAQPGSDKRKMDDSDQDSCRLSIDSQSSSSGPRKHLRTDAFSQHHLEPLECPF 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB7 ERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQASNTPSHIPISS :: :::...: CCDS42 ERQHYPEAYASPSHTKGEQGERWWGPRCPDTHPTSPPADRAAMPPLPSQAWWQEVNTLAM 250 260 270 280 290 300 >>CCDS46399.1 PAX8 gene_id:7849|Hs108|chr2 (398 aa) initn: 764 init1: 679 opt: 758 Z-score: 530.7 bits: 107.1 E(32554): 3.1e-23 Smith-Waterman score: 772; 37.0% identity (61.1% similar) in 427 aa overlap (1-412:6-394) 10 20 30 40 50 pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQVSNGCVSK ....:.:.:::::.::::::::. .::.::.:::.:.::::::: :.::.::::: CCDS46 MPHNSIRSGHGGLNQLGGAFVNGRPLPEVVRQRIVDLAHQGVRPCDISRQLRVSHGCVSK 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB7 ILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLSEGVCTND ::::::::::::: .::::::.::::.:: ::..:::. :..::::::::::.:::: :: CCDS46 ILGRYYETGSIRPGVIGGSKPKVATPKVVEKIGDYKRQNPTMFAWEIRDRLLAEGVCDND 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB7 NIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNGQT--GSWGTRPGWYPGTSVPGQP- ..::::::::..:. ... .. :. . :.: : .. : : .. :. CCDS46 TVPSVSSINRIIRTKVQQPFNLPMDSCVATKSLSPGHTLIPSSAVTPPESPQSDSLGSTY 130 140 150 160 170 180 180 190 200 210 220 pF1KB7 TQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKLQRN--RT-SFTQEQIEALEKEF . .: : . ..... .:: . .. : . . :. :: .:.:...: :: : CCDS46 SINGLLGIAQPGSDKRKMDDSDQDSCRLSIDSQSSSSGPRKHLRTDAFSQHHLEPLECPF 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB7 ERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQASNTPSHIPISS :: :::...: .. .. . . : : . . :. :::. :.. CCDS46 ERQHYPEAYASP---SHTKGEQGLYPLPLLNST--------LDDGK--ATLTPSNTPLGR 250 260 270 280 290 300 310 320 330 340 pF1KB7 SFSTSVYQPIPQPTTPVSSFTSGSMLGRTDTALTNTYSALPPMPSFTMANNLPMQPPVPS ..:: .: : ..: . : : : : :: .:: :: . CCDS46 NLST--HQTYPVVAAPPFWICSKSAPGSR-----------PSMP-------FPMLPPCTG 290 300 310 320 350 360 370 380 390 400 pF1KB7 QTSSYSCMLPTSPSV---NGRSYDTY--TPPHMQTHMNSQPMGT----SGTTSTGLISPG .. . :.: . . : ::. .:: .. : : . .: . . .: CCDS46 SSRAR----PSSQGERWWGPRCPDTHPTSPPADRAAMPPLPSQAWWQEVNTLAMPMATPP 330 340 350 360 370 380 410 420 pF1KB7 VSVPVQVPGSEPDMSQYWPRLQ . :. ::. : CCDS46 TP-PTARPGASPTPAC 390 >>CCDS65044.1 PAX5 gene_id:5079|Hs108|chr9 (295 aa) initn: 743 init1: 683 opt: 755 Z-score: 530.5 bits: 106.7 E(32554): 3.1e-23 Smith-Waterman score: 757; 51.8% identity (75.3% similar) in 247 aa overlap (2-238:14-250) 10 20 30 40 pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQV ...:.::::::::::::::::: .::.::::::.:.::::::: :.: CCDS65 MDLEKNYPTPRTSRTGHGGVNQLGGVFVNGRPLPDVVRQRIVELAHQGVRPCDISRQLRV 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB7 SNGCVSKILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLS :.::::::::::::::::.: .::::::.::::.:: :::.:::. :..::::::::::. CCDS65 SHGCVSKILGRYYETGSIKPGVIGGSKPKVATPKVVEKIAEYKRQNPTMFAWEIRDRLLA 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB7 EGVCTNDNIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNG--QTGSWGTRPGW--YP : :: ::..::::::::..:. ... .. . . .. .. :..: .: . : CCDS65 ERVCDNDTVPSVSSINRIIRTKVQQPPNQPVPASSHSIVSTGSVTQVSSVSTDSAGSSYS 130 140 150 160 170 180 170 180 190 200 210 pF1KB7 GTSVPG--QPTQDGCQQQ--EGGGENT--NSISSNGEDSDEAQMRLQLKRKLQRNRTSFT ... : .:. : ... :: :. :. : :.: . ::: .: :: CCDS65 ISGILGITSPSADTNKRKRDEGIQESPVPNGHSLPGRDFLRKQMRGDL----------FT 190 200 210 220 230 220 230 240 250 260 270 pF1KB7 QEQIEALEKEFERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQA :.:.:.:.. ::: :: :.: CCDS65 QQQLEVLDRVFERQHYSDIFTTTEPIKPEQAPPTIIALPPEEPPHLQPPLPMTVTDPWSQ 240 250 260 270 280 290 422 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 14:50:41 2016 done: Sat Nov 5 14:50:42 2016 Total Scan time: 3.410 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]