FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7583, 221 aa 1>>>pF1KB7583 221 - 221 aa - 221 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.9348+/-0.000884; mu= 7.4152+/- 0.054 mean_var=117.4885+/-22.995, 0's: 0 Z-trim(109.6): 27 B-trim: 0 in 0/53 Lambda= 0.118325 statistics sampled from 10979 (11000) to 10979 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.701), E-opt: 0.2 (0.338), width: 16 Scan time: 1.800 The best scores are: opt bits E(32554) CCDS1896.1 MXD1 gene_id:4084|Hs108|chr2 ( 221) 1420 252.7 1.3e-67 CCDS56123.1 MXD1 gene_id:4084|Hs108|chr2 ( 211) 1008 182.4 1.9e-46 CCDS7564.2 MXI1 gene_id:4601|Hs108|chr10 ( 228) 672 125.0 3.7e-29 CCDS7563.1 MXI1 gene_id:4601|Hs108|chr10 ( 295) 672 125.1 4.6e-29 CCDS3361.1 MXD4 gene_id:10608|Hs108|chr4 ( 209) 621 116.3 1.5e-26 CCDS31284.1 MXI1 gene_id:4601|Hs108|chr10 ( 182) 619 115.9 1.6e-26 CCDS4416.1 MXD3 gene_id:83463|Hs108|chr5 ( 206) 527 100.3 9.8e-22 CCDS47347.1 MXD3 gene_id:83463|Hs108|chr5 ( 193) 482 92.6 1.9e-19 >>CCDS1896.1 MXD1 gene_id:4084|Hs108|chr2 (221 aa) initn: 1420 init1: 1420 opt: 1420 Z-score: 1327.1 bits: 252.7 E(32554): 1.3e-67 Smith-Waterman score: 1420; 100.0% identity (100.0% similar) in 221 aa overlap (1-221:1-221) 10 20 30 40 50 60 pF1KB7 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSKKNNSSSRST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSKKNNSSSRST 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 HNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVHQID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 HNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVHQID 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 QLQREQRHLKRQLEKLGIERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTGDLDWSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 QLQREQRHLKRQLEKLGIERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTGDLDWSS 130 140 150 160 170 180 190 200 210 220 pF1KB7 SSVSDSDERGSMQSLGSDEGYSSTSIKRIKLQDSHKACLGL ::::::::::::::::::::::::::::::::::::::::: CCDS18 SSVSDSDERGSMQSLGSDEGYSSTSIKRIKLQDSHKACLGL 190 200 210 220 >>CCDS56123.1 MXD1 gene_id:4084|Hs108|chr2 (211 aa) initn: 1001 init1: 1001 opt: 1008 Z-score: 947.3 bits: 182.4 E(32554): 1.9e-46 Smith-Waterman score: 1324; 95.5% identity (95.5% similar) in 221 aa overlap (1-221:1-211) 10 20 30 40 50 60 pF1KB7 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSKKNNSSSRST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSKKNNSSSR-- 10 20 30 40 50 70 80 90 100 110 120 pF1KB7 HNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVHQID :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 --------RAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVHQID 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB7 QLQREQRHLKRQLEKLGIERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTGDLDWSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 QLQREQRHLKRQLEKLGIERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTGDLDWSS 120 130 140 150 160 170 190 200 210 220 pF1KB7 SSVSDSDERGSMQSLGSDEGYSSTSIKRIKLQDSHKACLGL ::::::::::::::::::::::::::::::::::::::::: CCDS56 SSVSDSDERGSMQSLGSDEGYSSTSIKRIKLQDSHKACLGL 180 190 200 210 >>CCDS7564.2 MXI1 gene_id:4601|Hs108|chr10 (228 aa) initn: 777 init1: 377 opt: 672 Z-score: 636.9 bits: 125.0 E(32554): 3.7e-29 Smith-Waterman score: 784; 59.1% identity (81.4% similar) in 220 aa overlap (5-207:4-223) 10 20 30 40 50 pF1KB7 MAAAVRM-NIQMLLEAADYLERREREAEHGYASMLPYNNKDR----DALKRRNKSKKNNS :.: :.: :::::..::::::: :::::: .: . : .: ....:..: CCDS75 MERVKMINVQRLLEAAEFLERRERECEHGYASSFPSMPSPRLQHSKPPRRLSRAQKHSS 10 20 30 40 50 60 70 80 90 100 pF1KB7 SS-------RSTHNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKL .: ::::::.:::::::::::::.:: :.::::. .:::::.::.::: ::::: CCDS75 GSSNTSTANRSTHNELEKNRRAHLRLCLERLKVLIPLGPDCTRHTTLGLLNKAKAHIKKL 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB7 EDCDRKAVHQIDQLQREQRHLKRQLEKLG----IERIRMDSIGSTVSSERSDSDREEIDV :. .::. ::...:.:::: :: .::.: .:::::::::::.::.::::.::::.: CCDS75 EEAERKSQHQLENLEREQRFLKWRLEQLQGPQEMERIRMDSIGSTISSDRSDSEREEIEV 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB7 DVESTDYLTGDLD-WSSSSVSDSDERGSMQSLGSDEGYSSTSIKRIKLQDSHKACLGL :::::.. :..: :..:.:: :...:. :.::::::::.:.: CCDS75 DVESTEFSHGEVDNISTTSISDIDDHSSLPSIGSDEGYSSASVKLSFTS 180 190 200 210 220 >>CCDS7563.1 MXI1 gene_id:4601|Hs108|chr10 (295 aa) initn: 708 init1: 377 opt: 672 Z-score: 635.2 bits: 125.1 E(32554): 4.6e-29 Smith-Waterman score: 750; 57.5% identity (80.4% similar) in 219 aa overlap (8-207:72-290) 10 20 30 pF1KB7 MAAAVRMNIQMLLEAADYLERREREA---EHGYASML :.:.:::::.:::. :.: :::::: . CCDS75 PAGAKPRCPFSDIFNTSENSMEKHINTFLQNVQILLEAASYLEQIEKENKKCEHGYASSF 50 60 70 80 90 100 40 50 60 70 80 pF1KB7 PYNNKDR----DALKRRNKSKKNNSSS-------RSTHNEMEKNRRAHLRLCLEKLKGLV : . : .: ....:..:.: ::::::.:::::::::::::.:: :. CCDS75 PSMPSPRLQHSKPPRRLSRAQKHSSGSSNTSTANRSTHNELEKNRRAHLRLCLERLKVLI 110 120 130 140 150 160 90 100 110 120 130 pF1KB7 PLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVHQIDQLQREQRHLKRQLEKLG----IE ::::. .:::::.::.::: ::::::. .::. ::...:.:::: :: .::.: .: CCDS75 PLGPDCTRHTTLGLLNKAKAHIKKLEEAERKSQHQLENLEREQRFLKWRLEQLQGPQEME 170 180 190 200 210 220 140 150 160 170 180 190 pF1KB7 RIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTGDLD-WSSSSVSDSDERGSMQSLGSD ::::::::::.::.::::.::::.::::::.. :..: :..:.:: :...:. :.::: CCDS75 RIRMDSIGSTISSDRSDSEREEIEVDVESTEFSHGEVDNISTTSISDIDDHSSLPSIGSD 230 240 250 260 270 280 200 210 220 pF1KB7 EGYSSTSIKRIKLQDSHKACLGL :::::.:.: CCDS75 EGYSSASVKLSFTS 290 >>CCDS3361.1 MXD4 gene_id:10608|Hs108|chr4 (209 aa) initn: 559 init1: 519 opt: 621 Z-score: 590.4 bits: 116.3 E(32554): 1.5e-26 Smith-Waterman score: 621; 53.2% identity (79.6% similar) in 201 aa overlap (8-201:5-196) 10 20 30 40 50 pF1KB7 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSK---KNNSSS .. .:::::.:::::.:::::::::.::. : : ....:. .. .. CCDS33 MELNSLLILLEAAEYLERRDREAEHGYASVLPF---DGDFAREKTKAAGLVRKAPNN 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 RSTHNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVH ::.:::.::.:::.::: ::.:: ::::::.:.:::::::: .::.::::::. ::.:. CCDS33 RSSHNELEKHRRAKLRLYLEQLKQLVPLGPDSTRHTTLSLLKRAKVHIKKLEEQDRRALS 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 QIDQLQREQRHLKRQLEKLGI---ERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTG .:::.:.: :::.::.:.. ::.: :: ::.::.. ::..: ::.:. .. : CCDS33 IKEQLQQEHRFLKRRLEQLSVQSVERVRTDSTGSAVSTD--DSEQE---VDIEGMEFGPG 120 130 140 150 160 180 190 200 210 220 pF1KB7 DLDWSSSSVSDSDERGSMQS-LGSDEGYSSTSIKRIKLQDSHKACLGL .:: : .: ::.:.. :.:: :.: :. CCDS33 ELD-SVGSSSDADDHYSLQSGTGGDSGFGPHCRRLGRPALS 170 180 190 200 >>CCDS31284.1 MXI1 gene_id:4601|Hs108|chr10 (182 aa) initn: 614 init1: 322 opt: 619 Z-score: 589.4 bits: 115.9 E(32554): 1.6e-26 Smith-Waterman score: 619; 58.9% identity (85.1% similar) in 168 aa overlap (45-207:13-177) 20 30 40 50 60 70 pF1KB7 AADYLERREREAEHGYASMLPYNNKDRDALKRRNKSKKNNSSSRSTHNEMEKNRRAHLRL .: ....:..:.: .: . :::::::: CCDS31 MPSPRLQHSKPPRRLSRAQKHSSGSSNTSTA---NRRAHLRL 10 20 30 80 90 100 110 120 130 pF1KB7 CLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAVHQIDQLQREQRHLKRQLE :::.:: :.::::. .:::::.::.::: ::::::. .::. ::...:.:::: :: .:: CCDS31 CLERLKVLIPLGPDCTRHTTLGLLNKAKAHIKKLEEAERKSQHQLENLEREQRFLKWRLE 40 50 60 70 80 90 140 150 160 170 180 pF1KB7 KLG----IERIRMDSIGSTVSSERSDSDREEIDVDVESTDYLTGDLD-WSSSSVSDSDER .: .:::::::::::.::.::::.::::.::::::.. :..: :..:.:: :.. CCDS31 QLQGPQEMERIRMDSIGSTISSDRSDSEREEIEVDVESTEFSHGEVDNISTTSISDIDDH 100 110 120 130 140 150 190 200 210 220 pF1KB7 GSMQSLGSDEGYSSTSIKRIKLQDSHKACLGL .:. :.::::::::.:.: CCDS31 SSLPSIGSDEGYSSASVKLSFTS 160 170 180 >>CCDS4416.1 MXD3 gene_id:83463|Hs108|chr5 (206 aa) initn: 574 init1: 295 opt: 527 Z-score: 503.7 bits: 100.3 E(32554): 9.8e-22 Smith-Waterman score: 527; 52.0% identity (79.2% similar) in 173 aa overlap (8-168:7-177) 10 20 30 40 50 pF1KB7 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSKKN----NSS :::.::.::..::::::::::::::. :. .. ..::.: . ..: CCDS44 MEPLASNIQVLLQAAEFLERREREAEHGYASLCPH--RSPGPIHRRKKRPPQAPGAQDS 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 SRSTHNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAV .::.:::.:: :::.:. :::.:: .::: . .:.:::::: .:..::.:::: ...: CCDS44 GRSVHNELEKRRRAQLKRCLERLKQQMPLGADCARYTTLSLLRRARMHIQKLEDQEQRAR 60 70 80 90 100 110 120 130 140 150 160 pF1KB7 HQIDQLQREQRHLKRQLEKL-GI------ERIRMDSIGST-VSSERSDSDREEIDVDVES . ..:. .:. :.::::.: :. ::.: ::. :. .::::::::.::..::::: CCDS44 QLKERLRSKQQSLQRQLEQLRGLAGAAERERLRADSLDSSGLSSERSDSDQEELEVDVES 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB7 TDYLTGDLDWSSSSVSDSDERGSMQSLGSDEGYSSTSIKRIKLQDSHKACLGL CCDS44 LVFGGEAELLRGFVAGQEHSYSHGGGAWL 180 190 200 >>CCDS47347.1 MXD3 gene_id:83463|Hs108|chr5 (193 aa) initn: 509 init1: 295 opt: 482 Z-score: 462.6 bits: 92.6 E(32554): 1.9e-19 Smith-Waterman score: 482; 50.6% identity (78.0% similar) in 164 aa overlap (8-159:7-168) 10 20 30 40 50 pF1KB7 MAAAVRMNIQMLLEAADYLERREREAEHGYASMLPYNNKDRDALKRRNKSKKN----NSS :::.::.::..::::::::::::::. :. .. ..::.: . ..: CCDS47 MEPLASNIQVLLQAAEFLERREREAEHGYASLCPH--RSPGPIHRRKKRPPQAPGAQDS 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 SRSTHNEMEKNRRAHLRLCLEKLKGLVPLGPESSRHTTLSLLTKAKLHIKKLEDCDRKAV .::.:::.:: :::.:. :::.:: .::: . .:.:::::: .:..::.:::: ...: CCDS47 GRSVHNELEKRRRAQLKRCLERLKQQMPLGADCARYTTLSLLRRARMHIQKLEDQEQRAR 60 70 80 90 100 110 120 130 140 150 160 pF1KB7 HQIDQLQREQRHLKRQLEKL-GI------ERIRMDSIGST-VSSERSDSDREEIDVDVES . ..:. .:. :.::::.: :. ::.: ::. :. .::::::::. CCDS47 QLKERLRSKQQSLQRQLEQLRGLAGAAERERLRADSLDSSGLSSERSDSDQVLPNENGGT 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB7 TDYLTGDLDWSSSSVSDSDERGSMQSLGSDEGYSSTSIKRIKLQDSHKACLGL CCDS47 PNHRPTGRGNNISSHH 180 190 221 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 08:50:35 2016 done: Fri Nov 4 08:50:35 2016 Total Scan time: 1.800 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]