FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5464, 266 aa 1>>>pF1KB5464 266 - 266 aa - 266 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.1683+/-0.000806; mu= 15.6058+/- 0.049 mean_var=61.3476+/-12.420, 0's: 0 Z-trim(106.6): 11 B-trim: 0 in 0/50 Lambda= 0.163748 statistics sampled from 9095 (9102) to 9095 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.66), E-opt: 0.2 (0.28), width: 16 Scan time: 2.210 The best scores are: opt bits E(32554) CCDS9409.1 ITM2B gene_id:9445|Hs108|chr13 ( 266) 1798 433.0 1e-121 CCDS2479.1 ITM2C gene_id:81618|Hs108|chr2 ( 267) 735 181.9 4e-46 CCDS74665.1 ITM2C gene_id:81618|Hs108|chr2 ( 205) 712 176.4 1.4e-44 CCDS14444.1 ITM2A gene_id:9452|Hs108|chrX ( 263) 683 169.6 2e-42 CCDS33396.1 ITM2C gene_id:81618|Hs108|chr2 ( 220) 661 164.4 6.2e-41 CCDS55455.1 ITM2A gene_id:9452|Hs108|chrX ( 219) 572 143.4 1.3e-34 CCDS33395.1 ITM2C gene_id:81618|Hs108|chr2 ( 230) 323 84.6 7e-17 >>CCDS9409.1 ITM2B gene_id:9445|Hs108|chr13 (266 aa) initn: 1798 init1: 1798 opt: 1798 Z-score: 2298.7 bits: 433.0 E(32554): 1e-121 Smith-Waterman score: 1798; 100.0% identity (100.0% similar) in 266 aa overlap (1-266:1-266) 10 20 30 40 50 60 pF1KB5 MVKVTFNSALAQKEAKKDEPKSGEEALIIPPDAVAVDCKDPDDVVPVGQRRAWCWCMCFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 MVKVTFNSALAQKEAKKDEPKSGEEALIIPPDAVAVDCKDPDDVVPVGQRRAWCWCMCFG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 LAFMLAGVILGGAYLYKYFALQPDDVYYCGIKYIKDDVILNEPSADAPAALYQTIEENIK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 LAFMLAGVILGGAYLYKYFALQPDDVYYCGIKYIKDDVILNEPSADAPAALYQTIEENIK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 IFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPLNTSIVMPPRNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 IFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPLNTSIVMPPRNL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 LELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETYKLQRRETIKGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 LELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETYKLQRRETIKGI 190 200 210 220 230 240 250 260 pF1KB5 QKREASNCFAIRHFENKFAVETLICS :::::::::::::::::::::::::: CCDS94 QKREASNCFAIRHFENKFAVETLICS 250 260 >>CCDS2479.1 ITM2C gene_id:81618|Hs108|chr2 (267 aa) initn: 670 init1: 641 opt: 735 Z-score: 941.5 bits: 181.9 E(32554): 4e-46 Smith-Waterman score: 741; 44.2% identity (69.9% similar) in 276 aa overlap (1-265:1-264) 10 20 30 40 50 pF1KB5 MVKVTFNSALAQ-KEAKKDE-------PKSGEEALIIPPDAVAVDCKDPDDVVPVGQRRA :::..:. :.: : : :. : :. : :. : : . . :. : . CCDS24 MVKISFQPAVAGIKGDKADKASASAPAPASATEILLTP----AREEQPPQHRSKRGGSVG 10 20 30 40 50 60 70 80 90 100 pF1KB5 WCWCMCFGLAFMLAGVILGGAYLYKYFALQP---DDVYYCGIKYIKDDVILNEPSADAPA . .:.. .: :......:.:.:: : :. . ::. : : : .. . CCDS24 GVCYLSMGMVVLLMGLVFASVYIYRYFFLAQLARDNFFRCGVLY--------EDSLSSQV 60 70 80 90 100 110 120 130 140 150 160 pF1KB5 ALYQTIEENIKIFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPL . .::..::. .:. : :.::::.:. .:::.:.:::.. :::: :..::::::: : CCDS24 RTQMELEEDVKIYLDENYERINVPVPQFGGGDPADIIHDFQRGLTAYHDISLDKCYVIEL 110 120 130 140 150 160 170 180 190 200 210 220 pF1KB5 NTSIVMPPRNLLELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETY ::.::.::::. :::.:.: ::::::.:.:.:.::.:... . . :: :::.::. :.:: CCDS24 NTTIVLPPRNFWELLMNVKRGTYLPQTYIIQEEMVVTEHVSDKEALGSFIYHLCNGKDTY 170 180 190 200 210 220 230 240 250 260 pF1KB5 KLQRRETIKGIQKREASNCFAIRHFENKFAVETLICS .:.:: : . :.:: :.:: ::::::: :.:::::: CCDS24 RLRRRATRRRINKRGAKNCNAIRHFENTFVVETLICGVV 230 240 250 260 >>CCDS74665.1 ITM2C gene_id:81618|Hs108|chr2 (205 aa) initn: 670 init1: 641 opt: 712 Z-score: 913.9 bits: 176.4 E(32554): 1.4e-44 Smith-Waterman score: 712; 50.2% identity (78.0% similar) in 209 aa overlap (60-265:2-202) 30 40 50 60 70 80 pF1KB5 PPDAVAVDCKDPDDVVPVGQRRAWCWCMCFGLAFMLAGVILGGAYLYKYFALQP---DDV :.. .: :......:.:.:: : :. CCDS74 MGMVVLLMGLVFASVYIYRYFFLAQLARDNF 10 20 30 90 100 110 120 130 140 pF1KB5 YYCGIKYIKDDVILNEPSADAPAALYQTIEENIKIFEEEEVEFISVPVPEFADSDPANIV . ::. : : : .. . . .::..::. .:. : :.::::.:. .:::.:. CCDS74 FRCGVLY--------EDSLSSQVRTQMELEEDVKIYLDENYERINVPVPQFGGGDPADII 40 50 60 70 80 150 160 170 180 190 200 pF1KB5 HDFNKKLTAYLDLNLDKCYVIPLNTSIVMPPRNLLELLINIKAGTYLPQSYLIHEHMVIT :::.. :::: :..::::::: :::.::.::::. :::.:.: ::::::.:.:.:.::.: CCDS74 HDFQRGLTAYHDISLDKCYVIELNTTIVLPPRNFWELLMNVKRGTYLPQTYIIQEEMVVT 90 100 110 120 130 140 210 220 230 240 250 260 pF1KB5 DRIENIDHLGFFIYRLCHDKETYKLQRRETIKGIQKREASNCFAIRHFENKFAVETLICS ... . . :: :::.::. :.::.:.:: : . :.:: :.:: ::::::: :.:::::: CCDS74 EHVSDKEALGSFIYHLCNGKDTYRLRRRATRRRINKRGAKNCNAIRHFENTFVVETLICG 150 160 170 180 190 200 CCDS74 VV >>CCDS14444.1 ITM2A gene_id:9452|Hs108|chrX (263 aa) initn: 686 init1: 572 opt: 683 Z-score: 875.3 bits: 169.6 E(32554): 2e-42 Smith-Waterman score: 683; 41.1% identity (72.6% similar) in 270 aa overlap (1-265:1-261) 10 20 30 40 50 pF1KB5 MVKVTFNSALAQKEAKKDEPKSGEEALIIPPDAVAVDCKDPDDVVPVGQRR----AWCWC :::..::. : ..:.: .. :::. .: .. .. . :.. . : CCDS14 MVKIAFNTPTA---VQKEEARQDVEALL--SRTVRTQILTGKELRVATQEKEGSSGRCML 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 MCFGLAFMLAGVILGGAYLYKYFALQPDDVYYCG-IKYIKDDVILNEPSADAPAALYQTI .::.:.:::.:.::: .:::: .: .. : : . .. .. : . : : : CCDS14 TLLGLSFILAGLIVGGACIYKYF--MPKSTIYRGEMCFFDSEDPANSLRGGEPNFLPVTE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 EENIKIFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPLNTSIVM : .:. :.... .:.:::: :.::::: :.:::.: .:::::: : .::..:::::::: CCDS14 EADIR--EDDNIAIIDVPVPSFSDSDPAAIIHDFEKGMTAYLDLLLGNCYLMPLNTSIVM 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 PPRNLLELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETYKLQRRE ::.::.::. .. .: ::::.:...: .: ...:.....::.:::.::.......:.::. CCDS14 PPKNLVELFGKLASGRYLPQTYVVREDLVAVEEIRDVSNLGIFIYQLCNNRKSFRLRRRD 180 190 200 210 220 230 240 250 260 pF1KB5 TIKGIQKREASNCFAIRHFENKFAVETLICS . :..:: ..:. :::: :.: ::: :: CCDS14 LLLGFNKRAIDKCWKIRHFPNEFIVETKICQE 240 250 260 >>CCDS33396.1 ITM2C gene_id:81618|Hs108|chr2 (220 aa) initn: 670 init1: 641 opt: 661 Z-score: 848.3 bits: 164.4 E(32554): 6.2e-41 Smith-Waterman score: 661; 53.0% identity (78.4% similar) in 185 aa overlap (81-265:41-217) 60 70 80 90 100 110 pF1KB5 RAWCWCMCFGLAFMLAGVILGGAYLYKYFALQPDDVYYCGIKYIKDDVILNEPSADAPAA : :. . ::. : : : .. . CCDS33 AGIKGDKADKASASAPAPASATEILLTPARLARDNFFRCGVLY--------EDSLSSQVR 20 30 40 50 60 120 130 140 150 160 170 pF1KB5 LYQTIEENIKIFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPLN . .::..::. .:. : :.::::.:. .:::.:.:::.. :::: :..::::::: :: CCDS33 TQMELEEDVKIYLDENYERINVPVPQFGGGDPADIIHDFQRGLTAYHDISLDKCYVIELN 70 80 90 100 110 120 180 190 200 210 220 230 pF1KB5 TSIVMPPRNLLELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETYK :.::.::::. :::.:.: ::::::.:.:.:.::.:... . . :: :::.::. :.::. CCDS33 TTIVLPPRNFWELLMNVKRGTYLPQTYIIQEEMVVTEHVSDKEALGSFIYHLCNGKDTYR 130 140 150 160 170 180 240 250 260 pF1KB5 LQRRETIKGIQKREASNCFAIRHFENKFAVETLICS :.:: : . :.:: :.:: ::::::: :.:::::: CCDS33 LRRRATRRRINKRGAKNCNAIRHFENTFVVETLICGVV 190 200 210 220 >>CCDS55455.1 ITM2A gene_id:9452|Hs108|chrX (219 aa) initn: 600 init1: 572 opt: 572 Z-score: 734.7 bits: 143.4 E(32554): 1.3e-34 Smith-Waterman score: 572; 49.4% identity (83.8% similar) in 154 aa overlap (112-265:64-217) 90 100 110 120 130 140 pF1KB5 QPDDVYYCGIKYIKDDVILNEPSADAPAALYQTIEENIKIFEEEEVEFISVPVPEFADSD . . :. : :.... .:.:::: :.::: CCDS55 LTGKSTIYRGEMCFFDSEDPANSLRGGEPNFLPVTEEADIREDDNIAIIDVPVPSFSDSD 40 50 60 70 80 90 150 160 170 180 190 200 pF1KB5 PANIVHDFNKKLTAYLDLNLDKCYVIPLNTSIVMPPRNLLELLINIKAGTYLPQSYLIHE :: :.:::.: .:::::: : .::..::::::::::.::.::. .. .: ::::.:...: CCDS55 PAAIIHDFEKGMTAYLDLLLGNCYLMPLNTSIVMPPKNLVELFGKLASGRYLPQTYVVRE 100 110 120 130 140 150 210 220 230 240 250 260 pF1KB5 HMVITDRIENIDHLGFFIYRLCHDKETYKLQRRETIKGIQKREASNCFAIRHFENKFAVE .: ...:.....::.:::.::.......:.::. . :..:: ..:. :::: :.: :: CCDS55 DLVAVEEIRDVSNLGIFIYQLCNNRKSFRLRRRDLLLGFNKRAIDKCWKIRHFPNEFIVE 160 170 180 190 200 210 pF1KB5 TLICS : :: CCDS55 TKICQE >>CCDS33395.1 ITM2C gene_id:81618|Hs108|chr2 (230 aa) initn: 334 init1: 316 opt: 323 Z-score: 416.5 bits: 84.6 E(32554): 7e-17 Smith-Waterman score: 484; 34.8% identity (58.3% similar) in 276 aa overlap (1-265:1-227) 10 20 30 40 50 pF1KB5 MVKVTFNSALAQ-KEAKKDE-------PKSGEEALIIPPDAVAVDCKDPDDVVPVGQRRA :::..:. :.: : : :. : :. : :. : : . . :. : . CCDS33 MVKISFQPAVAGIKGDKADKASASAPAPASATEILLTP----AREEQPPQHRSKRGGSVG 10 20 30 40 50 60 70 80 90 100 pF1KB5 WCWCMCFGLAFMLAGVILGGAYLYKYFALQP---DDVYYCGIKYIKDDVILNEPSADAPA . .:.. .: :......:.:.:: : :. . ::. : : : .. . CCDS33 GVCYLSMGMVVLLMGLVFASVYIYRYFFLAQLARDNFFRCGVLY--------EDSLSSQV 60 70 80 90 100 110 120 130 140 150 160 pF1KB5 ALYQTIEENIKIFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPL . .::..::. .:. : :.::::.:. .:::.:.:::... CCDS33 RTQMELEEDVKIYLDENYERINVPVPQFGGGDPADIIHDFQRR----------------- 110 120 130 140 150 170 180 190 200 210 220 pF1KB5 NTSIVMPPRNLLELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETY ::::::.:.:.:.::.:... . . :: :::.::. :.:: CCDS33 --------------------GTYLPQTYIIQEEMVVTEHVSDKEALGSFIYHLCNGKDTY 160 170 180 190 230 240 250 260 pF1KB5 KLQRRETIKGIQKREASNCFAIRHFENKFAVETLICS .:.:: : . :.:: :.:: ::::::: :.:::::: CCDS33 RLRRRATRRRINKRGAKNCNAIRHFENTFVVETLICGVV 200 210 220 230 266 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 12:51:59 2016 done: Sat Nov 5 12:51:59 2016 Total Scan time: 2.210 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]