FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5464, 266 aa 1>>>pF1KB5464 266 - 266 aa - 266 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.8505+/-0.000352; mu= 17.4480+/- 0.022 mean_var=61.3200+/-12.511, 0's: 0 Z-trim(113.4): 12 B-trim: 0 in 0/50 Lambda= 0.163785 statistics sampled from 22785 (22793) to 22785 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.645), E-opt: 0.2 (0.267), width: 16 Scan time: 6.680 The best scores are: opt bits E(85289) NP_068839 (OMIM: 117300,176500,603904,616079) inte ( 266) 1798 433.2 2.4e-121 NP_112188 (OMIM: 609554) integral membrane protein ( 267) 735 182.0 9.9e-46 NP_001274170 (OMIM: 609554) integral membrane prot ( 267) 735 182.0 9.9e-46 NP_001274169 (OMIM: 609554) integral membrane prot ( 205) 712 176.5 3.5e-44 NP_004858 (OMIM: 300222) integral membrane protein ( 263) 683 169.7 4.9e-42 NP_001012532 (OMIM: 609554) integral membrane prot ( 220) 661 164.5 1.6e-40 NP_001165052 (OMIM: 300222) integral membrane prot ( 219) 572 143.4 3.3e-34 NP_001012534 (OMIM: 609554) integral membrane prot ( 230) 323 84.6 1.8e-16 >>NP_068839 (OMIM: 117300,176500,603904,616079) integral (266 aa) initn: 1798 init1: 1798 opt: 1798 Z-score: 2299.5 bits: 433.2 E(85289): 2.4e-121 Smith-Waterman score: 1798; 100.0% identity (100.0% similar) in 266 aa overlap (1-266:1-266) 10 20 30 40 50 60 pF1KB5 MVKVTFNSALAQKEAKKDEPKSGEEALIIPPDAVAVDCKDPDDVVPVGQRRAWCWCMCFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_068 MVKVTFNSALAQKEAKKDEPKSGEEALIIPPDAVAVDCKDPDDVVPVGQRRAWCWCMCFG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 LAFMLAGVILGGAYLYKYFALQPDDVYYCGIKYIKDDVILNEPSADAPAALYQTIEENIK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_068 LAFMLAGVILGGAYLYKYFALQPDDVYYCGIKYIKDDVILNEPSADAPAALYQTIEENIK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 IFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPLNTSIVMPPRNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_068 IFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPLNTSIVMPPRNL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 LELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETYKLQRRETIKGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_068 LELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETYKLQRRETIKGI 190 200 210 220 230 240 250 260 pF1KB5 QKREASNCFAIRHFENKFAVETLICS :::::::::::::::::::::::::: NP_068 QKREASNCFAIRHFENKFAVETLICS 250 260 >>NP_112188 (OMIM: 609554) integral membrane protein 2C (267 aa) initn: 670 init1: 641 opt: 735 Z-score: 942.0 bits: 182.0 E(85289): 9.9e-46 Smith-Waterman score: 741; 44.2% identity (69.9% similar) in 276 aa overlap (1-265:1-264) 10 20 30 40 50 pF1KB5 MVKVTFNSALAQ-KEAKKDE-------PKSGEEALIIPPDAVAVDCKDPDDVVPVGQRRA :::..:. :.: : : :. : :. : :. : : . . :. : . NP_112 MVKISFQPAVAGIKGDKADKASASAPAPASATEILLTP----AREEQPPQHRSKRGGSVG 10 20 30 40 50 60 70 80 90 100 pF1KB5 WCWCMCFGLAFMLAGVILGGAYLYKYFALQP---DDVYYCGIKYIKDDVILNEPSADAPA . .:.. .: :......:.:.:: : :. . ::. : : : .. . NP_112 GVCYLSMGMVVLLMGLVFASVYIYRYFFLAQLARDNFFRCGVLY--------EDSLSSQV 60 70 80 90 100 110 120 130 140 150 160 pF1KB5 ALYQTIEENIKIFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPL . .::..::. .:. : :.::::.:. .:::.:.:::.. :::: :..::::::: : NP_112 RTQMELEEDVKIYLDENYERINVPVPQFGGGDPADIIHDFQRGLTAYHDISLDKCYVIEL 110 120 130 140 150 160 170 180 190 200 210 220 pF1KB5 NTSIVMPPRNLLELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETY ::.::.::::. :::.:.: ::::::.:.:.:.::.:... . . :: :::.::. :.:: NP_112 NTTIVLPPRNFWELLMNVKRGTYLPQTYIIQEEMVVTEHVSDKEALGSFIYHLCNGKDTY 170 180 190 200 210 220 230 240 250 260 pF1KB5 KLQRRETIKGIQKREASNCFAIRHFENKFAVETLICS .:.:: : . :.:: :.:: ::::::: :.:::::: NP_112 RLRRRATRRRINKRGAKNCNAIRHFENTFVVETLICGVV 230 240 250 260 >>NP_001274170 (OMIM: 609554) integral membrane protein (267 aa) initn: 670 init1: 641 opt: 735 Z-score: 942.0 bits: 182.0 E(85289): 9.9e-46 Smith-Waterman score: 741; 44.2% identity (69.9% similar) in 276 aa overlap (1-265:1-264) 10 20 30 40 50 pF1KB5 MVKVTFNSALAQ-KEAKKDE-------PKSGEEALIIPPDAVAVDCKDPDDVVPVGQRRA :::..:. :.: : : :. : :. : :. : : . . :. : . NP_001 MVKISFQPAVAGIKGDKADKASASAPAPASATEILLTP----AREEQPPQHRSKRGGSVG 10 20 30 40 50 60 70 80 90 100 pF1KB5 WCWCMCFGLAFMLAGVILGGAYLYKYFALQP---DDVYYCGIKYIKDDVILNEPSADAPA . .:.. .: :......:.:.:: : :. . ::. : : : .. . NP_001 GVCYLSMGMVVLLMGLVFASVYIYRYFFLAQLARDNFFRCGVLY--------EDSLSSQV 60 70 80 90 100 110 120 130 140 150 160 pF1KB5 ALYQTIEENIKIFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPL . .::..::. .:. : :.::::.:. .:::.:.:::.. :::: :..::::::: : NP_001 RTQMELEEDVKIYLDENYERINVPVPQFGGGDPADIIHDFQRGLTAYHDISLDKCYVIEL 110 120 130 140 150 160 170 180 190 200 210 220 pF1KB5 NTSIVMPPRNLLELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETY ::.::.::::. :::.:.: ::::::.:.:.:.::.:... . . :: :::.::. :.:: NP_001 NTTIVLPPRNFWELLMNVKRGTYLPQTYIIQEEMVVTEHVSDKEALGSFIYHLCNGKDTY 170 180 190 200 210 220 230 240 250 260 pF1KB5 KLQRRETIKGIQKREASNCFAIRHFENKFAVETLICS .:.:: : . :.:: :.:: ::::::: :.:::::: NP_001 RLRRRATRRRINKRGAKNCNAIRHFENTFVVETLICGVV 230 240 250 260 >>NP_001274169 (OMIM: 609554) integral membrane protein (205 aa) initn: 670 init1: 641 opt: 712 Z-score: 914.3 bits: 176.5 E(85289): 3.5e-44 Smith-Waterman score: 712; 50.2% identity (78.0% similar) in 209 aa overlap (60-265:2-202) 30 40 50 60 70 80 pF1KB5 PPDAVAVDCKDPDDVVPVGQRRAWCWCMCFGLAFMLAGVILGGAYLYKYFALQP---DDV :.. .: :......:.:.:: : :. NP_001 MGMVVLLMGLVFASVYIYRYFFLAQLARDNF 10 20 30 90 100 110 120 130 140 pF1KB5 YYCGIKYIKDDVILNEPSADAPAALYQTIEENIKIFEEEEVEFISVPVPEFADSDPANIV . ::. : : : .. . . .::..::. .:. : :.::::.:. .:::.:. NP_001 FRCGVLY--------EDSLSSQVRTQMELEEDVKIYLDENYERINVPVPQFGGGDPADII 40 50 60 70 80 150 160 170 180 190 200 pF1KB5 HDFNKKLTAYLDLNLDKCYVIPLNTSIVMPPRNLLELLINIKAGTYLPQSYLIHEHMVIT :::.. :::: :..::::::: :::.::.::::. :::.:.: ::::::.:.:.:.::.: NP_001 HDFQRGLTAYHDISLDKCYVIELNTTIVLPPRNFWELLMNVKRGTYLPQTYIIQEEMVVT 90 100 110 120 130 140 210 220 230 240 250 260 pF1KB5 DRIENIDHLGFFIYRLCHDKETYKLQRRETIKGIQKREASNCFAIRHFENKFAVETLICS ... . . :: :::.::. :.::.:.:: : . :.:: :.:: ::::::: :.:::::: NP_001 EHVSDKEALGSFIYHLCNGKDTYRLRRRATRRRINKRGAKNCNAIRHFENTFVVETLICG 150 160 170 180 190 200 NP_001 VV >>NP_004858 (OMIM: 300222) integral membrane protein 2A (263 aa) initn: 686 init1: 572 opt: 683 Z-score: 875.7 bits: 169.7 E(85289): 4.9e-42 Smith-Waterman score: 683; 41.1% identity (72.6% similar) in 270 aa overlap (1-265:1-261) 10 20 30 40 50 pF1KB5 MVKVTFNSALAQKEAKKDEPKSGEEALIIPPDAVAVDCKDPDDVVPVGQRR----AWCWC :::..::. : ..:.: .. :::. .: .. .. . :.. . : NP_004 MVKIAFNTPTA---VQKEEARQDVEALL--SRTVRTQILTGKELRVATQEKEGSSGRCML 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 MCFGLAFMLAGVILGGAYLYKYFALQPDDVYYCG-IKYIKDDVILNEPSADAPAALYQTI .::.:.:::.:.::: .:::: .: .. : : . .. .. : . : : : NP_004 TLLGLSFILAGLIVGGACIYKYF--MPKSTIYRGEMCFFDSEDPANSLRGGEPNFLPVTE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 EENIKIFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPLNTSIVM : .:. :.... .:.:::: :.::::: :.:::.: .:::::: : .::..:::::::: NP_004 EADIR--EDDNIAIIDVPVPSFSDSDPAAIIHDFEKGMTAYLDLLLGNCYLMPLNTSIVM 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 PPRNLLELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETYKLQRRE ::.::.::. .. .: ::::.:...: .: ...:.....::.:::.::.......:.::. NP_004 PPKNLVELFGKLASGRYLPQTYVVREDLVAVEEIRDVSNLGIFIYQLCNNRKSFRLRRRD 180 190 200 210 220 230 240 250 260 pF1KB5 TIKGIQKREASNCFAIRHFENKFAVETLICS . :..:: ..:. :::: :.: ::: :: NP_004 LLLGFNKRAIDKCWKIRHFPNEFIVETKICQE 240 250 260 >>NP_001012532 (OMIM: 609554) integral membrane protein (220 aa) initn: 670 init1: 641 opt: 661 Z-score: 848.7 bits: 164.5 E(85289): 1.6e-40 Smith-Waterman score: 661; 53.0% identity (78.4% similar) in 185 aa overlap (81-265:41-217) 60 70 80 90 100 110 pF1KB5 RAWCWCMCFGLAFMLAGVILGGAYLYKYFALQPDDVYYCGIKYIKDDVILNEPSADAPAA : :. . ::. : : : .. . NP_001 AGIKGDKADKASASAPAPASATEILLTPARLARDNFFRCGVLY--------EDSLSSQVR 20 30 40 50 60 120 130 140 150 160 170 pF1KB5 LYQTIEENIKIFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPLN . .::..::. .:. : :.::::.:. .:::.:.:::.. :::: :..::::::: :: NP_001 TQMELEEDVKIYLDENYERINVPVPQFGGGDPADIIHDFQRGLTAYHDISLDKCYVIELN 70 80 90 100 110 120 180 190 200 210 220 230 pF1KB5 TSIVMPPRNLLELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETYK :.::.::::. :::.:.: ::::::.:.:.:.::.:... . . :: :::.::. :.::. NP_001 TTIVLPPRNFWELLMNVKRGTYLPQTYIIQEEMVVTEHVSDKEALGSFIYHLCNGKDTYR 130 140 150 160 170 180 240 250 260 pF1KB5 LQRRETIKGIQKREASNCFAIRHFENKFAVETLICS :.:: : . :.:: :.:: ::::::: :.:::::: NP_001 LRRRATRRRINKRGAKNCNAIRHFENTFVVETLICGVV 190 200 210 220 >>NP_001165052 (OMIM: 300222) integral membrane protein (219 aa) initn: 600 init1: 572 opt: 572 Z-score: 735.1 bits: 143.4 E(85289): 3.3e-34 Smith-Waterman score: 572; 49.4% identity (83.8% similar) in 154 aa overlap (112-265:64-217) 90 100 110 120 130 140 pF1KB5 QPDDVYYCGIKYIKDDVILNEPSADAPAALYQTIEENIKIFEEEEVEFISVPVPEFADSD . . :. : :.... .:.:::: :.::: NP_001 LTGKSTIYRGEMCFFDSEDPANSLRGGEPNFLPVTEEADIREDDNIAIIDVPVPSFSDSD 40 50 60 70 80 90 150 160 170 180 190 200 pF1KB5 PANIVHDFNKKLTAYLDLNLDKCYVIPLNTSIVMPPRNLLELLINIKAGTYLPQSYLIHE :: :.:::.: .:::::: : .::..::::::::::.::.::. .. .: ::::.:...: NP_001 PAAIIHDFEKGMTAYLDLLLGNCYLMPLNTSIVMPPKNLVELFGKLASGRYLPQTYVVRE 100 110 120 130 140 150 210 220 230 240 250 260 pF1KB5 HMVITDRIENIDHLGFFIYRLCHDKETYKLQRRETIKGIQKREASNCFAIRHFENKFAVE .: ...:.....::.:::.::.......:.::. . :..:: ..:. :::: :.: :: NP_001 DLVAVEEIRDVSNLGIFIYQLCNNRKSFRLRRRDLLLGFNKRAIDKCWKIRHFPNEFIVE 160 170 180 190 200 210 pF1KB5 TLICS : :: NP_001 TKICQE >>NP_001012534 (OMIM: 609554) integral membrane protein (230 aa) initn: 334 init1: 316 opt: 323 Z-score: 416.8 bits: 84.6 E(85289): 1.8e-16 Smith-Waterman score: 484; 34.8% identity (58.3% similar) in 276 aa overlap (1-265:1-227) 10 20 30 40 50 pF1KB5 MVKVTFNSALAQ-KEAKKDE-------PKSGEEALIIPPDAVAVDCKDPDDVVPVGQRRA :::..:. :.: : : :. : :. : :. : : . . :. : . NP_001 MVKISFQPAVAGIKGDKADKASASAPAPASATEILLTP----AREEQPPQHRSKRGGSVG 10 20 30 40 50 60 70 80 90 100 pF1KB5 WCWCMCFGLAFMLAGVILGGAYLYKYFALQP---DDVYYCGIKYIKDDVILNEPSADAPA . .:.. .: :......:.:.:: : :. . ::. : : : .. . NP_001 GVCYLSMGMVVLLMGLVFASVYIYRYFFLAQLARDNFFRCGVLY--------EDSLSSQV 60 70 80 90 100 110 120 130 140 150 160 pF1KB5 ALYQTIEENIKIFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPL . .::..::. .:. : :.::::.:. .:::.:.:::... NP_001 RTQMELEEDVKIYLDENYERINVPVPQFGGGDPADIIHDFQRR----------------- 110 120 130 140 150 170 180 190 200 210 220 pF1KB5 NTSIVMPPRNLLELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETY ::::::.:.:.:.::.:... . . :: :::.::. :.:: NP_001 --------------------GTYLPQTYIIQEEMVVTEHVSDKEALGSFIYHLCNGKDTY 160 170 180 190 230 240 250 260 pF1KB5 KLQRRETIKGIQKREASNCFAIRHFENKFAVETLICS .:.:: : . :.:: :.:: ::::::: :.:::::: NP_001 RLRRRATRRRINKRGAKNCNAIRHFENTFVVETLICGVV 200 210 220 230 266 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 12:51:59 2016 done: Sat Nov 5 12:52:00 2016 Total Scan time: 6.680 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]