FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2627, 271 aa 1>>>pF1KE2627 271 - 271 aa - 271 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.0102+/-0.000746; mu= 16.3075+/- 0.045 mean_var=63.2615+/-13.432, 0's: 0 Z-trim(107.7): 27 B-trim: 0 in 0/48 Lambda= 0.161252 statistics sampled from 9711 (9737) to 9711 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.676), E-opt: 0.2 (0.299), width: 16 Scan time: 2.530 The best scores are: opt bits E(32554) CCDS8792.1 AQP2 gene_id:359|Hs108|chr12 ( 271) 1772 420.6 5.6e-118 CCDS8793.1 AQP5 gene_id:362|Hs108|chr12 ( 265) 1158 277.8 5.5e-75 CCDS8919.1 MIP gene_id:4284|Hs108|chr12 ( 263) 1082 260.1 1.2e-69 CCDS31798.1 AQP6 gene_id:363|Hs108|chr12 ( 282) 993 239.4 2.1e-63 CCDS58617.1 AQP4 gene_id:361|Hs108|chr18 ( 301) 776 189.0 3.5e-48 CCDS11889.1 AQP4 gene_id:361|Hs108|chr18 ( 323) 776 189.0 3.7e-48 CCDS5431.1 AQP1 gene_id:358|Hs108|chr7 ( 269) 768 187.1 1.1e-47 CCDS82244.1 AQP4 gene_id:361|Hs108|chr18 ( 296) 555 137.6 1e-32 CCDS55096.1 AQP1 gene_id:358|Hs108|chr7 ( 154) 435 109.5 1.5e-24 CCDS55098.1 AQP1 gene_id:358|Hs108|chr7 ( 186) 435 109.5 1.8e-24 CCDS55097.1 AQP1 gene_id:358|Hs108|chr7 ( 218) 435 109.6 2e-24 CCDS10626.1 AQP8 gene_id:343|Hs108|chr16 ( 261) 420 106.1 2.6e-23 >>CCDS8792.1 AQP2 gene_id:359|Hs108|chr12 (271 aa) initn: 1772 init1: 1772 opt: 1772 Z-score: 2231.5 bits: 420.6 E(32554): 5.6e-118 Smith-Waterman score: 1772; 100.0% identity (100.0% similar) in 271 aa overlap (1-271:1-271) 10 20 30 40 50 60 pF1KE2 MWELRSIAFSRAVFAEFLATLLFVFFGLGSALNWPQALPSVLQIAMAFGLGIGTLVQALG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 MWELRSIAFSRAVFAEFLATLLFVFFGLGSALNWPQALPSVLQIAMAFGLGIGTLVQALG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 HISGAHINPAVTVACLVGCHVSVLRAAFYVAAQLLGAVAGAALLHEITPADIRGDLAVNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 HISGAHINPAVTVACLVGCHVSVLRAAFYVAAQLLGAVAGAALLHEITPADIRGDLAVNA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 LSNSTTAGQAVTVELFLTLQLVLCIFASTDERRGENPGTPALSIGFSVALGHLLGIHYTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 LSNSTTAGQAVTVELFLTLQLVLCIFASTDERRGENPGTPALSIGFSVALGHLLGIHYTG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 CSMNPARSLAPAVVTGKFDDHWVFWIGPLVGAILGSLLYNYVLFPPAKSLSERLAVLKGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 CSMNPARSLAPAVVTGKFDDHWVFWIGPLVGAILGSLLYNYVLFPPAKSLSERLAVLKGL 190 200 210 220 230 240 250 260 270 pF1KE2 EPDTDWEEREVRRRQSVELHSPQSLPRGTKA ::::::::::::::::::::::::::::::: CCDS87 EPDTDWEEREVRRRQSVELHSPQSLPRGTKA 250 260 270 >>CCDS8793.1 AQP5 gene_id:362|Hs108|chr12 (265 aa) initn: 1170 init1: 892 opt: 1158 Z-score: 1459.7 bits: 277.8 E(32554): 5.5e-75 Smith-Waterman score: 1158; 66.0% identity (90.3% similar) in 259 aa overlap (3-259:4-262) 10 20 30 40 50 pF1KE2 MWELRSIAFSRAVFAEFLATLLFVFFGLGSALNWPQALPSVLQIAMAFGLGIGTLVQAL :. :.:: .::::::::::.::::::::::.::.:::..::::.::::.::::.::: CCDS87 MKKEVCSVAFLKAVFAEFLATLIFVFFGLGSALKWPSALPTILQIALAFGLAIGTLAQAL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 GHISGAHINPAVTVACLVGCHVSVLRAAFYVAAQLLGAVAGAALLHEITPADIRGDLAVN : .::.:::::.:.: ::: ..:.::: :::::::.::.:::..:. ..: . ::.:::: CCDS87 GPVSGGHINPAITLALLVGNQISLLRAFFYVAAQLVGAIAGAGILYGVAPLNARGNLAVN 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 ALSNSTTAGQAVTVELFLTLQLVLCIFASTDERRGENPGTPALSIGFSVALGHLLGIHYT ::.:.:: :::..:::.::.::.:::::::: :: :.::::::.::.::::.::..: CCDS87 ALNNNTTQGQAMVVELILTFQLALCIFASTDSRRTSPVGSPALSIGLSVTLGHLVGIYFT 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE2 GCSMNPARSLAPAVVTGKFDD-HWVFWIGPLVGAILGSLLYNYVLFPPAKSLSERLAVLK :::::::::..:::: ..:. :::::.::.:::.:...:: :.::: . :::::.:..: CCDS87 GCSMNPARSFGPAVVMNRFSPAHWVFWVGPIVGAVLAAILYFYLLFPNSLSLSERVAIIK 190 200 210 220 230 240 240 250 260 270 pF1KE2 GL-EPDTDWEEREVRRRQSVELHSPQSLPRGTKA : ::: ::::.. .:....:: CCDS87 GTYEPDEDWEEQREERKKTMELTTR 250 260 >>CCDS8919.1 MIP gene_id:4284|Hs108|chr12 (263 aa) initn: 1077 init1: 1077 opt: 1082 Z-score: 1364.2 bits: 260.1 E(32554): 1.2e-69 Smith-Waterman score: 1082; 61.5% identity (86.4% similar) in 265 aa overlap (1-265:1-263) 10 20 30 40 50 60 pF1KE2 MWELRSIAFSRAVFAEFLATLLFVFFGLGSALNWPQALPSVLQIAMAFGLGIGTLVQALG :::::: .: ::.::::.:::..:::::::.: : . :::.::::::...::::..: CCDS89 MWELRSASFWRAIFAEFFATLFYVFFGLGSSLRWAPGPLHVLQVAMAFGLALATLVQSVG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 HISGAHINPAVTVACLVGCHVSVLRAAFYVAAQLLGAVAGAALLHEITPADIRGDLAVNA ::::::.::::: : ::: ..:.::: :.::::::::::::.:. .:: .::.::.:. CCDS89 HISGAHVNPAVTFAFLVGSQMSLLRAFCYMAAQLLGAVAGAAVLYSVTPPAVRGNLALNT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 LSNSTTAGQAVTVELFLTLQLVLCIFASTDERRGENPGTPALSIGFSVALGHLLGIHYTG : ....:::.:::.:::::.::::::. ::::. . :. ::..:::.:::::.:..::: CCDS89 LHPAVSVGQATTVEIFLTLQFVLCIFATYDERRNGQLGSVALAVGFSLALGHLFGMYYTG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 CSMNPARSLAPAVVTGKFDDHWVFWIGPLVGAILGSLLYNYVLFPPAKSLSERLAVLKGL .::::::.:::..::.: .:::.:.::..:. ::::::...::: ::.::::.:::: CCDS89 AGMNPARSFAPAILTGNFTNHWVYWVGPIIGGGLGSLLYDFLLFPRLKSISERLSVLKGA 190 200 210 220 230 240 250 260 270 pF1KE2 EPDTDWEEREVRRRQSVELHSPQSLPRGTKA .::.. . :: . :::.. :.: CCDS89 KPDVSNGQPEVTG-EPVELNT-QAL 250 260 >>CCDS31798.1 AQP6 gene_id:363|Hs108|chr12 (282 aa) initn: 977 init1: 574 opt: 993 Z-score: 1251.8 bits: 239.4 E(32554): 2.1e-63 Smith-Waterman score: 993; 62.3% identity (85.4% similar) in 239 aa overlap (1-239:19-251) 10 20 30 40 pF1KE2 MWELRSIAFSRAVFAEFLATLLFVFFGLGSALNWPQALPSVL .:. :.:::.::::::: :.::::.::.. :: :::::: CCDS31 MDAVEPGGRGWASMLACRLWK----AISRALFAEFLATGLYVFFGVGSVMRWPTALPSVL 10 20 30 40 50 50 60 70 80 90 100 pF1KE2 QIAMAFGLGIGTLVQALGHISGAHINPAVTVACLVGCHVSVLRAAFYVAAQLLGAVAGAA :::..:.: . ::. . :::: :::::.: ::: :.:. ::. ::::::.::..::: CCDS31 QIAITFNLVTAMAVQVTWKASGAHANPAVTLAFLVGSHISLPRAVAYVAAQLVGATVGAA 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE2 LLHEITPADIRGDLAVNALSNSTTAGQAVTVELFLTLQLVLCIFASTDERRGENPGTPAL ::. . :.::: :..:.. ::...::::.:::.::::::::.::::: : .. :.:: CCDS31 LLYGVMPGDIRETLGINVVRNSVSTGQAVAVELLLTLQLVLCVFASTDSR--QTSGSPAT 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE2 SIGFSVALGHLLGIHYTGCSMNPARSLAPAVVTGKFDDHWVFWIGPLVGAILGSLLYNYV ::.:::::::.:::.::::::::::..::.. ::: :::::.:::.::.:.::.::.: CCDS31 MIGISVALGHLIGIHFTGCSMNPARSFGPAIIIGKFTVHWVFWVGPLMGALLASLIYNFV 180 190 200 210 220 230 230 240 250 260 270 pF1KE2 LFPPAKSLSERLAVLKGLEPDTDWEEREVRRRQSVELHSPQSLPRGTKA ::: .:.:..:::.: : CCDS31 LFPDTKTLAQRLAILTGTVEVGTGAGAGAEPLKKESQPGSGAVEMESV 240 250 260 270 280 >>CCDS58617.1 AQP4 gene_id:361|Hs108|chr18 (301 aa) initn: 775 init1: 677 opt: 776 Z-score: 978.6 bits: 189.0 E(32554): 3.5e-48 Smith-Waterman score: 776; 51.4% identity (82.9% similar) in 222 aa overlap (8-225:11-232) 10 20 30 40 50 pF1KE2 MWELRSIAFSRAVFAEFLATLLFVFFGLGSALNW---PQALP-SVLQIAMAFGLGIG :: .:: ::::: :.::...:::..:: . :: ... :.. :::.:. CCDS58 MVAFKGVWTQAFWKAVTAEFLAMLIFVLLSLGSTINWGGTEKPLPVDMVLISLCFGLSIA 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 TLVQALGHISGAHINPAVTVACLVGCHVSVLRAAFYVAAQLLGAVAGAALLHEITPADIR :.:: .:::::.::::::::: . ..:. ...::.::: :::. ::..:. .:: .. CCDS58 TMVQCFGHISGGHINPAVTVAMVCTRKISIAKSVFYIAAQCLGAIIGAGILYLVTPPSVV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 GDLAVNALSNSTTAGQAVTVELFLTLQLVLCIFASTDERRGENPGTPALSIGFSVALGHL : :.:. . .. :::... :::..:.:::. :::: : .: . :. ::.::::::.::: CCDS58 GGLGVTMVHGNLTAGHGLLVELIITFQLVFTIFASCDSKRTDVTGSIALAIGFSVAIGHL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE2 LGIHYTGCSMNPARSLAPAVVTGKFDDHWVFWIGPLVGAILGSLLYNYVLFPPAKSLSER ..:.::: :::::::..:::. :....::..:.::..::.:.. ::.::. : CCDS58 FAINYTGASMNPARSFGPAVIMGNWENHWIYWVGPIIGAVLAGGLYEYVFCPDVEFKRRF 190 200 210 220 230 240 240 250 260 270 pF1KE2 LAVLKGLEPDTDWEEREVRRRQSVELHSPQSLPRGTKA CCDS58 KEAFSKAAQQTKGSYMEVEDNRSQVETDDLILKPGVVHVIDVDRGEEKKGKDQSGEVLSS 250 260 270 280 290 300 >>CCDS11889.1 AQP4 gene_id:361|Hs108|chr18 (323 aa) initn: 775 init1: 677 opt: 776 Z-score: 978.2 bits: 189.0 E(32554): 3.7e-48 Smith-Waterman score: 776; 51.4% identity (82.9% similar) in 222 aa overlap (8-225:33-254) 10 20 30 pF1KE2 MWELRSIAFSRAVFAEFLATLLFVFFGLGSALNW--- :: .:: ::::: :.::...:::..:: CCDS11 DRPTARRWGKCGPLCTRENIMVAFKGVWTQAFWKAVTAEFLAMLIFVLLSLGSTINWGGT 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE2 PQALP-SVLQIAMAFGLGIGTLVQALGHISGAHINPAVTVACLVGCHVSVLRAAFYVAAQ . :: ... :.. :::.:.:.:: .:::::.::::::::: . ..:. ...::.::: CCDS11 EKPLPVDMVLISLCFGLSIATMVQCFGHISGGHINPAVTVAMVCTRKISIAKSVFYIAAQ 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE2 LLGAVAGAALLHEITPADIRGDLAVNALSNSTTAGQAVTVELFLTLQLVLCIFASTDERR :::. ::..:. .:: .. : :.:. . .. :::... :::..:.:::. :::: : .: CCDS11 CLGAIIGAGILYLVTPPSVVGGLGVTMVHGNLTAGHGLLVELIITFQLVFTIFASCDSKR 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE2 GENPGTPALSIGFSVALGHLLGIHYTGCSMNPARSLAPAVVTGKFDDHWVFWIGPLVGAI . :. ::.::::::.:::..:.::: :::::::..:::. :....::..:.::..::. CCDS11 TDVTGSIALAIGFSVAIGHLFAINYTGASMNPARSFGPAVIMGNWENHWIYWVGPIIGAV 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE2 LGSLLYNYVLFPPAKSLSERLAVLKGLEPDTDWEEREVRRRQSVELHSPQSLPRGTKA :.. ::.::. : CCDS11 LAGGLYEYVFCPDVEFKRRFKEAFSKAAQQTKGSYMEVEDNRSQVETDDLILKPGVVHVI 250 260 270 280 290 300 >>CCDS5431.1 AQP1 gene_id:358|Hs108|chr7 (269 aa) initn: 787 init1: 664 opt: 768 Z-score: 969.3 bits: 187.1 E(32554): 1.1e-47 Smith-Waterman score: 768; 45.0% identity (79.6% similar) in 260 aa overlap (3-254:4-263) 10 20 30 40 50 pF1KE2 MWELRSIAFSRAVFAEFLATLLFVFFGLGSALN--WP-----QALPSVLQIAMAFGLGI :... : ::: :::::: ::::...::::. .: :. . .....::::.: CCDS54 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNNQTAVQDNVKVSLAFGLSI 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 GTLVQALGHISGAHINPAVTVACLVGCHVSVLRAAFYVAAQLLGAVAGAALLHEITPADI .::.:..:::::::.:::::.. :..:..:..:: .:. :: .::....:.: :: . CCDS54 ATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQCVGAIVATAILSGITSSLT 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 RGDLAVNALSNSTTAGQAVTVELFLTLQLVLCIFASTDERRGENPGTPALSIGFSVALGH ..:. : :......::.. .:.. :::::::..:.::.:: . :. :.::.:::::: CCDS54 GNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDRRRRDLGGSAPLAIGLSVALGH 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE2 LLGIHYTGCSMNPARSLAPAVVTGKFDDHWVFWIGPLVGAILGSLLYNYVLFPPAKSLSE ::.: ::::..:::::.. ::.: .:..::.::.::..:. :. :.:...: : ...:.. CCDS54 LLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFIGGALAVLIYDFILAPRSSDLTD 190 200 210 220 230 240 240 250 260 270 pF1KE2 RLAV-LKGLEPDTDWEEREVRRRQSVELHSPQSLPRGTKA :. : .: . : . .. : CCDS54 RVKVWTSGQVEEYDLDADDINSRVEMKPK 250 260 >>CCDS82244.1 AQP4 gene_id:361|Hs108|chr18 (296 aa) initn: 577 init1: 448 opt: 555 Z-score: 700.9 bits: 137.6 E(32554): 1e-32 Smith-Waterman score: 579; 44.1% identity (71.6% similar) in 222 aa overlap (8-225:33-227) 10 20 30 pF1KE2 MWELRSIAFSRAVFAEFLATLLFVFFGLGSALNW--- :: .:: ::::: :.::...:::..:: CCDS82 DRPTARRWGKCGPLCTRENIMVAFKGVWTQAFWKAVTAEFLAMLIFVLLSLGSTINWGGT 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE2 PQALP-SVLQIAMAFGLGIGTLVQALGHISGAHINPAVTVACLVGCHVSVLRAAFYVAAQ . :: ... :.. :::.:.:.:: .:::::.::::::::: . ..:. ...::.::: CCDS82 EKPLPVDMVLISLCFGLSIATMVQCFGHISGGHINPAVTVAMVCTRKISIAKSVFYIAAQ 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE2 LLGAVAGAALLHEITPADIRGDLAVNALSNSTTAGQAVTVELFLTLQLVLCIFASTDERR :::. ::..:. .:: .. : :.:. . .. :::... :::..:.:::. :::: : .: CCDS82 CLGAIIGAGILYLVTPPSVVGGLGVTMVHGNLTAGHGLLVELIITFQLVFTIFASCDSKR 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE2 GENPGTPALSIGFSVALGHLLGIHYTGCSMNPARSLAPAVVTGKFDDHWVFWIGPLVGAI . :. ::.::::::.:::..: .:.::..::. CCDS82 TDVTGSIALAIGFSVAIGHLFAI---------------------------YWVGPIIGAV 190 200 210 220 230 240 250 260 270 pF1KE2 LGSLLYNYVLFPPAKSLSERLAVLKGLEPDTDWEEREVRRRQSVELHSPQSLPRGTKA :.. ::.::. : CCDS82 LAGGLYEYVFCPDVEFKRRFKEAFSKAAQQTKGSYMEVEDNRSQVETDDLILKPGVVHVI 220 230 240 250 260 270 >>CCDS55096.1 AQP1 gene_id:358|Hs108|chr7 (154 aa) initn: 457 init1: 421 opt: 435 Z-score: 554.1 bits: 109.5 E(32554): 1.5e-24 Smith-Waterman score: 435; 44.4% identity (80.7% similar) in 135 aa overlap (121-254:14-148) 100 110 120 130 140 150 pF1KE2 AAQLLGAVAGAALLHEITPADIRGDLAVNALSNSTTAGQAVTVELFLTLQLVLCIFASTD :......::.. .:.. :::::::..:.:: CCDS55 MQSGMGWNVLDFWLADGVNSGQGLGIEIIGTLQLVLCVLATTD 10 20 30 40 160 170 180 190 200 210 pF1KE2 ERRGENPGTPALSIGFSVALGHLLGIHYTGCSMNPARSLAPAVVTGKFDDHWVFWIGPLV .:: . :. :.::.::::::::.: ::::..:::::.. ::.: .:..::.::.::.. CCDS55 RRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFI 50 60 70 80 90 100 220 230 240 250 260 pF1KE2 GAILGSLLYNYVLFPPAKSLSERLAV-LKGLEPDTDWEEREVRRRQSVELHSPQSLPRGT :. :. :.:...: : ...:..:. : .: . : . .. : CCDS55 GGALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKPK 110 120 130 140 150 270 pF1KE2 KA >>CCDS55098.1 AQP1 gene_id:358|Hs108|chr7 (186 aa) initn: 473 init1: 421 opt: 435 Z-score: 552.9 bits: 109.5 E(32554): 1.8e-24 Smith-Waterman score: 435; 44.4% identity (80.7% similar) in 135 aa overlap (121-254:46-180) 100 110 120 130 140 150 pF1KE2 AAQLLGAVAGAALLHEITPADIRGDLAVNALSNSTTAGQAVTVELFLTLQLVLCIFASTD :......::.. .:.. :::::::..:.:: CCDS55 TLAWMQLDAKAPAHPRPLQLLGRVGPGSRQLADGVNSGQGLGIEIIGTLQLVLCVLATTD 20 30 40 50 60 70 160 170 180 190 200 210 pF1KE2 ERRGENPGTPALSIGFSVALGHLLGIHYTGCSMNPARSLAPAVVTGKFDDHWVFWIGPLV .:: . :. :.::.::::::::.: ::::..:::::.. ::.: .:..::.::.::.. CCDS55 RRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFI 80 90 100 110 120 130 220 230 240 250 260 pF1KE2 GAILGSLLYNYVLFPPAKSLSERLAV-LKGLEPDTDWEEREVRRRQSVELHSPQSLPRGT :. :. :.:...: : ...:..:. : .: . : . .. : CCDS55 GGALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKPK 140 150 160 170 180 270 pF1KE2 KA 271 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 10:52:20 2016 done: Sun Nov 6 10:52:21 2016 Total Scan time: 2.530 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]