FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3506, 269 aa 1>>>pF1KB3506 269 - 269 aa - 269 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3774+/-0.00102; mu= 13.7236+/- 0.061 mean_var=56.9872+/-11.582, 0's: 0 Z-trim(102.8): 34 B-trim: 9 in 1/47 Lambda= 0.169897 statistics sampled from 7075 (7105) to 7075 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.579), E-opt: 0.2 (0.218), width: 16 Scan time: 1.980 The best scores are: opt bits E(32554) CCDS5431.1 AQP1 gene_id:358|Hs108|chr7 ( 269) 1731 432.7 1.3e-121 CCDS55097.1 AQP1 gene_id:358|Hs108|chr7 ( 218) 945 240.0 1.1e-63 CCDS55098.1 AQP1 gene_id:358|Hs108|chr7 ( 186) 943 239.5 1.3e-63 CCDS55096.1 AQP1 gene_id:358|Hs108|chr7 ( 154) 937 238.0 3e-63 CCDS8919.1 MIP gene_id:4284|Hs108|chr12 ( 263) 777 198.9 3.1e-51 CCDS8792.1 AQP2 gene_id:359|Hs108|chr12 ( 271) 768 196.7 1.5e-50 CCDS8793.1 AQP5 gene_id:362|Hs108|chr12 ( 265) 751 192.5 2.6e-49 CCDS58617.1 AQP4 gene_id:361|Hs108|chr18 ( 301) 722 185.4 4e-47 CCDS11889.1 AQP4 gene_id:361|Hs108|chr18 ( 323) 722 185.4 4.3e-47 CCDS31798.1 AQP6 gene_id:363|Hs108|chr12 ( 282) 634 163.8 1.2e-40 CCDS82244.1 AQP4 gene_id:361|Hs108|chr18 ( 296) 508 133.0 2.4e-31 CCDS10626.1 AQP8 gene_id:343|Hs108|chr16 ( 261) 346 93.2 2e-19 >>CCDS5431.1 AQP1 gene_id:358|Hs108|chr7 (269 aa) initn: 1731 init1: 1731 opt: 1731 Z-score: 2296.9 bits: 432.7 E(32554): 1.3e-121 Smith-Waterman score: 1731; 100.0% identity (100.0% similar) in 269 aa overlap (1-269:1-269) 10 20 30 40 50 60 pF1KB3 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNNQTAVQDNVKVSLAFGLSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNNQTAVQDNVKVSLAFGLSI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 ATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQCVGAIVATAILSGITSSLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 ATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQCVGAIVATAILSGITSSLT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 GNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDRRRRDLGGSAPLAIGLSVALGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDRRRRDLGGSAPLAIGLSVALGH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 LLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFIGGALAVLIYDFILAPRSSDLTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 LLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFIGGALAVLIYDFILAPRSSDLTD 190 200 210 220 230 240 250 260 pF1KB3 RVKVWTSGQVEEYDLDADDINSRVEMKPK ::::::::::::::::::::::::::::: CCDS54 RVKVWTSGQVEEYDLDADDINSRVEMKPK 250 260 >>CCDS55097.1 AQP1 gene_id:358|Hs108|chr7 (218 aa) initn: 966 init1: 943 opt: 945 Z-score: 1257.2 bits: 240.0 E(32554): 1.1e-63 Smith-Waterman score: 945; 74.4% identity (82.9% similar) in 211 aa overlap (65-269:8-218) 40 50 60 70 80 90 pF1KB3 FKYPVGNNQTAVQDNVKVSLAFGLSIATLAQSVGHISGAHLNPAVTLGLLLSCQ-ISIFR ..:. . .:: .. ::.::. . : CCDS55 MFWTFGYEAVSPAGPSHLFASLLLGVLLTITFMPGAR 10 20 30 100 110 120 130 140 pF1KB3 AL-MYIIAQCVGAIV---ATAILSGITSSLTGN-SLGRNDLADGVNSGQGLGIEIIGTLQ : . .. : . : . : : .: : . : .:::::::::::::::::::: CCDS55 PLPLVLVPQNTLAWMQLDAKAPAHPRPLQLLGRVGPGSRQLADGVNSGQGLGIEIIGTLQ 40 50 60 70 80 90 150 160 170 180 190 200 pF1KB3 LVLCVLATTDRRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LVLCVLATTDRRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSN 100 110 120 130 140 150 210 220 230 240 250 260 pF1KB3 HWIFWVGPFIGGALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 HWIFWVGPFIGGALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKP 160 170 180 190 200 210 pF1KB3 K : CCDS55 K >>CCDS55098.1 AQP1 gene_id:358|Hs108|chr7 (186 aa) initn: 943 init1: 943 opt: 943 Z-score: 1255.6 bits: 239.5 E(32554): 1.3e-63 Smith-Waterman score: 943; 97.9% identity (98.6% similar) in 145 aa overlap (125-269:42-186) 100 110 120 130 140 150 pF1KB3 LMYIIAQCVGAIVATAILSGITSSLTGNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVL : .:::::::::::::::::::::::::: CCDS55 VPQNTLAWMQLDAKAPAHPRPLQLLGRVGPGSRQLADGVNSGQGLGIEIIGTLQLVLCVL 20 30 40 50 60 70 160 170 180 190 200 210 pF1KB3 ATTDRRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ATTDRRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWV 80 90 100 110 120 130 220 230 240 250 260 pF1KB3 GPFIGGALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKPK ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GPFIGGALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKPK 140 150 160 170 180 >>CCDS55096.1 AQP1 gene_id:358|Hs108|chr7 (154 aa) initn: 937 init1: 937 opt: 937 Z-score: 1249.0 bits: 238.0 E(32554): 3e-63 Smith-Waterman score: 937; 100.0% identity (100.0% similar) in 141 aa overlap (129-269:14-154) 100 110 120 130 140 150 pF1KB3 IAQCVGAIVATAILSGITSSLTGNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTD :::::::::::::::::::::::::::::: CCDS55 MQSGMGWNVLDFWLADGVNSGQGLGIEIIGTLQLVLCVLATTD 10 20 30 40 160 170 180 190 200 210 pF1KB3 RRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFI 50 60 70 80 90 100 220 230 240 250 260 pF1KB3 GGALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKPK ::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GGALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKPK 110 120 130 140 150 >>CCDS8919.1 MIP gene_id:4284|Hs108|chr12 (263 aa) initn: 793 init1: 695 opt: 777 Z-score: 1033.3 bits: 198.9 E(32554): 3.1e-51 Smith-Waterman score: 777; 48.1% identity (81.3% similar) in 241 aa overlap (4-244:3-236) 10 20 30 40 50 60 pF1KB3 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNNQTAVQDNVKVSLAFGLSI :... ::::. :::.:: ..::...::.: .. : .. ..:..::::.. CCDS89 MWELRSASFWRAIFAEFFATLFYVFFGLGSSL--RWAPGPLHV-----LQVAMAFGLAL 10 20 30 40 50 70 80 90 100 110 120 pF1KB3 ATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQCVGAIVATAILSGITSSLT :::.::::::::::.:::::...:.. :.:..::. :. :: .::....:.: ..: . CCDS89 ATLVQSVGHISGAHVNPAVTFAFLVGSQMSLLRAFCYMAAQLLGAVAGAAVLYSVTPPAV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB3 GNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDRRRRDLGGSAPLAIGLSVALGH ..:. : : .:. ::. .::. :::.:::..:: :.:: ::. ::.:.:.:::: CCDS89 RGNLALNTLHPAVSVGQATTVEIFLTLQFVLCIFATYDERRNGQLGSVALAVGFSLALGH 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB3 LLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFIGGALAVLIYDFILAPRSSDLTD :... ::: :.::::::. :..: ::.:::..::::.:::.:. :.:::.: :: ..... CCDS89 LFGMYYTGAGMNPARSFAPAILTGNFTNHWVYWVGPIIGGGLGSLLYDFLLFPRLKSISE 180 190 200 210 220 230 250 260 pF1KB3 RVKVWTSGQVEEYDLDADDINSRVEMKPK :..: CCDS89 RLSVLKGAKPDVSNGQPEVTGEPVELNTQAL 240 250 260 >>CCDS8792.1 AQP2 gene_id:359|Hs108|chr12 (271 aa) initn: 787 init1: 664 opt: 768 Z-score: 1021.1 bits: 196.7 E(32554): 1.5e-50 Smith-Waterman score: 768; 45.0% identity (79.6% similar) in 260 aa overlap (4-263:3-254) 10 20 30 40 50 60 pF1KB3 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNNQTAVQDNVKVSLAFGLSI :... : ::: :::::: ::::...:::: ..: :. . .....::::.: CCDS87 MWELRSIAFSRAVFAEFLATLLFVFFGLGSAL--NWP-----QALPSVLQIAMAFGLGI 10 20 30 40 50 70 80 90 100 110 120 pF1KB3 ATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQCVGAIVATAILSGITSSLT .::.:..:::::::.:::::.. :..:..:..:: .:. :: .::....:.: :: . CCDS87 GTLVQALGHISGAHINPAVTVACLVGCHVSVLRAAFYVAAQLLGAVAGAALLHEITPADI 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB3 GNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDRRRRDLGGSAPLAIGLSVALGH ..:. : :......::.. .:.. :::::::..:.::.:: . :. :.::.:::::: CCDS87 RGDLAVNALSNSTTAGQAVTVELFLTLQLVLCIFASTDERRGENPGTPALSIGFSVALGH 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB3 LLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFIGGALAVLIYDFILAPRSSDLTD ::.: ::::..:::::.. ::.: .:..::.::.::..:. :. :.:...: : ...:.. CCDS87 LLGIHYTGCSMNPARSLAPAVVTGKFDDHWVFWIGPLVGAILGSLLYNYVLFPPAKSLSE 180 190 200 210 220 230 250 260 pF1KB3 RVKVWTSGQVEEYDLDADDINSRVEMKPK :. : .: . : . .. : CCDS87 RLAV-LKGLEPDTDWEEREVRRRQSVELHSPQSLPRGTKA 240 250 260 270 >>CCDS8793.1 AQP5 gene_id:362|Hs108|chr12 (265 aa) initn: 742 init1: 524 opt: 751 Z-score: 998.8 bits: 192.5 E(32554): 2.6e-49 Smith-Waterman score: 751; 46.6% identity (77.2% similar) in 268 aa overlap (1-267:1-257) 10 20 30 40 50 60 pF1KB3 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNNQTAVQDNVKVSLAFGLSI : .: . : .:: :::::: .:::...:::: :.: .:. ....:::::.: CCDS87 MKKEVCSVAFLKAVFAEFLATLIFVFFGLGSAL--KWP-----SALPTILQIALAFGLAI 10 20 30 40 50 70 80 90 100 110 120 pF1KB3 ATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQCVGAIVATAILSGITSSLT .::::..: .::.:.:::.::.::.. :::..::..:. :: ::::....:: :.. . CCDS87 GTLAQALGPVSGGHINPAITLALLVGNQISLLRAFFYVAAQLVGAIAGAGILYGVAPLNA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB3 GNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDRRRRDLGGSAPLAIGLSVALGH ..:. : : .....::.. .:.: :.::.::..:.:: :: . :: :.:::::.::: CCDS87 RGNLAVNALNNNTTQGQAMVVELILTFQLALCIFASTDSRRTSPVGSPALSIGLSVTLGH 120 130 140 150 160 170 190 200 210 220 230 pF1KB3 LLAIDYTGCGINPARSFGSAVITHNFS-NHWIFWVGPFIGGALAVLIYDFILAPRSSDLT :..: .:::..::::::: ::. . :: ::.:::::..:..::...: ..: : : .:. CCDS87 LVGIYFTGCSMNPARSFGPAVVMNRFSPAHWVFWVGPIVGAVLAAILYFYLLFPNSLSLS 180 190 200 210 220 230 240 250 260 pF1KB3 DRVKVWTSGQVEEYDLDADDINSRVEMKPK .:: . .: :. : : ..: : : CCDS87 ERVAI-IKGT---YEPDEDWEEQREERKKTMELTTR 240 250 260 >>CCDS58617.1 AQP4 gene_id:361|Hs108|chr18 (301 aa) initn: 698 init1: 608 opt: 722 Z-score: 959.5 bits: 185.4 E(32554): 4e-47 Smith-Waterman score: 722; 44.8% identity (75.7% similar) in 259 aa overlap (10-265:12-266) 10 20 30 40 50 pF1KB3 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNNQTAVQDNVKVSLAFGL ::.::.::::: .::..:.::.... :... : : .:: ::: CCDS58 MVAFKGVWTQAFWKAVTAEFLAMLIFVLLSLGSTINWG---GTEKPLPVDMVLISLCFGL 10 20 30 40 50 60 70 80 90 100 110 pF1KB3 SIATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQCVGAIVATAILSGITSS ::::..: :::::.:.:::::.... . .::: ....:: :::.:::....:: .: CCDS58 SIATMVQCFGHISGGHINPAVTVAMVCTRKISIAKSVFYIAAQCLGAIIGAGILYLVTPP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB3 LTGNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDRRRRDLGGSAPLAIGLSVAL . ..:: . . ....:.:: .:.: :.:::. ..:. : .: :. :: ::::.:::. CCDS58 SVVGGLGVTMVHGNLTAGHGLLVELIITFQLVFTIFASCDSKRTDVTGSIALAIGFSVAI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB3 GHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFIGGALAVLIYDFILAPRSSDL :::.::.::: ..::::::: ::: :. ::::.::::.::..:: .:.... : . .. CCDS58 GHLFAINYTGASMNPARSFGPAVIMGNWENHWIYWVGPIIGAVLAGGLYEYVFCP-DVEF 180 190 200 210 220 230 240 250 260 pF1KB3 TDRVKVWTSGQVEEYD---LDADDINSRVEMKPK : : : ... ....: :.:: CCDS58 KRRFKEAFSKAAQQTKGSYMEVEDNRSQVETDDLILKPGVVHVIDVDRGEEKKGKDQSGE 240 250 260 270 280 290 >>CCDS11889.1 AQP4 gene_id:361|Hs108|chr18 (323 aa) initn: 698 init1: 608 opt: 722 Z-score: 959.0 bits: 185.4 E(32554): 4.3e-47 Smith-Waterman score: 722; 44.8% identity (75.7% similar) in 259 aa overlap (10-265:34-288) 10 20 30 pF1KB3 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPV ::.::.::::: .::..:.::.... CCDS11 RPTARRWGKCGPLCTRENIMVAFKGVWTQAFWKAVTAEFLAMLIFVLLSLGSTINWG--- 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB3 GNNQTAVQDNVKVSLAFGLSIATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYII :... : : .:: :::::::..: :::::.:.:::::.... . .::: ....:: CCDS11 GTEKPLPVDMVLISLCFGLSIATMVQCFGHISGGHINPAVTVAMVCTRKISIAKSVFYIA 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB3 AQCVGAIVATAILSGITSSLTGNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDR :::.:::....:: .: . ..:: . . ....:.:: .:.: :.:::. ..:. : CCDS11 AQCLGAIIGAGILYLVTPPSVVGGLGVTMVHGNLTAGHGLLVELIITFQLVFTIFASCDS 130 140 150 160 170 180 160 170 180 190 200 210 pF1KB3 RRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFIG .: :. :: ::::.:::.:::.::.::: ..::::::: ::: :. ::::.::::.:: CCDS11 KRTDVTGSIALAIGFSVAIGHLFAINYTGASMNPARSFGPAVIMGNWENHWIYWVGPIIG 190 200 210 220 230 240 220 230 240 250 260 pF1KB3 GALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYD---LDADDINSRVEMKPK ..:: .:.... : . .. : : : ... ....: :.:: CCDS11 AVLAGGLYEYVFCP-DVEFKRRFKEAFSKAAQQTKGSYMEVEDNRSQVETDDLILKPGVV 250 260 270 280 290 CCDS11 HVIDVDRGEEKKGKDQSGEVLSSV 300 310 320 >>CCDS31798.1 AQP6 gene_id:363|Hs108|chr12 (282 aa) initn: 697 init1: 326 opt: 634 Z-score: 843.3 bits: 163.8 E(32554): 1.2e-40 Smith-Waterman score: 686; 46.2% identity (76.2% similar) in 240 aa overlap (12-251:25-254) 10 20 30 40 pF1KB3 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNNQTAVQ ::. :::::: :.::...::.. ..: ::. CCDS31 MDAVEPGGRGWASMLACRLWKAISRALFAEFLATGLYVFFGVGSVM--RWP-----TALP 10 20 30 40 50 50 60 70 80 90 100 pF1KB3 DNVKVSLAFGLSIATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQCVGAIV . ......:.: : .: . . :::: ::::::..:.. .::. ::. :. :: ::: : CCDS31 SVLQIAITFNLVTAMAVQVTWKASGAHANPAVTLAFLVGSHISLPRAVAYVAAQLVGATV 60 70 80 90 100 110 110 120 130 140 150 160 pF1KB3 ATAILSGITSSLTGNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDRRRRDLGGS ..:.: :. . ..:: : . ..:..::....:.. ::::::::.:.:: :. .:: CCDS31 GAALLYGVMPGDIRETLGINVVRNSVSTGQAVAVELLLTLQLVLCVFASTDSRQT--SGS 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB3 APLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFIGGALAVLIY ::.:::::::..: .:::..::::::: :.: .:. ::.:::::..:. :: ::: CCDS31 PATMIGISVALGHLIGIHFTGCSMNPARSFGPAIIIGKFTVHWVFWVGPLMGALLASLIY 180 190 200 210 220 230 230 240 250 260 pF1KB3 DFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKPK .:.: : .. :..:. . : : :: CCDS31 NFVLFPDTKTLAQRLAILT-GTVEVGTGAGAGAEPLKKESQPGSGAVEMESV 240 250 260 270 280 269 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 02:33:56 2016 done: Fri Nov 4 02:33:56 2016 Total Scan time: 1.980 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]