FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3506, 269 aa
1>>>pF1KB3506 269 - 269 aa - 269 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.3774+/-0.00102; mu= 13.7236+/- 0.061
mean_var=56.9872+/-11.582, 0's: 0 Z-trim(102.8): 34 B-trim: 9 in 1/47
Lambda= 0.169897
statistics sampled from 7075 (7105) to 7075 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.579), E-opt: 0.2 (0.218), width: 16
Scan time: 1.980
The best scores are: opt bits E(32554)
CCDS5431.1 AQP1 gene_id:358|Hs108|chr7 ( 269) 1731 432.7 1.3e-121
CCDS55097.1 AQP1 gene_id:358|Hs108|chr7 ( 218) 945 240.0 1.1e-63
CCDS55098.1 AQP1 gene_id:358|Hs108|chr7 ( 186) 943 239.5 1.3e-63
CCDS55096.1 AQP1 gene_id:358|Hs108|chr7 ( 154) 937 238.0 3e-63
CCDS8919.1 MIP gene_id:4284|Hs108|chr12 ( 263) 777 198.9 3.1e-51
CCDS8792.1 AQP2 gene_id:359|Hs108|chr12 ( 271) 768 196.7 1.5e-50
CCDS8793.1 AQP5 gene_id:362|Hs108|chr12 ( 265) 751 192.5 2.6e-49
CCDS58617.1 AQP4 gene_id:361|Hs108|chr18 ( 301) 722 185.4 4e-47
CCDS11889.1 AQP4 gene_id:361|Hs108|chr18 ( 323) 722 185.4 4.3e-47
CCDS31798.1 AQP6 gene_id:363|Hs108|chr12 ( 282) 634 163.8 1.2e-40
CCDS82244.1 AQP4 gene_id:361|Hs108|chr18 ( 296) 508 133.0 2.4e-31
CCDS10626.1 AQP8 gene_id:343|Hs108|chr16 ( 261) 346 93.2 2e-19
>>CCDS5431.1 AQP1 gene_id:358|Hs108|chr7 (269 aa)
initn: 1731 init1: 1731 opt: 1731 Z-score: 2296.9 bits: 432.7 E(32554): 1.3e-121
Smith-Waterman score: 1731; 100.0% identity (100.0% similar) in 269 aa overlap (1-269:1-269)
10 20 30 40 50 60
pF1KB3 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNNQTAVQDNVKVSLAFGLSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNNQTAVQDNVKVSLAFGLSI
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 ATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQCVGAIVATAILSGITSSLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 ATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQCVGAIVATAILSGITSSLT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 GNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDRRRRDLGGSAPLAIGLSVALGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 GNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDRRRRDLGGSAPLAIGLSVALGH
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 LLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFIGGALAVLIYDFILAPRSSDLTD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 LLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFIGGALAVLIYDFILAPRSSDLTD
190 200 210 220 230 240
250 260
pF1KB3 RVKVWTSGQVEEYDLDADDINSRVEMKPK
:::::::::::::::::::::::::::::
CCDS54 RVKVWTSGQVEEYDLDADDINSRVEMKPK
250 260
>>CCDS55097.1 AQP1 gene_id:358|Hs108|chr7 (218 aa)
initn: 966 init1: 943 opt: 945 Z-score: 1257.2 bits: 240.0 E(32554): 1.1e-63
Smith-Waterman score: 945; 74.4% identity (82.9% similar) in 211 aa overlap (65-269:8-218)
40 50 60 70 80 90
pF1KB3 FKYPVGNNQTAVQDNVKVSLAFGLSIATLAQSVGHISGAHLNPAVTLGLLLSCQ-ISIFR
..:. . .:: .. ::.::. . :
CCDS55 MFWTFGYEAVSPAGPSHLFASLLLGVLLTITFMPGAR
10 20 30
100 110 120 130 140
pF1KB3 AL-MYIIAQCVGAIV---ATAILSGITSSLTGN-SLGRNDLADGVNSGQGLGIEIIGTLQ
: . .. : . : . : : .: : . : .::::::::::::::::::::
CCDS55 PLPLVLVPQNTLAWMQLDAKAPAHPRPLQLLGRVGPGSRQLADGVNSGQGLGIEIIGTLQ
40 50 60 70 80 90
150 160 170 180 190 200
pF1KB3 LVLCVLATTDRRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LVLCVLATTDRRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSN
100 110 120 130 140 150
210 220 230 240 250 260
pF1KB3 HWIFWVGPFIGGALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 HWIFWVGPFIGGALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKP
160 170 180 190 200 210
pF1KB3 K
:
CCDS55 K
>>CCDS55098.1 AQP1 gene_id:358|Hs108|chr7 (186 aa)
initn: 943 init1: 943 opt: 943 Z-score: 1255.6 bits: 239.5 E(32554): 1.3e-63
Smith-Waterman score: 943; 97.9% identity (98.6% similar) in 145 aa overlap (125-269:42-186)
100 110 120 130 140 150
pF1KB3 LMYIIAQCVGAIVATAILSGITSSLTGNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVL
: .::::::::::::::::::::::::::
CCDS55 VPQNTLAWMQLDAKAPAHPRPLQLLGRVGPGSRQLADGVNSGQGLGIEIIGTLQLVLCVL
20 30 40 50 60 70
160 170 180 190 200 210
pF1KB3 ATTDRRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ATTDRRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWV
80 90 100 110 120 130
220 230 240 250 260
pF1KB3 GPFIGGALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKPK
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GPFIGGALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKPK
140 150 160 170 180
>>CCDS55096.1 AQP1 gene_id:358|Hs108|chr7 (154 aa)
initn: 937 init1: 937 opt: 937 Z-score: 1249.0 bits: 238.0 E(32554): 3e-63
Smith-Waterman score: 937; 100.0% identity (100.0% similar) in 141 aa overlap (129-269:14-154)
100 110 120 130 140 150
pF1KB3 IAQCVGAIVATAILSGITSSLTGNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTD
::::::::::::::::::::::::::::::
CCDS55 MQSGMGWNVLDFWLADGVNSGQGLGIEIIGTLQLVLCVLATTD
10 20 30 40
160 170 180 190 200 210
pF1KB3 RRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 RRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFI
50 60 70 80 90 100
220 230 240 250 260
pF1KB3 GGALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKPK
:::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GGALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKPK
110 120 130 140 150
>>CCDS8919.1 MIP gene_id:4284|Hs108|chr12 (263 aa)
initn: 793 init1: 695 opt: 777 Z-score: 1033.3 bits: 198.9 E(32554): 3.1e-51
Smith-Waterman score: 777; 48.1% identity (81.3% similar) in 241 aa overlap (4-244:3-236)
10 20 30 40 50 60
pF1KB3 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNNQTAVQDNVKVSLAFGLSI
:... ::::. :::.:: ..::...::.: .. : .. ..:..::::..
CCDS89 MWELRSASFWRAIFAEFFATLFYVFFGLGSSL--RWAPGPLHV-----LQVAMAFGLAL
10 20 30 40 50
70 80 90 100 110 120
pF1KB3 ATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQCVGAIVATAILSGITSSLT
:::.::::::::::.:::::...:.. :.:..::. :. :: .::....:.: ..: .
CCDS89 ATLVQSVGHISGAHVNPAVTFAFLVGSQMSLLRAFCYMAAQLLGAVAGAAVLYSVTPPAV
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB3 GNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDRRRRDLGGSAPLAIGLSVALGH
..:. : : .:. ::. .::. :::.:::..:: :.:: ::. ::.:.:.::::
CCDS89 RGNLALNTLHPAVSVGQATTVEIFLTLQFVLCIFATYDERRNGQLGSVALAVGFSLALGH
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB3 LLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFIGGALAVLIYDFILAPRSSDLTD
:... ::: :.::::::. :..: ::.:::..::::.:::.:. :.:::.: :: .....
CCDS89 LFGMYYTGAGMNPARSFAPAILTGNFTNHWVYWVGPIIGGGLGSLLYDFLLFPRLKSISE
180 190 200 210 220 230
250 260
pF1KB3 RVKVWTSGQVEEYDLDADDINSRVEMKPK
:..:
CCDS89 RLSVLKGAKPDVSNGQPEVTGEPVELNTQAL
240 250 260
>>CCDS8792.1 AQP2 gene_id:359|Hs108|chr12 (271 aa)
initn: 787 init1: 664 opt: 768 Z-score: 1021.1 bits: 196.7 E(32554): 1.5e-50
Smith-Waterman score: 768; 45.0% identity (79.6% similar) in 260 aa overlap (4-263:3-254)
10 20 30 40 50 60
pF1KB3 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNNQTAVQDNVKVSLAFGLSI
:... : ::: :::::: ::::...:::: ..: :. . .....::::.:
CCDS87 MWELRSIAFSRAVFAEFLATLLFVFFGLGSAL--NWP-----QALPSVLQIAMAFGLGI
10 20 30 40 50
70 80 90 100 110 120
pF1KB3 ATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQCVGAIVATAILSGITSSLT
.::.:..:::::::.:::::.. :..:..:..:: .:. :: .::....:.: :: .
CCDS87 GTLVQALGHISGAHINPAVTVACLVGCHVSVLRAAFYVAAQLLGAVAGAALLHEITPADI
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB3 GNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDRRRRDLGGSAPLAIGLSVALGH
..:. : :......::.. .:.. :::::::..:.::.:: . :. :.::.::::::
CCDS87 RGDLAVNALSNSTTAGQAVTVELFLTLQLVLCIFASTDERRGENPGTPALSIGFSVALGH
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB3 LLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFIGGALAVLIYDFILAPRSSDLTD
::.: ::::..:::::.. ::.: .:..::.::.::..:. :. :.:...: : ...:..
CCDS87 LLGIHYTGCSMNPARSLAPAVVTGKFDDHWVFWIGPLVGAILGSLLYNYVLFPPAKSLSE
180 190 200 210 220 230
250 260
pF1KB3 RVKVWTSGQVEEYDLDADDINSRVEMKPK
:. : .: . : . .. :
CCDS87 RLAV-LKGLEPDTDWEEREVRRRQSVELHSPQSLPRGTKA
240 250 260 270
>>CCDS8793.1 AQP5 gene_id:362|Hs108|chr12 (265 aa)
initn: 742 init1: 524 opt: 751 Z-score: 998.8 bits: 192.5 E(32554): 2.6e-49
Smith-Waterman score: 751; 46.6% identity (77.2% similar) in 268 aa overlap (1-267:1-257)
10 20 30 40 50 60
pF1KB3 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNNQTAVQDNVKVSLAFGLSI
: .: . : .:: :::::: .:::...:::: :.: .:. ....:::::.:
CCDS87 MKKEVCSVAFLKAVFAEFLATLIFVFFGLGSAL--KWP-----SALPTILQIALAFGLAI
10 20 30 40 50
70 80 90 100 110 120
pF1KB3 ATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQCVGAIVATAILSGITSSLT
.::::..: .::.:.:::.::.::.. :::..::..:. :: ::::....:: :.. .
CCDS87 GTLAQALGPVSGGHINPAITLALLVGNQISLLRAFFYVAAQLVGAIAGAGILYGVAPLNA
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB3 GNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDRRRRDLGGSAPLAIGLSVALGH
..:. : : .....::.. .:.: :.::.::..:.:: :: . :: :.:::::.:::
CCDS87 RGNLAVNALNNNTTQGQAMVVELILTFQLALCIFASTDSRRTSPVGSPALSIGLSVTLGH
120 130 140 150 160 170
190 200 210 220 230
pF1KB3 LLAIDYTGCGINPARSFGSAVITHNFS-NHWIFWVGPFIGGALAVLIYDFILAPRSSDLT
:..: .:::..::::::: ::. . :: ::.:::::..:..::...: ..: : : .:.
CCDS87 LVGIYFTGCSMNPARSFGPAVVMNRFSPAHWVFWVGPIVGAVLAAILYFYLLFPNSLSLS
180 190 200 210 220 230
240 250 260
pF1KB3 DRVKVWTSGQVEEYDLDADDINSRVEMKPK
.:: . .: :. : : ..: : :
CCDS87 ERVAI-IKGT---YEPDEDWEEQREERKKTMELTTR
240 250 260
>>CCDS58617.1 AQP4 gene_id:361|Hs108|chr18 (301 aa)
initn: 698 init1: 608 opt: 722 Z-score: 959.5 bits: 185.4 E(32554): 4e-47
Smith-Waterman score: 722; 44.8% identity (75.7% similar) in 259 aa overlap (10-265:12-266)
10 20 30 40 50
pF1KB3 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNNQTAVQDNVKVSLAFGL
::.::.::::: .::..:.::.... :... : : .:: :::
CCDS58 MVAFKGVWTQAFWKAVTAEFLAMLIFVLLSLGSTINWG---GTEKPLPVDMVLISLCFGL
10 20 30 40 50
60 70 80 90 100 110
pF1KB3 SIATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQCVGAIVATAILSGITSS
::::..: :::::.:.:::::.... . .::: ....:: :::.:::....:: .:
CCDS58 SIATMVQCFGHISGGHINPAVTVAMVCTRKISIAKSVFYIAAQCLGAIIGAGILYLVTPP
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB3 LTGNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDRRRRDLGGSAPLAIGLSVAL
. ..:: . . ....:.:: .:.: :.:::. ..:. : .: :. :: ::::.:::.
CCDS58 SVVGGLGVTMVHGNLTAGHGLLVELIITFQLVFTIFASCDSKRTDVTGSIALAIGFSVAI
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB3 GHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFIGGALAVLIYDFILAPRSSDL
:::.::.::: ..::::::: ::: :. ::::.::::.::..:: .:.... : . ..
CCDS58 GHLFAINYTGASMNPARSFGPAVIMGNWENHWIYWVGPIIGAVLAGGLYEYVFCP-DVEF
180 190 200 210 220 230
240 250 260
pF1KB3 TDRVKVWTSGQVEEYD---LDADDINSRVEMKPK
: : : ... ....: :.::
CCDS58 KRRFKEAFSKAAQQTKGSYMEVEDNRSQVETDDLILKPGVVHVIDVDRGEEKKGKDQSGE
240 250 260 270 280 290
>>CCDS11889.1 AQP4 gene_id:361|Hs108|chr18 (323 aa)
initn: 698 init1: 608 opt: 722 Z-score: 959.0 bits: 185.4 E(32554): 4.3e-47
Smith-Waterman score: 722; 44.8% identity (75.7% similar) in 259 aa overlap (10-265:34-288)
10 20 30
pF1KB3 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPV
::.::.::::: .::..:.::....
CCDS11 RPTARRWGKCGPLCTRENIMVAFKGVWTQAFWKAVTAEFLAMLIFVLLSLGSTINWG---
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB3 GNNQTAVQDNVKVSLAFGLSIATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYII
:... : : .:: :::::::..: :::::.:.:::::.... . .::: ....::
CCDS11 GTEKPLPVDMVLISLCFGLSIATMVQCFGHISGGHINPAVTVAMVCTRKISIAKSVFYIA
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB3 AQCVGAIVATAILSGITSSLTGNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDR
:::.:::....:: .: . ..:: . . ....:.:: .:.: :.:::. ..:. :
CCDS11 AQCLGAIIGAGILYLVTPPSVVGGLGVTMVHGNLTAGHGLLVELIITFQLVFTIFASCDS
130 140 150 160 170 180
160 170 180 190 200 210
pF1KB3 RRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFIG
.: :. :: ::::.:::.:::.::.::: ..::::::: ::: :. ::::.::::.::
CCDS11 KRTDVTGSIALAIGFSVAIGHLFAINYTGASMNPARSFGPAVIMGNWENHWIYWVGPIIG
190 200 210 220 230 240
220 230 240 250 260
pF1KB3 GALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYD---LDADDINSRVEMKPK
..:: .:.... : . .. : : : ... ....: :.::
CCDS11 AVLAGGLYEYVFCP-DVEFKRRFKEAFSKAAQQTKGSYMEVEDNRSQVETDDLILKPGVV
250 260 270 280 290
CCDS11 HVIDVDRGEEKKGKDQSGEVLSSV
300 310 320
>>CCDS31798.1 AQP6 gene_id:363|Hs108|chr12 (282 aa)
initn: 697 init1: 326 opt: 634 Z-score: 843.3 bits: 163.8 E(32554): 1.2e-40
Smith-Waterman score: 686; 46.2% identity (76.2% similar) in 240 aa overlap (12-251:25-254)
10 20 30 40
pF1KB3 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNNQTAVQ
::. :::::: :.::...::.. ..: ::.
CCDS31 MDAVEPGGRGWASMLACRLWKAISRALFAEFLATGLYVFFGVGSVM--RWP-----TALP
10 20 30 40 50
50 60 70 80 90 100
pF1KB3 DNVKVSLAFGLSIATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQCVGAIV
. ......:.: : .: . . :::: ::::::..:.. .::. ::. :. :: ::: :
CCDS31 SVLQIAITFNLVTAMAVQVTWKASGAHANPAVTLAFLVGSHISLPRAVAYVAAQLVGATV
60 70 80 90 100 110
110 120 130 140 150 160
pF1KB3 ATAILSGITSSLTGNSLGRNDLADGVNSGQGLGIEIIGTLQLVLCVLATTDRRRRDLGGS
..:.: :. . ..:: : . ..:..::....:.. ::::::::.:.:: :. .::
CCDS31 GAALLYGVMPGDIRETLGINVVRNSVSTGQAVAVELLLTLQLVLCVFASTDSRQT--SGS
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB3 APLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPFIGGALAVLIY
::.:::::::..: .:::..::::::: :.: .:. ::.:::::..:. :: :::
CCDS31 PATMIGISVALGHLIGIHFTGCSMNPARSFGPAIIIGKFTVHWVFWVGPLMGALLASLIY
180 190 200 210 220 230
230 240 250 260
pF1KB3 DFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKPK
.:.: : .. :..:. . : : ::
CCDS31 NFVLFPDTKTLAQRLAILT-GTVEVGTGAGAGAEPLKKESQPGSGAVEMESV
240 250 260 270 280
269 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 02:33:56 2016 done: Fri Nov 4 02:33:56 2016
Total Scan time: 1.980 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]