FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0494, 218 aa
1>>>pF1KE0494 218 - 218 aa - 218 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.4787+/-0.000735; mu= 18.8316+/- 0.044
mean_var=69.6923+/-14.126, 0's: 0 Z-trim(109.3): 38 B-trim: 0 in 0/52
Lambda= 0.153632
statistics sampled from 10767 (10805) to 10767 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.697), E-opt: 0.2 (0.332), width: 16
Scan time: 2.240
The best scores are: opt bits E(32554)
CCDS13763.2 CLDN5 gene_id:7122|Hs108|chr22 ( 303) 1492 339.3 1.6e-93
CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 ( 217) 826 191.5 3.4e-49
CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 ( 220) 813 188.6 2.6e-48
CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 ( 220) 807 187.3 6.4e-48
CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 ( 209) 762 177.3 6.2e-45
CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 ( 211) 684 160.0 1e-39
CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 ( 211) 658 154.3 5.4e-38
CCDS44125.1 CLDN19 gene_id:149461|Hs108|chr1 ( 211) 641 150.5 7.4e-37
CCDS471.1 CLDN19 gene_id:149461|Hs108|chr1 ( 224) 641 150.5 7.7e-37
CCDS13587.1 CLDN8 gene_id:9073|Hs108|chr21 ( 225) 630 148.1 4.2e-36
CCDS13586.1 CLDN17 gene_id:26285|Hs108|chr21 ( 224) 579 136.8 1.1e-32
CCDS13645.1 CLDN14 gene_id:23562|Hs108|chr21 ( 239) 558 132.2 2.8e-31
CCDS14524.1 CLDN2 gene_id:9075|Hs108|chrX ( 230) 498 118.8 2.7e-27
CCDS9476.1 CLDN10 gene_id:9071|Hs108|chr13 ( 228) 466 111.7 3.7e-25
CCDS5717.1 CLDN15 gene_id:24146|Hs108|chr7 ( 228) 465 111.5 4.3e-25
CCDS54081.1 CLDN7 gene_id:1366|Hs108|chr17 ( 145) 454 108.9 1.7e-24
CCDS5249.1 CLDN20 gene_id:49861|Hs108|chr6 ( 219) 444 106.9 1.1e-23
CCDS53306.1 CLDN19 gene_id:149461|Hs108|chr1 ( 218) 428 103.3 1.2e-22
CCDS54824.1 CLDN24 gene_id:100132463|Hs108|chr4 ( 220) 426 102.9 1.7e-22
CCDS9475.1 CLDN10 gene_id:9071|Hs108|chr13 ( 226) 413 100.0 1.3e-21
CCDS43286.1 CLDN22 gene_id:53842|Hs108|chr4 ( 220) 406 98.4 3.6e-21
CCDS44736.1 CLDN25 gene_id:644672|Hs108|chr11 ( 229) 366 89.6 1.8e-18
CCDS3213.1 CLDN11 gene_id:5010|Hs108|chr3 ( 207) 331 81.8 3.5e-16
CCDS3095.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 316 78.6 4.2e-15
CCDS33862.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 306 76.3 1.9e-14
>>CCDS13763.2 CLDN5 gene_id:7122|Hs108|chr22 (303 aa)
initn: 1492 init1: 1492 opt: 1492 Z-score: 1792.6 bits: 339.3 E(32554): 1.6e-93
Smith-Waterman score: 1492; 100.0% identity (100.0% similar) in 218 aa overlap (1-218:86-303)
10 20 30
pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMW
::::::::::::::::::::::::::::::
CCDS13 GAKAPGPAQGAAQHGLGGSAGLRVRVSPLAMGSAALEILGLVLCLVGWGGLILACGLPMW
60 70 80 90 100 110
40 50 60 70 80 90
pF1KE0 QVTAFLDHNIVTAQTTWKGLWMSCVVQSTGHMQCKVYDSVLALSTEVQAARALTVSAVLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 QVTAFLDHNIVTAQTTWKGLWMSCVVQSTGHMQCKVYDSVLALSTEVQAARALTVSAVLL
120 130 140 150 160 170
100 110 120 130 140 150
pF1KE0 AFVALFVTLAGAQCTTCVAPGPAKARVALTGGVLYLFCGLLALVPLCWFANIVVREFYDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 AFVALFVTLAGAQCTTCVAPGPAKARVALTGGVLYLFCGLLALVPLCWFANIVVREFYDP
180 190 200 210 220 230
160 170 180 190 200 210
pF1KE0 SVPVSQKYELGAALYIGWAATALLMVGGCLLCCGAWVCTGRPDLSFPVKYSAPRRPTATG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SVPVSQKYELGAALYIGWAATALLMVGGCLLCCGAWVCTGRPDLSFPVKYSAPRRPTATG
240 250 260 270 280 290
pF1KE0 DYDKKNYV
::::::::
CCDS13 DYDKKNYV
300
>>CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 (217 aa)
initn: 805 init1: 787 opt: 826 Z-score: 996.6 bits: 191.5 E(32554): 3.4e-49
Smith-Waterman score: 826; 54.5% identity (81.5% similar) in 222 aa overlap (1-218:1-217)
10 20 30 40 50 60
pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG
:.:..::.::..: ..:: : ...:.::.:.::::. ..::.::..:.::::::::::::
CCDS10 MASTGLELLGMTLAVLGWLGTLVSCALPLWKVTAFIGNSIVVAQVVWEGLWMSCVVQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGPAKARVALT
.::::::::.::: ..:::::: : :.:::...:.:...:::::::: ::::..::
CCDS10 QMQCKVYDSLLALPQDLQAARALCVIALLLALLGLLVAITGAQCTTCVEDEGAKARIVLT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 GGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGCL
.::. :. :.:.:.:.:: :. ....::.: : . : ::::.::.::::.::::.:: :
CCDS10 AGVILLLAGILVLIPVCWTAHAIIQDFYNPLVAEALKRELGASLYLGWAAAALLMLGGGL
130 140 150 160 170 180
190 200 210
pF1KE0 LCCGAWVCTGRPDLSFP----VKYSAPRRPTATGDYDKKNYV
::: .: :.. : . :: : : :.: ::..::
CCDS10 LCC---TCPP-PQVERPRGPRLGYSIPSRSGASG-LDKRDYV
190 200 210
>>CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 (220 aa)
initn: 820 init1: 771 opt: 813 Z-score: 981.0 bits: 188.6 E(32554): 2.6e-48
Smith-Waterman score: 813; 55.0% identity (77.9% similar) in 222 aa overlap (3-218:2-220)
10 20 30 40 50 60
pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG
: .::: : .: ..:: : :. :.::::.:.::. ::.:.:. :.::::.:::::::
CCDS55 MSMGLEITGTALAVLGWLGTIVCCALPMWRVSAFIGSNIITSQNIWEGLWMNCVVQSTG
10 20 30 40 50
70 80 90 100 110 120
pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGPAKARVALT
.::::::::.::: ..:::::: : :.::: .:.:.:.:::::.:: :::.....
CCDS55 QMQCKVYDSLLALPQDLQAARALIVVAILLAAFGLLVALVGAQCTNCVQDDTAKAKITIV
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE0 GGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGCL
.:::.:. .::.:::. : :: ..:.::.: :: .:: :.::.::.::::.:: ..:: :
CCDS55 AGVLFLLAALLTLVPVSWSANTIIRDFYNPVVPEAQKREMGAGLYVGWAAAALQLLGGAL
120 130 140 150 160 170
190 200 210
pF1KE0 LCCGAWVCTGRPD--LSFPVKYSAPRR--PTAT-GD-YDKKNYV
:::. : : . : ::::: : :. : ::.:.::
CCDS55 LCCS---CPPREKKYTATKVVYSAPRSTGPGASLGTGYDRKDYV
180 190 200 210 220
>>CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 (220 aa)
initn: 815 init1: 784 opt: 807 Z-score: 973.8 bits: 187.3 E(32554): 6.4e-48
Smith-Waterman score: 807; 52.7% identity (80.9% similar) in 220 aa overlap (1-218:1-220)
10 20 30 40 50 60
pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG
:.::...:::.:: :.:: . ...:.::::.::::. ..::.::..:.::::::::::::
CCDS10 MASAGMQILGVVLTLLGWVNGLVSCALPMWKVTAFIGNSIVVAQVVWEGLWMSCVVQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGPAKARVALT
.::::::::.::: ..:::::: : :.:.:. .:.: ::::.::::: .:::..::
CCDS10 QMQCKVYDSLLALPQDLQAARALCVIALLVALFGLLVYLAGAKCTTCVEEKDSKARLVLT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 GGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGCL
.:..... :.:.:.:.:: :. ..:.::.: : .:: ::::.::.::::..::..:: :
CCDS10 SGIVFVISGVLTLIPVCWTAHAIIRDFYNPLVAEAQKRELGASLYLGWAASGLLLLGGGL
130 140 150 160 170 180
190 200 210
pF1KE0 LCCGAWVCTGRPDLSFPVKYS--APRRPTATGDYDKKNYV
::: .. . ..:: :: . ..: ::::
CCDS10 LCCTCPSGGSQGPSHYMARYSTSAPAISRGPSEYPTKNYV
190 200 210 220
>>CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 (209 aa)
initn: 741 init1: 720 opt: 762 Z-score: 920.2 bits: 177.3 E(32554): 6.2e-45
Smith-Waterman score: 762; 48.3% identity (82.3% similar) in 209 aa overlap (1-209:1-206)
10 20 30 40 50 60
pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG
:.: .:...:..: ..:: ...: :.::::.::::. ::::.:: :.::::.:::::::
CCDS55 MASMGLQVMGIALAVLGWLAVMLCCALPMWRVTAFIGSNIVTSQTIWEGLWMNCVVQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGPAKARVALT
.::::::::.::: ..::::::.. ....: ........:..::.:. :::.. ..
CCDS55 QMQCKVYDSLLALPQDLQAARALVIISIIVAALGVLLSVVGGKCTNCLEDESAKAKTMIV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 GGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGCL
.::..:. ::...::. : :. ....::.: : .:: :.::.::.::::..::..:: :
CCDS55 AGVVFLLAGLMVIVPVSWTAHNIIQDFYNPLVASGQKREMGASLYVGWAASGLLLLGGGL
130 140 150 160 170 180
190 200 210
pF1KE0 LCCGAWVCTGRPDLSFPVKYSAPRRPTATGDYDKKNYV
:::. : : : . .:::: : .:.
CCDS55 LCCN---CPPRTDKPYSAKYSAARSAAASNYV
190 200
>>CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 (211 aa)
initn: 662 init1: 397 opt: 684 Z-score: 826.7 bits: 160.0 E(32554): 1e-39
Smith-Waterman score: 684; 45.3% identity (74.3% similar) in 214 aa overlap (1-212:1-210)
10 20 30 40 50 60
pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG
:..:.:..::..: ..:: : :.. .::.:.. .. ::::::. ..::::::: ::::
CCDS32 MANAGLQLLGFILAFLGWIGAIVSTALPQWRIYSYAGDNIVTAQAMYEGLWMSCVSQSTG
10 20 30 40 50 60
70 80 90 100 110
pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGPA-KARVAL
..::::.::.: ::. .::.::: : ..::. .:.::. .: .: :. . : :.:.
CCDS32 QIQCKVFDSLLNLSSTLQATRALMVVGILLGVIAIFVATVGMKCMKCLEDDEVQKMRMAV
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE0 TGGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGC
::...:. :: :: :..: .:.::::: .::. .::.: ::. ::::..: ..::
CCDS32 IGGAIFLLAGLAILVATAWYGNRIVQEFYDPMTPVNARYEFGQALFTGWAAASLCLLGGA
130 140 150 160 170 180
180 190 200 210
pF1KE0 LLCCGAWVCTGRPDLSFPVKYSAPR-RPTATGDYDKKNYV
::::. : : :.:. :. :.. ::
CCDS32 LLCCS---CP-RKTTSYPTPRPYPKPAPSSGKDYV
190 200 210
>>CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 (211 aa)
initn: 663 init1: 412 opt: 658 Z-score: 795.5 bits: 154.3 E(32554): 5.4e-38
Smith-Waterman score: 658; 44.7% identity (76.2% similar) in 206 aa overlap (1-204:1-203)
10 20 30 40 50 60
pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG
:....:..::. . :.:: ::. ..:.::.... ::.:::. .:::::.::.::::
CCDS11 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG
10 20 30 40 50 60
70 80 90 100 110
pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGPAK-ARVAL
:.::.::::::::. .::.::: : ...:.:.:.::. : .:: : . .: ::.:.
CCDS11 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE0 TGGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGC
::.... :: ::: :... .: .::.: .:.. :::.: :..::::..::...::
CCDS11 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA
130 140 150 160 170 180
180 190 200 210
pF1KE0 LLCCGAWVCTGRPDLS-FPVKYSAPRRPTATGDYDKKNYV
:: :. : : . . . : : :.
CCDS11 LLSCS---CPGNESKAGYRVPRSYPKSNSSKEYV
190 200 210
>>CCDS44125.1 CLDN19 gene_id:149461|Hs108|chr1 (211 aa)
initn: 625 init1: 361 opt: 641 Z-score: 775.2 bits: 150.5 E(32554): 7.4e-37
Smith-Waterman score: 641; 44.4% identity (76.3% similar) in 207 aa overlap (1-206:1-201)
10 20 30 40 50 60
pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG
:....:..:: : : :: :.: . .::.:. ... :.:: ..::::::. ::::
CCDS44 MANSGLQLLGYFLALGGWVGIIASTALPQWKQSSYAGDAIITAVGLYEGLWMSCASQSTG
10 20 30 40 50 60
70 80 90 100 110
pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGP-AKARVAL
..:::.:::.:::. ..:.:::: : ::::.:::. ....: .:: .: ::.:::.
CCDS44 QVQCKLYDSLLALDGHIQSARALMVVAVLLGFVAMVLSVVGMKCTRVGDSNPIAKGRVAI
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE0 TGGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGC
.::.:... :: .:. . :.:..:..::..::.::. .::.: ::..:::...: ..::
CCDS44 AGGALFILAGLCTLTAVSWYATLVTQEFFNPSTPVNARYEFGPALFVGWASAGLAVLGGS
130 140 150 160 170 180
180 190 200 210
pF1KE0 LLCCGAWVCTGRPDLSFPVKYSAPRRPTATGDYDKKNYV
.::: .: :. : . : ::
CCDS44 FLCC---TC---PEPERPNSSPQPYRPGPSAAAREYV
190 200 210
>>CCDS471.1 CLDN19 gene_id:149461|Hs108|chr1 (224 aa)
initn: 625 init1: 361 opt: 641 Z-score: 774.8 bits: 150.5 E(32554): 7.7e-37
Smith-Waterman score: 641; 44.4% identity (76.3% similar) in 207 aa overlap (1-206:1-201)
10 20 30 40 50 60
pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG
:....:..:: : : :: :.: . .::.:. ... :.:: ..::::::. ::::
CCDS47 MANSGLQLLGYFLALGGWVGIIASTALPQWKQSSYAGDAIITAVGLYEGLWMSCASQSTG
10 20 30 40 50 60
70 80 90 100 110
pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGP-AKARVAL
..:::.:::.:::. ..:.:::: : ::::.:::. ....: .:: .: ::.:::.
CCDS47 QVQCKLYDSLLALDGHIQSARALMVVAVLLGFVAMVLSVVGMKCTRVGDSNPIAKGRVAI
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE0 TGGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGC
.::.:... :: .:. . :.:..:..::..::.::. .::.: ::..:::...: ..::
CCDS47 AGGALFILAGLCTLTAVSWYATLVTQEFFNPSTPVNARYEFGPALFVGWASAGLAVLGGS
130 140 150 160 170 180
180 190 200 210
pF1KE0 LLCCGAWVCTGRPDLSFPVKYSAPRRPTATGDYDKKNYV
.::: .: :. : . : ::
CCDS47 FLCC---TC---PEPERPNSSPQPYRPGPSAAAREPVVKLPASAKGPLGV
190 200 210 220
>>CCDS13587.1 CLDN8 gene_id:9073|Hs108|chr21 (225 aa)
initn: 614 init1: 359 opt: 630 Z-score: 761.6 bits: 148.1 E(32554): 4.2e-36
Smith-Waterman score: 630; 42.3% identity (76.1% similar) in 213 aa overlap (1-212:1-209)
10 20 30 40 50 60
pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG
:.. :::: :: : :: : . . .:.:.:.::...:::. .. :.::::.:: :..
CCDS13 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI
10 20 30 40 50 60
70 80 90 100 110
pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGP-AKARVAL
.::::.:::.:::: ..::::.: .: ...:.:..... : .:: :.. . .::.. :
CCDS13 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE0 TGGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGC
:.:..... :...:.:. : :: ..:.::. : :.:: ::: :::.::... .:.:::
CCDS13 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA
130 140 150 160 170 180
180 190 200 210
pF1KE0 LLCCGAWVCTGRPDLSFPVKYSAPRRPTATGDYDKKNYV
:.:: : .. . :. .:: : . :. .:
CCDS13 LFCC--VFCCNEKSSSY--RYSIPSHRTTQKSYHTGKKSPSVYSRSQYV
190 200 210 220
218 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 04:21:39 2016 done: Thu Nov 3 04:21:40 2016
Total Scan time: 2.240 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]