FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6949, 211 aa 1>>>pF1KB6949 211 - 211 aa - 211 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.9147+/-0.000794; mu= 15.4973+/- 0.048 mean_var=59.3690+/-12.013, 0's: 0 Z-trim(107.5): 41 B-trim: 0 in 0/49 Lambda= 0.166454 statistics sampled from 9577 (9617) to 9577 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.661), E-opt: 0.2 (0.295), width: 16 Scan time: 1.750 The best scores are: opt bits E(32554) CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 ( 211) 1414 347.6 3.4e-96 CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 ( 211) 925 230.1 7.7e-61 CCDS54081.1 CLDN7 gene_id:1366|Hs108|chr17 ( 145) 864 215.4 1.5e-56 CCDS44125.1 CLDN19 gene_id:149461|Hs108|chr1 ( 211) 841 210.0 9.1e-55 CCDS471.1 CLDN19 gene_id:149461|Hs108|chr1 ( 224) 830 207.3 6e-54 CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 ( 209) 714 179.5 1.4e-45 CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 ( 220) 710 178.5 2.8e-45 CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 ( 217) 700 176.1 1.4e-44 CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 ( 220) 685 172.5 1.8e-43 CCDS13763.2 CLDN5 gene_id:7122|Hs108|chr22 ( 303) 663 167.3 9e-42 CCDS13645.1 CLDN14 gene_id:23562|Hs108|chr21 ( 239) 625 158.1 4.1e-39 CCDS13587.1 CLDN8 gene_id:9073|Hs108|chr21 ( 225) 624 157.9 4.7e-39 CCDS53306.1 CLDN19 gene_id:149461|Hs108|chr1 ( 218) 611 154.7 3.9e-38 CCDS13586.1 CLDN17 gene_id:26285|Hs108|chr21 ( 224) 584 148.3 3.6e-36 CCDS14524.1 CLDN2 gene_id:9075|Hs108|chrX ( 230) 561 142.7 1.7e-34 CCDS5249.1 CLDN20 gene_id:49861|Hs108|chr6 ( 219) 549 139.8 1.2e-33 CCDS5717.1 CLDN15 gene_id:24146|Hs108|chr7 ( 228) 536 136.7 1.1e-32 CCDS9476.1 CLDN10 gene_id:9071|Hs108|chr13 ( 228) 530 135.3 2.9e-32 CCDS9475.1 CLDN10 gene_id:9071|Hs108|chr13 ( 226) 493 126.4 1.4e-29 CCDS54824.1 CLDN24 gene_id:100132463|Hs108|chr4 ( 220) 445 114.9 4e-26 CCDS43286.1 CLDN22 gene_id:53842|Hs108|chr4 ( 220) 438 113.2 1.3e-25 CCDS33862.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 388 101.2 6e-22 CCDS3095.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 381 99.5 1.9e-21 CCDS44736.1 CLDN25 gene_id:644672|Hs108|chr11 ( 229) 366 95.9 2.1e-20 CCDS3213.1 CLDN11 gene_id:5010|Hs108|chr3 ( 207) 357 93.7 8.7e-20 CCDS3296.1 CLDN16 gene_id:10686|Hs108|chr3 ( 305) 293 78.5 5.1e-15 CCDS55195.1 CLDN23 gene_id:137075|Hs108|chr8 ( 292) 250 68.1 6.3e-12 >>CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 (211 aa) initn: 1414 init1: 1414 opt: 1414 Z-score: 1840.4 bits: 347.6 E(32554): 3.4e-96 Smith-Waterman score: 1414; 99.5% identity (100.0% similar) in 211 aa overlap (1-211:1-211) 10 20 30 40 50 60 pF1KB6 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA 130 140 150 160 170 180 190 200 210 pF1KB6 LLSCSCPGNESKAGYRAPRSYPKSNSSKEYV ::::::::::::::::.:::::::::::::: CCDS11 LLSCSCPGNESKAGYRVPRSYPKSNSSKEYV 190 200 210 >>CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 (211 aa) initn: 911 init1: 911 opt: 925 Z-score: 1205.8 bits: 230.1 E(32554): 7.7e-61 Smith-Waterman score: 925; 60.6% identity (86.4% similar) in 213 aa overlap (1-211:1-211) 10 20 30 40 50 60 pF1KB6 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG :::.::::::: .:.:::.: .. ::.:::.. :::::::.::::::.::::.::.:::: CCDS32 MANAGLQLLGFILAFLGWIGAIVSTALPQWRIYSYAGDNIVTAQAMYEGLWMSCVSQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM ...::..::.: ::..::::::::::...:: .:.::::.:::: .: ::.:.: :.:. CCDS32 QIQCKVFDSLLNLSSTLQATRALMVVGILLGVIAIFVATVGMKCMKCLEDDEVQKMRMAV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA :: ::..:::: ::: .:::..:: .::.:. :.: .:::: :.: :::...: .:::: CCDS32 IGGAIFLLAGLAILVATAWYGNRIVQEFYDPMTPVNARYEFGQALFTGWAAASLCLLGGA 130 140 150 160 170 180 190 200 210 pF1KB6 LLSCSCPGNESKAGYRAPRSYPKS--NSSKEYV :: :::: .. ..: .:: ::: .:.:.:: CCDS32 LLCCSCP--RKTTSYPTPRPYPKPAPSSGKDYV 190 200 210 >>CCDS54081.1 CLDN7 gene_id:1366|Hs108|chr17 (145 aa) initn: 878 init1: 864 opt: 864 Z-score: 1129.0 bits: 215.4 E(32554): 1.5e-56 Smith-Waterman score: 864; 98.5% identity (100.0% similar) in 132 aa overlap (1-132:1-132) 10 20 30 40 50 60 pF1KB6 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA ::::::::::.. CCDS54 GGGIIFIVAGMSLALPSLLAGQGLP 130 140 >>CCDS44125.1 CLDN19 gene_id:149461|Hs108|chr1 (211 aa) initn: 841 init1: 841 opt: 841 Z-score: 1096.7 bits: 210.0 E(32554): 9.1e-55 Smith-Waterman score: 841; 53.6% identity (83.4% similar) in 211 aa overlap (1-211:1-211) 10 20 30 40 50 60 pF1KB6 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG ::::::::::. .:: ::::..: ::.:::..:::::: :::: ..:.::::.:..:::: CCDS44 MANSGLQLLGYFLALGGWVGIIASTALPQWKQSSYAGDAIITAVGLYEGLWMSCASQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM ...::.:::.:::.. .:..::::::...:::.:: ....:::::: : .. . :.:.:. CCDS44 QVQCKLYDSLLALDGHIQSARALMVVAVLLGFVAMVLSVVGMKCTRVGDSNPIAKGRVAI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA .:: .::.::: .:.: :::. .. .:.:: :.: .::::::.:.:::...:..:::. CCDS44 AGGALFILAGLCTLTAVSWYATLVTQEFFNPSTPVNARYEFGPALFVGWASAGLAVLGGS 130 140 150 160 170 180 190 200 210 pF1KB6 LLSCSCPGNESKAGYRAPRSYPKSNSSKEYV .: :.:: : . : : ...::: CCDS44 FLCCTCPEPERPNSSPQPYRPGPSAAAREYV 190 200 210 >>CCDS471.1 CLDN19 gene_id:149461|Hs108|chr1 (224 aa) initn: 819 init1: 819 opt: 830 Z-score: 1082.1 bits: 207.3 E(32554): 6e-54 Smith-Waterman score: 830; 53.1% identity (82.9% similar) in 211 aa overlap (1-211:1-211) 10 20 30 40 50 60 pF1KB6 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG ::::::::::. .:: ::::..: ::.:::..:::::: :::: ..:.::::.:..:::: CCDS47 MANSGLQLLGYFLALGGWVGIIASTALPQWKQSSYAGDAIITAVGLYEGLWMSCASQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM ...::.:::.:::.. .:..::::::...:::.:: ....:::::: : .. . :.:.:. CCDS47 QVQCKLYDSLLALDGHIQSARALMVVAVLLGFVAMVLSVVGMKCTRVGDSNPIAKGRVAI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA .:: .::.::: .:.: :::. .. .:.:: :.: .::::::.:.:::...:..:::. CCDS47 AGGALFILAGLCTLTAVSWYATLVTQEFFNPSTPVNARYEFGPALFVGWASAGLAVLGGS 130 140 150 160 170 180 190 200 210 pF1KB6 LLSCSCPGNESKAGYRAPRSYPKSNSSKEYV .: :.:: : . : : ...: : CCDS47 FLCCTCPEPERPNSSPQPYRPGPSAAAREPVVKLPASAKGPLGV 190 200 210 220 >>CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 (209 aa) initn: 744 init1: 438 opt: 714 Z-score: 932.0 bits: 179.5 E(32554): 1.4e-45 Smith-Waterman score: 714; 44.1% identity (82.0% similar) in 211 aa overlap (1-211:1-209) 10 20 30 40 50 60 pF1KB6 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG ::. :::..:...:.:::.... : :.:.:..... :.::.:.:....::::.::.:::: CCDS55 MASMGLQVMGIALAVLGWLAVMLCCALPMWRVTAFIGSNIVTSQTIWEGLWMNCVVQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM .:.::.:::.::: :::.:::...:.... :.......: ::: : .:. ::. . CCDS55 QMQCKVYDSLLALPQDLQAARALVIISIIVAALGVLLSVVGGKCTNCL-EDESAKAKTMI 70 80 90 100 110 130 140 150 160 170 180 pF1KB6 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA .:..:..::: ..: :: .:.:. ::::::. .. : :.: ....:::.:.:..:::. CCDS55 VAGVVFLLAGLMVIVPVSWTAHNIIQDFYNPLVASGQKREMGASLYVGWAASGLLLLGGG 120 130 140 150 160 170 190 200 210 pF1KB6 LLSCSCPGNESKAGYRAPRSYPKSNSSKEYV :: :.:: .: : : : .: ....:: CCDS55 LLCCNCPPRTDKP-YSAKYSAARSAAASNYV 180 190 200 >>CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 (220 aa) initn: 726 init1: 430 opt: 710 Z-score: 926.5 bits: 178.5 E(32554): 2.8e-45 Smith-Waterman score: 710; 48.8% identity (80.1% similar) in 201 aa overlap (5-200:4-203) 10 20 30 40 50 60 pF1KB6 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG ::.. : ..:.:::.: ..: :.:.:..:.. :.::::.: ...::::.::.:::: CCDS55 MSMGLEITGTALAVLGWLGTIVCCALPMWRVSAFIGSNIITSQNIWEGLWMNCVVQSTG 10 20 30 40 50 70 80 90 100 110 120 pF1KB6 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM .:.::.:::.::: :::.:::.::...:. ....:: .: .:: : :: .: :.:.. CCDS55 QMQCKVYDSLLALPQDLQAARALIVVAILLAAFGLLVALVGAQCTNCVQDDTAK-AKITI 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB6 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA .:..:..:.: .:: :: .. :. :::::..: : :.: ....:::..:: .:::: CCDS55 VAGVLFLLAALLTLVPVSWSANTIIRDFYNPVVPEAQKREMGAGLYVGWAAAALQLLGGA 120 130 140 150 160 170 190 200 210 pF1KB6 LLSCSCPGNE-----SKAGYRAPRSYPKSNSSKEYV :: :::: : .:. : :::: CCDS55 LLCCSCPPREKKYTATKVVYSAPRSTGPGASLGTGYDRKDYV 180 190 200 210 220 >>CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 (217 aa) initn: 443 init1: 443 opt: 700 Z-score: 913.6 bits: 176.1 E(32554): 1.4e-44 Smith-Waterman score: 700; 45.2% identity (79.0% similar) in 219 aa overlap (1-211:1-217) 10 20 30 40 50 pF1KB6 MANSGLQLLGFSMALLGWVG-LVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQST ::..::.:::...:.:::.: ::.: :.: :..... :..:..::....::::.::.::: CCDS10 MASTGLELLGMTLAVLGWLGTLVSC-ALPLWKVTAFIGNSIVVAQVVWEGLWMSCVVQST 10 20 30 40 50 60 70 80 90 100 110 pF1KB6 GMMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIA :.:.::.:::.::: :::.::: :..:.:..:...:: : .:: : .:. ::::. CCDS10 GQMQCKVYDSLLALPQDLQAARALCVIALLLALLGLLVAITGAQCTTCV-EDEGAKARIV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB6 MGGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGG . .:.:...::. .:. : .: :. ::::::. .: :.: ....:::..::..::: CCDS10 LTAGVILLLAGILVLIPVCWTAHAIIQDFYNPLVAEALKRELGASLYLGWAAAALLMLGG 120 130 140 150 160 170 180 190 200 210 pF1KB6 ALLSCSCPGNE------SKAGYRAP-RSYPKSNSSKEYV .:: :.:: . . :: : :: .. ....:: CCDS10 GLLCCTCPPPQVERPRGPRLGYSIPSRSGASGLDKRDYV 180 190 200 210 >>CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 (220 aa) initn: 676 init1: 407 opt: 685 Z-score: 894.0 bits: 172.5 E(32554): 1.8e-43 Smith-Waterman score: 685; 44.9% identity (78.7% similar) in 216 aa overlap (1-210:1-214) 10 20 30 40 50 pF1KB6 MANSGLQLLGFSMALLGWV-GLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQST ::..:.:.:: ..::::: :::.: :.:.:..... :..:..::....::::.::.::: CCDS10 MASAGMQILGVVLTLLGWVNGLVSC-ALPMWKVTAFIGNSIVVAQVVWEGLWMSCVVQST 10 20 30 40 50 60 70 80 90 100 110 pF1KB6 GMMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIA :.:.::.:::.::: :::.::: :..:........: : ::: : ..: .:::.. CCDS10 GQMQCKVYDSLLALPQDLQAARALCVIALLVALFGLLVYLAGAKCTTCV-EEKDSKARLV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB6 MGGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGG . .::.:...:. .:. : .: :. ::::::. : :.: ....:::.:.:..::: CCDS10 LTSGIVFVISGVLTLIPVCWTAHAIIRDFYNPLVAEAQKRELGASLYLGWAASGLLLLGG 120 130 140 150 160 170 180 190 200 210 pF1KB6 ALLSCSCP--GNESKAGY--RAPRSYPK-SNSSKEYV .:: :.:: :... . : : : : : . .:: CCDS10 GLLCCTCPSGGSQGPSHYMARYSTSAPAISRGPSEYPTKNYV 180 190 200 210 220 >>CCDS13763.2 CLDN5 gene_id:7122|Hs108|chr22 (303 aa) initn: 663 init1: 412 opt: 663 Z-score: 863.4 bits: 167.3 E(32554): 9e-42 Smith-Waterman score: 663; 43.8% identity (74.9% similar) in 219 aa overlap (1-211:86-303) 10 20 30 pF1KB6 MANSGLQLLGFSMALLGWVGLVACTAIPQW :....:..::. . :.:: ::. ..:.: CCDS13 GAKAPGPAQGAAQHGLGGSAGLRVRVSPLAMGSAALEILGLVLCLVGWGGLILACGLPMW 60 70 80 90 100 110 40 50 60 70 80 90 pF1KB6 QMSSYAGDNIITAQAMYKGLWMDCVTQSTGMMSCKMYDSVLALSAALQATRALMVVSLVL :.... ::.:::. .:::::.::.:::: :.::.::::::::. .::.::: : ...: CCDS13 QVTAFLDHNIVTAQTTWKGLWMSCVVQSTGHMQCKVYDSVLALSTEVQAARALTVSAVLL 120 130 140 150 160 170 100 110 120 130 140 150 pF1KB6 GFLAMFVATMGMKCTRCGGDDKVKKARIAMGGGIIFIVAGLAALVACSWYGHQIVTDFYN .:.:.::. : .:: : . .: ::.:. ::.... :: ::: :... .: .::. CCDS13 AFVALFVTLAGAQCTTCVAPGPAK-ARVALTGGVLYLFCGLLALVPLCWFANIVVREFYD 180 190 200 210 220 230 160 170 180 190 200 pF1KB6 PLIPTNIKYEFGPAIFIGWAGSALVILGGALLSCS---CPGNES---KAGYRAPRSYPKS : .:.. :::.: :..::::..::...:: :: :. : : . . : ::: . CCDS13 PSVPVSQKYELGAALYIGWAATALLMVGGCLLCCGAWVCTGRPDLSFPVKYSAPRRPTAT 240 250 260 270 280 290 210 pF1KB6 NS--SKEYV .. .:.:: CCDS13 GDYDKKNYV 300 211 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 11:30:50 2016 done: Fri Nov 4 11:30:51 2016 Total Scan time: 1.750 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]