FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB0998, 230 aa 1>>>pF1KB0998 230 - 230 aa - 230 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.0588+/-0.000674; mu= 16.2141+/- 0.041 mean_var=66.6318+/-13.389, 0's: 0 Z-trim(110.1): 44 B-trim: 0 in 0/51 Lambda= 0.157121 statistics sampled from 11332 (11376) to 11332 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.715), E-opt: 0.2 (0.349), width: 16 Scan time: 2.330 The best scores are: opt bits E(32554) CCDS14524.1 CLDN2 gene_id:9075|Hs108|chrX ( 230) 1507 349.7 9e-97 CCDS13645.1 CLDN14 gene_id:23562|Hs108|chr21 ( 239) 741 176.1 1.7e-44 CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 ( 220) 591 142.1 2.8e-34 CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 ( 209) 578 139.1 2.1e-33 CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 ( 220) 576 138.7 2.9e-33 CCDS471.1 CLDN19 gene_id:149461|Hs108|chr1 ( 224) 576 138.7 3e-33 CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 ( 217) 571 137.5 6.4e-33 CCDS44125.1 CLDN19 gene_id:149461|Hs108|chr1 ( 211) 565 136.2 1.6e-32 CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 ( 211) 559 134.8 4.1e-32 CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 ( 211) 529 128.0 4.6e-30 CCDS5249.1 CLDN20 gene_id:49861|Hs108|chr6 ( 219) 525 127.1 8.9e-30 CCDS13586.1 CLDN17 gene_id:26285|Hs108|chr21 ( 224) 504 122.4 2.4e-28 CCDS13587.1 CLDN8 gene_id:9073|Hs108|chr21 ( 225) 503 122.1 2.9e-28 CCDS13763.2 CLDN5 gene_id:7122|Hs108|chr22 ( 303) 498 121.1 8e-28 CCDS53306.1 CLDN19 gene_id:149461|Hs108|chr1 ( 218) 447 109.4 1.9e-24 CCDS5717.1 CLDN15 gene_id:24146|Hs108|chr7 ( 228) 429 105.4 3.3e-23 CCDS54081.1 CLDN7 gene_id:1366|Hs108|chr17 ( 145) 392 96.9 7.6e-21 CCDS9476.1 CLDN10 gene_id:9071|Hs108|chr13 ( 228) 392 97.0 1.1e-20 CCDS9475.1 CLDN10 gene_id:9071|Hs108|chr13 ( 226) 364 90.6 8.8e-19 CCDS54824.1 CLDN24 gene_id:100132463|Hs108|chr4 ( 220) 354 88.4 4.1e-18 CCDS43286.1 CLDN22 gene_id:53842|Hs108|chr4 ( 220) 345 86.3 1.7e-17 CCDS44736.1 CLDN25 gene_id:644672|Hs108|chr11 ( 229) 308 77.9 5.9e-15 CCDS33862.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 293 74.6 6.9e-14 CCDS3095.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 287 73.2 1.8e-13 CCDS3213.1 CLDN11 gene_id:5010|Hs108|chr3 ( 207) 261 67.3 8.8e-12 >>CCDS14524.1 CLDN2 gene_id:9075|Hs108|chrX (230 aa) initn: 1507 init1: 1507 opt: 1507 Z-score: 1850.8 bits: 349.7 E(32554): 9e-97 Smith-Waterman score: 1507; 100.0% identity (100.0% similar) in 230 aa overlap (1-230:1-230) 10 20 30 40 50 60 pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKDRVAVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKDRVAVA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB0 GGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 GGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGII 130 140 150 160 170 180 190 200 210 220 230 pF1KB0 LCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV 190 200 210 220 230 >>CCDS13645.1 CLDN14 gene_id:23562|Hs108|chr21 (239 aa) initn: 766 init1: 707 opt: 741 Z-score: 912.2 bits: 176.1 E(32554): 1.7e-44 Smith-Waterman score: 741; 47.8% identity (78.3% similar) in 230 aa overlap (1-227:1-226) 10 20 30 40 50 60 pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG ::: ..::.:..:..::..:::.. .:: :. ...::..:.:::.. :::::::. :::: CCDS13 MASTAVQLLGFLLSFLGMVGTLITTILPHWRRTAHVGTNILTAVSYLKGLWMECVWHSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKDRVAVA : ::.:: .::.:: :.:::.:.:: : .:..:: .:.::.:: . . :: :. CCDS13 IYQCQIYRSLLALPQDLQAARALMVISCLLSGIACACAVIGMKCTRCAKGTPAKTTFAIL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB0 GGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGII ::..:::.::: .. :.:. . ....::.::.:..::::::.:::::.::: .:::.: . CCDS13 GGTLFILAGLLCMVAVSWTTNDVVQNFYNPLLPSGMKFEIGQALYLGFISSSLSLIGGTL 130 140 150 160 170 180 190 200 210 220 230 pF1KB0 LCFSCSSQRNRSNYYDAYQAQPLATRSSPR--PG-QPPKVKSEFNSYSLTGYV ::.::... : ::: : :: .. :. ::: . .. . :.: CCDS13 LCLSCQDEAP----YRPYQAPPRATTTTANTAPAYQPPAAYKDNRAPSVTSATHSGYRLN 190 200 210 220 230 CCDS13 DYV >>CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 (220 aa) initn: 625 init1: 574 opt: 591 Z-score: 728.9 bits: 142.1 E(32554): 2.8e-34 Smith-Waterman score: 591; 39.0% identity (78.6% similar) in 210 aa overlap (3-212:2-207) 10 20 30 40 50 60 pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG :.::...: :..:: :::.: :: :..:...:..:.:. .. .::::.:...::: CCDS55 MSMGLEITGTALAVLGWLGTIVCCALPMWRVSAFIGSNIITSQNIWEGLWMNCVVQSTG 10 20 30 40 50 70 80 90 100 110 120 pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKDRVAVA :: .:..::.:: :.:::.:..:.. ..... ....:: .:: :.. :: ..... CCDS55 QMQCKVYDSLLALPQDLQAARALIVVAILLAAFGLLVALVGAQCTNCVQDDTAKAKITIV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB0 GGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGII .::.:.:..:: ..::.:. . :.::::.:.::...: :.: .::.: .. ..:..: . CCDS55 AGVLFLLAALLTLVPVSWSANTIIRDFYNPVVPEAQKREMGAGLYVGWAAAALQLLGGAL 120 130 140 150 160 170 190 200 210 220 230 pF1KB0 LCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV :: :: .... : : .. : ::. :: CCDS55 LCCSCPPREKK---YTATKVVYSAPRSTG-PGASLGTGYDRKDYV 180 190 200 210 220 >>CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 (209 aa) initn: 599 init1: 572 opt: 578 Z-score: 713.3 bits: 139.1 E(32554): 2.1e-33 Smith-Waterman score: 578; 39.4% identity (76.4% similar) in 208 aa overlap (1-208:1-203) 10 20 30 40 50 60 pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG :::.:::..: :..:: :.... :: :......:..:::. . .::::.:...::: CCDS55 MASMGLQVMGIALAVLGWLAVMLCCALPMWRVTAFIGSNIVTSQTIWEGLWMNCVVQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKDRVAVA :: .:..::.:: :.:::.:... : ...:. ..:::: .:: .. :: .. .. CCDS55 QMQCKVYDSLLALPQDLQAARALVIISIIVAALGVLLSVVGGKCTNCLEDESAKAKTMIV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB0 GGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGII .:: :.:.::. ..::.:. :.:..:::.::: ...: :.: .::.: .: . :..: . CCDS55 AGVVFLLAGLMVIVPVSWTAHNIIQDFYNPLVASGQKREMGASLYVGWAASGLLLLGGGL 130 140 150 160 170 180 190 200 210 220 230 pF1KB0 LCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV :: .: . .. :.:. :.::. CCDS55 LCCNCPPRTDKP-----YSAKYSAARSAAASNYV 190 200 >>CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 (220 aa) initn: 593 init1: 567 opt: 576 Z-score: 710.5 bits: 138.7 E(32554): 2.9e-33 Smith-Waterman score: 576; 39.8% identity (74.4% similar) in 211 aa overlap (1-209:1-211) 10 20 30 40 50 60 pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG ::: :.:..: .: ::: .. ::. :: ::.....: :::.: .:::: :...::: CCDS10 MASAGMQILGVVLTLLGWVNGLVSCALPMWKVTAFIGNSIVVAQVVWEGLWMSCVVQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKDRVAVA :: .:..::.:: :.:::.:. : . .. .. .. ..: .::. .:. .: :.... CCDS10 QMQCKVYDSLLALPQDLQAARALCVIALLVALFGLLVYLAGAKCTTCVEEKDSKARLVLT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB0 GGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGII .:. :...:.: .::: :. :.:.::::.::: ...: :.: .:::: .: . :..: . CCDS10 SGIVFVISGVLTLIPVCWTAHAIIRDFYNPLVAEAQKRELGASLYLGWAASGLLLLGGGL 130 140 150 160 170 180 190 200 210 220 230 pF1KB0 LCFSCSS--QRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV :: .: : ... :.:. :... : .: CCDS10 LCCTCPSGGSQGPSHYMARYSTSAPAISRGPSEYPTKNYV 190 200 210 220 >>CCDS471.1 CLDN19 gene_id:149461|Hs108|chr1 (224 aa) initn: 581 init1: 374 opt: 576 Z-score: 710.4 bits: 138.7 E(32554): 3e-33 Smith-Waterman score: 576; 40.6% identity (72.1% similar) in 219 aa overlap (1-218:1-219) 10 20 30 40 50 60 pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG ::. ::::.::.:.: : .: ... ::.:: :::.: .:.::::. .:::: ::..::: CCDS47 MANSGLQLLGYFLALGGWVGIIASTALPQWKQSSYAGDAIITAVGLYEGLWMSCASQSTG 10 20 30 40 50 60 70 80 90 100 110 pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCT-VFCQESRAKDRVAV .:: .:..::.: . ::.:.:.::.. .. .: ..:::::.:: : .. :: :::. CCDS47 QVQCKLYDSLLALDGHIQSARALMVVAVLLGFVAMVLSVVGMKCTRVGDSNPIAKGRVAI 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB0 AGGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGI :::..:::.:: . :.: . ..:..: .: . ..:.: ::..: :. .....: CCDS47 AGGALFILAGLCTLTAVSWYATLVTQEFFNPSTPVNARYEFGPALFVGWASAGLAVLGGS 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB0 ILCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV .:: .: . .. . :. : :. : : ..: CCDS47 FLCCTCPEPERPNSSPQPYRPGPSAAAREPVVKLPASAKGPLGV 190 200 210 220 >>CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 (217 aa) initn: 648 init1: 571 opt: 571 Z-score: 704.5 bits: 137.5 E(32554): 6.4e-33 Smith-Waterman score: 571; 43.2% identity (78.4% similar) in 185 aa overlap (1-185:1-185) 10 20 30 40 50 60 pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG ::: ::.:.:. :..:: :::::. :: ::.....: :::.: .:::: :...::: CCDS10 MASTGLELLGMTLAVLGWLGTLVSCALPLWKVTAFIGNSIVVAQVVWEGLWMSCVVQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKDRVAVA :: .:..::.:: :.:::.:. : . .. :. .....: .::. .. :: :.... CCDS10 QMQCKVYDSLLALPQDLQAARALCVIALLLALLGLLVAITGAQCTTCVEDEGAKARIVLT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB0 GGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGII .::...:.:.: .::: :. :.:..:::.::: ...: :.: .:::: .. . ...: . CCDS10 AGVILLLAGILVLIPVCWTAHAIIQDFYNPLVAEALKRELGASLYLGWAAAALLMLGGGL 130 140 150 160 170 180 190 200 210 220 230 pF1KB0 LCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV :: .: CCDS10 LCCTCPPPQVERPRGPRLGYSIPSRSGASGLDKRDYV 190 200 210 >>CCDS44125.1 CLDN19 gene_id:149461|Hs108|chr1 (211 aa) initn: 581 init1: 374 opt: 565 Z-score: 697.3 bits: 136.2 E(32554): 1.6e-32 Smith-Waterman score: 565; 42.0% identity (74.1% similar) in 205 aa overlap (1-204:1-205) 10 20 30 40 50 60 pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG ::. ::::.::.:.: : .: ... ::.:: :::.: .:.::::. .:::: ::..::: CCDS44 MANSGLQLLGYFLALGGWVGIIASTALPQWKQSSYAGDAIITAVGLYEGLWMSCASQSTG 10 20 30 40 50 60 70 80 90 100 110 pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCT-VFCQESRAKDRVAV .:: .:..::.: . ::.:.:.::.. .. .: ..:::::.:: : .. :: :::. CCDS44 QVQCKLYDSLLALDGHIQSARALMVVAVLLGFVAMVLSVVGMKCTRVGDSNPIAKGRVAI 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB0 AGGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGI :::..:::.:: . :.: . ..:..: .: . ..:.: ::..: :. .....: CCDS44 AGGALFILAGLCTLTAVSWYATLVTQEFFNPSTPVNARYEFGPALFVGWASAGLAVLGGS 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB0 ILCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV .:: .: . .. . :. : : CCDS44 FLCCTCPEPERPNSSPQPYRPGPSAAAREYV 190 200 210 >>CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 (211 aa) initn: 577 init1: 349 opt: 559 Z-score: 690.0 bits: 134.8 E(32554): 4.1e-32 Smith-Waterman score: 559; 39.0% identity (79.0% similar) in 195 aa overlap (1-194:1-195) 10 20 30 40 50 60 pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG ::. ::::.:. ..::: .: .. .:.:. :::.: .:.:: .. :::::.:.:.::: CCDS11 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG 10 20 30 40 50 60 70 80 90 100 110 pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKD-RVAV . .: .:...:.: : .::..:.::.: ... :: .....::.:: ....: :.:. CCDS11 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB0 AGGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGI .::..::..:: ... .: : :. :::.::.: ..:.:.: :...: .: . ...: CCDS11 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB0 ILCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV .: :: .......: CCDS11 LLSCSCPGNESKAGYRVPRSYPKSNSSKEYV 190 200 210 >>CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 (211 aa) initn: 527 init1: 335 opt: 529 Z-score: 653.2 bits: 128.0 E(32554): 4.6e-30 Smith-Waterman score: 530; 38.0% identity (71.0% similar) in 221 aa overlap (1-219:1-206) 10 20 30 40 50 60 pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG ::. ::::.:.::..:: .:..:. ::.:. ::.: .:::: .. .:::: :...::: CCDS32 MANAGLQLLGFILAFLGWIGAIVSTALPQWRIYSYAGDNIVTAQAMYEGLWMSCVSQSTG 10 20 30 40 50 60 70 80 90 100 110 pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRA--KDRVA :: ....::.: . .::..:.::.. .. .: ....:::.: . : :. : :.: CCDS32 QIQCKVFDSLLNLSSTLQATRALMVVGILLGVIAIFVATVGMKC-MKCLEDDEVQKMRMA 70 80 90 100 110 120 130 140 150 160 170 pF1KB0 VAGGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAG : ::..:.:.:: .. .:: . :...::.:..: . ..:.:.::. : .. . :..: CCDS32 VIGGAIFLLAGLAILVATAWYGNRIVQEFYDPMTPVNARYEFGQALFTGWAAASLCLLGG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB0 IILCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV .:: :: :. ..: : .::: : .: CCDS32 ALLC--CSCPRKTTSY-------P-----TPRPYPKPAPSSGKDYV 180 190 200 210 230 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 20:25:51 2016 done: Fri Nov 4 20:25:51 2016 Total Scan time: 2.330 Total Display time: -0.020 Function used was FASTA [36.3.4 Apr, 2011]