FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0494, 218 aa 1>>>pF1KE0494 218 - 218 aa - 218 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.4787+/-0.000735; mu= 18.8316+/- 0.044 mean_var=69.6923+/-14.126, 0's: 0 Z-trim(109.3): 38 B-trim: 0 in 0/52 Lambda= 0.153632 statistics sampled from 10767 (10805) to 10767 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.697), E-opt: 0.2 (0.332), width: 16 Scan time: 2.240 The best scores are: opt bits E(32554) CCDS13763.2 CLDN5 gene_id:7122|Hs108|chr22 ( 303) 1492 339.3 1.6e-93 CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 ( 217) 826 191.5 3.4e-49 CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 ( 220) 813 188.6 2.6e-48 CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 ( 220) 807 187.3 6.4e-48 CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 ( 209) 762 177.3 6.2e-45 CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 ( 211) 684 160.0 1e-39 CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 ( 211) 658 154.3 5.4e-38 CCDS44125.1 CLDN19 gene_id:149461|Hs108|chr1 ( 211) 641 150.5 7.4e-37 CCDS471.1 CLDN19 gene_id:149461|Hs108|chr1 ( 224) 641 150.5 7.7e-37 CCDS13587.1 CLDN8 gene_id:9073|Hs108|chr21 ( 225) 630 148.1 4.2e-36 CCDS13586.1 CLDN17 gene_id:26285|Hs108|chr21 ( 224) 579 136.8 1.1e-32 CCDS13645.1 CLDN14 gene_id:23562|Hs108|chr21 ( 239) 558 132.2 2.8e-31 CCDS14524.1 CLDN2 gene_id:9075|Hs108|chrX ( 230) 498 118.8 2.7e-27 CCDS9476.1 CLDN10 gene_id:9071|Hs108|chr13 ( 228) 466 111.7 3.7e-25 CCDS5717.1 CLDN15 gene_id:24146|Hs108|chr7 ( 228) 465 111.5 4.3e-25 CCDS54081.1 CLDN7 gene_id:1366|Hs108|chr17 ( 145) 454 108.9 1.7e-24 CCDS5249.1 CLDN20 gene_id:49861|Hs108|chr6 ( 219) 444 106.9 1.1e-23 CCDS53306.1 CLDN19 gene_id:149461|Hs108|chr1 ( 218) 428 103.3 1.2e-22 CCDS54824.1 CLDN24 gene_id:100132463|Hs108|chr4 ( 220) 426 102.9 1.7e-22 CCDS9475.1 CLDN10 gene_id:9071|Hs108|chr13 ( 226) 413 100.0 1.3e-21 CCDS43286.1 CLDN22 gene_id:53842|Hs108|chr4 ( 220) 406 98.4 3.6e-21 CCDS44736.1 CLDN25 gene_id:644672|Hs108|chr11 ( 229) 366 89.6 1.8e-18 CCDS3213.1 CLDN11 gene_id:5010|Hs108|chr3 ( 207) 331 81.8 3.5e-16 CCDS3095.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 316 78.6 4.2e-15 CCDS33862.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 306 76.3 1.9e-14 >>CCDS13763.2 CLDN5 gene_id:7122|Hs108|chr22 (303 aa) initn: 1492 init1: 1492 opt: 1492 Z-score: 1792.6 bits: 339.3 E(32554): 1.6e-93 Smith-Waterman score: 1492; 100.0% identity (100.0% similar) in 218 aa overlap (1-218:86-303) 10 20 30 pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMW :::::::::::::::::::::::::::::: CCDS13 GAKAPGPAQGAAQHGLGGSAGLRVRVSPLAMGSAALEILGLVLCLVGWGGLILACGLPMW 60 70 80 90 100 110 40 50 60 70 80 90 pF1KE0 QVTAFLDHNIVTAQTTWKGLWMSCVVQSTGHMQCKVYDSVLALSTEVQAARALTVSAVLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 QVTAFLDHNIVTAQTTWKGLWMSCVVQSTGHMQCKVYDSVLALSTEVQAARALTVSAVLL 120 130 140 150 160 170 100 110 120 130 140 150 pF1KE0 AFVALFVTLAGAQCTTCVAPGPAKARVALTGGVLYLFCGLLALVPLCWFANIVVREFYDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 AFVALFVTLAGAQCTTCVAPGPAKARVALTGGVLYLFCGLLALVPLCWFANIVVREFYDP 180 190 200 210 220 230 160 170 180 190 200 210 pF1KE0 SVPVSQKYELGAALYIGWAATALLMVGGCLLCCGAWVCTGRPDLSFPVKYSAPRRPTATG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SVPVSQKYELGAALYIGWAATALLMVGGCLLCCGAWVCTGRPDLSFPVKYSAPRRPTATG 240 250 260 270 280 290 pF1KE0 DYDKKNYV :::::::: CCDS13 DYDKKNYV 300 >>CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 (217 aa) initn: 805 init1: 787 opt: 826 Z-score: 996.6 bits: 191.5 E(32554): 3.4e-49 Smith-Waterman score: 826; 54.5% identity (81.5% similar) in 222 aa overlap (1-218:1-217) 10 20 30 40 50 60 pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG :.:..::.::..: ..:: : ...:.::.:.::::. ..::.::..:.:::::::::::: CCDS10 MASTGLELLGMTLAVLGWLGTLVSCALPLWKVTAFIGNSIVVAQVVWEGLWMSCVVQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGPAKARVALT .::::::::.::: ..:::::: : :.:::...:.:...:::::::: ::::..:: CCDS10 QMQCKVYDSLLALPQDLQAARALCVIALLLALLGLLVAITGAQCTTCVEDEGAKARIVLT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 GGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGCL .::. :. :.:.:.:.:: :. ....::.: : . : ::::.::.::::.::::.:: : CCDS10 AGVILLLAGILVLIPVCWTAHAIIQDFYNPLVAEALKRELGASLYLGWAAAALLMLGGGL 130 140 150 160 170 180 190 200 210 pF1KE0 LCCGAWVCTGRPDLSFP----VKYSAPRRPTATGDYDKKNYV ::: .: :.. : . :: : : :.: ::..:: CCDS10 LCC---TCPP-PQVERPRGPRLGYSIPSRSGASG-LDKRDYV 190 200 210 >>CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 (220 aa) initn: 820 init1: 771 opt: 813 Z-score: 981.0 bits: 188.6 E(32554): 2.6e-48 Smith-Waterman score: 813; 55.0% identity (77.9% similar) in 222 aa overlap (3-218:2-220) 10 20 30 40 50 60 pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG : .::: : .: ..:: : :. :.::::.:.::. ::.:.:. :.::::.::::::: CCDS55 MSMGLEITGTALAVLGWLGTIVCCALPMWRVSAFIGSNIITSQNIWEGLWMNCVVQSTG 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGPAKARVALT .::::::::.::: ..:::::: : :.::: .:.:.:.:::::.:: :::..... CCDS55 QMQCKVYDSLLALPQDLQAARALIVVAILLAAFGLLVALVGAQCTNCVQDDTAKAKITIV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 GGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGCL .:::.:. .::.:::. : :: ..:.::.: :: .:: :.::.::.::::.:: ..:: : CCDS55 AGVLFLLAALLTLVPVSWSANTIIRDFYNPVVPEAQKREMGAGLYVGWAAAALQLLGGAL 120 130 140 150 160 170 190 200 210 pF1KE0 LCCGAWVCTGRPD--LSFPVKYSAPRR--PTAT-GD-YDKKNYV :::. : : . : ::::: : :. : ::.:.:: CCDS55 LCCS---CPPREKKYTATKVVYSAPRSTGPGASLGTGYDRKDYV 180 190 200 210 220 >>CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 (220 aa) initn: 815 init1: 784 opt: 807 Z-score: 973.8 bits: 187.3 E(32554): 6.4e-48 Smith-Waterman score: 807; 52.7% identity (80.9% similar) in 220 aa overlap (1-218:1-220) 10 20 30 40 50 60 pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG :.::...:::.:: :.:: . ...:.::::.::::. ..::.::..:.:::::::::::: CCDS10 MASAGMQILGVVLTLLGWVNGLVSCALPMWKVTAFIGNSIVVAQVVWEGLWMSCVVQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGPAKARVALT .::::::::.::: ..:::::: : :.:.:. .:.: ::::.::::: .:::..:: CCDS10 QMQCKVYDSLLALPQDLQAARALCVIALLVALFGLLVYLAGAKCTTCVEEKDSKARLVLT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 GGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGCL .:..... :.:.:.:.:: :. ..:.::.: : .:: ::::.::.::::..::..:: : CCDS10 SGIVFVISGVLTLIPVCWTAHAIIRDFYNPLVAEAQKRELGASLYLGWAASGLLLLGGGL 130 140 150 160 170 180 190 200 210 pF1KE0 LCCGAWVCTGRPDLSFPVKYS--APRRPTATGDYDKKNYV ::: .. . ..:: :: . ..: :::: CCDS10 LCCTCPSGGSQGPSHYMARYSTSAPAISRGPSEYPTKNYV 190 200 210 220 >>CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 (209 aa) initn: 741 init1: 720 opt: 762 Z-score: 920.2 bits: 177.3 E(32554): 6.2e-45 Smith-Waterman score: 762; 48.3% identity (82.3% similar) in 209 aa overlap (1-209:1-206) 10 20 30 40 50 60 pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG :.: .:...:..: ..:: ...: :.::::.::::. ::::.:: :.::::.::::::: CCDS55 MASMGLQVMGIALAVLGWLAVMLCCALPMWRVTAFIGSNIVTSQTIWEGLWMNCVVQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGPAKARVALT .::::::::.::: ..::::::.. ....: ........:..::.:. :::.. .. CCDS55 QMQCKVYDSLLALPQDLQAARALVIISIIVAALGVLLSVVGGKCTNCLEDESAKAKTMIV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 GGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGCL .::..:. ::...::. : :. ....::.: : .:: :.::.::.::::..::..:: : CCDS55 AGVVFLLAGLMVIVPVSWTAHNIIQDFYNPLVASGQKREMGASLYVGWAASGLLLLGGGL 130 140 150 160 170 180 190 200 210 pF1KE0 LCCGAWVCTGRPDLSFPVKYSAPRRPTATGDYDKKNYV :::. : : : . .:::: : .:. CCDS55 LCCN---CPPRTDKPYSAKYSAARSAAASNYV 190 200 >>CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 (211 aa) initn: 662 init1: 397 opt: 684 Z-score: 826.7 bits: 160.0 E(32554): 1e-39 Smith-Waterman score: 684; 45.3% identity (74.3% similar) in 214 aa overlap (1-212:1-210) 10 20 30 40 50 60 pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG :..:.:..::..: ..:: : :.. .::.:.. .. ::::::. ..::::::: :::: CCDS32 MANAGLQLLGFILAFLGWIGAIVSTALPQWRIYSYAGDNIVTAQAMYEGLWMSCVSQSTG 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGPA-KARVAL ..::::.::.: ::. .::.::: : ..::. .:.::. .: .: :. . : :.:. CCDS32 QIQCKVFDSLLNLSSTLQATRALMVVGILLGVIAIFVATVGMKCMKCLEDDEVQKMRMAV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 TGGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGC ::...:. :: :: :..: .:.::::: .::. .::.: ::. ::::..: ..:: CCDS32 IGGAIFLLAGLAILVATAWYGNRIVQEFYDPMTPVNARYEFGQALFTGWAAASLCLLGGA 130 140 150 160 170 180 180 190 200 210 pF1KE0 LLCCGAWVCTGRPDLSFPVKYSAPR-RPTATGDYDKKNYV ::::. : : :.:. :. :.. :: CCDS32 LLCCS---CP-RKTTSYPTPRPYPKPAPSSGKDYV 190 200 210 >>CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 (211 aa) initn: 663 init1: 412 opt: 658 Z-score: 795.5 bits: 154.3 E(32554): 5.4e-38 Smith-Waterman score: 658; 44.7% identity (76.2% similar) in 206 aa overlap (1-204:1-203) 10 20 30 40 50 60 pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG :....:..::. . :.:: ::. ..:.::.... ::.:::. .:::::.::.:::: CCDS11 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGPAK-ARVAL :.::.::::::::. .::.::: : ...:.:.:.::. : .:: : . .: ::.:. CCDS11 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 TGGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGC ::.... :: ::: :... .: .::.: .:.. :::.: :..::::..::...:: CCDS11 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA 130 140 150 160 170 180 180 190 200 210 pF1KE0 LLCCGAWVCTGRPDLS-FPVKYSAPRRPTATGDYDKKNYV :: :. : : . . . : : :. CCDS11 LLSCS---CPGNESKAGYRVPRSYPKSNSSKEYV 190 200 210 >>CCDS44125.1 CLDN19 gene_id:149461|Hs108|chr1 (211 aa) initn: 625 init1: 361 opt: 641 Z-score: 775.2 bits: 150.5 E(32554): 7.4e-37 Smith-Waterman score: 641; 44.4% identity (76.3% similar) in 207 aa overlap (1-206:1-201) 10 20 30 40 50 60 pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG :....:..:: : : :: :.: . .::.:. ... :.:: ..::::::. :::: CCDS44 MANSGLQLLGYFLALGGWVGIIASTALPQWKQSSYAGDAIITAVGLYEGLWMSCASQSTG 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGP-AKARVAL ..:::.:::.:::. ..:.:::: : ::::.:::. ....: .:: .: ::.:::. CCDS44 QVQCKLYDSLLALDGHIQSARALMVVAVLLGFVAMVLSVVGMKCTRVGDSNPIAKGRVAI 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 TGGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGC .::.:... :: .:. . :.:..:..::..::.::. .::.: ::..:::...: ..:: CCDS44 AGGALFILAGLCTLTAVSWYATLVTQEFFNPSTPVNARYEFGPALFVGWASAGLAVLGGS 130 140 150 160 170 180 180 190 200 210 pF1KE0 LLCCGAWVCTGRPDLSFPVKYSAPRRPTATGDYDKKNYV .::: .: :. : . : :: CCDS44 FLCC---TC---PEPERPNSSPQPYRPGPSAAAREYV 190 200 210 >>CCDS471.1 CLDN19 gene_id:149461|Hs108|chr1 (224 aa) initn: 625 init1: 361 opt: 641 Z-score: 774.8 bits: 150.5 E(32554): 7.7e-37 Smith-Waterman score: 641; 44.4% identity (76.3% similar) in 207 aa overlap (1-206:1-201) 10 20 30 40 50 60 pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG :....:..:: : : :: :.: . .::.:. ... :.:: ..::::::. :::: CCDS47 MANSGLQLLGYFLALGGWVGIIASTALPQWKQSSYAGDAIITAVGLYEGLWMSCASQSTG 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGP-AKARVAL ..:::.:::.:::. ..:.:::: : ::::.:::. ....: .:: .: ::.:::. CCDS47 QVQCKLYDSLLALDGHIQSARALMVVAVLLGFVAMVLSVVGMKCTRVGDSNPIAKGRVAI 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 TGGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGC .::.:... :: .:. . :.:..:..::..::.::. .::.: ::..:::...: ..:: CCDS47 AGGALFILAGLCTLTAVSWYATLVTQEFFNPSTPVNARYEFGPALFVGWASAGLAVLGGS 130 140 150 160 170 180 180 190 200 210 pF1KE0 LLCCGAWVCTGRPDLSFPVKYSAPRRPTATGDYDKKNYV .::: .: :. : . : :: CCDS47 FLCC---TC---PEPERPNSSPQPYRPGPSAAAREPVVKLPASAKGPLGV 190 200 210 220 >>CCDS13587.1 CLDN8 gene_id:9073|Hs108|chr21 (225 aa) initn: 614 init1: 359 opt: 630 Z-score: 761.6 bits: 148.1 E(32554): 4.2e-36 Smith-Waterman score: 630; 42.3% identity (76.1% similar) in 213 aa overlap (1-212:1-209) 10 20 30 40 50 60 pF1KE0 MGSAALEILGLVLCLVGWGGLILACGLPMWQVTAFLDHNIVTAQTTWKGLWMSCVVQSTG :.. :::: :: : :: : . . .:.:.:.::...:::. .. :.::::.:: :.. CCDS13 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI 10 20 30 40 50 60 70 80 90 100 110 pF1KE0 HMQCKVYDSVLALSTEVQAARALTVSAVLLAFVALFVTLAGAQCTTCVAPGP-AKARVAL .::::.:::.:::: ..::::.: .: ...:.:..... : .:: :.. . .::.. : CCDS13 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE0 TGGVLYLFCGLLALVPLCWFANIVVREFYDPSVPVSQKYELGAALYIGWAATALLMVGGC :.:..... :...:.:. : :: ..:.::. : :.:: ::: :::.::... .:.::: CCDS13 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA 130 140 150 160 170 180 180 190 200 210 pF1KE0 LLCCGAWVCTGRPDLSFPVKYSAPRRPTATGDYDKKNYV :.:: : .. . :. .:: : . :. .: CCDS13 LFCC--VFCCNEKSSSY--RYSIPSHRTTQKSYHTGKKSPSVYSRSQYV 190 200 210 220 218 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 04:21:39 2016 done: Thu Nov 3 04:21:40 2016 Total Scan time: 2.240 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]