FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6906, 223 aa 1>>>pF1KB6906 223 - 223 aa - 223 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3981+/-0.000873; mu= 13.3239+/- 0.052 mean_var=72.6947+/-14.103, 0's: 0 Z-trim(107.0): 32 B-trim: 10 in 1/50 Lambda= 0.150426 statistics sampled from 9271 (9301) to 9271 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.657), E-opt: 0.2 (0.286), width: 16 Scan time: 1.940 The best scores are: opt bits E(32554) CCDS12708.1 ELSPBP1 gene_id:64100|Hs108|chr19 ( 223) 1663 369.9 7.1e-103 CCDS76869.1 MMP2 gene_id:4313|Hs108|chr16 ( 584) 458 108.7 8.2e-24 CCDS45487.1 MMP2 gene_id:4313|Hs108|chr16 ( 610) 458 108.7 8.5e-24 CCDS10752.1 MMP2 gene_id:4313|Hs108|chr16 ( 660) 458 108.7 9.1e-24 CCDS46512.1 FN1 gene_id:2335|Hs108|chr2 ( 657) 346 84.4 1.9e-16 CCDS46135.1 BSPH1 gene_id:100131137|Hs108|chr19 ( 132) 335 81.6 2.7e-16 CCDS2400.1 FN1 gene_id:2335|Hs108|chr2 (2176) 346 84.7 5e-16 CCDS77522.1 FN1 gene_id:2335|Hs108|chr2 (2240) 346 84.7 5.1e-16 CCDS77523.1 FN1 gene_id:2335|Hs108|chr2 (2265) 346 84.7 5.1e-16 CCDS77525.1 FN1 gene_id:2335|Hs108|chr2 (2267) 346 84.7 5.1e-16 CCDS42813.1 FN1 gene_id:2335|Hs108|chr2 (2296) 346 84.7 5.2e-16 CCDS46510.1 FN1 gene_id:2335|Hs108|chr2 (2330) 346 84.7 5.2e-16 CCDS2399.1 FN1 gene_id:2335|Hs108|chr2 (2355) 346 84.7 5.3e-16 CCDS77526.1 FN1 gene_id:2335|Hs108|chr2 (2446) 346 84.8 5.4e-16 CCDS42814.1 FN1 gene_id:2335|Hs108|chr2 (2477) 346 84.8 5.5e-16 >>CCDS12708.1 ELSPBP1 gene_id:64100|Hs108|chr19 (223 aa) initn: 1663 init1: 1663 opt: 1663 Z-score: 1960.4 bits: 369.9 E(32554): 7.1e-103 Smith-Waterman score: 1663; 99.6% identity (100.0% similar) in 223 aa overlap (1-223:1-223) 10 20 30 40 50 60 pF1KB6 MTRWSSYLLGWTTFLLYSYESSGGMHEECVFPFTYKGSVYFTCTHIHSLSPWCATRAVYN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MTRWSSYLLGWTTFLLYSYESSGGMHEECVFPFTYKGSVYFTCTHIHSLSPWCATRAVYN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 GQWKYCQSEDYPRCIFPFIYRGKAYNSCISQGSFLGSLWCSVTSVFDEKQQWKFCETNEY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GQWKYCQSEDYPRCIFPFIYRGKAYNSCISQGSFLGSLWCSVTSVFDEKQQWKFCETNEY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 GGNSLRKPCIFPSIYRNNVVSDCMEDESNKLWCPTTENMDKDGKWSFCADTRISALVPGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GGNSLRKPCIFPSIYRNNVVSDCMEDESNKLWCPTTENMDKDGKWSFCADTRISALVPGF 130 140 150 160 170 180 190 200 210 220 pF1KB6 PCHFPFNYKNKNYFNCTNKGSKENLVWCATSYNYDQDHTWVYC ::::::::::::::::::.:::::::::::::::::::::::: CCDS12 PCHFPFNYKNKNYFNCTNEGSKENLVWCATSYNYDQDHTWVYC 190 200 210 220 >>CCDS76869.1 MMP2 gene_id:4313|Hs108|chr16 (584 aa) initn: 459 init1: 173 opt: 458 Z-score: 541.0 bits: 108.7 E(32554): 8.2e-24 Smith-Waterman score: 458; 33.2% identity (62.7% similar) in 217 aa overlap (17-223:106-314) 10 20 30 40 pF1KB6 MTRWSSYLLGWTTFLLYSYESSGGMHEECVFPFT-YKGSVYFTCTH : .... :. . : : :. .: . CCDS76 SDVTPLRFSRIHDGEADIMINFGRWEHGDGYPFDGKDGLLAHAFAPGTGVGGDSHFDDDE 80 90 100 110 120 130 50 60 70 80 90 100 pF1KB6 IHSLSPWCATRAVY-NGQWKYCQSEDYPRCIFPFIYRGKAYNSCISQGSFLGSLWCSVTS . .:. ..:. : :.. .::. :::.. :: :::: . : : ::::.: CCDS76 LWTLGEGQVVRVKYGNADGEYCK--------FPFLFNGKEYNSCTDTGRSDGFLWCSTTY 140 150 160 170 180 110 120 130 140 150 pF1KB6 VFDEKQQWKFCETNE---YGGNSLRKPCIFPSIYRNNVVSDCM-EDESNKL-WCPTTENM :.. .. :: . .:::. .:: :: .... ..: : ... :: :::.. CCDS76 NFEKDGKYGFCPHEALFTMGGNAEGQPCKFPFRFQGTSYDSCTTEGRTDGYRWCGTTEDY 190 200 210 220 230 240 160 170 180 190 200 210 pF1KB6 DKDGKWSFCADTRISAL---VPGFPCHFPFNYKNKNYFNCTNKGSKENLVWCATSYNYDQ :.: :..:: .: .:.. : :: :::.. ...: .::. : ... .::::. :::. CCDS76 DRDKKYGFCPETAMSTVGGNSEGAPCVFPFTFLGNKYESCTSAGRSDGKMWCATTANYDD 250 260 270 280 290 300 220 pF1KB6 DHTWVYC :. : .: CCDS76 DRKWGFCPDQGYSLFLVAAHEFGHAMGLEHSQDPGALMAPIYTYTKNFRLSQDDIKGIQE 310 320 330 340 350 360 >>CCDS45487.1 MMP2 gene_id:4313|Hs108|chr16 (610 aa) initn: 459 init1: 173 opt: 458 Z-score: 540.7 bits: 108.7 E(32554): 8.5e-24 Smith-Waterman score: 458; 33.2% identity (62.7% similar) in 217 aa overlap (17-223:132-340) 10 20 30 40 pF1KB6 MTRWSSYLLGWTTFLLYSYESSGGMHEECVFPFT-YKGSVYFTCTH : .... :. . : : :. .: . CCDS45 SDVTPLRFSRIHDGEADIMINFGRWEHGDGYPFDGKDGLLAHAFAPGTGVGGDSHFDDDE 110 120 130 140 150 160 50 60 70 80 90 100 pF1KB6 IHSLSPWCATRAVY-NGQWKYCQSEDYPRCIFPFIYRGKAYNSCISQGSFLGSLWCSVTS . .:. ..:. : :.. .::. :::.. :: :::: . : : ::::.: CCDS45 LWTLGEGQVVRVKYGNADGEYCK--------FPFLFNGKEYNSCTDTGRSDGFLWCSTTY 170 180 190 200 210 110 120 130 140 150 pF1KB6 VFDEKQQWKFCETNE---YGGNSLRKPCIFPSIYRNNVVSDCM-EDESNKL-WCPTTENM :.. .. :: . .:::. .:: :: .... ..: : ... :: :::.. CCDS45 NFEKDGKYGFCPHEALFTMGGNAEGQPCKFPFRFQGTSYDSCTTEGRTDGYRWCGTTEDY 220 230 240 250 260 270 160 170 180 190 200 210 pF1KB6 DKDGKWSFCADTRISAL---VPGFPCHFPFNYKNKNYFNCTNKGSKENLVWCATSYNYDQ :.: :..:: .: .:.. : :: :::.. ...: .::. : ... .::::. :::. CCDS45 DRDKKYGFCPETAMSTVGGNSEGAPCVFPFTFLGNKYESCTSAGRSDGKMWCATTANYDD 280 290 300 310 320 330 220 pF1KB6 DHTWVYC :. : .: CCDS45 DRKWGFCPDQGYSLFLVAAHEFGHAMGLEHSQDPGALMAPIYTYTKNFRLSQDDIKGIQE 340 350 360 370 380 390 >>CCDS10752.1 MMP2 gene_id:4313|Hs108|chr16 (660 aa) initn: 459 init1: 173 opt: 458 Z-score: 540.2 bits: 108.7 E(32554): 9.1e-24 Smith-Waterman score: 458; 33.2% identity (62.7% similar) in 217 aa overlap (17-223:182-390) 10 20 30 40 pF1KB6 MTRWSSYLLGWTTFLLYSYESSGGMHEECVFPFT-YKGSVYFTCTH : .... :. . : : :. .: . CCDS10 SDVTPLRFSRIHDGEADIMINFGRWEHGDGYPFDGKDGLLAHAFAPGTGVGGDSHFDDDE 160 170 180 190 200 210 50 60 70 80 90 100 pF1KB6 IHSLSPWCATRAVY-NGQWKYCQSEDYPRCIFPFIYRGKAYNSCISQGSFLGSLWCSVTS . .:. ..:. : :.. .::. :::.. :: :::: . : : ::::.: CCDS10 LWTLGEGQVVRVKYGNADGEYCK--------FPFLFNGKEYNSCTDTGRSDGFLWCSTTY 220 230 240 250 260 110 120 130 140 150 pF1KB6 VFDEKQQWKFCETNE---YGGNSLRKPCIFPSIYRNNVVSDCM-EDESNKL-WCPTTENM :.. .. :: . .:::. .:: :: .... ..: : ... :: :::.. CCDS10 NFEKDGKYGFCPHEALFTMGGNAEGQPCKFPFRFQGTSYDSCTTEGRTDGYRWCGTTEDY 270 280 290 300 310 320 160 170 180 190 200 210 pF1KB6 DKDGKWSFCADTRISAL---VPGFPCHFPFNYKNKNYFNCTNKGSKENLVWCATSYNYDQ :.: :..:: .: .:.. : :: :::.. ...: .::. : ... .::::. :::. CCDS10 DRDKKYGFCPETAMSTVGGNSEGAPCVFPFTFLGNKYESCTSAGRSDGKMWCATTANYDD 330 340 350 360 370 380 220 pF1KB6 DHTWVYC :. : .: CCDS10 DRKWGFCPDQGYSLFLVAAHEFGHAMGLEHSQDPGALMAPIYTYTKNFRLSQDDIKGIQE 390 400 410 420 430 440 >>CCDS46512.1 FN1 gene_id:2335|Hs108|chr2 (657 aa) initn: 456 init1: 192 opt: 346 Z-score: 408.9 bits: 84.4 E(32554): 1.9e-16 Smith-Waterman score: 354; 29.9% identity (56.4% similar) in 234 aa overlap (5-223:238-461) 10 20 30 pF1KB6 MTRWSSYLLGWTTFLLYSYESSGGMHEECVFPFT .:: .: : .: ... : .:. : CCDS46 WMMVDCTCLGEGSGRITCTSRNRCNDQDTRTSYRIGDT----WSKKDNRGNLLQCIC--T 210 220 230 240 250 260 40 50 60 70 80 pF1KB6 YKGSVYFTC---THIHSLS----PWCATRA-VYNGQWKYCQSEDYPRCIFPFIYRGKAYN .: . : : ... : :. .:: ::. : . : : .:. : .:. CCDS46 GNGRGEWKCERHTSVQTTSSGSGPFTDVRAAVYQPQ-PHPQPPPYGHCVTD---SGVVYS 270 280 290 300 310 90 100 110 120 130 140 pF1KB6 SCISQGSFLGSLWCSVTSVFDEKQQWKFCETNEYGGNSLRKPCIFPSIYRNNVVSDCMED .. . :. : . . . . :. ::::: .::..: : . . .: . CCDS46 VGMQWLKTQGNKQMLCTCLGNGVSCQETAVTQTYGGNSNGEPCVLPFTYNGRTFYSCTTE 320 330 340 350 360 370 150 160 170 180 190 pF1KB6 --ESNKLWCPTTENMDKDGKWSFCADTRISALVPGFP-----CHFPFNYKNKNYFNCTNK ....::: :: :...: :.:::.: . . . : ::::: :.:.:: .::.. CCDS46 GRQDGHLWCSTTSNYEQDQKYSFCTDHTVLVQTRGGNSNGALCHFPFLYNNHNYTDCTSE 380 390 400 410 420 430 200 210 220 pF1KB6 GSKENLVWCATSYNYDQDHTWVYC : ..:. ::.:. ::: :. . .: CCDS46 GRRDNMKWCGTTQNYDADQKFGFCPMAAHEEICTTNEGVMYRIGDQWDKQHDMGHMMRCT 440 450 460 470 480 490 >>CCDS46135.1 BSPH1 gene_id:100131137|Hs108|chr19 (132 aa) initn: 335 init1: 335 opt: 335 Z-score: 406.1 bits: 81.6 E(32554): 2.7e-16 Smith-Waterman score: 335; 42.7% identity (70.8% similar) in 89 aa overlap (28-116:44-132) 10 20 30 40 50 pF1KB6 MTRWSSYLLGWTTFLLYSYESSGGMHEECVFPFTYKGSVYFTCTHIHSLSPWCATRA :::::: ::...:. : . .. ::. CCDS46 NSSACIFPVILNELSSTVETITHFPEVTDGECVFPFHYKNGTYYDCIKSKARHKWCSLNK 20 30 40 50 60 70 60 70 80 90 100 110 pF1KB6 VYNGQWKYCQSEDYPRCIFPFIYRGKAYNSCISQGSFLGSLWCSVTSVFDEKQQWKFCET .:.: ::.:..::. :.::: :: : : ..: .:. :::.:. :.. . ::.:: CCDS46 TYEGYWKFCSAEDFANCVFPFWYRRLIYWECTDDGEAFGKKWCSLTKNFNKDRIWKYCE 80 90 100 110 120 130 120 130 140 150 160 170 pF1KB6 NEYGGNSLRKPCIFPSIYRNNVVSDCMEDESNKLWCPTTENMDKDGKWSFCADTRISALV >>CCDS2400.1 FN1 gene_id:2335|Hs108|chr2 (2176 aa) initn: 431 init1: 192 opt: 346 Z-score: 401.3 bits: 84.7 E(32554): 5e-16 Smith-Waterman score: 354; 29.9% identity (56.4% similar) in 234 aa overlap (5-223:238-461) 10 20 30 pF1KB6 MTRWSSYLLGWTTFLLYSYESSGGMHEECVFPFT .:: .: : .: ... : .:. : CCDS24 WMMVDCTCLGEGSGRITCTSRNRCNDQDTRTSYRIGDT----WSKKDNRGNLLQCIC--T 210 220 230 240 250 260 40 50 60 70 80 pF1KB6 YKGSVYFTC---THIHSLS----PWCATRA-VYNGQWKYCQSEDYPRCIFPFIYRGKAYN .: . : : ... : :. .:: ::. : . : : .:. : .:. CCDS24 GNGRGEWKCERHTSVQTTSSGSGPFTDVRAAVYQPQ-PHPQPPPYGHCVTD---SGVVYS 270 280 290 300 310 90 100 110 120 130 140 pF1KB6 SCISQGSFLGSLWCSVTSVFDEKQQWKFCETNEYGGNSLRKPCIFPSIYRNNVVSDCMED .. . :. : . . . . :. ::::: .::..: : . . .: . CCDS24 VGMQWLKTQGNKQMLCTCLGNGVSCQETAVTQTYGGNSNGEPCVLPFTYNGRTFYSCTTE 320 330 340 350 360 370 150 160 170 180 190 pF1KB6 --ESNKLWCPTTENMDKDGKWSFCADTRISALVPGFP-----CHFPFNYKNKNYFNCTNK ....::: :: :...: :.:::.: . . . : ::::: :.:.:: .::.. CCDS24 GRQDGHLWCSTTSNYEQDQKYSFCTDHTVLVQTRGGNSNGALCHFPFLYNNHNYTDCTSE 380 390 400 410 420 430 200 210 220 pF1KB6 GSKENLVWCATSYNYDQDHTWVYC : ..:. ::.:. ::: :. . .: CCDS24 GRRDNMKWCGTTQNYDADQKFGFCPMAAHEEICTTNEGVMYRIGDQWDKQHDMGHMMRCT 440 450 460 470 480 490 >>CCDS77522.1 FN1 gene_id:2335|Hs108|chr2 (2240 aa) initn: 431 init1: 192 opt: 346 Z-score: 401.1 bits: 84.7 E(32554): 5.1e-16 Smith-Waterman score: 354; 29.9% identity (56.4% similar) in 234 aa overlap (5-223:238-461) 10 20 30 pF1KB6 MTRWSSYLLGWTTFLLYSYESSGGMHEECVFPFT .:: .: : .: ... : .:. : CCDS77 WMMVDCTCLGEGSGRITCTSRNRCNDQDTRTSYRIGDT----WSKKDNRGNLLQCIC--T 210 220 230 240 250 260 40 50 60 70 80 pF1KB6 YKGSVYFTC---THIHSLS----PWCATRA-VYNGQWKYCQSEDYPRCIFPFIYRGKAYN .: . : : ... : :. .:: ::. : . : : .:. : .:. CCDS77 GNGRGEWKCERHTSVQTTSSGSGPFTDVRAAVYQPQ-PHPQPPPYGHCVTD---SGVVYS 270 280 290 300 310 90 100 110 120 130 140 pF1KB6 SCISQGSFLGSLWCSVTSVFDEKQQWKFCETNEYGGNSLRKPCIFPSIYRNNVVSDCMED .. . :. : . . . . :. ::::: .::..: : . . .: . CCDS77 VGMQWLKTQGNKQMLCTCLGNGVSCQETAVTQTYGGNSNGEPCVLPFTYNGRTFYSCTTE 320 330 340 350 360 370 150 160 170 180 190 pF1KB6 --ESNKLWCPTTENMDKDGKWSFCADTRISALVPGFP-----CHFPFNYKNKNYFNCTNK ....::: :: :...: :.:::.: . . . : ::::: :.:.:: .::.. CCDS77 GRQDGHLWCSTTSNYEQDQKYSFCTDHTVLVQTRGGNSNGALCHFPFLYNNHNYTDCTSE 380 390 400 410 420 430 200 210 220 pF1KB6 GSKENLVWCATSYNYDQDHTWVYC : ..:. ::.:. ::: :. . .: CCDS77 GRRDNMKWCGTTQNYDADQKFGFCPMAAHEEICTTNEGVMYRIGDQWDKQHDMGHMMRCT 440 450 460 470 480 490 >>CCDS77523.1 FN1 gene_id:2335|Hs108|chr2 (2265 aa) initn: 431 init1: 192 opt: 346 Z-score: 401.0 bits: 84.7 E(32554): 5.1e-16 Smith-Waterman score: 354; 29.9% identity (56.4% similar) in 234 aa overlap (5-223:238-461) 10 20 30 pF1KB6 MTRWSSYLLGWTTFLLYSYESSGGMHEECVFPFT .:: .: : .: ... : .:. : CCDS77 WMMVDCTCLGEGSGRITCTSRNRCNDQDTRTSYRIGDT----WSKKDNRGNLLQCIC--T 210 220 230 240 250 260 40 50 60 70 80 pF1KB6 YKGSVYFTC---THIHSLS----PWCATRA-VYNGQWKYCQSEDYPRCIFPFIYRGKAYN .: . : : ... : :. .:: ::. : . : : .:. : .:. CCDS77 GNGRGEWKCERHTSVQTTSSGSGPFTDVRAAVYQPQ-PHPQPPPYGHCVTD---SGVVYS 270 280 290 300 310 90 100 110 120 130 140 pF1KB6 SCISQGSFLGSLWCSVTSVFDEKQQWKFCETNEYGGNSLRKPCIFPSIYRNNVVSDCMED .. . :. : . . . . :. ::::: .::..: : . . .: . CCDS77 VGMQWLKTQGNKQMLCTCLGNGVSCQETAVTQTYGGNSNGEPCVLPFTYNGRTFYSCTTE 320 330 340 350 360 370 150 160 170 180 190 pF1KB6 --ESNKLWCPTTENMDKDGKWSFCADTRISALVPGFP-----CHFPFNYKNKNYFNCTNK ....::: :: :...: :.:::.: . . . : ::::: :.:.:: .::.. CCDS77 GRQDGHLWCSTTSNYEQDQKYSFCTDHTVLVQTRGGNSNGALCHFPFLYNNHNYTDCTSE 380 390 400 410 420 430 200 210 220 pF1KB6 GSKENLVWCATSYNYDQDHTWVYC : ..:. ::.:. ::: :. . .: CCDS77 GRRDNMKWCGTTQNYDADQKFGFCPMAAHEEICTTNEGVMYRIGDQWDKQHDMGHMMRCT 440 450 460 470 480 490 >>CCDS77525.1 FN1 gene_id:2335|Hs108|chr2 (2267 aa) initn: 431 init1: 192 opt: 346 Z-score: 401.0 bits: 84.7 E(32554): 5.1e-16 Smith-Waterman score: 354; 29.9% identity (56.4% similar) in 234 aa overlap (5-223:238-461) 10 20 30 pF1KB6 MTRWSSYLLGWTTFLLYSYESSGGMHEECVFPFT .:: .: : .: ... : .:. : CCDS77 WMMVDCTCLGEGSGRITCTSRNRCNDQDTRTSYRIGDT----WSKKDNRGNLLQCIC--T 210 220 230 240 250 260 40 50 60 70 80 pF1KB6 YKGSVYFTC---THIHSLS----PWCATRA-VYNGQWKYCQSEDYPRCIFPFIYRGKAYN .: . : : ... : :. .:: ::. : . : : .:. : .:. CCDS77 GNGRGEWKCERHTSVQTTSSGSGPFTDVRAAVYQPQ-PHPQPPPYGHCVTD---SGVVYS 270 280 290 300 310 90 100 110 120 130 140 pF1KB6 SCISQGSFLGSLWCSVTSVFDEKQQWKFCETNEYGGNSLRKPCIFPSIYRNNVVSDCMED .. . :. : . . . . :. ::::: .::..: : . . .: . CCDS77 VGMQWLKTQGNKQMLCTCLGNGVSCQETAVTQTYGGNSNGEPCVLPFTYNGRTFYSCTTE 320 330 340 350 360 370 150 160 170 180 190 pF1KB6 --ESNKLWCPTTENMDKDGKWSFCADTRISALVPGFP-----CHFPFNYKNKNYFNCTNK ....::: :: :...: :.:::.: . . . : ::::: :.:.:: .::.. CCDS77 GRQDGHLWCSTTSNYEQDQKYSFCTDHTVLVQTRGGNSNGALCHFPFLYNNHNYTDCTSE 380 390 400 410 420 430 200 210 220 pF1KB6 GSKENLVWCATSYNYDQDHTWVYC : ..:. ::.:. ::: :. . .: CCDS77 GRRDNMKWCGTTQNYDADQKFGFCPMAAHEEICTTNEGVMYRIGDQWDKQHDMGHMMRCT 440 450 460 470 480 490 223 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 14:15:53 2016 done: Sat Nov 5 14:15:54 2016 Total Scan time: 1.940 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]