FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0009, 643 aa 1>>>pF1KE0009 643 - 643 aa - 643 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.5541+/-0.00111; mu= 1.4850+/- 0.067 mean_var=294.5448+/-58.332, 0's: 0 Z-trim(112.9): 120 B-trim: 0 in 0/51 Lambda= 0.074731 statistics sampled from 13477 (13594) to 13477 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.748), E-opt: 0.2 (0.418), width: 16 Scan time: 2.760 The best scores are: opt bits E(32554) CCDS56578.1 ECM2 gene_id:1842|Hs108|chr9 ( 643) 4307 478.3 1.4e-134 CCDS6698.1 ECM2 gene_id:1842|Hs108|chr9 ( 699) 3059 343.8 4.8e-94 CCDS55601.1 PODN gene_id:127435|Hs108|chr1 ( 519) 530 71.0 4.7e-12 CCDS55602.1 PODN gene_id:127435|Hs108|chr1 ( 642) 493 67.1 8.6e-11 CCDS573.1 PODN gene_id:127435|Hs108|chr1 ( 661) 493 67.1 8.8e-11 >>CCDS56578.1 ECM2 gene_id:1842|Hs108|chr9 (643 aa) initn: 4307 init1: 4307 opt: 4307 Z-score: 2529.5 bits: 478.3 E(32554): 1.4e-134 Smith-Waterman score: 4307; 99.8% identity (99.8% similar) in 643 aa overlap (1-643:1-643) 10 20 30 40 50 60 pF1KE0 MKIAVLFCFFLLIIFQTDFGKNEEIPRKQRRKIYHRRLRKSSTSHKHRSNRQLGIPQTTV ::::::::::::::::::::::::::::::::::::::::::::::::::::::: :::: CCDS56 MKIAVLFCFFLLIIFQTDFGKNEEIPRKQRRKIYHRRLRKSSTSHKHRSNRQLGIQQTTV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 FTPVARLPIVNFDYSMEEKFESFSSFPGVESSYNVLPGKKGHCLVKGITMYNKAVWSPEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 FTPVARLPIVNFDYSMEEKFESFSSFPGVESSYNVLPGKKGHCLVKGITMYNKAVWSPEP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 CTTCLCSDGRVLCDETMCHPQRCPQTVIPEGECCPVCSATEQREPTNLLHKQLPPPQVGM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 CTTCLCSDGRVLCDETMCHPQRCPQTVIPEGECCPVCSATEQREPTNLLHKQLPPPQVGM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 DRIVRKEALQSEEDEEVKEEDTEQKRETPESRNQGQLYSEGDSRGGDRKQRPGEERRLAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 DRIVRKEALQSEEDEEVKEEDTEQKRETPESRNQGQLYSEGDSRGGDRKQRPGEERRLAH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE0 QQQRQGREEEEDEEEEGEEGEEDEEDEEDPVRGDMFRMPSRSPLPAPPRGTLRLPSGCSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 QQQRQGREEEEDEEEEGEEGEEDEEDEEDPVRGDMFRMPSRSPLPAPPRGTLRLPSGCSL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE0 SYRTISCINAMLTQIPPLTAPQITSLELTGNSIASIPDEAFNGLPNLERLDLSKNNITSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 SYRTISCINAMLTQIPPLTAPQITSLELTGNSIASIPDEAFNGLPNLERLDLSKNNITSS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE0 GIGPKAFKLLKKLMRLNMDGNNLIQIPSQLPSTLEELKVNENNLQAIDEESLSDLNQLVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 GIGPKAFKLLKKLMRLNMDGNNLIQIPSQLPSTLEELKVNENNLQAIDEESLSDLNQLVT 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE0 LELEGNNLSEANVNPLAFKPLKSLAYLRLGKNKFRIIPQGLPGSIEELYLENNQIEEITE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 LELEGNNLSEANVNPLAFKPLKSLAYLRLGKNKFRIIPQGLPGSIEELYLENNQIEEITE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE0 ICFNHTRKINVIVLRYNKIEENRIAPLAWINQENLESIDLSYNKLYHVPSYLPKSLLHLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 ICFNHTRKINVIVLRYNKIEENRIAPLAWINQENLESIDLSYNKLYHVPSYLPKSLLHLV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE0 LLGNQIERIPGYVFGHMEPGLEYLYLSFNKLADDGMDRVSFYGAYHSLRELFLDHNDLKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 LLGNQIERIPGYVFGHMEPGLEYLYLSFNKLADDGMDRVSFYGAYHSLRELFLDHNDLKS 550 560 570 580 590 600 610 620 630 640 pF1KE0 IPPGIQEMKALHFLRLNNNKIRCVSDAVLETVTNRSDVAFPLW ::::::::::::::::::::::::::::::::::::::::::: CCDS56 IPPGIQEMKALHFLRLNNNKIRCVSDAVLETVTNRSDVAFPLW 610 620 630 640 >>CCDS6698.1 ECM2 gene_id:1842|Hs108|chr9 (699 aa) initn: 4526 init1: 3044 opt: 3059 Z-score: 1801.9 bits: 343.8 E(32554): 4.8e-94 Smith-Waterman score: 4113; 96.1% identity (96.3% similar) in 646 aa overlap (1-624:1-646) 10 20 30 40 50 60 pF1KE0 MKIAVLFCFFLLIIFQTDFGKNEEIPRKQRRKIYHRRLRKSSTSHKHRSNRQLGIPQTTV ::::::::::::::::::::::::::::::::::::::::::::::::::::::: :::: CCDS66 MKIAVLFCFFLLIIFQTDFGKNEEIPRKQRRKIYHRRLRKSSTSHKHRSNRQLGIQQTTV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 FTPVARLPIVNFDYSMEEKFESFSSFPGVESSYNVLPGKKGHCLVKGITMYNKAVWSPEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 FTPVARLPIVNFDYSMEEKFESFSSFPGVESSYNVLPGKKGHCLVKGITMYNKAVWSPEP 70 80 90 100 110 120 130 140 150 160 pF1KE0 CTTCLCSDGRVLCDETMCHPQRCPQTVIPEGECCPVCSAT-------------------- :::::::::::::::::::::::::::::::::::::::: CCDS66 CTTCLCSDGRVLCDETMCHPQRCPQTVIPEGECCPVCSATVSYSLLSGIALNDRNEFSGD 130 140 150 160 170 180 170 180 190 200 210 pF1KE0 --EQREPTNLLHKQLPPPQVGMDRIVRKEALQSEEDEEVKEEDTEQKRETPESRNQGQLY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 SSEQREPTNLLHKQLPPPQVGMDRIVRKEALQSEEDEEVKEEDTEQKRETPESRNQGQLY 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE0 SEGDSRGGDRKQRPGEERRLAHQQQRQGREEEEDEEEEGEEGEEDEEDEEDPVRGDMFRM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 SEGDSRGGDRKQRPGEERRLAHQQQRQGREEEEDEEEEGEEGEEDEEDEEDPVRGDMFRM 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE0 PSRSPLPAPPRGTLRLPSGCSLSYRTISCINAMLTQIPPLTAPQITSLELTGNSIASIPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 PSRSPLPAPPRGTLRLPSGCSLSYRTISCINAMLTQIPPLTAPQITSLELTGNSIASIPD 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE0 EAFNGLPNLERLDLSKNNITSSGIGPKAFKLLKKLMRLNMDGNNLIQIPSQLPSTLEELK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 EAFNGLPNLERLDLSKNNITSSGIGPKAFKLLKKLMRLNMDGNNLIQIPSQLPSTLEELK 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE0 VNENNLQAIDEESLSDLNQLVTLELEGNNLSEANVNPLAFKPLKSLAYLRLGKNKFRIIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 VNENNLQAIDEESLSDLNQLVTLELEGNNLSEANVNPLAFKPLKSLAYLRLGKNKFRIIP 430 440 450 460 470 480 460 470 480 490 500 510 pF1KE0 QGLPGSIEELYLENNQIEEITEICFNHTRKINVIVLRYNKIEENRIAPLAWINQENLESI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 QGLPGSIEELYLENNQIEEITEICFNHTRKINVIVLRYNKIEENRIAPLAWINQENLESI 490 500 510 520 530 540 520 530 540 550 560 570 pF1KE0 DLSYNKLYHVPSYLPKSLLHLVLLGNQIERIPGYVFGHMEPGLEYLYLSFNKLADDGMDR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 DLSYNKLYHVPSYLPKSLLHLVLLGNQIERIPGYVFGHMEPGLEYLYLSFNKLADDGMDR 550 560 570 580 590 600 580 590 600 610 620 630 pF1KE0 VSFYGAYHSLRELFLDHNDLKSIPPGIQEMKALHFLRLNNNKIRCVSDAVLETVTNRSDV :::::::::::::::::::::::::::::::::::::::::::: . CCDS66 VSFYGAYHSLRELFLDHNDLKSIPPGIQEMKALHFLRLNNNKIRNILPEEICNAEEDDDS 610 620 630 640 650 660 640 pF1KE0 AFPLW CCDS66 NLEHLHLENNYIKIREIPSYTFSCIRSYSSIVLKPQNIK 670 680 690 >>CCDS55601.1 PODN gene_id:127435|Hs108|chr1 (519 aa) initn: 705 init1: 366 opt: 530 Z-score: 330.0 bits: 71.0 E(32554): 4.7e-12 Smith-Waterman score: 530; 30.3% identity (62.2% similar) in 376 aa overlap (261-634:89-453) 240 250 260 270 280 290 pF1KE0 RPGEERRLAHQQQRQGREEEEDEEEEGEEGEEDEEDEEDPVRGDMFRMPSRSPLPAPPRG ::.: ::.:: . . . : :.: . CCDS55 LLLPPQLHLGPVLAVRAPGFGRSGGHSLSPEENEFAEEEPV----LVLSPEEPGPGP--A 60 70 80 90 100 110 300 310 320 330 340 pF1KE0 TLRLPSGCSLSYR-TISCINAMLTQIPPLTAPQITSLELTGNSIASIPDEAFNGLPNLER .. : :. : . ...: . : ..: . . : : .:.. .:: ::. : .:.. CCDS55 AVSCPRDCACSQEGVVDCGGIDLREFPGDLPEHTNHLSLQNNKLEKIPPGAFSELSSLRE 120 130 140 150 160 170 350 360 370 380 390 400 pF1KE0 LDLSKNNITSSGIGPKAFKLLKKLMRLNMDGNNLIQIPSQLPSTLEELKVNENNLQAIDE : :..: .:. :. ..: :..: :....::: ..:. :: .: :....: ....: CCDS55 LYLQNNYLTDEGLDNETFWKLSSLEYLDLSSNNLSRVPAGLPRSLVLLHLEKNAIRSVDA 180 190 200 210 220 230 410 420 430 440 450 460 pF1KE0 ESLSDLNQLVTLELEGNNLSEANVNPLAFKPLKSLAYLRLGKNKFRIIPQGLPGSIEELY . :. . .: : :..:.: : ...::::. :: : ..: .: .. .:.::: .. :. CCDS55 NVLTPIRSLEYLLLHSNQLREQGIHPLAFQGLKRLHTVHLYNNALERVPSGLPRRVRTLM 240 250 260 270 280 290 470 480 490 500 510 520 pF1KE0 LENNQIEEITEICFNHTRKINVIVLRYNKIEENRIAPLAWINQENLESIDLSYNKLYHVP . .::: : . : : .. . : ::.: .. :. . . :.:.::: :.:. .: CCDS55 ILHNQITGIGREDFATTYFLEELNLSYNRITSPQVHRDAFRKLRLLRSLDLSGNRLHTLP 300 310 320 330 340 350 530 540 550 560 570 580 pF1KE0 SYLPKSLLHLVLLGNQIERIP-GYVFGHMEPGLEYLYLSFNKLADDGMDRVSFYGAYHSL ::... : . :.. . : . : . :. :::. :.: . .. .. : : CCDS55 PGLPRNVHVLKVKRNELAALARGALVGMAQ--LRELYLTSNRLRSRALGPRAWVDLAH-L 360 370 380 390 400 590 600 610 620 630 640 pF1KE0 RELFLDHNDLKSIPPGIQEMKALHFLRLNNNKIRCVSDAVLETVTNRSDVAFPLW . : . :.: :: :. : .:..: :.:::: : ..... : CCDS55 QLLDIAGNQLTEIPEGLPE--SLEYLYLQNNKISAVPANAFDSTPNLKGIFLRFNKLAVG 410 420 430 440 450 460 CCDS55 SVVDSAFRRLKHLQVLDIEGNLEFGDISKDRGRLGKEKEEEEEEEEEEEETR 470 480 490 500 510 >>CCDS55602.1 PODN gene_id:127435|Hs108|chr1 (642 aa) initn: 705 init1: 366 opt: 493 Z-score: 307.2 bits: 67.1 E(32554): 8.6e-11 Smith-Waterman score: 493; 31.2% identity (63.9% similar) in 324 aa overlap (312-634:258-576) 290 300 310 320 330 340 pF1KE0 SPLPAPPRGTLRLPSGCSLSYRTISCINAMLTQIPPLTAPQITSLELTGNSIASIPDEAF : ..: : . .:.: .:.. .:: :: CCDS55 HNNKLADAGLPDNMFNGSSNVEVLILSSNFLRHVPKHLPPALYKLHLKNNKLEKIPPGAF 230 240 250 260 270 280 350 360 370 380 390 400 pF1KE0 NGLPNLERLDLSKNNITSSGIGPKAFKLLKKLMRLNMDGNNLIQIPSQLPSTLEELKVNE . : .:..: :..: .:. :. ..: :..: :....::: ..:. :: .: :.... CCDS55 SELSSLRELYLQNNYLTDEGLDNETFWKLSSLEYLDLSSNNLSRVPAGLPRSLVLLHLEK 290 300 310 320 330 340 410 420 430 440 450 460 pF1KE0 NNLQAIDEESLSDLNQLVTLELEGNNLSEANVNPLAFKPLKSLAYLRLGKNKFRIIPQGL : ....: . :. . .: : :..:.: : ...::::. :: : ..: .: .. .:.:: CCDS55 NAIRSVDANVLTPIRSLEYLLLHSNQLREQGIHPLAFQGLKRLHTVHLYNNALERVPSGL 350 360 370 380 390 400 470 480 490 500 510 520 pF1KE0 PGSIEELYLENNQIEEITEICFNHTRKINVIVLRYNKIEENRIAPLAWINQENLESIDLS : .. :.. .::: : . : : .. . : ::.: .. :. . . :.:.::: CCDS55 PRRVRTLMILHNQITGIGREDFATTYFLEELNLSYNRITSPQVHRDAFRKLRLLRSLDLS 410 420 430 440 450 460 530 540 550 560 570 580 pF1KE0 YNKLYHVPSYLPKSLLHLVLLGNQIERIP-GYVFGHMEPGLEYLYLSFNKLADDGMDRVS :.:. .: ::... : . :.. . : . : . :. :::. :.: . .. . CCDS55 GNRLHTLPPGLPRNVHVLKVKRNELAALARGALVGMAQ--LRELYLTSNRLRSRALGPRA 470 480 490 500 510 520 590 600 610 620 630 640 pF1KE0 FYGAYHSLRELFLDHNDLKSIPPGIQEMKALHFLRLNNNKIRCVSDAVLETVTNRSDVAF . : :. : . :.: :: :. : .:..: :.:::: : ..... : CCDS55 WVDLAH-LQLLDIAGNQLTEIPEGLPE--SLEYLYLQNNKISAVPANAFDSTPNLKGIFL 530 540 550 560 570 580 pF1KE0 PLW CCDS55 RFNKLAVGSVVDSAFRRLKHLQVLDIEGNLEFGDISKDRGRLGKEKEEEEEEEEEEEETR 590 600 610 620 630 640 >>CCDS573.1 PODN gene_id:127435|Hs108|chr1 (661 aa) initn: 705 init1: 366 opt: 493 Z-score: 307.1 bits: 67.1 E(32554): 8.8e-11 Smith-Waterman score: 493; 31.2% identity (63.9% similar) in 324 aa overlap (312-634:277-595) 290 300 310 320 330 340 pF1KE0 SPLPAPPRGTLRLPSGCSLSYRTISCINAMLTQIPPLTAPQITSLELTGNSIASIPDEAF : ..: : . .:.: .:.. .:: :: CCDS57 HNNKLADAGLPDNMFNGSSNVEVLILSSNFLRHVPKHLPPALYKLHLKNNKLEKIPPGAF 250 260 270 280 290 300 350 360 370 380 390 400 pF1KE0 NGLPNLERLDLSKNNITSSGIGPKAFKLLKKLMRLNMDGNNLIQIPSQLPSTLEELKVNE . : .:..: :..: .:. :. ..: :..: :....::: ..:. :: .: :.... CCDS57 SELSSLRELYLQNNYLTDEGLDNETFWKLSSLEYLDLSSNNLSRVPAGLPRSLVLLHLEK 310 320 330 340 350 360 410 420 430 440 450 460 pF1KE0 NNLQAIDEESLSDLNQLVTLELEGNNLSEANVNPLAFKPLKSLAYLRLGKNKFRIIPQGL : ....: . :. . .: : :..:.: : ...::::. :: : ..: .: .. .:.:: CCDS57 NAIRSVDANVLTPIRSLEYLLLHSNQLREQGIHPLAFQGLKRLHTVHLYNNALERVPSGL 370 380 390 400 410 420 470 480 490 500 510 520 pF1KE0 PGSIEELYLENNQIEEITEICFNHTRKINVIVLRYNKIEENRIAPLAWINQENLESIDLS : .. :.. .::: : . : : .. . : ::.: .. :. . . :.:.::: CCDS57 PRRVRTLMILHNQITGIGREDFATTYFLEELNLSYNRITSPQVHRDAFRKLRLLRSLDLS 430 440 450 460 470 480 530 540 550 560 570 580 pF1KE0 YNKLYHVPSYLPKSLLHLVLLGNQIERIP-GYVFGHMEPGLEYLYLSFNKLADDGMDRVS :.:. .: ::... : . :.. . : . : . :. :::. :.: . .. . CCDS57 GNRLHTLPPGLPRNVHVLKVKRNELAALARGALVGMAQ--LRELYLTSNRLRSRALGPRA 490 500 510 520 530 540 590 600 610 620 630 640 pF1KE0 FYGAYHSLRELFLDHNDLKSIPPGIQEMKALHFLRLNNNKIRCVSDAVLETVTNRSDVAF . : :. : . :.: :: :. : .:..: :.:::: : ..... : CCDS57 WVDLAH-LQLLDIAGNQLTEIPEGLPE--SLEYLYLQNNKISAVPANAFDSTPNLKGIFL 550 560 570 580 590 600 pF1KE0 PLW CCDS57 RFNKLAVGSVVDSAFRRLKHLQVLDIEGNLEFGDISKDRGRLGKEKEEEEEEEEEEEETR 610 620 630 640 650 660 643 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 08:30:29 2016 done: Fri Nov 4 08:30:30 2016 Total Scan time: 2.760 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]