FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0212, 657 aa 1>>>pF1KSDA0212 657 - 657 aa - 657 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.6992+/-0.00103; mu= 10.5531+/- 0.062 mean_var=183.9126+/-37.481, 0's: 0 Z-trim(111.0): 14 B-trim: 109 in 2/48 Lambda= 0.094573 statistics sampled from 11990 (12000) to 11990 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.705), E-opt: 0.2 (0.369), width: 16 Scan time: 3.220 The best scores are: opt bits E(32554) CCDS33686.1 EDEM1 gene_id:9695|Hs108|chr3 ( 657) 4513 628.5 9e-180 CCDS1363.2 EDEM3 gene_id:80267|Hs108|chr1 ( 932) 837 127.1 1.1e-28 CCDS46592.1 EDEM2 gene_id:55741|Hs108|chr20 ( 541) 489 79.4 1.5e-14 CCDS13247.1 EDEM2 gene_id:55741|Hs108|chr20 ( 578) 489 79.4 1.5e-14 >>CCDS33686.1 EDEM1 gene_id:9695|Hs108|chr3 (657 aa) initn: 4513 init1: 4513 opt: 4513 Z-score: 3341.0 bits: 628.5 E(32554): 9e-180 Smith-Waterman score: 4513; 100.0% identity (100.0% similar) in 657 aa overlap (1-657:1-657) 10 20 30 40 50 60 pF1KSD MQWRALVLGLVLLRLGLHGVLWLVFGLGPSMGFYQRFPLSFGFQRLRSPDGPASPTSGPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MQWRALVLGLVLLRLGLHGVLWLVFGLGPSMGFYQRFPLSFGFQRLRSPDGPASPTSGPV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD GRPGGVSGPSWLQPPGTGAAQSPRKAPRRPGPGMCGPANWGYVLGGRGRGPDEYEKRYSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GRPGGVSGPSWLQPPGTGAAQSPRKAPRRPGPGMCGPANWGYVLGGRGRGPDEYEKRYSG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD AFPPQLRAQMRDLARGMFVFGYDNYMAHAFPQDELNPIHCRGRGPDRGDPSNLNINDVLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 AFPPQLRAQMRDLARGMFVFGYDNYMAHAFPQDELNPIHCRGRGPDRGDPSNLNINDVLG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD NYSLTLVDALDTLAIMGNSSEFQKAVKLVINTVSFDKDSTVQVFEATIRVLGSLLSAHRI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 NYSLTLVDALDTLAIMGNSSEFQKAVKLVINTVSFDKDSTVQVFEATIRVLGSLLSAHRI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD ITDSKQPFGDMTIKDYDNELLYMAHDLAVRLLPAFENTKTGIPYPRVNLKTGVPPDTNNE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ITDSKQPFGDMTIKDYDNELLYMAHDLAVRLLPAFENTKTGIPYPRVNLKTGVPPDTNNE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD TCTAGAGSLLVEFGILSRLLGDSTFEWVARRAVKALWNLRSNDTGLLGNVVNIQTGHWVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TCTAGAGSLLVEFGILSRLLGDSTFEWVARRAVKALWNLRSNDTGLLGNVVNIQTGHWVG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD KQSGLGAGLDSFYEYLLKSYILFGEKEDLEMFNAAYQSIQNYLRRGREACNEGEGDPPLY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KQSGLGAGLDSFYEYLLKSYILFGEKEDLEMFNAAYQSIQNYLRRGREACNEGEGDPPLY 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD VNVNMFSGQLMNTWIDSLQAFFPGLQVLIGDVEDAICLHAFYYAIWKRYGALPERYNWQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VNVNMFSGQLMNTWIDSLQAFFPGLQVLIGDVEDAICLHAFYYAIWKRYGALPERYNWQL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD QAPDVLFYPLRPELVESTYLLYQATKNPFYLHVGMDILQSLEKYTKVKCGYATLHHVIDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QAPDVLFYPLRPELVESTYLLYQATKNPFYLHVGMDILQSLEKYTKVKCGYATLHHVIDK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD STEDRMESFFLSETCKYLYLLFDEDNPVHKSGTRYMFTTEGHIVSVDEHLRELPWKEFFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 STEDRMESFFLSETCKYLYLLFDEDNPVHKSGTRYMFTTEGHIVSVDEHLRELPWKEFFS 550 560 570 580 590 600 610 620 630 640 650 pF1KSD EEGGQDQGGKSVHRPKPHELKVINSSSNCNRVPDERRYSLPLKSIYMRQIDQMVGLI ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 EEGGQDQGGKSVHRPKPHELKVINSSSNCNRVPDERRYSLPLKSIYMRQIDQMVGLI 610 620 630 640 650 >>CCDS1363.2 EDEM3 gene_id:80267|Hs108|chr1 (932 aa) initn: 1247 init1: 366 opt: 837 Z-score: 628.4 bits: 127.1 E(32554): 1.1e-28 Smith-Waterman score: 1303; 44.8% identity (74.5% similar) in 475 aa overlap (119-584:39-496) 90 100 110 120 130 140 pF1KSD RPGPGMCGPANWGYVLGGRGRGPDEYEKRYSGAFPP--QLRAQMRDLARGMFVFGYDNYM .:: : . . .. . . :: .: ::: CCDS13 CGSPVPQRARWRLVAATAAFCLVSATSVWTAGAEPMSREEKQKLGNQVLEMFDHAYGNYM 10 20 30 40 50 60 150 160 170 180 190 200 pF1KSD AHAFPQDELNPIHCRGRGPDRG-DPSNLNINDVLGNYSLTLVDALDTLAIMGNSSEFQKA ::.: ::: :. :::: :: .:: ...:.::..::::.:.::::.......::. : CCDS13 EHAYPADELMPLTCRGRV--RGQEPSRGDVDDALGKFSLTLIDSLDTLVVLNKTKEFEDA 70 80 90 100 110 120 210 220 230 240 250 260 pF1KSD VKLVINTVSFDKDSTVQVFEATIRVLGSLLSAHRIITDSKQPFGDMTIKDYDNELLYMAH :. :. :..:.: .:.:::..:::::.::..: . :. :.. .. :..::: ::. CCDS13 VRKVLRDVNLDNDVVVSVFETNIRVLGGLLGGHSLAIMLKEK-GEY-MQWYNDELLQMAK 130 140 150 160 170 180 270 280 290 300 310 320 pF1KSD DLAVRLLPAFENTKTGIPYPRVNLKTGV-PPD----TNNETCTAGAGSLLVEFGILSRLL .:. .::::: :: .:.::::.::: :. :. :...:::: ::.:..::. :::. CCDS13 QLGYKLLPAF-NTTSGLPYPRINLKFGIRKPEARTGTETDTCTACAGTLILEFAALSRFT 190 200 210 220 230 240 330 340 350 360 370 380 pF1KSD GDSTFEWVARRAVKALWNLRSNDTGLLGNVVNIQTGHWVGKQSGLGAGLDSFYEYLLKSY : . :: ::.:. ::. :. ...:.: ..::.:: :: :.::.:::.::.::::::.: CCDS13 GATIFEEYARKALDFLWEKRQRSSNLVGVTINIHTGDWVRKDSGVGAGIDSYYEYLLKAY 250 260 270 280 290 300 390 400 410 420 430 pF1KSD ILFGEKEDLEMFNAAYQSIQNYLRRGREACNEGEGDPPLYVNVNMFSGQL-MNTWIDSLQ .:.:. :: ::. :..:. :. . ::: ..:.. . .: ::.:.: CCDS13 VLLGDDSFLERFNTHYDAIMRYISQ-----------PPLLLDVHIHKPMLNARTWMDALL 310 320 330 340 350 440 450 460 470 480 490 pF1KSD AFFPGLQVLIGDVEDAICLHAFYYAIWKRYGALPERYNWQLQAPDVLFYPLRPELVESTY ::::::::: ::.. :: : . : . :... ::: .. .... . .:::::..:::: CCDS13 AFFPGLQVLKGDIRPAIETHEMLYQVIKKHNFLPEAFTTDFRVHWAQ-HPLRPEFAESTY 360 370 380 390 400 410 500 510 520 530 540 550 pF1KSD LLYQATKNPFYLHVGMDILQSLEKYTKVKCGYATLHHVIDKSTEDRMESFFLSETCKYLY .::.:: .:.::.:: ....:.::..: ::.:... : : ::::.::::.: :::: CCDS13 FLYKATGDPYYLEVGKTLIENLNKYARVPCGFAAMKDVRTGSHEDRMDSFFLAEMFKYLY 420 430 440 450 460 470 560 570 580 590 600 610 pF1KSD LLFDEDNPVHKSGTRYMFTTEGHIVSVDEHLRELPWKEFFSEEGGQDQGGKSVHRPKPHE ::: . . . . :.::::.:.. CCDS13 LLFADKEDIIFDIEDYIFTTEAHLLPLWLSTTNQSISKKNTTSEYTELDDSNFDWTCPNT 480 490 500 510 520 530 >>CCDS46592.1 EDEM2 gene_id:55741|Hs108|chr20 (541 aa) initn: 935 init1: 333 opt: 489 Z-score: 374.9 bits: 79.4 E(32554): 1.5e-14 Smith-Waterman score: 1108; 41.2% identity (66.6% similar) in 497 aa overlap (155-619:15-489) 130 140 150 160 170 180 pF1KSD QLRAQMRDLARGMFVFGYDNYMAHAFPQDELNPIHCRGRGPDRGDPSNLNINDVLGNYSL : : : . ::: . :. . . .:: CCDS46 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYS-----FSL 10 20 30 190 200 210 220 230 240 pF1KSD TLVDALDTLAIMGNSSEFQKAVKLVINTVSFDKDSTVQVFEATIRVLGSLLSAHRIITDS ::.:::::: :.:: ::::..:... ..:.:: : ...:::..:::.:.::::: . : CCDS46 TLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLL---S 40 50 60 70 80 90 250 260 270 280 290 300 pF1KSD KQPFGDMTIK-DYDNELLYMAHDLAVRLLPAFENTKTGIPYPRVNLKTGVPPDTNNETCT :. .. .. :: ::.. : .:::::. : ::.:: ::: :: : . ::: CCDS46 KKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQ-TPTGMPYGTVNLLHGVNPGETPVTCT 100 110 120 130 140 150 310 320 330 340 350 360 pF1KSD AGAGSLLVEFGILSRLLGDSTFEWVARRAVKALWNLRSNDTGLLGNVVNIQTGHWVGKQS :: :...:::. :: : :: .:: ::: :. ::. :: : ::.:: ... ::.::.... CCDS46 AGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRS-DIGLVGNHIDVLTGKWVAQDA 160 170 180 190 200 210 370 380 390 400 410 420 pF1KSD GLGAGLDSFYEYLLKSYILFGEKEDLEMFNAAYQSIQNYLRRGREACNEGEGDPPLYVNV :.:::.::..:::.:. ::. .:. . :: ..:.:: : :. : CCDS46 GIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFD-----------DWYLWV 220 230 240 250 260 430 440 450 460 470 480 pF1KSD NMFSGQLMNTWIDSLQAFFPGLQVLIGDVEDAICLHAFYYAIWKRYGALPERYNWQLQAP .:..: . ..::.:..:::: ::::...:. ::..::..:.::: :: :. CCDS46 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIP-QGY 270 280 290 300 310 320 490 500 510 520 530 540 pF1KSD DVLF---YPLRPELVESTYLLYQATKNPFYLHVGMDILQSLEKYTKVKCGYATLHHVIDK : :::::::.::.. ::.:: .: :..: : ..:.:: .::.::.::.. . :. CCDS46 TVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATIKDLRDH 330 340 350 360 370 380 550 560 570 580 pF1KSD STEDRMESFFLSETCKYLYLLFDEDNPVHKSGTR-----------------YMFTTEGHI . ..:::::::.:: :::::::: : .:..:. :.:.::.: CCDS46 KLDNRMESFFLAETVKYLYLLFDPTNFIHNNGSTFDAVITPYGECILGAGGYIFNTEAHP 390 400 410 420 430 440 590 600 610 620 630 pF1KSD VSVD-----EHLRELPW------KEFFSEEGGQDQGGKSVHRPKPHELKVINSSSNCNRV .. ..:.: : .::.: . .... :.. : : CCDS46 IDPAALHCCQRLKEEQWEVEDLMREFYSLKRSRSKFQKNTVSSGPWEPPARPGTLFSPEN 450 460 470 480 490 500 640 650 pF1KSD PDERRYSLPLKSIYMRQIDQMVGLI CCDS46 HDQARERKPAKQKVPLLSCPSQPFTSKLALLGQVFLDSS 510 520 530 540 >>CCDS13247.1 EDEM2 gene_id:55741|Hs108|chr20 (578 aa) initn: 1070 init1: 333 opt: 489 Z-score: 374.5 bits: 79.4 E(32554): 1.5e-14 Smith-Waterman score: 1195; 40.8% identity (65.9% similar) in 542 aa overlap (110-619:24-526) 80 90 100 110 120 130 pF1KSD AQSPRKAPRRPGPGMCGPANWGYVLGGRGRGPDEYEKRYSGAFPPQLRAQMRDLARGMFV ::: :. : :..:. ...:: CCDS13 MPFRLLIPLGLLCALLPQHHGAPGPD-------GSAPDP--AHYRERVKAMFY 10 20 30 40 140 150 160 170 180 190 pF1KSD FGYDNYMAHAFPQDELNPIHCRGRGPDRGDPSNLNINDVLGNYSLTLVDALDTLAIMGNS .::.:. .::: ::: :. : : .:. :..::::.:::::: :.:: CCDS13 HAYDSYLENAFPFDELRPLTCDG-------------HDTWGSFSLTLIDALDTLLILGNV 50 60 70 80 90 200 210 220 230 240 250 pF1KSD SEFQKAVKLVINTVSFDKDSTVQVFEATIRVLGSLLSAHRIITDSKQPFGDMTIK-DYDN ::::..:... ..:.:: : ...:::..:::.:.::::: . ::. .. .. CCDS13 SEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLL---SKKAGVEVEAGWPCSG 100 110 120 130 140 260 270 280 290 300 310 pF1KSD ELLYMAHDLAVRLLPAFENTKTGIPYPRVNLKTGVPPDTNNETCTAGAGSLLVEFGILSR :: ::.. : .:::::. : ::.:: ::: :: : . ::::: :...:::. :: CCDS13 PLLRMAEEAARKLLPAFQ-TPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSS 150 160 170 180 190 200 320 330 340 350 360 370 pF1KSD LLGDSTFEWVARRAVKALWNLRSNDTGLLGNVVNIQTGHWVGKQSGLGAGLDSFYEYLLK : :: .:: ::: :. ::. :: : ::.:: ... ::.::....:.:::.::..:::.: CCDS13 LTGDPVFEDVARVALMRLWESRS-DIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVK 210 220 230 240 250 260 380 390 400 410 420 430 pF1KSD SYILFGEKEDLEMFNAAYQSIQNYLRRGREACNEGEGDPPLYVNVNMFSGQLMNTWIDSL . ::. .:. . :: ..:.:: : :. :.:..: . ..:: CCDS13 GAILLQDKKLMAMFLEYNKAIRNYTRFD-----------DWYLWVQMYKGTVSMPVFQSL 270 280 290 300 310 440 450 460 470 480 490 pF1KSD QAFFPGLQVLIGDVEDAICLHAFYYAIWKRYGALPERYNWQLQAPDVLF---YPLRPELV .:..:::: ::::...:. ::..::..:.::: :: :. : :::::::. CCDS13 EAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIP-QGYTVEKREGYPLRPELI 320 330 340 350 360 370 500 510 520 530 540 550 pF1KSD ESTYLLYQATKNPFYLHVGMDILQSLEKYTKVKCGYATLHHVIDKSTEDRMESFFLSETC ::.. ::.:: .: :..: : ..:.:: .::.::.::.. . :.. ..:::::::.:: CCDS13 ESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATIKDLRDHKLDNRMESFFLAETV 380 390 400 410 420 430 560 570 580 590 pF1KSD KYLYLLFDEDNPVHKSGTR-----------------YMFTTEGHIVSVD-----EHLREL :::::::: : .:..:. :.:.::.: .. ..:.: CCDS13 KYLYLLFDPTNFIHNNGSTFDAVITPYGECILGAGGYIFNTEAHPIDPAALHCCQRLKEE 440 450 460 470 480 490 600 610 620 630 640 pF1KSD PW------KEFFSEEGGQDQGGKSVHRPKPHELKVINSSSNCNRVPDERRYSLPLKSIYM : .::.: . .... :.. : : CCDS13 QWEVEDLMREFYSLKRSRSKFQKNTVSSGPWEPPARPGTLFSPENHDQARERKPAKQKVP 500 510 520 530 540 550 650 pF1KSD RQIDQMVGLI CCDS13 LLSCPSQPFTSKLALLGQVFLDSS 560 570 657 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 00:42:24 2016 done: Thu Nov 3 00:42:25 2016 Total Scan time: 3.220 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]