FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA0212, 657 aa
1>>>pF1KSDA0212 657 - 657 aa - 657 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.6992+/-0.00103; mu= 10.5531+/- 0.062
mean_var=183.9126+/-37.481, 0's: 0 Z-trim(111.0): 14 B-trim: 109 in 2/48
Lambda= 0.094573
statistics sampled from 11990 (12000) to 11990 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.705), E-opt: 0.2 (0.369), width: 16
Scan time: 3.220
The best scores are: opt bits E(32554)
CCDS33686.1 EDEM1 gene_id:9695|Hs108|chr3 ( 657) 4513 628.5 9e-180
CCDS1363.2 EDEM3 gene_id:80267|Hs108|chr1 ( 932) 837 127.1 1.1e-28
CCDS46592.1 EDEM2 gene_id:55741|Hs108|chr20 ( 541) 489 79.4 1.5e-14
CCDS13247.1 EDEM2 gene_id:55741|Hs108|chr20 ( 578) 489 79.4 1.5e-14
>>CCDS33686.1 EDEM1 gene_id:9695|Hs108|chr3 (657 aa)
initn: 4513 init1: 4513 opt: 4513 Z-score: 3341.0 bits: 628.5 E(32554): 9e-180
Smith-Waterman score: 4513; 100.0% identity (100.0% similar) in 657 aa overlap (1-657:1-657)
10 20 30 40 50 60
pF1KSD MQWRALVLGLVLLRLGLHGVLWLVFGLGPSMGFYQRFPLSFGFQRLRSPDGPASPTSGPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MQWRALVLGLVLLRLGLHGVLWLVFGLGPSMGFYQRFPLSFGFQRLRSPDGPASPTSGPV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD GRPGGVSGPSWLQPPGTGAAQSPRKAPRRPGPGMCGPANWGYVLGGRGRGPDEYEKRYSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GRPGGVSGPSWLQPPGTGAAQSPRKAPRRPGPGMCGPANWGYVLGGRGRGPDEYEKRYSG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD AFPPQLRAQMRDLARGMFVFGYDNYMAHAFPQDELNPIHCRGRGPDRGDPSNLNINDVLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 AFPPQLRAQMRDLARGMFVFGYDNYMAHAFPQDELNPIHCRGRGPDRGDPSNLNINDVLG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD NYSLTLVDALDTLAIMGNSSEFQKAVKLVINTVSFDKDSTVQVFEATIRVLGSLLSAHRI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NYSLTLVDALDTLAIMGNSSEFQKAVKLVINTVSFDKDSTVQVFEATIRVLGSLLSAHRI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD ITDSKQPFGDMTIKDYDNELLYMAHDLAVRLLPAFENTKTGIPYPRVNLKTGVPPDTNNE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ITDSKQPFGDMTIKDYDNELLYMAHDLAVRLLPAFENTKTGIPYPRVNLKTGVPPDTNNE
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD TCTAGAGSLLVEFGILSRLLGDSTFEWVARRAVKALWNLRSNDTGLLGNVVNIQTGHWVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TCTAGAGSLLVEFGILSRLLGDSTFEWVARRAVKALWNLRSNDTGLLGNVVNIQTGHWVG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD KQSGLGAGLDSFYEYLLKSYILFGEKEDLEMFNAAYQSIQNYLRRGREACNEGEGDPPLY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KQSGLGAGLDSFYEYLLKSYILFGEKEDLEMFNAAYQSIQNYLRRGREACNEGEGDPPLY
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD VNVNMFSGQLMNTWIDSLQAFFPGLQVLIGDVEDAICLHAFYYAIWKRYGALPERYNWQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VNVNMFSGQLMNTWIDSLQAFFPGLQVLIGDVEDAICLHAFYYAIWKRYGALPERYNWQL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD QAPDVLFYPLRPELVESTYLLYQATKNPFYLHVGMDILQSLEKYTKVKCGYATLHHVIDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QAPDVLFYPLRPELVESTYLLYQATKNPFYLHVGMDILQSLEKYTKVKCGYATLHHVIDK
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD STEDRMESFFLSETCKYLYLLFDEDNPVHKSGTRYMFTTEGHIVSVDEHLRELPWKEFFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 STEDRMESFFLSETCKYLYLLFDEDNPVHKSGTRYMFTTEGHIVSVDEHLRELPWKEFFS
550 560 570 580 590 600
610 620 630 640 650
pF1KSD EEGGQDQGGKSVHRPKPHELKVINSSSNCNRVPDERRYSLPLKSIYMRQIDQMVGLI
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EEGGQDQGGKSVHRPKPHELKVINSSSNCNRVPDERRYSLPLKSIYMRQIDQMVGLI
610 620 630 640 650
>>CCDS1363.2 EDEM3 gene_id:80267|Hs108|chr1 (932 aa)
initn: 1247 init1: 366 opt: 837 Z-score: 628.4 bits: 127.1 E(32554): 1.1e-28
Smith-Waterman score: 1303; 44.8% identity (74.5% similar) in 475 aa overlap (119-584:39-496)
90 100 110 120 130 140
pF1KSD RPGPGMCGPANWGYVLGGRGRGPDEYEKRYSGAFPP--QLRAQMRDLARGMFVFGYDNYM
.:: : . . .. . . :: .: :::
CCDS13 CGSPVPQRARWRLVAATAAFCLVSATSVWTAGAEPMSREEKQKLGNQVLEMFDHAYGNYM
10 20 30 40 50 60
150 160 170 180 190 200
pF1KSD AHAFPQDELNPIHCRGRGPDRG-DPSNLNINDVLGNYSLTLVDALDTLAIMGNSSEFQKA
::.: ::: :. :::: :: .:: ...:.::..::::.:.::::.......::. :
CCDS13 EHAYPADELMPLTCRGRV--RGQEPSRGDVDDALGKFSLTLIDSLDTLVVLNKTKEFEDA
70 80 90 100 110 120
210 220 230 240 250 260
pF1KSD VKLVINTVSFDKDSTVQVFEATIRVLGSLLSAHRIITDSKQPFGDMTIKDYDNELLYMAH
:. :. :..:.: .:.:::..:::::.::..: . :. :.. .. :..::: ::.
CCDS13 VRKVLRDVNLDNDVVVSVFETNIRVLGGLLGGHSLAIMLKEK-GEY-MQWYNDELLQMAK
130 140 150 160 170 180
270 280 290 300 310 320
pF1KSD DLAVRLLPAFENTKTGIPYPRVNLKTGV-PPD----TNNETCTAGAGSLLVEFGILSRLL
.:. .::::: :: .:.::::.::: :. :. :...:::: ::.:..::. :::.
CCDS13 QLGYKLLPAF-NTTSGLPYPRINLKFGIRKPEARTGTETDTCTACAGTLILEFAALSRFT
190 200 210 220 230 240
330 340 350 360 370 380
pF1KSD GDSTFEWVARRAVKALWNLRSNDTGLLGNVVNIQTGHWVGKQSGLGAGLDSFYEYLLKSY
: . :: ::.:. ::. :. ...:.: ..::.:: :: :.::.:::.::.::::::.:
CCDS13 GATIFEEYARKALDFLWEKRQRSSNLVGVTINIHTGDWVRKDSGVGAGIDSYYEYLLKAY
250 260 270 280 290 300
390 400 410 420 430
pF1KSD ILFGEKEDLEMFNAAYQSIQNYLRRGREACNEGEGDPPLYVNVNMFSGQL-MNTWIDSLQ
.:.:. :: ::. :..:. :. . ::: ..:.. . .: ::.:.:
CCDS13 VLLGDDSFLERFNTHYDAIMRYISQ-----------PPLLLDVHIHKPMLNARTWMDALL
310 320 330 340 350
440 450 460 470 480 490
pF1KSD AFFPGLQVLIGDVEDAICLHAFYYAIWKRYGALPERYNWQLQAPDVLFYPLRPELVESTY
::::::::: ::.. :: : . : . :... ::: .. .... . .:::::..::::
CCDS13 AFFPGLQVLKGDIRPAIETHEMLYQVIKKHNFLPEAFTTDFRVHWAQ-HPLRPEFAESTY
360 370 380 390 400 410
500 510 520 530 540 550
pF1KSD LLYQATKNPFYLHVGMDILQSLEKYTKVKCGYATLHHVIDKSTEDRMESFFLSETCKYLY
.::.:: .:.::.:: ....:.::..: ::.:... : : ::::.::::.: ::::
CCDS13 FLYKATGDPYYLEVGKTLIENLNKYARVPCGFAAMKDVRTGSHEDRMDSFFLAEMFKYLY
420 430 440 450 460 470
560 570 580 590 600 610
pF1KSD LLFDEDNPVHKSGTRYMFTTEGHIVSVDEHLRELPWKEFFSEEGGQDQGGKSVHRPKPHE
::: . . . . :.::::.:..
CCDS13 LLFADKEDIIFDIEDYIFTTEAHLLPLWLSTTNQSISKKNTTSEYTELDDSNFDWTCPNT
480 490 500 510 520 530
>>CCDS46592.1 EDEM2 gene_id:55741|Hs108|chr20 (541 aa)
initn: 935 init1: 333 opt: 489 Z-score: 374.9 bits: 79.4 E(32554): 1.5e-14
Smith-Waterman score: 1108; 41.2% identity (66.6% similar) in 497 aa overlap (155-619:15-489)
130 140 150 160 170 180
pF1KSD QLRAQMRDLARGMFVFGYDNYMAHAFPQDELNPIHCRGRGPDRGDPSNLNINDVLGNYSL
: : : . ::: . :. . . .::
CCDS46 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYS-----FSL
10 20 30
190 200 210 220 230 240
pF1KSD TLVDALDTLAIMGNSSEFQKAVKLVINTVSFDKDSTVQVFEATIRVLGSLLSAHRIITDS
::.:::::: :.:: ::::..:... ..:.:: : ...:::..:::.:.::::: . :
CCDS46 TLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLL---S
40 50 60 70 80 90
250 260 270 280 290 300
pF1KSD KQPFGDMTIK-DYDNELLYMAHDLAVRLLPAFENTKTGIPYPRVNLKTGVPPDTNNETCT
:. .. .. :: ::.. : .:::::. : ::.:: ::: :: : . :::
CCDS46 KKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQ-TPTGMPYGTVNLLHGVNPGETPVTCT
100 110 120 130 140 150
310 320 330 340 350 360
pF1KSD AGAGSLLVEFGILSRLLGDSTFEWVARRAVKALWNLRSNDTGLLGNVVNIQTGHWVGKQS
:: :...:::. :: : :: .:: ::: :. ::. :: : ::.:: ... ::.::....
CCDS46 AGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRS-DIGLVGNHIDVLTGKWVAQDA
160 170 180 190 200 210
370 380 390 400 410 420
pF1KSD GLGAGLDSFYEYLLKSYILFGEKEDLEMFNAAYQSIQNYLRRGREACNEGEGDPPLYVNV
:.:::.::..:::.:. ::. .:. . :: ..:.:: : :. :
CCDS46 GIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFD-----------DWYLWV
220 230 240 250 260
430 440 450 460 470 480
pF1KSD NMFSGQLMNTWIDSLQAFFPGLQVLIGDVEDAICLHAFYYAIWKRYGALPERYNWQLQAP
.:..: . ..::.:..:::: ::::...:. ::..::..:.::: :: :.
CCDS46 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIP-QGY
270 280 290 300 310 320
490 500 510 520 530 540
pF1KSD DVLF---YPLRPELVESTYLLYQATKNPFYLHVGMDILQSLEKYTKVKCGYATLHHVIDK
: :::::::.::.. ::.:: .: :..: : ..:.:: .::.::.::.. . :.
CCDS46 TVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATIKDLRDH
330 340 350 360 370 380
550 560 570 580
pF1KSD STEDRMESFFLSETCKYLYLLFDEDNPVHKSGTR-----------------YMFTTEGHI
. ..:::::::.:: :::::::: : .:..:. :.:.::.:
CCDS46 KLDNRMESFFLAETVKYLYLLFDPTNFIHNNGSTFDAVITPYGECILGAGGYIFNTEAHP
390 400 410 420 430 440
590 600 610 620 630
pF1KSD VSVD-----EHLRELPW------KEFFSEEGGQDQGGKSVHRPKPHELKVINSSSNCNRV
.. ..:.: : .::.: . .... :.. : :
CCDS46 IDPAALHCCQRLKEEQWEVEDLMREFYSLKRSRSKFQKNTVSSGPWEPPARPGTLFSPEN
450 460 470 480 490 500
640 650
pF1KSD PDERRYSLPLKSIYMRQIDQMVGLI
CCDS46 HDQARERKPAKQKVPLLSCPSQPFTSKLALLGQVFLDSS
510 520 530 540
>>CCDS13247.1 EDEM2 gene_id:55741|Hs108|chr20 (578 aa)
initn: 1070 init1: 333 opt: 489 Z-score: 374.5 bits: 79.4 E(32554): 1.5e-14
Smith-Waterman score: 1195; 40.8% identity (65.9% similar) in 542 aa overlap (110-619:24-526)
80 90 100 110 120 130
pF1KSD AQSPRKAPRRPGPGMCGPANWGYVLGGRGRGPDEYEKRYSGAFPPQLRAQMRDLARGMFV
::: :. : :..:. ...::
CCDS13 MPFRLLIPLGLLCALLPQHHGAPGPD-------GSAPDP--AHYRERVKAMFY
10 20 30 40
140 150 160 170 180 190
pF1KSD FGYDNYMAHAFPQDELNPIHCRGRGPDRGDPSNLNINDVLGNYSLTLVDALDTLAIMGNS
.::.:. .::: ::: :. : : .:. :..::::.:::::: :.::
CCDS13 HAYDSYLENAFPFDELRPLTCDG-------------HDTWGSFSLTLIDALDTLLILGNV
50 60 70 80 90
200 210 220 230 240 250
pF1KSD SEFQKAVKLVINTVSFDKDSTVQVFEATIRVLGSLLSAHRIITDSKQPFGDMTIK-DYDN
::::..:... ..:.:: : ...:::..:::.:.::::: . ::. .. ..
CCDS13 SEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLL---SKKAGVEVEAGWPCSG
100 110 120 130 140
260 270 280 290 300 310
pF1KSD ELLYMAHDLAVRLLPAFENTKTGIPYPRVNLKTGVPPDTNNETCTAGAGSLLVEFGILSR
:: ::.. : .:::::. : ::.:: ::: :: : . ::::: :...:::. ::
CCDS13 PLLRMAEEAARKLLPAFQ-TPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSS
150 160 170 180 190 200
320 330 340 350 360 370
pF1KSD LLGDSTFEWVARRAVKALWNLRSNDTGLLGNVVNIQTGHWVGKQSGLGAGLDSFYEYLLK
: :: .:: ::: :. ::. :: : ::.:: ... ::.::....:.:::.::..:::.:
CCDS13 LTGDPVFEDVARVALMRLWESRS-DIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVK
210 220 230 240 250 260
380 390 400 410 420 430
pF1KSD SYILFGEKEDLEMFNAAYQSIQNYLRRGREACNEGEGDPPLYVNVNMFSGQLMNTWIDSL
. ::. .:. . :: ..:.:: : :. :.:..: . ..::
CCDS13 GAILLQDKKLMAMFLEYNKAIRNYTRFD-----------DWYLWVQMYKGTVSMPVFQSL
270 280 290 300 310
440 450 460 470 480 490
pF1KSD QAFFPGLQVLIGDVEDAICLHAFYYAIWKRYGALPERYNWQLQAPDVLF---YPLRPELV
.:..:::: ::::...:. ::..::..:.::: :: :. : :::::::.
CCDS13 EAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIP-QGYTVEKREGYPLRPELI
320 330 340 350 360 370
500 510 520 530 540 550
pF1KSD ESTYLLYQATKNPFYLHVGMDILQSLEKYTKVKCGYATLHHVIDKSTEDRMESFFLSETC
::.. ::.:: .: :..: : ..:.:: .::.::.::.. . :.. ..:::::::.::
CCDS13 ESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATIKDLRDHKLDNRMESFFLAETV
380 390 400 410 420 430
560 570 580 590
pF1KSD KYLYLLFDEDNPVHKSGTR-----------------YMFTTEGHIVSVD-----EHLREL
:::::::: : .:..:. :.:.::.: .. ..:.:
CCDS13 KYLYLLFDPTNFIHNNGSTFDAVITPYGECILGAGGYIFNTEAHPIDPAALHCCQRLKEE
440 450 460 470 480 490
600 610 620 630 640
pF1KSD PW------KEFFSEEGGQDQGGKSVHRPKPHELKVINSSSNCNRVPDERRYSLPLKSIYM
: .::.: . .... :.. : :
CCDS13 QWEVEDLMREFYSLKRSRSKFQKNTVSSGPWEPPARPGTLFSPENHDQARERKPAKQKVP
500 510 520 530 540 550
650
pF1KSD RQIDQMVGLI
CCDS13 LLSCPSQPFTSKLALLGQVFLDSS
560 570
657 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 00:42:24 2016 done: Thu Nov 3 00:42:25 2016
Total Scan time: 3.220 Total Display time: 0.020
Function used was FASTA [36.3.4 Apr, 2011]