FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1247, 870 aa
1>>>pF1KSDA1247 870 - 870 aa - 870 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.1657+/-0.000963; mu= 16.6915+/- 0.058
mean_var=81.0745+/-15.554, 0's: 0 Z-trim(106.0): 25 B-trim: 0 in 0/52
Lambda= 0.142440
statistics sampled from 8709 (8732) to 8709 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.634), E-opt: 0.2 (0.268), width: 16
Scan time: 3.650
The best scores are: opt bits E(32554)
CCDS13408.1 SULF2 gene_id:55959|Hs108|chr20 ( 870) 6069 1257.4 0
CCDS13409.2 SULF2 gene_id:55959|Hs108|chr20 ( 867) 6034 1250.2 0
CCDS6204.1 SULF1 gene_id:23213|Hs108|chr8 ( 871) 2774 580.3 5e-165
CCDS8970.1 GNS gene_id:2799|Hs108|chr12 ( 552) 1044 224.7 3.5e-58
CCDS4073.1 ARSK gene_id:153642|Hs108|chr5 ( 536) 329 77.8 5.9e-14
>>CCDS13408.1 SULF2 gene_id:55959|Hs108|chr20 (870 aa)
initn: 6069 init1: 6069 opt: 6069 Z-score: 6735.6 bits: 1257.4 E(32554): 0
Smith-Waterman score: 6069; 99.9% identity (100.0% similar) in 870 aa overlap (1-870:1-870)
10 20 30 40 50 60
pF1KSD MGPPSLVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVELGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MGPPSLVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVELGS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD MQVMNKTRRIMEQGGTHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSWQA
:::::::::::::::.::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MQVMNKTRRIMEQGGAHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSWQA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD QHESRTFAVYLNSTGYRTAFFGKYLNEYNGSYVPPGWKEWVGLLKNSRFYNYTLCRNGVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 QHESRTFAVYLNSTGYRTAFFGKYLNEYNGSYVPPGWKEWVGLLKNSRFYNYTLCRNGVK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD EKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRLFP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 EKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRLFP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD NASQHITPSYNYAPNPDKHWIMRYTGPMKPIHMEFTNMLQRKRLQTLMSVDDSMETIYNM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 NASQHITPSYNYAPNPDKHWIMRYTGPMKPIHMEFTNMLQRKRLQTLMSVDDSMETIYNM
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD LVETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPHIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LVETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPHIV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD LNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGKLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGKLL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD HKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLGQKWQCVEDATGKLKLHKCKGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 HKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLGQKWQCVEDATGKLKLHKCKGP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD MRLGGSRALSNLVPKYYGQGSEACTCDSGDYKLSLAGRRKKLFKKKYKASYVRSRSIRSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MRLGGSRALSNLVPKYYGQGSEACTCDSGDYKLSLAGRRKKLFKKKYKASYVRSRSIRSV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD AIEVDGRVYHVGLGDAAQPRNLTKRHWPGAPEDQDDKDGGDFSGTGGLPDYSAANPIKVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 AIEVDGRVYHVGLGDAAQPRNLTKRHWPGAPEDQDDKDGGDFSGTGGLPDYSAANPIKVT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD HRCYILENDTVQCDLDLYKSLQAWKDHKLHIDHEIETLQNKIKNLREVRGHLKKKRPEEC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 HRCYILENDTVQCDLDLYKSLQAWKDHKLHIDHEIETLQNKIKNLREVRGHLKKKRPEEC
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD DCHKISYHTQHKGRLKHRGSSLHPFRKGLQEKDKVWLLREQKRKKKLRKLLKRLQNNDTC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 DCHKISYHTQHKGRLKHRGSSLHPFRKGLQEKDKVWLLREQKRKKKLRKLLKRLQNNDTC
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD SMPGLTCFTHDNQHWQTAPFWTLGPFCACTSANNNTYWCMRTINETHNFLFCEFATGFLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SMPGLTCFTHDNQHWQTAPFWTLGPFCACTSANNNTYWCMRTINETHNFLFCEFATGFLE
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD YFDLNTDPYQLMNAVNTLDRDVLNQLHVQLMELRSCKGYKQCNPRTRNMDLGLKDGGSYE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 YFDLNTDPYQLMNAVNTLDRDVLNQLHVQLMELRSCKGYKQCNPRTRNMDLGLKDGGSYE
790 800 810 820 830 840
850 860 870
pF1KSD QYRQFQRRKWPEMKRPSSKSLGQLWEGWEG
::::::::::::::::::::::::::::::
CCDS13 QYRQFQRRKWPEMKRPSSKSLGQLWEGWEG
850 860 870
>>CCDS13409.2 SULF2 gene_id:55959|Hs108|chr20 (867 aa)
initn: 5802 init1: 5802 opt: 6034 Z-score: 6696.8 bits: 1250.2 E(32554): 0
Smith-Waterman score: 6034; 99.5% identity (99.7% similar) in 870 aa overlap (1-870:1-867)
10 20 30 40 50 60
pF1KSD MGPPSLVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVELGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MGPPSLVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVELGS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD MQVMNKTRRIMEQGGTHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSWQA
:::::::::::::::.::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MQVMNKTRRIMEQGGAHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSWQA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD QHESRTFAVYLNSTGYRTAFFGKYLNEYNGSYVPPGWKEWVGLLKNSRFYNYTLCRNGVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 QHESRTFAVYLNSTGYRTAFFGKYLNEYNGSYVPPGWKEWVGLLKNSRFYNYTLCRNGVK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD EKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRLFP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 EKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRLFP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD NASQHITPSYNYAPNPDKHWIMRYTGPMKPIHMEFTNMLQRKRLQTLMSVDDSMETIYNM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 NASQHITPSYNYAPNPDKHWIMRYTGPMKPIHMEFTNMLQRKRLQTLMSVDDSMETIYNM
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD LVETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPHIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LVETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPHIV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD LNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGKLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGKLL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD HKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLGQKWQCVEDATGKLKLHKCKGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 HKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLGQKWQCVEDATGKLKLHKCKGP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD MRLGGSRALSNLVPKYYGQGSEACTCDSGDYKLSLAGRRKKLFKKKYKASYVRSRSIRSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MRLGGSRALSNLVPKYYGQGSEACTCDSGDYKLSLAGRRKKLFKKKYKASYVRSRSIRSV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD AIEVDGRVYHVGLGDAAQPRNLTKRHWPGAPEDQDDKDGGDFSGTGGLPDYSAANPIKVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 AIEVDGRVYHVGLGDAAQPRNLTKRHWPGAPEDQDDKDGGDFSGTGGLPDYSAANPIKVT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD HRCYILENDTVQCDLDLYKSLQAWKDHKLHIDHEIETLQNKIKNLREVRGHLKKKRPEEC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 HRCYILENDTVQCDLDLYKSLQAWKDHKLHIDHEIETLQNKIKNLREVRGHLKKKRPEEC
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD DCHKISYHTQHKGRLKHRGSSLHPFRKGLQEKDKVWLLREQKRKKKLRKLLKRLQNNDTC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 DCHKISYHTQHKGRLKHRGSSLHPFRKGLQEKDKVWLLREQKRKKKLRKLLKRLQNNDTC
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD SMPGLTCFTHDNQHWQTAPFWTLGPFCACTSANNNTYWCMRTINETHNFLFCEFATGFLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SMPGLTCFTHDNQHWQTAPFWTLGPFCACTSANNNTYWCMRTINETHNFLFCEFATGFLE
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD YFDLNTDPYQLMNAVNTLDRDVLNQLHVQLMELRSCKGYKQCNPRTRNMDLGLKDGGSYE
::::::::::::::::::::::::::::::::::::::::::::::::::: ::::::
CCDS13 YFDLNTDPYQLMNAVNTLDRDVLNQLHVQLMELRSCKGYKQCNPRTRNMDL---DGGSYE
790 800 810 820 830
850 860 870
pF1KSD QYRQFQRRKWPEMKRPSSKSLGQLWEGWEG
::::::::::::::::::::::::::::::
CCDS13 QYRQFQRRKWPEMKRPSSKSLGQLWEGWEG
840 850 860
>>CCDS6204.1 SULF1 gene_id:23213|Hs108|chr8 (871 aa)
initn: 3955 init1: 2651 opt: 2774 Z-score: 3076.2 bits: 580.3 E(32554): 5e-165
Smith-Waterman score: 4065; 65.1% identity (84.7% similar) in 887 aa overlap (5-870:7-871)
10 20 30 40 50
pF1KSD MGPPSLVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVEL
.::: .:.. :::. . . :..::.:..:.::::::::::::::::::
CCDS62 MKYSCCALVLAVLGTE---LLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVEL
10 20 30 40 50
60 70 80 90 100 110
pF1KSD GSMQVMNKTRRIMEQGGTHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSW
::.:::::::.:::.::. :::::::::::::::::.::::::::::.::::::::::::
CCDS62 GSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSW
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD QAQHESRTFAVYLNSTGYRTAFFGKYLNEYNGSYVPPGWKEWVGLLKNSRFYNYTLCRNG
::.:: ::::::::.:::::::::::::::::::.::::.::.::.:::::::::.::::
CCDS62 QAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNG
120 130 140 150 160 170
180 190 200 210 220 230
pF1KSD VKEKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRL
.::::: ::.:::.::::::.:...:. ::.:::::::.:::::::::::::::::.:.:
CCDS62 IKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKL
180 190 200 210 220 230
240 250 260 270 280 290
pF1KSD FPNASQHITPSYNYAPNPDKHWIMRYTGPMKPIHMEFTNMLQRKRLQTLMSVDDSMETIY
.:::::::::::::::: ::::::.::::: ::::::::.:::::::::::::::.: .:
CCDS62 YPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLY
240 250 260 270 280 290
300 310 320 330 340 350
pF1KSD NMLVETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPH
:::::::::.::::.::::::::::::::::::::::.:::::::..:::.:: : . :.
CCDS62 NMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQ
300 310 320 330 340 350
360 370 380 390 400 410
pF1KSD IVLNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGK
:::::::::::::::::: : :.::::.::::: :.: :::. .:: ..:::.:::::::
CCDS62 IVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGK
360 370 380 390 400 410
420 430 440 450 460 470
pF1KSD LLHKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLGQKWQCVEDATGKLKLHKCK
.:.:..... . :. : ::::.:::.:::.:.::::::: ::::::.::..:::..::::
CCDS62 FLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCK
420 430 440 450 460 470
480 490 500 510 520 530
pF1KSD GPMRLGGSR-ALSNLVPKYYGQGSEACTCDSGDYKLSLAGRR-KKLFKK-----KYKASY
:: : : . :: . . . .. :.: . :. : . :. .. : . ::: .
CCDS62 GPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRF
480 490 500 510 520 530
540 550 560 570 580
pF1KSD VRSRSIRSVAIEVDGRVYHVGLGDAA-----QPRNLTKRHWPG--APEDQDDKDGGDFSG
:..:. ::...: .:..: ..: . ::::..::: : .:.: . ..::. :
CCDS62 VHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGN-RG
540 550 560 570 580 590
590 600 610 620 630 640
pF1KSD TGGLPDYSAANP---IKVTHRCYILENDTVQCDLDLYKSLQAWKDHKLHIDHEIETLQNK
. .:..: ..:::.:.:: ::...:. .::.: .:::::: .::.:::.::.:
CCDS62 RMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDK
600 610 620 630 640 650
650 660 670 680 690
pF1KSD IKNLREVRGHLKKKRPEECDCHKISYHTQHKGRLKHRG--SSLHPFRKGLQEKD-KVWLL
::::::::::::...::::.: : ::....:: :.. : ::::... :: : :. :.
CCDS62 IKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLF
660 670 680 690 700 710
700 710 720 730 740 750
pF1KSD REQ-KRKKKLRKLLKRLQNNDTCSMPGLTCFTHDNQHWQTAPFWTLGPFCACTSANNNTY
.:. .:.:: :: .: .... ::.::::::::::.::::::::.:: ::::::.:::::
CCDS62 KENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTY
720 730 740 750 760 770
760 770 780 790 800 810
pF1KSD WCMRTINETHNFLFCEFATGFLEYFDLNTDPYQLMNAVNTLDRDVLNQLHVQLMELRSCK
::.::.::::::::::::::::::::.::::::: :.:.:..: .::::::::::::::.
CCDS62 WCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQ
780 790 800 810 820 830
820 830 840 850 860 870
pF1KSD GYKQCNPRTRNMDLGLKDGGSYEQYRQFQRRKWPEMKRPSSKSLGQLWEGWEG
:::::::: .:.:.: ::::::. .: ::::.::::
CCDS62 GYKQCNPRPKNLDVGNKDGGSYDLHR------------------GQLWDGWEG
840 850 860 870
>>CCDS8970.1 GNS gene_id:2799|Hs108|chr12 (552 aa)
initn: 1122 init1: 436 opt: 1044 Z-score: 1158.0 bits: 224.7 E(32554): 3.5e-58
Smith-Waterman score: 1049; 41.3% identity (65.6% similar) in 448 aa overlap (43-478:46-468)
20 30 40 50 60 70
pF1KSD ATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVELGSMQVMNKTRRIME
:::..:.:::::: ::.: ..::. ..
CCDS89 PRHLPSCSPALLLLVLGGCLGVFGVAAGTRRPNVVLLLTDDQDEVLGGMTPLKKTKALIG
20 30 40 50 60 70
80 90 100 110 120 130
pF1KSD QGGTHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNE--NCSSPSWQAQHESRTFAVY
. : : .:.: . .:::::.::::::: :::.. .:. :::: ::: .: :: .
CCDS89 EMGMTFSSAYVPSALCCPSRASILTGKYPHNHHVVNNTLEGNCSSKSWQKIQEPNTFPAI
80 90 100 110 120 130
140 150 160 170 180
pF1KSD LNST-GYRTAFFGKYLNEYNGS------YVPPGWKEWVGLLKNSRFYNYTLCRNGVKEKH
: : ::.: : :::::::.. .:: ::. : .: :::..::::: :: .::
CCDS89 LRSMCGYQTFFAGKYLNEYGAPDAGGLEHVPLGWSYWYALEKNSKYYNYTLSINGKARKH
140 150 160 170 180 190
190 200 210 220 230 240
pF1KSD GSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRLFPNAS
: .:: :::::...: :..:. .... .: .:.:. :::.: .::::.. : :.
CCDS89 GENYSVDYLTDVLANVSLDFLDYKSNF---EPFFMMIATPAPHSPWTAAPQYQKAFQNVF
200 210 220 230 240 250
250 260 270 280 290 300
pF1KSD QHITPSYNYAPNPDKHWIMRYTG-PMKPIHMEFTNMLQRKRLQTLMSVDDSMETIYNMLV
. ..: . .:::..: . :: ..: . ::: :::.:::: .: . . :
CCDS89 APRNKNFNIH-GTNKHWLIRQAKTPMTNSSIQFLDNAFRKRWQTLLSVDDLVEKLVKRLE
260 270 280 290 300 310
310 320 330 340 350 360
pF1KSD ETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPHIVLN
::::.:::: ::.:.::: :::.: : . :::::.::. ::::... . . .: :
CCDS89 FTGELNNTYIFYTSDNGYHTGQFSLPIDKRQLYEFDIKVPLLVRGPGIKPNQTSKMLVAN
320 330 340 350 360 370
370 380 390 400 410 420
pF1KSD IDLAPTILDIAGLDI-PADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGKLLH
:::.:::::::: :. ..::: :.: .: : .. . .::.. ::: .
CCDS89 IDLGPTILDIAGYDLNKTQMDGMSLLPIL---RGASNL-------TWRSDVLVEY----Q
380 390 400 410
430 440 450 460 470 480
pF1KSD KRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQ-LGQKWQCVEDATGKLKLHKCKGP
. . .: .. : .. : .::. .. . ::. .. .:. :.
CCDS89 GEGRNVTDPTCPSLSPGVSQCFPDC-------VCEDAYNNTYACVRTMSALWNLQYCEFD
420 430 440 450 460 470
490 500 510 520 530 540
pF1KSD MRLGGSRALSNLVPKYYGQGSEACTCDSGDYKLSLAGRRKKLFKKKYKASYVRSRSIRSV
CCDS89 DQEVFVEVYNLTADPDQITNIAKTIDPELLGKMNYRLMMLQSCSGPTCRTPGVFDPGYRF
480 490 500 510 520 530
>>CCDS4073.1 ARSK gene_id:153642|Hs108|chr5 (536 aa)
initn: 425 init1: 154 opt: 329 Z-score: 364.1 bits: 77.8 E(32554): 5.9e-14
Smith-Waterman score: 379; 26.6% identity (56.4% similar) in 399 aa overlap (36-408:24-402)
10 20 30 40 50 60
pF1KSD LVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVEL----GSM
:: : ::..::..:. : .: ::.
CCDS40 MLLLWVSVVAALALAVLAPGAGEQRRRAAKAPNVVLVVSDSFDGRLTFHPGSQ
10 20 30 40 50
70 80 90 100 110 120
pF1KSD QVMNKTRRIMEQGGTHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSWQAQ
: .:. :: :.::....:.:::::... .: ..: ... :: . .:..
CCDS40 VVKLPFINFMKTRGTSFLNAYTNSPICCPSRAAMWSGLFTHLTESW-NNFKGLDPNYT--
60 70 80 90 100 110
130 140 150 160 170
pF1KSD HESRTFAVYLNSTGYRTAFFGKYLNEYNG----SYVPPGWKEWVG-LLKNSRFYNYTLCR
:. .. :::: ::: :. .: : .: . :. ::.. .: :
CCDS40 ----TWMDVMERHGYRTQKFGK-LDYTSGHHSISNRVEAWTRDVAFLLRQEGRPMVNLIR
120 130 140 150 160
180 190 200 210 220 230
pF1KSD NGVKEKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYS
: .: . . .:. . :. .:...: : . : .. .. :: : : :. .
CCDS40 NRTKVR---VMERDWQN---TDKAVNWLRKEAINYTE-PFVIYLGLNLPH-PYPS-PSSG
170 180 190 200 210
240 250 260 270 280
pF1KSD RLFPNASQHITPSYNYAPNPDKHWIMRYTGPMKPIH-MEF--------TNMLQRKRLQTL
. : ... : . . . : : ... :.. .: ... :. . .:.....
CCDS40 ENFGSSTFHTSLYWLEKVSHDAIKIPKWS-PLSEMHPVDYYSSYTKNCTGRFTKKEIKNI
220 230 240 250 260 270
290 300 310 320 330
pF1KSD MSVDDSM--ET---IYNMLVETGELD---NTYIVYTADHGYHIGQFGLVKGKSMPYEFDI
. .: :: . .... .:: .: ..:..::: . :: :: .
CCDS40 RAFYYAMCAETDAMLGEIILALHQLDLLQKTIVIYSSDHGELAMEHRQFYKMSM-YEASA
280 290 300 310 320 330
340 350 360 370 380 390
pF1KSD RVPFYVRGPNVEAGCLNPHIVLNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRF
.::. . ::...:: ..: .:. ::.:::::. .: ...: :.: : ..: :.
CCDS40 HVPLLMMGPGIKAGLQVSNVVSLVDIYPTMLDIAGIPLPQNLSGYSLLPL-SSETFKNEH
340 350 360 370 380 390
400 410 420 430 440 450
pF1KSD HLKKKMRVWRDSFLVERGKLLHKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLG
..:. :
CCDS40 KVKNLHPPWILSEFHGCNVNASTYMLRTNHWKYIAYSDGASILPQLFDLSSDPDELTNVA
400 410 420 430 440 450
870 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 05:33:05 2016 done: Thu Nov 3 05:33:06 2016
Total Scan time: 3.650 Total Display time: 0.140
Function used was FASTA [36.3.4 Apr, 2011]