FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA1247, 870 aa 1>>>pF1KSDA1247 870 - 870 aa - 870 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1657+/-0.000963; mu= 16.6915+/- 0.058 mean_var=81.0745+/-15.554, 0's: 0 Z-trim(106.0): 25 B-trim: 0 in 0/52 Lambda= 0.142440 statistics sampled from 8709 (8732) to 8709 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.634), E-opt: 0.2 (0.268), width: 16 Scan time: 3.650 The best scores are: opt bits E(32554) CCDS13408.1 SULF2 gene_id:55959|Hs108|chr20 ( 870) 6069 1257.4 0 CCDS13409.2 SULF2 gene_id:55959|Hs108|chr20 ( 867) 6034 1250.2 0 CCDS6204.1 SULF1 gene_id:23213|Hs108|chr8 ( 871) 2774 580.3 5e-165 CCDS8970.1 GNS gene_id:2799|Hs108|chr12 ( 552) 1044 224.7 3.5e-58 CCDS4073.1 ARSK gene_id:153642|Hs108|chr5 ( 536) 329 77.8 5.9e-14 >>CCDS13408.1 SULF2 gene_id:55959|Hs108|chr20 (870 aa) initn: 6069 init1: 6069 opt: 6069 Z-score: 6735.6 bits: 1257.4 E(32554): 0 Smith-Waterman score: 6069; 99.9% identity (100.0% similar) in 870 aa overlap (1-870:1-870) 10 20 30 40 50 60 pF1KSD MGPPSLVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVELGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MGPPSLVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVELGS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD MQVMNKTRRIMEQGGTHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSWQA :::::::::::::::.:::::::::::::::::::::::::::::::::::::::::::: CCDS13 MQVMNKTRRIMEQGGAHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSWQA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD QHESRTFAVYLNSTGYRTAFFGKYLNEYNGSYVPPGWKEWVGLLKNSRFYNYTLCRNGVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 QHESRTFAVYLNSTGYRTAFFGKYLNEYNGSYVPPGWKEWVGLLKNSRFYNYTLCRNGVK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD EKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRLFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 EKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRLFP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD NASQHITPSYNYAPNPDKHWIMRYTGPMKPIHMEFTNMLQRKRLQTLMSVDDSMETIYNM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 NASQHITPSYNYAPNPDKHWIMRYTGPMKPIHMEFTNMLQRKRLQTLMSVDDSMETIYNM 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD LVETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPHIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LVETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPHIV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD LNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGKLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGKLL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD HKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLGQKWQCVEDATGKLKLHKCKGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 HKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLGQKWQCVEDATGKLKLHKCKGP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD MRLGGSRALSNLVPKYYGQGSEACTCDSGDYKLSLAGRRKKLFKKKYKASYVRSRSIRSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MRLGGSRALSNLVPKYYGQGSEACTCDSGDYKLSLAGRRKKLFKKKYKASYVRSRSIRSV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD AIEVDGRVYHVGLGDAAQPRNLTKRHWPGAPEDQDDKDGGDFSGTGGLPDYSAANPIKVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 AIEVDGRVYHVGLGDAAQPRNLTKRHWPGAPEDQDDKDGGDFSGTGGLPDYSAANPIKVT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD HRCYILENDTVQCDLDLYKSLQAWKDHKLHIDHEIETLQNKIKNLREVRGHLKKKRPEEC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 HRCYILENDTVQCDLDLYKSLQAWKDHKLHIDHEIETLQNKIKNLREVRGHLKKKRPEEC 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD DCHKISYHTQHKGRLKHRGSSLHPFRKGLQEKDKVWLLREQKRKKKLRKLLKRLQNNDTC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 DCHKISYHTQHKGRLKHRGSSLHPFRKGLQEKDKVWLLREQKRKKKLRKLLKRLQNNDTC 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD SMPGLTCFTHDNQHWQTAPFWTLGPFCACTSANNNTYWCMRTINETHNFLFCEFATGFLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SMPGLTCFTHDNQHWQTAPFWTLGPFCACTSANNNTYWCMRTINETHNFLFCEFATGFLE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD YFDLNTDPYQLMNAVNTLDRDVLNQLHVQLMELRSCKGYKQCNPRTRNMDLGLKDGGSYE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 YFDLNTDPYQLMNAVNTLDRDVLNQLHVQLMELRSCKGYKQCNPRTRNMDLGLKDGGSYE 790 800 810 820 830 840 850 860 870 pF1KSD QYRQFQRRKWPEMKRPSSKSLGQLWEGWEG :::::::::::::::::::::::::::::: CCDS13 QYRQFQRRKWPEMKRPSSKSLGQLWEGWEG 850 860 870 >>CCDS13409.2 SULF2 gene_id:55959|Hs108|chr20 (867 aa) initn: 5802 init1: 5802 opt: 6034 Z-score: 6696.8 bits: 1250.2 E(32554): 0 Smith-Waterman score: 6034; 99.5% identity (99.7% similar) in 870 aa overlap (1-870:1-867) 10 20 30 40 50 60 pF1KSD MGPPSLVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVELGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MGPPSLVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVELGS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD MQVMNKTRRIMEQGGTHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSWQA :::::::::::::::.:::::::::::::::::::::::::::::::::::::::::::: CCDS13 MQVMNKTRRIMEQGGAHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSWQA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD QHESRTFAVYLNSTGYRTAFFGKYLNEYNGSYVPPGWKEWVGLLKNSRFYNYTLCRNGVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 QHESRTFAVYLNSTGYRTAFFGKYLNEYNGSYVPPGWKEWVGLLKNSRFYNYTLCRNGVK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD EKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRLFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 EKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRLFP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD NASQHITPSYNYAPNPDKHWIMRYTGPMKPIHMEFTNMLQRKRLQTLMSVDDSMETIYNM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 NASQHITPSYNYAPNPDKHWIMRYTGPMKPIHMEFTNMLQRKRLQTLMSVDDSMETIYNM 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD LVETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPHIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LVETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPHIV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD LNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGKLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGKLL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD HKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLGQKWQCVEDATGKLKLHKCKGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 HKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLGQKWQCVEDATGKLKLHKCKGP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD MRLGGSRALSNLVPKYYGQGSEACTCDSGDYKLSLAGRRKKLFKKKYKASYVRSRSIRSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MRLGGSRALSNLVPKYYGQGSEACTCDSGDYKLSLAGRRKKLFKKKYKASYVRSRSIRSV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD AIEVDGRVYHVGLGDAAQPRNLTKRHWPGAPEDQDDKDGGDFSGTGGLPDYSAANPIKVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 AIEVDGRVYHVGLGDAAQPRNLTKRHWPGAPEDQDDKDGGDFSGTGGLPDYSAANPIKVT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD HRCYILENDTVQCDLDLYKSLQAWKDHKLHIDHEIETLQNKIKNLREVRGHLKKKRPEEC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 HRCYILENDTVQCDLDLYKSLQAWKDHKLHIDHEIETLQNKIKNLREVRGHLKKKRPEEC 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD DCHKISYHTQHKGRLKHRGSSLHPFRKGLQEKDKVWLLREQKRKKKLRKLLKRLQNNDTC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 DCHKISYHTQHKGRLKHRGSSLHPFRKGLQEKDKVWLLREQKRKKKLRKLLKRLQNNDTC 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD SMPGLTCFTHDNQHWQTAPFWTLGPFCACTSANNNTYWCMRTINETHNFLFCEFATGFLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SMPGLTCFTHDNQHWQTAPFWTLGPFCACTSANNNTYWCMRTINETHNFLFCEFATGFLE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD YFDLNTDPYQLMNAVNTLDRDVLNQLHVQLMELRSCKGYKQCNPRTRNMDLGLKDGGSYE ::::::::::::::::::::::::::::::::::::::::::::::::::: :::::: CCDS13 YFDLNTDPYQLMNAVNTLDRDVLNQLHVQLMELRSCKGYKQCNPRTRNMDL---DGGSYE 790 800 810 820 830 850 860 870 pF1KSD QYRQFQRRKWPEMKRPSSKSLGQLWEGWEG :::::::::::::::::::::::::::::: CCDS13 QYRQFQRRKWPEMKRPSSKSLGQLWEGWEG 840 850 860 >>CCDS6204.1 SULF1 gene_id:23213|Hs108|chr8 (871 aa) initn: 3955 init1: 2651 opt: 2774 Z-score: 3076.2 bits: 580.3 E(32554): 5e-165 Smith-Waterman score: 4065; 65.1% identity (84.7% similar) in 887 aa overlap (5-870:7-871) 10 20 30 40 50 pF1KSD MGPPSLVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVEL .::: .:.. :::. . . :..::.:..:.:::::::::::::::::: CCDS62 MKYSCCALVLAVLGTE---LLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVEL 10 20 30 40 50 60 70 80 90 100 110 pF1KSD GSMQVMNKTRRIMEQGGTHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSW ::.:::::::.:::.::. :::::::::::::::::.::::::::::.:::::::::::: CCDS62 GSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSW 60 70 80 90 100 110 120 130 140 150 160 170 pF1KSD QAQHESRTFAVYLNSTGYRTAFFGKYLNEYNGSYVPPGWKEWVGLLKNSRFYNYTLCRNG ::.:: ::::::::.:::::::::::::::::::.::::.::.::.:::::::::.:::: CCDS62 QAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KSD VKEKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRL .::::: ::.:::.::::::.:...:. ::.:::::::.:::::::::::::::::.:.: CCDS62 IKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKL 180 190 200 210 220 230 240 250 260 270 280 290 pF1KSD FPNASQHITPSYNYAPNPDKHWIMRYTGPMKPIHMEFTNMLQRKRLQTLMSVDDSMETIY .:::::::::::::::: ::::::.::::: ::::::::.:::::::::::::::.: .: CCDS62 YPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLY 240 250 260 270 280 290 300 310 320 330 340 350 pF1KSD NMLVETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPH :::::::::.::::.::::::::::::::::::::::.:::::::..:::.:: : . :. CCDS62 NMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQ 300 310 320 330 340 350 360 370 380 390 400 410 pF1KSD IVLNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGK :::::::::::::::::: : :.::::.::::: :.: :::. .:: ..:::.::::::: CCDS62 IVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGK 360 370 380 390 400 410 420 430 440 450 460 470 pF1KSD LLHKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLGQKWQCVEDATGKLKLHKCK .:.:..... . :. : ::::.:::.:::.:.::::::: ::::::.::..:::..:::: CCDS62 FLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCK 420 430 440 450 460 470 480 490 500 510 520 530 pF1KSD GPMRLGGSR-ALSNLVPKYYGQGSEACTCDSGDYKLSLAGRR-KKLFKK-----KYKASY :: : : . :: . . . .. :.: . :. : . :. .. : . ::: . CCDS62 GPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRF 480 490 500 510 520 530 540 550 560 570 580 pF1KSD VRSRSIRSVAIEVDGRVYHVGLGDAA-----QPRNLTKRHWPG--APEDQDDKDGGDFSG :..:. ::...: .:..: ..: . ::::..::: : .:.: . ..::. : CCDS62 VHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGN-RG 540 550 560 570 580 590 590 600 610 620 630 640 pF1KSD TGGLPDYSAANP---IKVTHRCYILENDTVQCDLDLYKSLQAWKDHKLHIDHEIETLQNK . .:..: ..:::.:.:: ::...:. .::.: .:::::: .::.:::.::.: CCDS62 RMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDK 600 610 620 630 640 650 650 660 670 680 690 pF1KSD IKNLREVRGHLKKKRPEECDCHKISYHTQHKGRLKHRG--SSLHPFRKGLQEKD-KVWLL ::::::::::::...::::.: : ::....:: :.. : ::::... :: : :. :. CCDS62 IKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLF 660 670 680 690 700 710 700 710 720 730 740 750 pF1KSD REQ-KRKKKLRKLLKRLQNNDTCSMPGLTCFTHDNQHWQTAPFWTLGPFCACTSANNNTY .:. .:.:: :: .: .... ::.::::::::::.::::::::.:: ::::::.::::: CCDS62 KENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTY 720 730 740 750 760 770 760 770 780 790 800 810 pF1KSD WCMRTINETHNFLFCEFATGFLEYFDLNTDPYQLMNAVNTLDRDVLNQLHVQLMELRSCK ::.::.::::::::::::::::::::.::::::: :.:.:..: .::::::::::::::. CCDS62 WCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQ 780 790 800 810 820 830 820 830 840 850 860 870 pF1KSD GYKQCNPRTRNMDLGLKDGGSYEQYRQFQRRKWPEMKRPSSKSLGQLWEGWEG :::::::: .:.:.: ::::::. .: ::::.:::: CCDS62 GYKQCNPRPKNLDVGNKDGGSYDLHR------------------GQLWDGWEG 840 850 860 870 >>CCDS8970.1 GNS gene_id:2799|Hs108|chr12 (552 aa) initn: 1122 init1: 436 opt: 1044 Z-score: 1158.0 bits: 224.7 E(32554): 3.5e-58 Smith-Waterman score: 1049; 41.3% identity (65.6% similar) in 448 aa overlap (43-478:46-468) 20 30 40 50 60 70 pF1KSD ATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVELGSMQVMNKTRRIME :::..:.:::::: ::.: ..::. .. CCDS89 PRHLPSCSPALLLLVLGGCLGVFGVAAGTRRPNVVLLLTDDQDEVLGGMTPLKKTKALIG 20 30 40 50 60 70 80 90 100 110 120 130 pF1KSD QGGTHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNE--NCSSPSWQAQHESRTFAVY . : : .:.: . .:::::.::::::: :::.. .:. :::: ::: .: :: . CCDS89 EMGMTFSSAYVPSALCCPSRASILTGKYPHNHHVVNNTLEGNCSSKSWQKIQEPNTFPAI 80 90 100 110 120 130 140 150 160 170 180 pF1KSD LNST-GYRTAFFGKYLNEYNGS------YVPPGWKEWVGLLKNSRFYNYTLCRNGVKEKH : : ::.: : :::::::.. .:: ::. : .: :::..::::: :: .:: CCDS89 LRSMCGYQTFFAGKYLNEYGAPDAGGLEHVPLGWSYWYALEKNSKYYNYTLSINGKARKH 140 150 160 170 180 190 190 200 210 220 230 240 pF1KSD GSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYSRLFPNAS : .:: :::::...: :..:. .... .: .:.:. :::.: .::::.. : :. CCDS89 GENYSVDYLTDVLANVSLDFLDYKSNF---EPFFMMIATPAPHSPWTAAPQYQKAFQNVF 200 210 220 230 240 250 250 260 270 280 290 300 pF1KSD QHITPSYNYAPNPDKHWIMRYTG-PMKPIHMEFTNMLQRKRLQTLMSVDDSMETIYNMLV . ..: . .:::..: . :: ..: . ::: :::.:::: .: . . : CCDS89 APRNKNFNIH-GTNKHWLIRQAKTPMTNSSIQFLDNAFRKRWQTLLSVDDLVEKLVKRLE 260 270 280 290 300 310 310 320 330 340 350 360 pF1KSD ETGELDNTYIVYTADHGYHIGQFGLVKGKSMPYEFDIRVPFYVRGPNVEAGCLNPHIVLN ::::.:::: ::.:.::: :::.: : . :::::.::. ::::... . . .: : CCDS89 FTGELNNTYIFYTSDNGYHTGQFSLPIDKRQLYEFDIKVPLLVRGPGIKPNQTSKMLVAN 320 330 340 350 360 370 370 380 390 400 410 420 pF1KSD IDLAPTILDIAGLDI-PADMDGKSILKLLDTERPVNRFHLKKKMRVWRDSFLVERGKLLH :::.:::::::: :. ..::: :.: .: : .. . .::.. ::: . CCDS89 IDLGPTILDIAGYDLNKTQMDGMSLLPIL---RGASNL-------TWRSDVLVEY----Q 380 390 400 410 430 440 450 460 470 480 pF1KSD KRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQ-LGQKWQCVEDATGKLKLHKCKGP . . .: .. : .. : .::. .. . ::. .. .:. :. CCDS89 GEGRNVTDPTCPSLSPGVSQCFPDC-------VCEDAYNNTYACVRTMSALWNLQYCEFD 420 430 440 450 460 470 490 500 510 520 530 540 pF1KSD MRLGGSRALSNLVPKYYGQGSEACTCDSGDYKLSLAGRRKKLFKKKYKASYVRSRSIRSV CCDS89 DQEVFVEVYNLTADPDQITNIAKTIDPELLGKMNYRLMMLQSCSGPTCRTPGVFDPGYRF 480 490 500 510 520 530 >>CCDS4073.1 ARSK gene_id:153642|Hs108|chr5 (536 aa) initn: 425 init1: 154 opt: 329 Z-score: 364.1 bits: 77.8 E(32554): 5.9e-14 Smith-Waterman score: 379; 26.6% identity (56.4% similar) in 399 aa overlap (36-408:24-402) 10 20 30 40 50 60 pF1KSD LVLCLLSATVFSLLGGSSAFLSHHRLKGRFQRDRRNIRPNIILVLTDDQDVEL----GSM :: : ::..::..:. : .: ::. CCDS40 MLLLWVSVVAALALAVLAPGAGEQRRRAAKAPNVVLVVSDSFDGRLTFHPGSQ 10 20 30 40 50 70 80 90 100 110 120 pF1KSD QVMNKTRRIMEQGGTHFINAFVTTPMCCPSRSSILTGKYVHNHNTYTNNENCSSPSWQAQ : .:. :: :.::....:.:::::... .: ..: ... :: . .:.. CCDS40 VVKLPFINFMKTRGTSFLNAYTNSPICCPSRAAMWSGLFTHLTESW-NNFKGLDPNYT-- 60 70 80 90 100 110 130 140 150 160 170 pF1KSD HESRTFAVYLNSTGYRTAFFGKYLNEYNG----SYVPPGWKEWVG-LLKNSRFYNYTLCR :. .. :::: ::: :. .: : .: . :. ::.. .: : CCDS40 ----TWMDVMERHGYRTQKFGK-LDYTSGHHSISNRVEAWTRDVAFLLRQEGRPMVNLIR 120 130 140 150 160 180 190 200 210 220 230 pF1KSD NGVKEKHGSDYSKDYLTDLITNDSVSFFRTSKKMYPHRPVLMVISHAAPHGPEDSAPQYS : .: . . .:. . :. .:...: : . : .. .. :: : : :. . CCDS40 NRTKVR---VMERDWQN---TDKAVNWLRKEAINYTE-PFVIYLGLNLPH-PYPS-PSSG 170 180 190 200 210 240 250 260 270 280 pF1KSD RLFPNASQHITPSYNYAPNPDKHWIMRYTGPMKPIH-MEF--------TNMLQRKRLQTL . : ... : . . . : : ... :.. .: ... :. . .:..... CCDS40 ENFGSSTFHTSLYWLEKVSHDAIKIPKWS-PLSEMHPVDYYSSYTKNCTGRFTKKEIKNI 220 230 240 250 260 270 290 300 310 320 330 pF1KSD MSVDDSM--ET---IYNMLVETGELD---NTYIVYTADHGYHIGQFGLVKGKSMPYEFDI . .: :: . .... .:: .: ..:..::: . :: :: . CCDS40 RAFYYAMCAETDAMLGEIILALHQLDLLQKTIVIYSSDHGELAMEHRQFYKMSM-YEASA 280 290 300 310 320 330 340 350 360 370 380 390 pF1KSD RVPFYVRGPNVEAGCLNPHIVLNIDLAPTILDIAGLDIPADMDGKSILKLLDTERPVNRF .::. . ::...:: ..: .:. ::.:::::. .: ...: :.: : ..: :. CCDS40 HVPLLMMGPGIKAGLQVSNVVSLVDIYPTMLDIAGIPLPQNLSGYSLLPL-SSETFKNEH 340 350 360 370 380 390 400 410 420 430 440 450 pF1KSD HLKKKMRVWRDSFLVERGKLLHKRDNDKVDAQEENFLPKYQRVKDLCQRAEYQTACEQLG ..:. : CCDS40 KVKNLHPPWILSEFHGCNVNASTYMLRTNHWKYIAYSDGASILPQLFDLSSDPDELTNVA 400 410 420 430 440 450 870 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 05:33:05 2016 done: Thu Nov 3 05:33:06 2016 Total Scan time: 3.650 Total Display time: 0.140 Function used was FASTA [36.3.4 Apr, 2011]