FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1270, 985 aa 1>>>pF1KA1270 985 - 985 aa - 985 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6278+/-0.000894; mu= 19.8235+/- 0.054 mean_var=72.0235+/-14.358, 0's: 0 Z-trim(106.2): 21 B-trim: 5 in 1/50 Lambda= 0.151125 statistics sampled from 8865 (8876) to 8865 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.641), E-opt: 0.2 (0.273), width: 16 Scan time: 4.920 The best scores are: opt bits E(32554) CCDS34464.1 AARS2 gene_id:57505|Hs108|chr6 ( 985) 6561 1440.3 0 CCDS32474.1 AARS gene_id:16|Hs108|chr16 ( 968) 2777 615.3 1.9e-175 >>CCDS34464.1 AARS2 gene_id:57505|Hs108|chr6 (985 aa) initn: 6561 init1: 6561 opt: 6561 Z-score: 7722.0 bits: 1440.3 E(32554): 0 Smith-Waterman score: 6561; 99.9% identity (100.0% similar) in 985 aa overlap (1-985:1-985) 10 20 30 40 50 60 pF1KA1 MAASVAAAARRLRRAIRRSPAWRGLSHRPLSSEPPAAKASAVRAAFLNFFRDRHGHRLVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MAASVAAAARRLRRAIRRSPAWRGLSHRPLSSEPPAAKASAVRAAFLNFFRDRHGHRLVP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA1 SASVRPRGDPSLLFVNAGMNQFKPIFLGTVDPRSEMAGFRRVANSQKCVRAGGHHNDLED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SASVRPRGDPSLLFVNAGMNQFKPIFLGTVDPRSEMAGFRRVANSQKCVRAGGHHNDLED 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA1 VGRDLSHHTFFEMLGNWAFGGEYFKEEACNMAWELLTQVYGIPEERLWISYFDGDPKAGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 VGRDLSHHTFFEMLGNWAFGGEYFKEEACNMAWELLTQVYGIPEERLWISYFDGDPKAGL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA1 DPDLETRDIWLSLGVPASRVLSFGPQENFWEMGDTGPCGPCTEIHYDLAGGVGAPQLVEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 DPDLETRDIWLSLGVPASRVLSFGPQENFWEMGDTGPCGPCTEIHYDLAGGVGAPQLVEL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA1 WNLVFMQHNREADGSLQPLPQRHVDTGMGLERLVAVLQGKHSTYDTDLFSPLLNAIQQGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 WNLVFMQHNREADGSLQPLPQRHVDTGMGLERLVAVLQGKHSTYDTDLFSPLLNAIQQGC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA1 RAPPYLGRVGVADEGRTDTAYRVVADHIRTLSVCISDGVFPGMSGPPLVLRRILRRAVRF ::::::::::::::::::::::::::::::::::::::.::::::::::::::::::::: CCDS34 RAPPYLGRVGVADEGRTDTAYRVVADHIRTLSVCISDGIFPGMSGPPLVLRRILRRAVRF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA1 SMEILKAPPGFLGSLVPVVVETLGDAYPELQRNSAQIANLVSEDEAAFLASLERGRRIID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SMEILKAPPGFLGSLVPVVVETLGDAYPELQRNSAQIANLVSEDEAAFLASLERGRRIID 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA1 RTLRTLGPSDMFPAEVAWSLSLCGDLGLPLDMVELMLEEKGVQLDSAGLERLAQEEAQHR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RTLRTLGPSDMFPAEVAWSLSLCGDLGLPLDMVELMLEEKGVQLDSAGLERLAQEEAQHR 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA1 ARQAEPVQKQGLWLDVHALGELQRQGVPPTDDSPKYNYSLRPSGSYEFGTCEAQVLQLYT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 ARQAEPVQKQGLWLDVHALGELQRQGVPPTDDSPKYNYSLRPSGSYEFGTCEAQVLQLYT 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA1 EDGTAVASVGKGQRCGLLLDRTNFYAEQGGQASDRGYLVRAGQEDVLFPVARAQVCGGFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 EDGTAVASVGKGQRCGLLLDRTNFYAEQGGQASDRGYLVRAGQEDVLFPVARAQVCGGFI 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA1 LHEAVAPECLRLGDQVQLHVDEAWRLGCMAKHTATHLLNWALRQTLGPGTEQQGSHLNPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LHEAVAPECLRLGDQVQLHVDEAWRLGCMAKHTATHLLNWALRQTLGPGTEQQGSHLNPE 610 620 630 640 650 660 670 680 690 700 710 720 pF1KA1 QLRLDVTTQTPLTPEQLRAVENTVQEAVGQDEAVYMEEVPLALTAQVPGLRSLDEVYPDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 QLRLDVTTQTPLTPEQLRAVENTVQEAVGQDEAVYMEEVPLALTAQVPGLRSLDEVYPDP 670 680 690 700 710 720 730 740 750 760 770 780 pF1KA1 VRVVSVGVPVAHALDPASQAALQTSVELCCGTHLLRTGAVGDLVIIGDRQLSKGTTRLLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 VRVVSVGVPVAHALDPASQAALQTSVELCCGTHLLRTGAVGDLVIIGDRQLSKGTTRLLA 730 740 750 760 770 780 790 800 810 820 830 840 pF1KA1 VTGEQAQQARELGQSLAQEVKAATERLSLGSRDVAEALRLSKDIGRLIEAVETAVMPQWQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 VTGEQAQQARELGQSLAQEVKAATERLSLGSRDVAEALRLSKDIGRLIEAVETAVMPQWQ 790 800 810 820 830 840 850 860 870 880 890 900 pF1KA1 RRELLATVKMLQRRANTAIRKLQMGQAAKKTQELLERHSKGPLIVDTVSAESLSVLVKVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RRELLATVKMLQRRANTAIRKLQMGQAAKKTQELLERHSKGPLIVDTVSAESLSVLVKVV 850 860 870 880 890 900 910 920 930 940 950 960 pF1KA1 RQLCEQAPSTSVLLLSPQPMGKVLCACQVAQGAMPTFTAEAWALAVCSHMGGKAWGSRVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RQLCEQAPSTSVLLLSPQPMGKVLCACQVAQGAMPTFTAEAWALAVCSHMGGKAWGSRVV 910 920 930 940 950 960 970 980 pF1KA1 AQGTGSTTDLEAALSIAQTYALSQL ::::::::::::::::::::::::: CCDS34 AQGTGSTTDLEAALSIAQTYALSQL 970 980 >>CCDS32474.1 AARS gene_id:16|Hs108|chr16 (968 aa) initn: 1952 init1: 783 opt: 2777 Z-score: 3263.4 bits: 615.3 E(32554): 1.9e-175 Smith-Waterman score: 2777; 46.0% identity (72.4% similar) in 970 aa overlap (39-985:7-963) 10 20 30 40 50 60 pF1KA1 ARRLRRAIRRSPAWRGLSHRPLSSEPPAAKASAVRAAFLNFFRDRHGHRLVPSASVRPRG :: .: :..::. :. : : :... : CCDS32 MDSTLTASEIRQRFIDFFK-RNEHTYVHSSATIPLD 10 20 30 70 80 90 100 110 120 pF1KA1 DPSLLFVNAGMNQFKPIFLGTVDPRSEMAGFRRVANSQKCVRAGGHHNDLEDVGRDLSHH ::.:::.::::::::::::.:.:: :: . :.::.:::.::::.::::.:::.:. :: CCDS32 DPTLLFANAGMNQFKPIFLNTIDPSHPMAKLSRAANTQKCIRAGGKHNDLDDVGKDVYHH 40 50 60 70 80 90 130 140 150 160 170 180 pF1KA1 TFFEMLGNWAFGGEYFKEEACNMAWELLTQVYGIPEERLWISYFDGDPKAGLDPDLETRD :::::::.:.:: .:::: ::.:: ::::: .::: :::...:: :: :::. ::: .. CCDS32 TFFEMLGSWSFG-DYFKELACKMALELLTQEFGIPIERLYVTYFGGDEAAGLEADLECKQ 100 110 120 130 140 150 190 200 210 220 230 240 pF1KA1 IWLSLGVPASRVLSFGPQENFWEMGDTGPCGPCTEIHYDLAGGVGA--------PQLVEL :: .::. ...: . ..::::::::::::::.::::: :: : :...:. CCDS32 IWQNLGLDDTKILPGNMKDNFWEMGDTGPCGPCSEIHYDRIGGRDAAHLVNQDDPNVLEI 160 170 180 190 200 210 250 260 270 280 290 300 pF1KA1 WNLVFMQHNREADGSLQPLPQRHVDTGMGLERLVAVLQGKHSTYDTDLFSPLLNAIQQGC :::::.:.:::::: :.:::.. .::::::::::.:::.: :.:::::: : ..:::.: CCDS32 WNLVFIQYNREADGILKPLPKKSIDTGMGLERLVSVLQNKMSNYDTDLFVPYFEAIQKGT 220 230 240 250 260 270 310 320 330 340 350 360 pF1KA1 RAPPYLGRVGVADEGRTDTAYRVVADHIRTLSVCISDGVFPGMSGPPLVLRRILRRAVRF : :: :.::. : : ::::.::: ::..: ..:: : .: :::::::::::. CCDS32 GARPYTGKVGAEDADGIDMAYRVLADHARTITVALADGGRPDNTGRGYVLRRILRRAVRY 280 290 300 310 320 330 370 380 390 400 410 420 pF1KA1 SMEILKAPPGFLGSLVPVVVETLGDAYPELQRNSAQIANLVSEDEAAFLASLERGRRIID . : :.: ::...:: :::..::::.:::... .. ....:.:. :: .: :::::.: CCDS32 AHEKLNASRGFFATLVDVVVQSLGDAFPELKKDPDMVKDIINEEEVQFLKTLSRGRRILD 340 350 360 370 380 390 430 440 450 460 470 pF1KA1 RTLRTLGPSDMFPAEVAWSLSLCGDLGLPLDMVELMLEEKGVQLDSAGLE---RLAQEEA : ...:: : .:...:: : :.:.:.. :. ::::. .: :.: .::: .. CCDS32 RKIQSLGDSKTIPGDTAWLLY--DTYGFPVDLTGLIAEEKGLVVDMDGFEEERKLAQLKS 400 410 420 430 440 450 480 490 500 510 520 530 pF1KA1 QHRARQAEPVQKQGLWLDVHALGELQRQGVPPTDDSPKYNYSLRPSGSYEFGTCEAQVLQ : .. .: . . ::..:. ::. .:. ::::::::: : :::: : . : :. CCDS32 QGKGAGGEDL----IMLDIYAIEELRARGLEVTDDSPKYNYHLDSSGSYVFENTVATVMA 460 470 480 490 500 540 550 560 570 580 590 pF1KA1 LYTEDGTAVASVGKGQRCGLLLDRTNFYAEQGGQASDRGYLVRA--GQED-VLFPVARAQ : : : :. ::.::..::.: :::::::: :.::::.. ..:: . : : :: CCDS32 LRREK-MFVEEVSTGQECGVVLDKTCFYAEQGGQIYDEGYLVKVDDSSEDKTEFTVKNAQ 510 520 530 540 550 560 600 610 620 630 640 650 pF1KA1 VCGGFILHEAVAPECLRLGDQVQLHVDEAWRLGCMAKHTATHLLNWALRQTLGPGTEQQG : ::..:: .. :..:::: : .:: : :..:::::.::.:::..:: . .:.: CCDS32 VRGGYVLHIGTIYGDLKVGDQVWLFIDEPRRRPIMSNHTATHILNFALRSVLGEA-DQKG 570 580 590 600 610 620 660 670 680 690 700 710 pF1KA1 SHLNPEQLRLDVTTQTPLTPEQLRAVENTVQEAVGQDEAVYMEEVPLALTAQVPGLRSL- : . :..::.: :.. .. .:.. .:. ..: . .::: .. ::: . . :::.. CCDS32 SLVAPDRLRFDFTAKGAMSTQQIKKAEEIANEMIEAAKAVYTQDCPLAAAKAIQGLRAVF 630 640 650 660 670 680 720 730 740 750 760 770 pF1KA1 DEVYPDPVRVVSVGVPVAHALD-PASQAALQTSVELCCGTHLLRTGAVGDLVIIGDRQLS ::.:::::::::.::::.. :: :.. :. ::::.: :::: .. .: .::. .. .. CCDS32 DETYPDPVRVVSIGVPVSELLDDPSGPAGSLTSVEFCGGTHLRNSSHAGAFVIVTEEAIA 690 700 710 720 730 740 780 790 800 810 820 830 pF1KA1 KGTTRLLAVTGEQAQQARELGQSLAQEVKAATERLSLGSRDVAEALRLSKDIGRLIEAVE :: :..:::: .::.: . ..:: . ... ... . .. : :.: ::. CCDS32 KGIRRIVAVTGAEAQKALRKAESLKKCLSVMEAKVKAQTAPNKDVQREIADLG---EALA 750 760 770 780 790 800 840 850 860 870 880 pF1KA1 TAVMPQWQRRELLATVKMLQRRANTAIRKLQMG---QAAKKTQELLERHSKGPLIV-DTV :::.::::. :: :.: :.. . : . .. .::..... . . ::.. . CCDS32 TAVIPQWQKDELRETLKSLKKVMDDLDRASKADVQKRVLEKTKQFIDSNPNQPLVILEME 810 820 830 840 850 860 890 900 910 920 930 940 pF1KA1 SAESLSVLVKVVRQLCEQAPSTSVLLLS-PQPMGKVLCACQVAQGAMPT-FTAEAWALAV :. : ..: .... . ..:.::..:.. . ::. : ::: :.: . : :. : CCDS32 SGASAKALNEALKLFKMHSPQTSAMLFTVDNEAGKITCLCQVPQNAANRGLKASEWVQQV 870 880 890 900 910 920 950 960 970 980 pF1KA1 CSHMGGKAWGSRVVAQGTGSTTD-LEAALSIAQTYALSQL . : ::. :. : ::.::... :. ::..: ..: .: CCDS32 SGLMDGKGGGKDVSAQATGKNVGCLQEALQLATSFAQLRLGDVKN 930 940 950 960 985 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 01:26:44 2016 done: Fri Nov 4 01:26:45 2016 Total Scan time: 4.920 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]