FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA0512, 632 aa 1>>>pF1KA0512 632 - 632 aa - 632 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.1281+/-0.0012; mu= -10.0615+/- 0.072 mean_var=419.5451+/-87.124, 0's: 0 Z-trim(112.2): 46 B-trim: 327 in 1/53 Lambda= 0.062616 statistics sampled from 12965 (13000) to 12965 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.704), E-opt: 0.2 (0.399), width: 16 Scan time: 4.320 The best scores are: opt bits E(32554) CCDS14490.1 ARMCX2 gene_id:9823|Hs108|chrX ( 632) 4056 381.0 2.6e-105 CCDS14487.1 ARMCX1 gene_id:51309|Hs108|chrX ( 453) 955 100.8 4.3e-21 CCDS14489.1 ARMCX3 gene_id:51566|Hs108|chrX ( 379) 875 93.5 5.7e-19 CCDS55146.1 ARMC10 gene_id:83787|Hs108|chr7 ( 308) 776 84.5 2.4e-16 CCDS5728.1 ARMC10 gene_id:83787|Hs108|chr7 ( 343) 770 84.0 3.8e-16 CCDS59170.1 ARMCX4 gene_id:100131755|Hs108|chrX (2290) 651 73.9 2.7e-12 >>CCDS14490.1 ARMCX2 gene_id:9823|Hs108|chrX (632 aa) initn: 4056 init1: 4056 opt: 4056 Z-score: 2004.1 bits: 381.0 E(32554): 2.6e-105 Smith-Waterman score: 4056; 100.0% identity (100.0% similar) in 632 aa overlap (1-632:1-632) 10 20 30 40 50 60 pF1KA0 MSRVRDAGCVAAGIVIGAGAWYCVYKYTRGRDQTKKRMAKPKNRAVAGTGARARAGLRAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MSRVRDAGCVAAGIVIGAGAWYCVYKYTRGRDQTKKRMAKPKNRAVAGTGARARAGLRAG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA0 FTIDLGSGFSPPTPVRAEAEDRAQDEASALDTVGAEAVAPAASSAEAQSGAGSQAQEADG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 FTIDLGSGFSPPTPVRAEAEDRAQDEASALDTVGAEAVAPAASSAEAQSGAGSQAQEADG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA0 AGVGPKAESVVGAAMASAIAPPPGVTEALGAAEAPAMAGAPKVAEAPREAETSRAAVPPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 AGVGPKAESVVGAAMASAIAPPPGVTEALGAAEAPAMAGAPKVAEAPREAETSRAAVPPG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA0 TVVPTEAAAPTEVTEGPGVAAPTKVAEAPGVASPTEAAEAPVPATPTGAAAPTGAAESPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 TVVPTEAAAPTEVTEGPGVAAPTKVAEAPGVASPTEAAEAPVPATPTGAAAPTGAAESPG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA0 TSGSPRTAVVPGTSAAKKATPGAHTGAIPKATSATGAVPKGGGKGVTRSRNGGKGKGKKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 TSGSPRTAVVPGTSAAKKATPGAHTGAIPKATSATGAVPKGGGKGVTRSRNGGKGKGKKS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA0 KVEVDELGMGFRPGDGAAAAAAASANGGQAFLAEVPDSEEGESGWTDTESDSDSEPETQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 KVEVDELGMGFRPGDGAAAAAAASANGGQAFLAEVPDSEEGESGWTDTESDSDSEPETQR 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA0 RGRGRRPVAMQKRPFPYEIDEILGVRDLRKVLALLQKSDDPFIQQVALLTLSNNANYSCN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 RGRGRRPVAMQKRPFPYEIDEILGVRDLRKVLALLQKSDDPFIQQVALLTLSNNANYSCN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA0 QETIRKLGGLPIIANMINKTDPHIKEKALMAMNNLSENYENQGRLQVYMNKVMDDIMASN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 QETIRKLGGLPIIANMINKTDPHIKEKALMAMNNLSENYENQGRLQVYMNKVMDDIMASN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA0 LNSAVQVVGLKFLTNMTITNDYQHLLVNSIANFFRLLSQGGGKIKVEILKILSNFAENPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LNSAVQVVGLKFLTNMTITNDYQHLLVNSIANFFRLLSQGGGKIKVEILKILSNFAENPD 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA0 MLKKLLSTQVPASFSSLYNSYVESEILINALTLFEIIYDNLRAEVFNYREFNKGSLFYLC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MLKKLLSTQVPASFSSLYNSYVESEILINALTLFEIIYDNLRAEVFNYREFNKGSLFYLC 550 560 570 580 590 600 610 620 630 pF1KA0 TTSGVCVKKIRALANHHDLLVKVKVIKLVNKF :::::::::::::::::::::::::::::::: CCDS14 TTSGVCVKKIRALANHHDLLVKVKVIKLVNKF 610 620 630 >>CCDS14487.1 ARMCX1 gene_id:51309|Hs108|chrX (453 aa) initn: 1120 init1: 756 opt: 955 Z-score: 492.1 bits: 100.8 E(32554): 4.3e-21 Smith-Waterman score: 958; 42.0% identity (68.9% similar) in 421 aa overlap (215-632:45-453) 190 200 210 220 230 240 pF1KA0 TEAAAPTEVTEGPGVAAPTKVAEAPGVASPTEAAEAPVPATPTGAAAPTGAAESPGTSGS :...: : : :: . .::. . .:. CCDS14 VIGAGACYCVYRLAWGRDENEKIWDEDEESTDTSEIGVE-TVKGAKTNAGAGSGAKLQGD 20 30 40 50 60 70 250 260 270 280 290 300 pF1KA0 PRTAVVPGTSAAKKATPGAHTGAIPKATSATGAVPKGGGKGVTRSRNGGKGKGKKSKVEV . : : .: . . ::.. : . :. : :. . : ..... :: ..: CCDS14 --SEVKPEVSLGLEDCPGVKEKAHSGSHSGGGLEAKAKALFNTLKEQASAKAGKGARV-- 80 90 100 110 120 310 320 330 340 350 360 pF1KA0 DELGMGFRPGDGAAAAAAASANG-GQAFLAEVPDSEEGESGWTDTESDSDSEPETQRRGR : :. . : . .: : . :. : : .. .: . .. .. : CCDS14 -----GTISGNRTLAPSLPCPGGRGGGCHPTRSGSRAG--GRASGKSKGKARSKSTRAPA 130 140 150 160 170 180 370 380 390 400 410 420 pF1KA0 GRRPVAMQKRPFPYEIDEILGVRDLRKVLALLQKSDDPFIQQVALLTLSNNANYSCNQET :: : :::.::.::.. ::.::: .:....:::::.:::.::.::: :: ::.. CCDS14 TTWPVRRGKFNFPYKIDDILSAPDLQKVLNILERTNDPFIQEVALVTLGNNAAYSFNQNA 190 200 210 220 230 240 430 440 450 460 470 480 pF1KA0 IRKLGGLPIIANMINKTDPHIKEKALMAMNNLSENYENQGRLQVYMNKVMDDIMASNLNS ::.:::.::::..:. :: :.::. :.:::: : ::::....:...: :: :. :.: CCDS14 IRELGGVPIIAKLIKTKDPIIREKTYNALNNLSVNAENQGKIKTYISQVCDDTMVCRLDS 250 260 270 280 290 300 490 500 510 520 530 540 pF1KA0 AVQVVGLKFLTNMTITNDYQHLLVNSIANFFRLLSQGGGKIKVEILKILSNFAENPDMLK :::..::..:::::.:: ::::: :. .:: :: :. :..:.:.. ::.::: : . CCDS14 AVQMAGLRLLTNMTVTNHYQHLLSYSFPDFFALLFLGNHFTKIQIMKLIINFTENPAMTR 310 320 330 340 350 360 550 560 570 580 590 600 pF1KA0 KLLSTQVPASFSSLYNSYVESEILINALTLFEIIYDNLRAEVF--NYREFNKGSLFYLCT .:.: .::. . ::.:. . :::.: ::::: : ::.. : . . .::...:::.: CCDS14 ELVSCKVPSELISLFNKEWDREILLNILTLFENINDNIKNEGLASSRKEFSRSSLFFLFK 370 380 390 400 410 420 610 620 630 pF1KA0 TSGVCVKKIRALANHHDLLVKVKVIKLVNKF ::::::::.:::::.::.:::::.:...:. CCDS14 ESGVCVKKIKALANHNDLVVKVKVLKVLTKL 430 440 450 >>CCDS14489.1 ARMCX3 gene_id:51566|Hs108|chrX (379 aa) initn: 1007 init1: 742 opt: 875 Z-score: 454.1 bits: 93.5 E(32554): 5.7e-19 Smith-Waterman score: 875; 42.9% identity (73.8% similar) in 347 aa overlap (294-632:29-369) 270 280 290 300 310 320 pF1KA0 HTGAIPKATSATGAVPKGGGKGVTRSRNGGKGKGKKSKVEVDELGMGFRPGDGAAAAAAA .:. :..: .. : : : : :. ..: CCDS14 MGYARKVGWVTAGLVIGAGACYCIYRLTRGR-KQNKEKMAEGGSG--DVDDAGDCSGA 10 20 30 40 50 330 340 350 360 370 pF1KA0 SANGGQAFLAEVPDSEEGES-----GWTDTESDSDSEPETQRRGRGRRPV-AMQKRPFPY : . . ::.:..: :. ... .. ... :.:. : :.::: : CCDS14 RYND---WSDDDDDSNESKSIVWYPPWARIGTEAGTRARARARARATRARRAVQKRASPN 60 70 80 90 100 110 380 390 400 410 420 430 pF1KA0 EIDEILGVRDLRKVLALLQKSDDPFIQQVALLTLSNNANYSCNQETIRKLGGLPIIANMI : .:. ..:.::: :.. :. :.: ..::..:.::: :. :.. :: ::::::.:... CCDS14 SDDTVLSPQELQKVLCLVEMSEKPYILEAALIALGNNAAYAFNRDIIRDLGGLPIVAKIL 120 130 140 150 160 170 440 450 460 470 480 490 pF1KA0 NKTDPHIKEKALMAMNNLSENYENQGRLQVYMNKVMDDIMASNLNSAVQVVGLKFLTNMT : :: .:::::...:::: : ::: ::.::::.: :: ..: :::.::..::..::::: CCDS14 NTRDPIVKEKALIVLNNLSVNAENQRRLKVYMNQVCDDTITSRLNSSVQLAGLRLLTNMT 180 190 200 210 220 230 500 510 520 530 540 550 pF1KA0 ITNDYQHLLVNSIANFFRLLSQGGGKIKVEILKILSNFAENPDMLKKLLSTQVPASFSSL .::.:::.:.:::..::::.: :. . :...::.: :.:::: : ..:: .:::.:..:: CCDS14 VTNEYQHMLANSISDFFRLFSAGNEETKLQVLKLLLNLAENPAMTRELLRAQVPSSLGSL 240 250 260 270 280 290 560 570 580 590 600 610 pF1KA0 YNSYVESEILINALTLFEIIYDNLRAEVFN--YREFNKGSLFYLCTTSGVCVKKIRALAN .:. ..:.... :..:: : ::.. : . .:..::::.. ::. :. .. . CCDS14 FNKKENKEVILKLLVIFENINDNFKWEENEPTQNQFGEGSLFFFLKEFQVCADKVLGIES 300 310 320 330 340 350 620 630 pF1KA0 HHDLLVKVKVIKLVNKF :::.:::::: :.. :. CCDS14 HHDFLVKVKVGKFMAKLAEHMFPKSQE 360 370 >>CCDS55146.1 ARMC10 gene_id:83787|Hs108|chr7 (308 aa) initn: 871 init1: 636 opt: 776 Z-score: 407.0 bits: 84.5 E(32554): 2.4e-16 Smith-Waterman score: 776; 45.9% identity (76.2% similar) in 281 aa overlap (358-631:28-307) 330 340 350 360 370 380 pF1KA0 GQAFLAEVPDSEEGESGWTDTESDSDSEPETQRRGRGRRPVAMQKRPFPYEI-----DEI :. : :: : ..... .. :.. CCDS55 MGGPRGAGWVAAGLLLGAGACYCIYRLTRGRRRGDRELGIRSSKSAEDLTDGSYDDV 10 20 30 40 50 390 400 410 420 430 440 pF1KA0 LGVRDLRKVLALLQKSDDPFIQQVALLTLSNNANYSCNQETIRKLGGLPIIANMINKTDP :....:.:.: ::....:: : . ::.::.::: .: :: ::.:::.::.:: ::... CCDS55 LNAEQLQKLLYLLESTEDPVIIERALITLGNNAAFSVNQAIIRELGGIPIVANKINHSNQ 60 70 80 90 100 110 450 460 470 480 490 500 pF1KA0 HIKEKALMAMNNLSENYENQGRLQVYMNKVMDDIMASNLNSAVQVVGLKFLTNMTITNDY :::::: :.:::: : ::: ....:...: .:.... ::::::..:: .:::::.:::. CCDS55 SIKEKALNALNNLSVNVENQIKIKIYISQVCEDVFSGPLNSAVQLAGLTLLTNMTVTNDH 120 130 140 150 160 170 510 520 530 540 550 560 pF1KA0 QHLLVNSIANFFRLLSQGGGKIKVEILKILSNFAENPDMLKKLLSTQVPASFSSLYNSYV ::.: . :...:..: :.:. ::..::.: :..::: : . :: .:: .:: :::.:.: CCDS55 QHMLHSYITDLFQVLLTGNGNTKVQVLKLLLNLSENPAMTEGLLRAQVDSSFLSLYDSHV 180 190 200 210 220 230 570 580 590 600 610 620 pF1KA0 ESEILINALTLFEIIYDNLRAE--VFNYREFNKGSLFYLCTTSGVCVKKIRALANHHDLL .:::. .::::. : . :. : . :..::::.: . :..:::::..::: CCDS55 AKEILLRVLTLFQNIKNCLKIEGHLAVQPTFTEGSLFFL-LHGEECAQKIRALVDHHDAE 240 250 260 270 280 290 630 pF1KA0 VKVKVIKLVNKF :: ::. .. : CCDS55 VKEKVVTIIPKI 300 >>CCDS5728.1 ARMC10 gene_id:83787|Hs108|chr7 (343 aa) initn: 882 init1: 636 opt: 770 Z-score: 403.4 bits: 84.0 E(32554): 3.8e-16 Smith-Waterman score: 774; 42.3% identity (70.2% similar) in 326 aa overlap (309-631:38-342) 280 290 300 310 320 330 pF1KA0 PKGGGKGVTRSRNGGKGKGKKSKVEVDELGMGFRPGDGAAAAAAASANGGQAFLAEVPDS .:.: . .:.: ....: . :.. CCDS57 GWVAAGLLLGAGACYCIYRLTRGRRRGDRELGIRSSKSAGALEEGTSEGQLCGRSARPQT 10 20 30 40 50 60 340 350 360 370 380 390 pF1KA0 E-EGESGWTDTESDSDSEPETQRRGRGRRPVAMQKRPFPYEIDEILGVRDLRKVLALLQK :: :. : :.:: : :..:....:.:.: ::.. CCDS57 GGTWESQWSKT-----SQPEDLTDGS---------------YDDVLNAEQLQKLLYLLES 70 80 90 100 400 410 420 430 440 450 pF1KA0 SDDPFIQQVALLTLSNNANYSCNQETIRKLGGLPIIANMINKTDPHIKEKALMAMNNLSE ..:: : . ::.::.::: .: :: ::.:::.::.:: ::... :::::: :.:::: CCDS57 TEDPVIIERALITLGNNAAFSVNQAIIRELGGIPIVANKINHSNQSIKEKALNALNNLSV 110 120 130 140 150 160 460 470 480 490 500 510 pF1KA0 NYENQGRLQVYMNKVMDDIMASNLNSAVQVVGLKFLTNMTITNDYQHLLVNSIANFFRLL : ::: ....:...: .:.... ::::::..:: .:::::.:::.::.: . :...:..: CCDS57 NVENQIKIKIYISQVCEDVFSGPLNSAVQLAGLTLLTNMTVTNDHQHMLHSYITDLFQVL 170 180 190 200 210 220 520 530 540 550 560 570 pF1KA0 SQGGGKIKVEILKILSNFAENPDMLKKLLSTQVPASFSSLYNSYVESEILINALTLFEII :.:. ::..::.: :..::: : . :: .:: .:: :::.:.: .:::. .::::. : CCDS57 LTGNGNTKVQVLKLLLNLSENPAMTEGLLRAQVDSSFLSLYDSHVAKEILLRVLTLFQNI 230 240 250 260 270 280 580 590 600 610 620 630 pF1KA0 YDNLRAE--VFNYREFNKGSLFYLCTTSGVCVKKIRALANHHDLLVKVKVIKLVNKF . :. : . :..::::.: . :..:::::..::: :: ::. .. : CCDS57 KNCLKIEGHLAVQPTFTEGSLFFL-LHGEECAQKIRALVDHHDAEVKEKVVTIIPKI 290 300 310 320 330 340 >>CCDS59170.1 ARMCX4 gene_id:100131755|Hs108|chrX (2290 aa) initn: 809 init1: 520 opt: 651 Z-score: 334.1 bits: 73.9 E(32554): 2.7e-12 Smith-Waterman score: 723; 29.5% identity (62.1% similar) in 660 aa overlap (6-632:1664-2290) 10 20 30 pF1KA0 MSRVRDAGCVAAGIVIGAGAWYCVYKYTRGRDQTK : .: ..: :::. ... .: .. CCDS59 SWAGTGNQSSGRSWIGPGDQAVDCSKPEFEDQAC-GGGSWAGAGSQASGESWAGSRPGNE 1640 1650 1660 1670 1680 1690 40 50 60 70 80 pF1KA0 ----KRMAKPKNRAVAGTGAR----ARAGLRAGFTIDLGSGFSPPTPVRAEAEDRAQDEA .::.. ...:..:. :: : . ....: .. . :: ..: . : CCDS59 AIGGSRMGS-EDQATGGSWARSEDQASGRFQVSFEVEANEGFWFGPGAEAVIGSWCWTEE 1700 1710 1720 1730 1740 1750 90 100 110 120 130 140 pF1KA0 SALDTVGAEAVAPAASSAEAQSGAGSQAQ-----EADG-AGVGPKAESVVGAAMASAIAP .: : :. :..: ..:::: .:. ::.. :. : .: : :.: .. CCDS59 KA-DIVSRPDDKDEATTA-SRSGAGEEAMICSRIEAENKASSGSWIRSEEVAYMGSCVGA 1760 1770 1780 1790 1800 150 160 170 180 190 200 pF1KA0 PPGVTEALGA-AEAPAMAGAPKVAEAPREAETSRAAVPPGTVVPTEAAAPTEVTEGPGVA :. :: ::: : ::: ::: . :.. ::: :..: .: ... CCDS59 EAGAGAEAGAGAEAGAGAGAEAGAEAG-----AGAGAGPGT----ESGAGIWSWDGDATT 1810 1820 1830 1840 1850 1860 210 220 230 240 250 pF1KA0 APTKVA--EAPGVASPTEAA-----EAPVPATPTGAAAPTGA---AESPGTSGSPRTAVV . .... : :: : : : : ..: . ::: . :.. :. CCDS59 VESRLGAGEEAGVESWTLARNVGEDELSRESSPDIEEISLRSLFWAESEN-SNTFRSK-- 1870 1880 1890 1900 1910 260 270 280 290 300 pF1KA0 PGTSAAKKATPGAHTGAIPKATSATGAVPKG-----GGKGVTRSRNGGKGKGKKSKVEVD : .:. .. : .: .: :.:.: : :.......... :.:.:::. : CCDS59 SGKDASFESGAGDNT-SIKDKFEAAGGVDIGSWFCAGNENTSEDKSAPKAKAKKSS-ESR 1920 1930 1940 1950 1960 1970 310 320 330 340 350 360 pF1KA0 ELGMGFRPGDGAAAAAAASANGGQAFLAEVPDSEEGESGWTDTESDSDSEPETQRRGRGR . . :: : . : .:.. . .:. ....:... ...:. .: : :. CCDS59 GIYPYMVPGAGMG-----SWDGAMIW-SETKFAHQSEASFP---VEDESRKQT-RTGEKT 1980 1990 2000 2010 2020 370 380 390 400 410 420 pF1KA0 RPVAMQKRPFPYEIDEILGVRDLRKVLALLQKSDDPFIQQVALLTLSNNANYSCNQETIR :: . . . .: . . :::.:.. ... ..:: ....: .: :.:.:: ..:..: CCDS59 RPWSCRCK---HEAN--MDPRDLEKLICMIEMTEDPSVHEIANNALYNSADYSYSHEVVR 2030 2040 2050 2060 2070 2080 430 440 450 460 470 480 pF1KA0 KLGGLPIIANMINKTDPHIKEKALMAMNNLSENYENQGRLQVYMNKVMDDIMASNLNSAV ..::. .: ...:. : ...::: :.::.: ::. ....:.:.: .: .. ::: : CCDS59 NVGGISVIESLLNNPYPSVRQKALNALNNISVAAENHRKVKTYLNQVCEDTVTYPLNSNV 2090 2100 2110 2120 2130 2140 490 500 510 520 530 540 pF1KA0 QVVGLKFLTNMTITNDYQHLLVNSIANFFRLLSQGGGKIKVEILKILSNFAENPDMLKKL :..::... ..:::..:::...: :..:.:::. :.:. : ..: .: ::..::.: : : CCDS59 QLAGLRLIRHLTITSEYQHMVTNYISEFLRLLTVGSGETKDHVLGMLLNFSKNPSMTKDL 2150 2160 2170 2180 2190 2200 550 560 570 580 590 600 pF1KA0 LSTQVPASFSSLYNSYVESEILINALTLFEIIYDNL--RAEVFNYREFNKGSLFYLCTTS : ...:.:. ..... .: ..:::.::: : .. ::..:. .:.:.::..: CCDS59 LIANAPTSLINIFSKKETKENILNALSLFENINYHFKRRAKAFTQDKFSKNSLYFLFQRP 2210 2220 2230 2240 2250 2260 610 620 630 pF1KA0 GVCVKKIRALANH-HDLLVKVKVIKLVNKF .:.::.:::: . .: :: .: :..:. CCDS59 KACAKKLRALAAECNDPEVKERVELLISKL 2270 2280 2290 632 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 19:10:09 2016 done: Wed Nov 2 19:10:10 2016 Total Scan time: 4.320 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]