FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA1209, 1444 aa 1>>>pF1KA1209 1444 - 1444 aa - 1444 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.4676+/-0.00109; mu= 13.0088+/- 0.065 mean_var=120.7627+/-23.700, 0's: 0 Z-trim(106.5): 107 B-trim: 52 in 1/50 Lambda= 0.116710 statistics sampled from 8908 (9018) to 8908 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.625), E-opt: 0.2 (0.277), width: 16 Scan time: 5.650 The best scores are: opt bits E(32554) CCDS34552.1 PLEKHG1 gene_id:57480|Hs108|chr6 (1385) 9170 1556.3 0 CCDS76690.1 PLEKHG3 gene_id:26030|Hs108|chr14 (1219) 1579 278.2 1e-73 CCDS33022.2 PLEKHG2 gene_id:64857|Hs108|chr19 (1386) 1119 200.7 2.4e-50 CCDS55514.1 MCF2 gene_id:4168|Hs108|chrX ( 821) 460 89.7 3.9e-17 CCDS55515.1 MCF2 gene_id:4168|Hs108|chrX ( 860) 460 89.7 4e-17 CCDS14667.1 MCF2 gene_id:4168|Hs108|chrX ( 925) 460 89.7 4.3e-17 CCDS48175.1 MCF2 gene_id:4168|Hs108|chrX ( 985) 460 89.7 4.5e-17 CCDS3883.1 TRIO gene_id:7204|Hs108|chr5 (3097) 464 90.6 7.7e-17 CCDS55429.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 414) 445 87.0 1.2e-16 CCDS55430.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 463) 445 87.1 1.4e-16 CCDS83477.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 495) 445 87.1 1.4e-16 CCDS66517.1 SPATA13 gene_id:221178|Hs108|chr13 ( 574) 446 87.3 1.5e-16 CCDS35315.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 516) 445 87.1 1.5e-16 CCDS66518.1 SPATA13 gene_id:221178|Hs108|chr13 ( 596) 446 87.3 1.5e-16 CCDS9305.1 SPATA13 gene_id:221178|Hs108|chr13 ( 652) 446 87.3 1.6e-16 CCDS55516.1 MCF2 gene_id:4168|Hs108|chrX ( 941) 447 87.5 2e-16 CCDS55517.1 MCF2 gene_id:4168|Hs108|chrX (1001) 447 87.5 2.1e-16 CCDS53857.1 SPATA13 gene_id:221178|Hs108|chr13 (1277) 446 87.4 2.9e-16 CCDS9521.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 646) 440 86.3 3.2e-16 CCDS2165.1 ARHGEF4 gene_id:50649|Hs108|chr2 ( 690) 434 85.3 6.9e-16 CCDS42754.1 ARHGEF4 gene_id:50649|Hs108|chr2 ( 670) 431 84.8 9.6e-16 CCDS45069.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 753) 428 84.3 1.5e-15 CCDS32009.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 782) 428 84.3 1.6e-15 CCDS45068.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 803) 428 84.3 1.6e-15 CCDS81781.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 547) 417 82.4 4.1e-15 CCDS81782.1 MCF2L gene_id:23263|Hs108|chr13 ( 984) 418 82.6 6.1e-15 CCDS9527.3 MCF2L gene_id:23263|Hs108|chr13 (1123) 418 82.7 6.8e-15 CCDS45070.2 MCF2L gene_id:23263|Hs108|chr13 (1125) 418 82.7 6.9e-15 CCDS78509.1 ARHGEF6 gene_id:9459|Hs108|chrX ( 622) 413 81.7 7.3e-15 CCDS14660.1 ARHGEF6 gene_id:9459|Hs108|chrX ( 776) 413 81.8 8.9e-15 CCDS3028.1 KALRN gene_id:8997|Hs108|chr3 (1289) 410 81.4 2e-14 CCDS8947.1 ARHGEF25 gene_id:115557|Hs108|chr12 ( 580) 398 79.2 4e-14 CCDS44931.1 ARHGEF25 gene_id:115557|Hs108|chr12 ( 619) 398 79.2 4.2e-14 CCDS82829.1 KALRN gene_id:8997|Hs108|chr3 (1654) 393 78.5 1.8e-13 CCDS3027.1 KALRN gene_id:8997|Hs108|chr3 (1663) 393 78.5 1.8e-13 CCDS73553.1 SPATA13 gene_id:221178|Hs108|chr13 ( 512) 381 76.3 2.6e-13 CCDS45512.1 PLEKHG4 gene_id:25894|Hs108|chr16 (1110) 374 75.3 1.2e-12 CCDS32466.1 PLEKHG4 gene_id:25894|Hs108|chr16 (1191) 374 75.3 1.2e-12 CCDS3243.1 MCF2L2 gene_id:23101|Hs108|chr3 (1114) 369 74.4 2.1e-12 CCDS34124.1 PLEKHG4B gene_id:153478|Hs108|chr5 (1271) 368 74.3 2.6e-12 CCDS6201.1 PREX2 gene_id:80243|Hs108|chr8 (1606) 363 73.5 5.7e-12 CCDS59341.1 VAV1 gene_id:7409|Hs108|chr19 ( 823) 356 72.2 7.2e-12 CCDS12174.1 VAV1 gene_id:7409|Hs108|chr19 ( 845) 356 72.2 7.4e-12 CCDS13410.1 PREX1 gene_id:57580|Hs108|chr20 (1659) 356 72.3 1.3e-11 CCDS785.1 VAV3 gene_id:10451|Hs108|chr1 ( 847) 341 69.7 4.3e-11 CCDS6979.1 VAV2 gene_id:7410|Hs108|chr9 ( 839) 337 69.0 6.8e-11 CCDS48053.1 VAV2 gene_id:7410|Hs108|chr9 ( 878) 337 69.0 7e-11 >>CCDS34552.1 PLEKHG1 gene_id:57480|Hs108|chr6 (1385 aa) initn: 9170 init1: 9170 opt: 9170 Z-score: 8343.6 bits: 1556.3 E(32554): 0 Smith-Waterman score: 9170; 100.0% identity (100.0% similar) in 1385 aa overlap (60-1444:1-1385) 30 40 50 60 70 80 pF1KA1 QLRLEVPSAVTKVPHPKTTARRSCPQELKTMELSDSDRPVSFGSTSSSASSRDSHGSFGS :::::::::::::::::::::::::::::: CCDS34 MELSDSDRPVSFGSTSSSASSRDSHGSFGS 10 20 30 90 100 110 120 130 140 pF1KA1 RMTLVSNSHMGLFNQDKEVGAIKLELIPARPFSSSELQRDNPATGQQNADEGSERPPRAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RMTLVSNSHMGLFNQDKEVGAIKLELIPARPFSSSELQRDNPATGQQNADEGSERPPRAQ 40 50 60 70 80 90 150 160 170 180 190 200 pF1KA1 WRVDSNGAPKTIADSATSPKLLYVDRVVQEILETERTYVQDLKSIVEDYLDCIRDQTKLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 WRVDSNGAPKTIADSATSPKLLYVDRVVQEILETERTYVQDLKSIVEDYLDCIRDQTKLP 100 110 120 130 140 150 210 220 230 240 250 260 pF1KA1 LGTEERSALFGNIQDIYHFNSELLQDLENCENDPVAIAECFVSKSEEFHIYTQYCTNYPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LGTEERSALFGNIQDIYHFNSELLQDLENCENDPVAIAECFVSKSEEFHIYTQYCTNYPR 160 170 180 190 200 210 270 280 290 300 310 320 pF1KA1 SVAVLTECMRNKILAKFFRERQETLKHSLPLGSYLLKPVQRILKYHLLLHEIENHLDKDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SVAVLTECMRNKILAKFFRERQETLKHSLPLGSYLLKPVQRILKYHLLLHEIENHLDKDT 220 230 240 250 260 270 330 340 350 360 370 380 pF1KA1 EGYDVVLDAIDTMQRVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSYGELVLEGTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 EGYDVVLDAIDTMQRVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSYGELVLEGTF 280 290 300 310 320 330 390 400 410 420 430 440 pF1KA1 RIQRAKNERTLFLFDKLLLITKKRDDTFTYKAHILCGNLMLVEVIPKEPLSFSVFHYKNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RIQRAKNERTLFLFDKLLLITKKRDDTFTYKAHILCGNLMLVEVIPKEPLSFSVFHYKNP 340 350 360 370 380 390 450 460 470 480 490 500 pF1KA1 KLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPAKAKQAILEMDAIHHPGFCYSPEGGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 KLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPAKAKQAILEMDAIHHPGFCYSPEGGT 400 410 420 430 440 450 510 520 530 540 550 560 pF1KA1 KALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETAQDIQKVSREEGSPQLSSARPSPAQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 KALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETAQDIQKVSREEGSPQLSSARPSPAQR 460 470 480 490 500 510 570 580 590 600 610 620 pF1KA1 NSQPSSSTMISVLRAGGALRNIWTDHQIRQALFPSRRSPQENEDDEDDYQMFVPSFSSSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 NSQPSSSTMISVLRAGGALRNIWTDHQIRQALFPSRRSPQENEDDEDDYQMFVPSFSSSD 520 530 540 550 560 570 630 640 650 660 670 680 pF1KA1 LNSTRLCEDSTSSRPCSWHMGQMESTETSSSGHRIVRRASSAGESNTCPPEIGTSDRTRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LNSTRLCEDSTSSRPCSWHMGQMESTETSSSGHRIVRRASSAGESNTCPPEIGTSDRTRE 580 590 600 610 620 630 690 700 710 720 730 740 pF1KA1 LQNSPKTEGQEEMTPFGSSIELTIDDIDHVYDNISYEDLKLMVAKREEAESTPSKSARDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LQNSPKTEGQEEMTPFGSSIELTIDDIDHVYDNISYEDLKLMVAKREEAESTPSKSARDS 640 650 660 670 680 690 750 760 770 780 790 800 pF1KA1 VRPKSTPELAFTKRQAGHSKGSLYAQTDGTLSGGEASSQSTHELQAVEENIYDTIGLPDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 VRPKSTPELAFTKRQAGHSKGSLYAQTDGTLSGGEASSQSTHELQAVEENIYDTIGLPDP 700 710 720 730 740 750 810 820 830 840 850 860 pF1KA1 PSLGFKCSSLKRAKRSTFLGLEADFVCCDSLRPFVSQDSLQLSEDEAPYHQATPDHGYLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PSLGFKCSSLKRAKRSTFLGLEADFVCCDSLRPFVSQDSLQLSEDEAPYHQATPDHGYLS 760 770 780 790 800 810 870 880 890 900 910 920 pF1KA1 LLYDSPSGNLSMPHKPVSDKLSEEVDEIWNDLENYIKKNEDKARDRLLAAFPVSKDDVPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LLYDSPSGNLSMPHKPVSDKLSEEVDEIWNDLENYIKKNEDKARDRLLAAFPVSKDDVPD 820 830 840 850 860 870 930 940 950 960 970 980 pF1KA1 RLHAESTPELSRDVGRSVSTLSLPESQALLTPVKSRAGRASRANCPFEEDLISKEGSFMS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RLHAESTPELSRDVGRSVSTLSLPESQALLTPVKSRAGRASRANCPFEEDLISKEGSFMS 880 890 900 910 920 930 990 1000 1010 1020 1030 1040 pF1KA1 LNRLSLASEMPLMDNPYDLANSGLSQTDPENPDLGMEATDKTKSRVFMMARQYSQKIKKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LNRLSLASEMPLMDNPYDLANSGLSQTDPENPDLGMEATDKTKSRVFMMARQYSQKIKKA 940 950 960 970 980 990 1050 1060 1070 1080 1090 1100 pF1KA1 NQLLKVKSLELEQPPASQHQKSMHKDLAAILEEKKQGGPAIGARIAEYSQLYDQIVFRES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 NQLLKVKSLELEQPPASQHQKSMHKDLAAILEEKKQGGPAIGARIAEYSQLYDQIVFRES 1000 1010 1020 1030 1040 1050 1110 1120 1130 1140 1150 1160 pF1KA1 PLKIQKDGWASPQESSLLRSVSPSQVHHGSGDWLLHSTYSNGELADFCLPPEQDLRSRYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PLKIQKDGWASPQESSLLRSVSPSQVHHGSGDWLLHSTYSNGELADFCLPPEQDLRSRYP 1060 1070 1080 1090 1100 1110 1170 1180 1190 1200 1210 1220 pF1KA1 TFEINTKSTPRQLSAACSVPSLQTSDPLPGSVQRCSVVVSQPNKENWCQDHLYNSLGRKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 TFEINTKSTPRQLSAACSVPSLQTSDPLPGSVQRCSVVVSQPNKENWCQDHLYNSLGRKG 1120 1130 1140 1150 1160 1170 1230 1240 1250 1260 1270 1280 pF1KA1 ISAKSQPYHRSQSSSSVLINKSMDSINYPSDVGKQQLLSLHRSSRCESHQDLLPDIADSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 ISAKSQPYHRSQSSSSVLINKSMDSINYPSDVGKQQLLSLHRSSRCESHQDLLPDIADSH 1180 1190 1200 1210 1220 1230 1290 1300 1310 1320 1330 1340 pF1KA1 QQGTEKLSDLTLQDSQKVVVVNRNLPLNAQIATQNYFSNFKETDGDEDDYVEIKSEEDES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 QQGTEKLSDLTLQDSQKVVVVNRNLPLNAQIATQNYFSNFKETDGDEDDYVEIKSEEDES 1240 1250 1260 1270 1280 1290 1350 1360 1370 1380 1390 1400 pF1KA1 ELELSHNRRRKSDSKFVDADFSDNVCSGNTLHSLNSPRTPKKPVNSKLGLSPYLTPYNDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 ELELSHNRRRKSDSKFVDADFSDNVCSGNTLHSLNSPRTPKKPVNSKLGLSPYLTPYNDS 1300 1310 1320 1330 1340 1350 1410 1420 1430 1440 pF1KA1 DKLNDYLWRGPSPNQQNIVQSLREKFQCLSSSSFA ::::::::::::::::::::::::::::::::::: CCDS34 DKLNDYLWRGPSPNQQNIVQSLREKFQCLSSSSFA 1360 1370 1380 >>CCDS76690.1 PLEKHG3 gene_id:26030|Hs108|chr14 (1219 aa) initn: 1783 init1: 1114 opt: 1579 Z-score: 1436.7 bits: 278.2 E(32554): 1e-73 Smith-Waterman score: 1664; 34.6% identity (58.0% similar) in 1194 aa overlap (54-1204:2-1098) 30 40 50 60 70 80 pF1KA1 SITDGHQLRLEVPSAVTKVPHPKTTARRSCPQELKTMELSDSDRPVSFGST-SSSASSRD : . . ....::::. :: :::.:: : CCDS76 MPVSTSLHQDGSQERPVSLTSTTSSSGSSCD 10 20 30 90 100 110 120 130 140 pF1KA1 SHGSFGSRMTLVSNSHMGLFNQDKEVGAIKLELIPARPFSSSELQRDNPATGQQNADEGS :. : : :.:. ::. ..: .: : ....... . CCDS76 SR----SAMEEPSSSEA-----------------PAKNGAGSLRSRHLPNSNNNSSSWLN 40 50 60 70 150 160 170 180 190 200 pF1KA1 ERPPRAQWRVDSNGAPKTIADSATSPKLLYVDRVVQEILETERTYVQDLKSIVEDYLDCI . : . . . ..: . :: :. :::.::.:::: :::::.::::::: : CCDS76 VKGPLSPFNSRAAAGP-------AHHKLSYLGRVVREIVETERMYVQDLRSIVEDYLLKI 80 90 100 110 120 210 220 230 240 250 260 pF1KA1 RDQTKLPLGTEERSALFGNIQDIYHFNSELLQDLENCENDPVAIAECFVSKSEEFHIYTQ : : : :. :::::::..:: .::.::.::..:..::::.: ::: .:.:: :::: CCDS76 IDTPGL-LKPEQVSALFGNIENIYALNSQLLRDLDSCNSDPVAVASCFVERSQEFDIYTQ 130 140 150 160 170 180 270 280 290 300 310 320 pF1KA1 YCTNYPRSVAVLTECMRNKILAKFFRERQETLKHSLPLGSYLLKPVQRILKYHLLLHEIE ::.::: :::.::::::.: :::::.::: :.:::::::::::::::::::::::.:: CCDS76 YCNNYPNSVAALTECMRDKQQAKFFRDRQELLQHSLPLGSYLLKPVQRILKYHLLLQEIA 190 200 210 220 230 240 330 340 350 360 370 380 pF1KA1 NHLDKDTEGYDVVLDAIDTMQRVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSYGE .:.:.. .:..:: :::::: :::.::::::.:::::::::::::: ::::::::.::: CCDS76 KHFDEEEDGFEVVEDAIDTMTCVAWYINDMKRRHEHAVRLQEIQSLLINWKGPDLTTYGE 250 260 270 280 290 300 390 400 410 420 430 440 pF1KA1 LVLEGTFRIQRAKNERTLFLFDKLLLITKKRDDTFTYKAHILCGNLMLVEVIPKEPLSFS ::::::::..:..::::.::::: ::::::: : :.::..: :..:::.: .. : :. CCDS76 LVLEGTFRVHRVRNERTFFLFDKTLLITKKRGDHFVYKGNIPCSSLMLIEST-RDSLCFT 310 320 330 340 350 360 450 460 470 480 490 500 pF1KA1 VFHYKNPKLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPAKAKQAILEMDAIHHPGFC : :::. : :...:::. ..:: :. :.:::::::: : :: :::.::::::. . . CCDS76 VTHYKHSKQQYSIQAKTVEEKRNWTHHIKRLILENHHATIPQKAKEAILEMDSYYPNRYR 370 380 390 400 410 420 510 520 530 540 550 560 pF1KA1 YSPEGGTKALFGSKEGSAPYRL-RRKSEPSSRSHKVLKTSETAQDIQKVSREEGSPQLSS ::: :: .. : :. : ::.:::... . :. . : .. .:.:. . :: CCDS76 CSPERLKKAWSSQDEVSTNVRQGRRQSEPTKHLLRQLNEKARAAGMKGKGRRESESSRSS 430 440 450 460 470 480 570 580 590 600 610 pF1KA1 ARPSPAQRNSQPSSSTMISVLRAGGALRNIWTDHQI--RQALF-----PS-RRSPQENED ::: . .:.:. ... ..: .. : . .: .: :: ...:...:. CCDS76 RRPS----GRSPTSTEKRMSFESISSLPEVEPDPEAGSEQEVFSAVEGPSAEETPSDTES 490 500 510 520 530 620 630 640 650 660 pF1KA1 DE------DDYQMFV---PSFSSSDLNSTRLCEDSTS-SRPCSWHMGQMESTETSSSGHR : : .: .. : . :. ... :: . : .:: . : CCDS76 PEVLETQLDAHQGLLGMDPPGDMVDFVAAESTEDLKALSSEEEEEMGGAAQEPESLLPPS 540 550 560 570 580 590 670 680 690 700 710 720 pF1KA1 IVRRASSAGESNTCPPEIGTSDRTRELQNSPKTEGQEEMTPFGSSIELTIDDIDHVYDNI .. .:: .: . . : :. :.. :. : ::: .: ... . . CCDS76 VLDQASVIAERFVS----SFSRRSSVAQEDSKSSG------FGSP-RL----VSRSSSVL 600 610 620 630 640 730 740 750 760 770 780 pF1KA1 SYEDLKLMVAKREEAESTPSKSARDSVRPKSTPELAFT---KRQAGHSKGSLYAQTDGTL : : . .:.. :: ::. . .::. .. . . : ... . : CCDS76 SLEGSEKGLARH--------GSATDSLSCQLSPEVDISVGVATEDSPSVNGMEPPSPGCP 650 660 670 680 690 790 800 810 820 830 pF1KA1 SGGEASSQSTHE--LQAVEENIYDTIGL----PDPPSLGFKCSSLKRAKRSTFL--GLEA . :: . .: :.. .. . : : . . :: :..: . ... :: CCDS76 VEPDRSSCKKKESALSTRDRLLLDKIKSYYENAEHHDAGF---SVRRRESLSYIPKGLVR 700 710 720 730 740 750 840 850 860 870 880 pF1KA1 DFVC-CDSL-RPFVSQDSLQLSEDEAPYHQATPDHGYLSLLYDSPSGNLSMPHKPVSD-- . . .:: :: : . . . .. .. . .:: .. :.:: CCDS76 NSISRFNSLPRP----DPEPVPPVGSKRQVGSRPTSWALFELPGPSQAVKGDPPPISDAE 760 770 780 790 800 890 900 910 920 930 940 pF1KA1 -KLSEEVDEIWNDLENYIKKNEDKARDRLLAAFPVSKDDVPDRLHAESTPELSRDVGRSV . : :. .::. .:. . . .: :. . : ::. . . CCDS76 FRPSSEIVKIWEGMESSGGSPGKGPGQGQANGF-----DLHEPLFILEEHELGA-ITEES 810 820 830 840 850 860 950 960 970 980 990 1000 pF1KA1 STLSLPESQALLTPVKSRAGRASRANCPFEEDLISKEGSFMSLNRLSLASEMPLMDNPYD .: : :::. .:...: : :. : . :: : . ..: :: . CCDS76 ATAS-PESS---SPTEGR----SPAHLARELKELVKELSSSTQGELV----APLHPRIVQ 870 880 890 900 1010 1020 1030 1040 1050 1060 pF1KA1 LANSGLSQTDPENPDLGMEATDKTKSRVFMMARQYSQKIKKANQLLKVKSLELEQPPASQ :.. . ......:..:...::::: .::. . .. :. :. . CCDS76 LSHV-----------MDSHVSERVKNKVYQLARQYSLRIKSNKPVMARPPLQWEKVAPER 910 920 930 940 950 1070 1080 1090 1100 1110 1120 pF1KA1 HQKSMHKDLAAILEEKKQGGPAIGARIAEYSQL-YDQIVFRE-SPLKIQKDGWASPQESS :: . . :: . . : : : . :.:.. .: :: : .. : :::. CCDS76 DGKS--PTVPCLQEEAGEPLGGKGKRKPVLSLFDYEQLMAQEHSPPKPSSAGEMSPQRFF 960 970 980 990 1000 1010 1130 1140 1150 1160 1170 1180 pF1KA1 LLRSVSPSQVHHGSGDWLLHSTYSNGELADFCLPPEQDLRSRYPTFEINTKS---TPR-- . :. ... .: .: : : : : ..: :.: . . .. :: CCDS76 FNPSAVSQRTTSPGGRPSARSPLSPTE--TFSWPDVRELCSKYASRDEARRAGGGRPRGP 1020 1030 1040 1050 1060 1070 1190 1200 1210 1220 1230 1240 pF1KA1 QLSAACSVPSLQTSDPLPGSVQRCSVVVSQPNKENWCQDHLYNSLGRKGISAKSQPYHRS .. . ::: .. :: : : :: CCDS76 PVNRSHSVPENMVEPPLSGRVGRCRSLSTKRGRGGGEAAQSPGPLPQSKPDGGETLYVTA 1080 1090 1100 1110 1120 1130 >>CCDS33022.2 PLEKHG2 gene_id:64857|Hs108|chr19 (1386 aa) initn: 1117 init1: 318 opt: 1119 Z-score: 1017.3 bits: 200.7 E(32554): 2.4e-50 Smith-Waterman score: 1188; 33.0% identity (59.1% similar) in 872 aa overlap (130-957:63-887) 100 110 120 130 140 150 pF1KA1 GLFNQDKEVGAIKLELIPARPFSSSELQRDNPATGQQNADEGSERPPRAQWRVDSNGAPK .:: : : .:. : . . .: CCDS33 ETRTAPAAPTMASPRGSGSSTSLSTVGSEGDPAPGPTPACSASRPEPLPGPPIRLHLSPV 40 50 60 70 80 90 160 170 180 190 200 210 pF1KA1 TIADSATSPKLLYVDRVVQEILETERTYVQDLKSIVEDYLDCIRDQTKLPLGTEERSALF : :: .: .::..::.::::.::.::.::::::: . : : :..:. ..:: CCDS33 GIPGSARPSRL---ERVAREIVETERAYVRDLRSIVEDYLGPLLDGGVLGLSVEQVGTLF 100 110 120 130 140 220 230 240 250 260 270 pF1KA1 GNIQDIYHFNSELLQDLENCENDPVAIAECFVSKSEEFHIYTQYCTNYPRSVAVLTECMR .::.:::.:.::::.:::: .. .::::::..::.: ::: :: ::: :.:.: : CCDS33 ANIEDIYEFSSELLEDLENS-SSAGGIAECFVQRSEDFDIYTLYCMNYPSSLALLRELSL 150 160 170 180 190 200 280 290 300 310 320 330 pF1KA1 NKILAKFFRERQETLKHSLPLGSYLLKPVQRILKYHLLLHEIENHLDKD--TEGYDVVLD . : ...::: :.::::: :.:::::::::::::::.:. .: . : : ..: . CCDS33 SPPAALWLQERQAQLRHSLPLQSFLLKPVQRILKYHLLLQELGKHWAEGPGTGGREMVEE 210 220 230 240 250 260 340 350 360 370 380 390 pF1KA1 AIDTMQRVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSYGELVLEGTFRI-----Q :: .: :::.:::::::.:::.::::.: : .: ::.:...:::::::.:: CCDS33 AIVSMTAVAWYINDMKRKQEHAARLQEVQRRLGGWTGPELSAFGELVLEGAFRGGGGGGP 270 280 290 300 310 320 400 410 420 430 440 450 pF1KA1 RAKN-ERTLFLFDKLLLITKKRDDTFTYKAHILCGNLMLVEVIPKEPLSFSVFHYKNPKL : .. :: ::::...::..:.: .:::.::.: :: . : :..::.:.: :: CCDS33 RLRGGERLLFLFSRMLLVAKRRGLEYTYKGHIFCCNLSVSES-PRDPLGFKVSDLTIPKH 330 340 350 360 370 380 460 470 480 490 500 pF1KA1 QHTVQAKSQQDKRLWVLHLKRLILENHAAKIPAKAKQAILEMDAIH-----HPGFC-YSP .: .:::.:..::::. :.::..::: :.:::::::..:: ...: .: . .: CCDS33 RHLLQAKNQEEKRLWIHCLQRLFFENHPASIPAKAKQVLLE-NSLHCAPKSKPVLEPLTP 390 400 410 420 430 440 510 520 530 540 550 pF1KA1 EGGT------KALFGSKEGSAP-------YRLRRKSEPSSRSHKVLKTSETAQDIQKVSR :. ... .....:: : ::.::: .. :. ... ..... CCDS33 PLGSPRPRDARSFTPGRRNTAPSPGPSVIRRGRRQSEPV-KDPYVMFPQNAKPGFKHAGS 450 460 470 480 490 500 560 570 580 590 600 pF1KA1 E------EGSPQLSSARPSPAQRNSQPSSSTMISVLRAGGALRNIWTDHQIRQALFPSRR : :..: .:.. : ... : . : .:. .: ..: . : ..: CCDS33 EGELYPPESQPPVSGSAPPEDLEDAGPPT------LDPSGT--SI--TEEILELL--NQR 510 520 530 540 550 610 620 630 640 650 660 pF1KA1 SPQENEDDEDDYQMFVPSFSSSDLNSTRLCEDSTSSRPCSWHMGQ----MESTETSSSGH . .. . : : :. :. .: : .. :: : . . .: : . : CCDS33 GLRDPGPSTHDIPKF-PGDSQVPGDSETLTFQALPSRDSSEEEEEEEEGLEMDERGPSPL 560 570 580 590 600 610 670 680 690 700 710 720 pF1KA1 RIVRRASSAGESNTCPPEIGTSDRTRELQNSPKTEGQEEMTPFGSSIELTIDDIDHVYDN .... :. .. : : . .. : :. .. :. : :: . ...::. :.. CCDS33 HVLEGLESSIAAEM--PSIPCLTKIPDVPNLPEIPSRCEI-PEGSRLP-SLSDISDVFEM 620 630 640 650 660 730 740 750 760 770 pF1KA1 ISYEDLKLMVAKREEAESTPSKSARDSVR-PKSTP-ELAFTKRQ--AGHSKGSLYAQTDG . : . :::. : . .. : . : : :.:. .: . :.: .: CCDS33 PCLPAIP-SVPNTPSLSSTPTLSCDSWLQGPLQEPAEAPATRRELFSGSNPGKLGEPPSG 670 680 690 700 710 720 780 790 800 810 820 830 pF1KA1 TLSGGEASSQSTHELQAVEENIYDTIGLPDPPSLGFK-CSSLKRAKRSTFLGLEADFVCC .: : . ... . ... . :.:: :.:. :: .. : .. : : CCDS33 GKAGPEEDEEGVSFTDFQPQDVTQHQGFPD--ELAFRSCSEIRSAWQALEQGQLA----- 730 740 750 760 770 780 840 850 860 870 880 890 pF1KA1 DSLRPFVSQDSLQLSEDEAPYHQATPDHGYLSLLYDSPSGNLSMPH-KPVSDKLSEEVDE :: . : : ... ... : .::.. . . . .. ::.... CCDS33 ---RPGFPEPLLILEDSDLGGDSGSGKAG-------APSSERTASRVRELARLYSERIQQ 790 800 810 820 830 900 910 920 930 940 950 pF1KA1 IWNDLENYIKKNEDKARDRLLAAFPVSKDDVPDRLHAESTPELSRDVGRS-VSTLSLPES . . :. . : . : :.:: : . .: . .. : : :. : :..: . CCDS33 M-QRAETRASANAPRRRPRVLAQ-PQPSPCLP---QEQAEPGLLPAFGHVLVCELAFPLT 840 850 860 870 880 960 970 980 990 1000 1010 pF1KA1 QALLTPVKSRAGRASRANCPFEEDLISKEGSFMSLNRLSLASEMPLMDNPYDLANSGLSQ : CCDS33 CAQESVPLGPAVWVQAAIPLSKQGGSPDGQGLHVSNLPKQDLPGIHVSAATLLPEQGGSR 890 900 910 920 930 940 >>CCDS55514.1 MCF2 gene_id:4168|Hs108|chrX (821 aa) initn: 319 init1: 151 opt: 460 Z-score: 421.2 bits: 89.7 E(32554): 3.9e-17 Smith-Waterman score: 487; 27.8% identity (58.5% similar) in 439 aa overlap (92-488:373-783) 70 80 90 100 110 pF1KA1 LSDSDRPVSFGSTSSSASSRDSHGSFGSRMTLVSNSHMGLFN-QDKEVGAIKLELIPA-- .. :.. :. : ::.: :.. ..:. CCDS55 ETLQYEFDVILSPELKVQMKTIQLKLENIRSIFENQQAGFRNLADKHVRPIQF-VVPTPE 350 360 370 380 390 400 120 130 140 150 160 170 pF1KA1 ------RPFSSSELQRDNPATGQQNADEGSERPPRAQWRVDSNGAPKTIADSATSPKLLY :: ::. . . .:.: : : : . :.: :.. :...: .: CCDS55 NLVTSGTPFFSSKQGKKTWRQNQSNLK--IEVVPDCQEK-RSSG-PSSSLDNGNSLDVLK 410 420 430 440 450 180 190 200 210 220 pF1KA1 VDRVVQEILETERTYVQDLKSIVEDYLDCIRDQTKL-----PLGTEERSALFGNIQDIYH ..:..:...:::.::..: ... : . :. .. :: .... ::::. .::. CCDS55 -NHVLNELIQTERVYVRELYTVLLGYRAEM-DNPEMFDLMPPLLRNKKDILFGNMAEIYE 460 470 480 490 500 510 230 240 250 260 270 280 pF1KA1 FNSEL-LQDLENCENDPVAIAECFVSKSEEFHIYTQYCTNYPRSVAV---LTECMRNKIL :.... :..:::: . : .. ::. ....:..:..:: : ::: .. .:: CCDS55 FHNDIFLSSLENCAHAPERVGPCFLERKDDFQMYAKYCQNKPRSETIWRKYSECA----- 520 530 540 550 560 570 290 300 310 320 330 340 pF1KA1 AKFFRERQETLKHSLPLGSYLLKPVQRILKYHLLLHEIENHLDKDTEGYDVVLDAIDTMQ ::.: :. ::: : : :::::::::: ::.:::.:. .. .:: :: .. :.:.: CCDS55 --FFQECQRKLKHRLRLDSYLLKPVQRITKYQLLLKELLKY-SKDCEGSALLKKALDAML 580 590 600 610 620 350 360 370 380 390 pF1KA1 RVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSYGELVLEGTFRIQ--------RAK . .:: :. :. ... : .:. :.....: : . . : CCDS55 DLLKSVND--SMHQIAI---------NGYIG-NLNELGKMIMQGGFSVWIGHKKGATKMK 630 640 650 660 670 400 410 420 430 pF1KA1 N-------ERTLFLFDKLLLITKKR------DDTFTYKAHILCGNL---MLVEVIPKEPL . .: :::..: ... :.: .: . . : .. ..: . . CCDS55 DLARFKPMQRHLFLYEKAIVFCKRRVESGEGSDRYPSYSFKHCWKMDEVGITEYVKGDNR 680 690 700 710 720 730 440 450 460 470 480 490 pF1KA1 SFSVFHYKNPKLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPAKAKQAILEMDAIHHP .: ... .. .. . :::.. . : :. ... ..:... : :: CCDS55 KFEIWYGEKEEV-YIVQASNVDVKMTWLKEIRNILLKQQELLTVKKRKQQDQLTERDKFQ 740 750 760 770 780 790 500 510 520 530 540 550 pF1KA1 GFCYSPEGGTKALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETAQDIQKVSREEGSPQL CCDS55 ISLQQNDEDLCRRWLSYIDEATMSNGK 800 810 820 >>CCDS55515.1 MCF2 gene_id:4168|Hs108|chrX (860 aa) initn: 319 init1: 151 opt: 460 Z-score: 420.8 bits: 89.7 E(32554): 4e-17 Smith-Waterman score: 487; 27.8% identity (58.5% similar) in 439 aa overlap (92-488:412-822) 70 80 90 100 110 pF1KA1 LSDSDRPVSFGSTSSSASSRDSHGSFGSRMTLVSNSHMGLFN-QDKEVGAIKLELIPA-- .. :.. :. : ::.: :.. ..:. CCDS55 ETLQYEFDVILSPELKVQMKTIQLKLENIRSIFENQQAGFRNLADKHVRPIQF-VVPTPE 390 400 410 420 430 440 120 130 140 150 160 170 pF1KA1 ------RPFSSSELQRDNPATGQQNADEGSERPPRAQWRVDSNGAPKTIADSATSPKLLY :: ::. . . .:.: : : : . :.: :.. :...: .: CCDS55 NLVTSGTPFFSSKQGKKTWRQNQSNLK--IEVVPDCQEK-RSSG-PSSSLDNGNSLDVLK 450 460 470 480 490 180 190 200 210 220 pF1KA1 VDRVVQEILETERTYVQDLKSIVEDYLDCIRDQTKL-----PLGTEERSALFGNIQDIYH ..:..:...:::.::..: ... : . :. .. :: .... ::::. .::. CCDS55 -NHVLNELIQTERVYVRELYTVLLGYRAEM-DNPEMFDLMPPLLRNKKDILFGNMAEIYE 500 510 520 530 540 550 230 240 250 260 270 280 pF1KA1 FNSEL-LQDLENCENDPVAIAECFVSKSEEFHIYTQYCTNYPRSVAV---LTECMRNKIL :.... :..:::: . : .. ::. ....:..:..:: : ::: .. .:: CCDS55 FHNDIFLSSLENCAHAPERVGPCFLERKDDFQMYAKYCQNKPRSETIWRKYSECA----- 560 570 580 590 600 290 300 310 320 330 340 pF1KA1 AKFFRERQETLKHSLPLGSYLLKPVQRILKYHLLLHEIENHLDKDTEGYDVVLDAIDTMQ ::.: :. ::: : : :::::::::: ::.:::.:. .. .:: :: .. :.:.: CCDS55 --FFQECQRKLKHRLRLDSYLLKPVQRITKYQLLLKELLKY-SKDCEGSALLKKALDAML 610 620 630 640 650 660 350 360 370 380 390 pF1KA1 RVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSYGELVLEGTFRIQ--------RAK . .:: :. :. ... : .:. :.....: : . . : CCDS55 DLLKSVND--SMHQIAI---------NGYIG-NLNELGKMIMQGGFSVWIGHKKGATKMK 670 680 690 700 710 400 410 420 430 pF1KA1 N-------ERTLFLFDKLLLITKKR------DDTFTYKAHILCGNL---MLVEVIPKEPL . .: :::..: ... :.: .: . . : .. ..: . . CCDS55 DLARFKPMQRHLFLYEKAIVFCKRRVESGEGSDRYPSYSFKHCWKMDEVGITEYVKGDNR 720 730 740 750 760 770 440 450 460 470 480 490 pF1KA1 SFSVFHYKNPKLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPAKAKQAILEMDAIHHP .: ... .. .. . :::.. . : :. ... ..:... : :: CCDS55 KFEIWYGEKEEV-YIVQASNVDVKMTWLKEIRNILLKQQELLTVKKRKQQDQLTERDKFQ 780 790 800 810 820 830 500 510 520 530 540 550 pF1KA1 GFCYSPEGGTKALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETAQDIQKVSREEGSPQL CCDS55 ISLQQNDEDLCRRWLSYIDEATMSNGK 840 850 860 >>CCDS14667.1 MCF2 gene_id:4168|Hs108|chrX (925 aa) initn: 319 init1: 151 opt: 460 Z-score: 420.4 bits: 89.7 E(32554): 4.3e-17 Smith-Waterman score: 487; 27.8% identity (58.5% similar) in 439 aa overlap (92-488:412-822) 70 80 90 100 110 pF1KA1 LSDSDRPVSFGSTSSSASSRDSHGSFGSRMTLVSNSHMGLFN-QDKEVGAIKLELIPA-- .. :.. :. : ::.: :.. ..:. CCDS14 ETLQYEFDVILSPELKVQMKTIQLKLENIRSIFENQQAGFRNLADKHVRPIQF-VVPTPE 390 400 410 420 430 440 120 130 140 150 160 170 pF1KA1 ------RPFSSSELQRDNPATGQQNADEGSERPPRAQWRVDSNGAPKTIADSATSPKLLY :: ::. . . .:.: : : : . :.: :.. :...: .: CCDS14 NLVTSGTPFFSSKQGKKTWRQNQSNLK--IEVVPDCQEK-RSSG-PSSSLDNGNSLDVLK 450 460 470 480 490 180 190 200 210 220 pF1KA1 VDRVVQEILETERTYVQDLKSIVEDYLDCIRDQTKL-----PLGTEERSALFGNIQDIYH ..:..:...:::.::..: ... : . :. .. :: .... ::::. .::. CCDS14 -NHVLNELIQTERVYVRELYTVLLGYRAEM-DNPEMFDLMPPLLRNKKDILFGNMAEIYE 500 510 520 530 540 550 230 240 250 260 270 280 pF1KA1 FNSEL-LQDLENCENDPVAIAECFVSKSEEFHIYTQYCTNYPRSVAV---LTECMRNKIL :.... :..:::: . : .. ::. ....:..:..:: : ::: .. .:: CCDS14 FHNDIFLSSLENCAHAPERVGPCFLERKDDFQMYAKYCQNKPRSETIWRKYSECA----- 560 570 580 590 600 290 300 310 320 330 340 pF1KA1 AKFFRERQETLKHSLPLGSYLLKPVQRILKYHLLLHEIENHLDKDTEGYDVVLDAIDTMQ ::.: :. ::: : : :::::::::: ::.:::.:. .. .:: :: .. :.:.: CCDS14 --FFQECQRKLKHRLRLDSYLLKPVQRITKYQLLLKELLKY-SKDCEGSALLKKALDAML 610 620 630 640 650 660 350 360 370 380 390 pF1KA1 RVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSYGELVLEGTFRIQ--------RAK . .:: :. :. ... : .:. :.....: : . . : CCDS14 DLLKSVND--SMHQIAI---------NGYIG-NLNELGKMIMQGGFSVWIGHKKGATKMK 670 680 690 700 710 400 410 420 430 pF1KA1 N-------ERTLFLFDKLLLITKKR------DDTFTYKAHILCGNL---MLVEVIPKEPL . .: :::..: ... :.: .: . . : .. ..: . . CCDS14 DLARFKPMQRHLFLYEKAIVFCKRRVESGEGSDRYPSYSFKHCWKMDEVGITEYVKGDNR 720 730 740 750 760 770 440 450 460 470 480 490 pF1KA1 SFSVFHYKNPKLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPAKAKQAILEMDAIHHP .: ... .. .. . :::.. . : :. ... ..:... : :: CCDS14 KFEIWYGEKEEV-YIVQASNVDVKMTWLKEIRNILLKQQELLTVKKRKQQDQLTERDKFQ 780 790 800 810 820 830 500 510 520 530 540 550 pF1KA1 GFCYSPEGGTKALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETAQDIQKVSREEGSPQL CCDS14 ISLQQNDEKQQGAFISTEETELEHTSTVVEVCEAIASVQAEANTVWTEASQSAEISEEPA 840 850 860 870 880 890 >>CCDS48175.1 MCF2 gene_id:4168|Hs108|chrX (985 aa) initn: 319 init1: 151 opt: 460 Z-score: 419.9 bits: 89.7 E(32554): 4.5e-17 Smith-Waterman score: 487; 27.8% identity (58.5% similar) in 439 aa overlap (92-488:472-882) 70 80 90 100 110 pF1KA1 LSDSDRPVSFGSTSSSASSRDSHGSFGSRMTLVSNSHMGLFN-QDKEVGAIKLELIPA-- .. :.. :. : ::.: :.. ..:. CCDS48 ETLQYEFDVILSPELKVQMKTIQLKLENIRSIFENQQAGFRNLADKHVRPIQF-VVPTPE 450 460 470 480 490 500 120 130 140 150 160 170 pF1KA1 ------RPFSSSELQRDNPATGQQNADEGSERPPRAQWRVDSNGAPKTIADSATSPKLLY :: ::. . . .:.: : : : . :.: :.. :...: .: CCDS48 NLVTSGTPFFSSKQGKKTWRQNQSNLK--IEVVPDCQEK-RSSG-PSSSLDNGNSLDVLK 510 520 530 540 550 180 190 200 210 220 pF1KA1 VDRVVQEILETERTYVQDLKSIVEDYLDCIRDQTKL-----PLGTEERSALFGNIQDIYH ..:..:...:::.::..: ... : . :. .. :: .... ::::. .::. CCDS48 -NHVLNELIQTERVYVRELYTVLLGYRAEM-DNPEMFDLMPPLLRNKKDILFGNMAEIYE 560 570 580 590 600 610 230 240 250 260 270 280 pF1KA1 FNSEL-LQDLENCENDPVAIAECFVSKSEEFHIYTQYCTNYPRSVAV---LTECMRNKIL :.... :..:::: . : .. ::. ....:..:..:: : ::: .. .:: CCDS48 FHNDIFLSSLENCAHAPERVGPCFLERKDDFQMYAKYCQNKPRSETIWRKYSECA----- 620 630 640 650 660 290 300 310 320 330 340 pF1KA1 AKFFRERQETLKHSLPLGSYLLKPVQRILKYHLLLHEIENHLDKDTEGYDVVLDAIDTMQ ::.: :. ::: : : :::::::::: ::.:::.:. .. .:: :: .. :.:.: CCDS48 --FFQECQRKLKHRLRLDSYLLKPVQRITKYQLLLKELLKY-SKDCEGSALLKKALDAML 670 680 690 700 710 720 350 360 370 380 390 pF1KA1 RVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSYGELVLEGTFRIQ--------RAK . .:: :. :. ... : .:. :.....: : . . : CCDS48 DLLKSVND--SMHQIAI---------NGYIG-NLNELGKMIMQGGFSVWIGHKKGATKMK 730 740 750 760 770 400 410 420 430 pF1KA1 N-------ERTLFLFDKLLLITKKR------DDTFTYKAHILCGNL---MLVEVIPKEPL . .: :::..: ... :.: .: . . : .. ..: . . CCDS48 DLARFKPMQRHLFLYEKAIVFCKRRVESGEGSDRYPSYSFKHCWKMDEVGITEYVKGDNR 780 790 800 810 820 830 440 450 460 470 480 490 pF1KA1 SFSVFHYKNPKLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPAKAKQAILEMDAIHHP .: ... .. .. . :::.. . : :. ... ..:... : :: CCDS48 KFEIWYGEKEEV-YIVQASNVDVKMTWLKEIRNILLKQQELLTVKKRKQQDQLTERDKFQ 840 850 860 870 880 890 500 510 520 530 540 550 pF1KA1 GFCYSPEGGTKALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETAQDIQKVSREEGSPQL CCDS48 ISLQQNDEKQQGAFISTEETELEHTSTVVEVCEAIASVQAEANTVWTEASQSAEISEEPA 900 910 920 930 940 950 >>CCDS3883.1 TRIO gene_id:7204|Hs108|chr5 (3097 aa) initn: 391 init1: 142 opt: 464 Z-score: 415.8 bits: 90.6 E(32554): 7.7e-17 Smith-Waterman score: 475; 25.6% identity (53.3% similar) in 621 aa overlap (47-644:1849-2430) 20 30 40 50 60 70 pF1KA1 TNRVLGQSITDGHQLRLEVPSAVTKVPHPKTTARRSCPQELKTMELSDS-DRPVSFGSTS ... .:: .: . : .:. : .. . CCDS38 DDSAATPQDETVEERGRNEGLSSGTLSKSSSSGMQSCGEE-EGEEGADAVPLPPPMAIQQ 1820 1830 1840 1850 1860 1870 80 90 100 110 120 130 pF1KA1 SSASSRDSHGSFGSRMTLVSNSHMGLFNQDKEVGAIKLELIPARPFSSSELQRDNPATGQ : . ::. . .: :: . . . :.::. ::. .:. .: :.. CCDS38 HSLLQPDSQDDKASSRLLVRPTSSETPSAAELVSAIE-ELV-----KSKMALEDRPSSLL 1880 1890 1900 1910 1920 1930 140 150 160 170 180 190 pF1KA1 QNADEGSERPPR---AQWRVDSNGAPKTIADSATSPKLLYVDRVVQEILETERTYVQDLK .:.:. : .. . :...: . : .: :.::..:::: ::.:: CCDS38 --VDQGDSSSPSFNPSDNSLLSSSSPIDEMEERKSSSLKRRHYVLQELVETERDYVRDLG 1940 1950 1960 1970 1980 200 210 220 230 240 250 pF1KA1 SIVEDYLDCIRDQTKLPLGTEERSAL-FGNIQDIYHFNSEL-LQDLENCENDPVAIAECF .:: :. .... .: . .. . ::::..:: .. .. : .::.: .:: .. : CCDS38 YVVEGYMALMKEDG-VPDDMKGKDKIVFGNIHQIYDWHRDFFLGELEKCLEDPEKLGSLF 1990 2000 2010 2020 2030 2040 260 270 280 290 300 310 pF1KA1 VSKSEEFHIYTQYCTNYPRSVAVLTECMRNKILAKFFRERQETLKHSLPLGSYLLKPVQR :.. ...:.: :: : :.: ...: . ::.. .. : : : : . :.::::: CCDS38 VKHERRLHMYIAYCQNKPKSEHIVSE-----YIDTFFEDLKQRLGHRLQLTDLLIKPVQR 2050 2060 2070 2080 2090 2100 320 330 340 350 360 370 pF1KA1 ILKYHLLLHEIENHLDKDTEGYDVVLDAIDTMQRVAWHINDMKRKHEHAVRLQEIQSLLT :.::.:::... .. : . . . :...: : . ::: .. ::: CCDS38 IMKYQLLLKDFLKYSKKASLDTSELERAVEVMCIVPRRCNDMM----NVGRLQ------- 2110 2120 2130 2140 2150 380 390 400 410 pF1KA1 NWKGPDLTSYGELVLEGTFRI--QRAK-----NERTLFLFDKLLLITKKRDDT------- .. : ... :.:.:. :: . : : :: .:::........ : CCDS38 GFDGK-IVAQGKLLLQDTFLVTDQDAGLLPRCRERRIFLFEQIVIFSEPLDKKKGFSMPG 2160 2170 2180 2190 2200 2210 420 430 440 450 460 470 pF1KA1 FTYKAHILCGNLMLVEVIPKEPLSFSVFHYKNPKLQHTV-QAKSQQDKRLWVLHLKRLIL : .: : . : : : . ..: .:.. . .. . ...: . .. :. : :: CCDS38 FLFKNSIKVSCLCLEENVENDPCKFALTSRTGDVVETFILHSSSPSVRQTWI-HEINQIL 2220 2230 2240 2250 2260 2270 480 490 500 510 520 530 pF1KA1 ENHAAKIPAKAKQAILEMDAIHHPGFCYSPEGGTKALFGSKEGSAPYRLRRKSE-PSSRS ::. . .: . .:.. : : . ::. . :: :.:: .: ::: . CCDS38 ENQRNFL--NALTSPIEYQRNHSGGGGGGGSGGSGGGGGSGGGGAPSGGSGHSGGPSSCG 2280 2290 2300 2310 2320 540 550 560 570 580 590 pF1KA1 HKVLKTSETAQDIQKVSREEGSPQLSSARPSPAQRNSQPSSSTMISVLRAGGALRNIWTD . . : . :.. .::: : :. ... ..:: : :: . . CCDS38 GAPSTSRSRPSRIPQPVRHHPPVLVSSAASSQAEADKMSGTSTPGPSLPPPGAAPEAGPS 2330 2340 2350 2360 2370 2380 600 610 620 630 640 650 pF1KA1 HQIRQALFPSRRSPQENEDDEDDYQMFVPSFSSSDLNSTRL-CEDSTSSRPCSWHMGQME :::: : . . . .:... :.: : ....: : CCDS38 A-------PSRRPPGADAEGSEREAEPIPKMKV--LESPRKGAANASGSSPDAPAKDARA 2390 2400 2410 2420 2430 660 670 680 690 700 710 pF1KA1 STETSSSGHRIVRRASSAGESNTCPPEIGTSDRTRELQNSPKTEGQEEMTPFGSSIELTI CCDS38 SLGTLPLGKPRAGAASPLNSPLSSAVPSLGKEPFPPSSPLQKGGSFWSSIPASPASRPGS 2440 2450 2460 2470 2480 2490 >-- initn: 277 init1: 111 opt: 432 Z-score: 386.7 bits: 85.2 E(32554): 3.2e-15 Smith-Waterman score: 468; 28.3% identity (59.6% similar) in 403 aa overlap (176-560:1296-1661) 150 160 170 180 190 200 pF1KA1 PRAQWRVDSNGAPKTIADSATSPKLLYVDRVVQEILETERTYVQDLKSIVEDYL-DCIRD .. :...::..::.::. .. :: . CCDS38 ASIPGSEVKLRDAAHELNEEKRKSARRKEFIMAELIQTEKAYVRDLRECMDTYLWEMTSG 1270 1280 1290 1300 1310 1320 210 220 230 240 250 260 pF1KA1 QTKLPLGTEERS-ALFGNIQDIYHF-NSELLQDLENCENDPVAIAECFVSKSEEFHIYTQ ..: : .. .:::.:.::.: :. .:..::. :. : ...:::. ...:..:. CCDS38 VEEIPPGIVNKELIIFGNMQEIYEFHNNIFLKELEKYEQLPEDVGHCFVTWADKFQMYVT 1330 1340 1350 1360 1370 1380 270 280 290 300 310 320 pF1KA1 YCTNYPRSVAVLTECMRNKILAKFFRERQETLKHSLP--LGSYLLKPVQRILKYHLLLHE :: : : :. .. : ...: : :. .:.: ..:::.:::::: ::.:::.: CCDS38 YCKNKPDSTQLILEHA-----GSYFDEIQQ--RHGLANSISSYLIKPVQRITKYQLLLKE 1390 1400 1410 1420 1430 330 340 350 360 370 380 pF1KA1 IENHLDKDTEGYDVVLDAIDTMQRVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSY . : :: . :....: : . :: :..:. .... : . : CCDS38 L---LTCCEEGKGEIKDGLEVMLSVPKRAND-------AMHLSMLEGFDEN-----IESQ 1440 1450 1460 1470 1480 390 400 410 420 pF1KA1 GELVLEGTFRIQRAKN------ERTLFLFDKLLLITKKRDDT-----FTYKAHILCGNLM :::.:. .:.. :. :: ::::. :...:. :. . ::.... ..: CCDS38 GELILQESFQVWDPKTLIRKGRERHLFLFEMSLVFSKEVKDSSGRSKYLYKSKLFTSELG 1490 1500 1510 1520 1530 1540 430 440 450 460 470 480 pF1KA1 LVEVIPKEPLSFSVFHYKNPKLQHTV--QAKSQQDKRLWVLHLKRLILENHAAKIPAKAK ..: . .: .:... ..: .. . .:.: ..:. :. :....: : . : CCDS38 VTEHVEGDPCKFALWVGRTPTSDNKIVLKASSIENKQDWIKHIREVIQER-----TIHLK 1550 1560 1570 1580 1590 490 500 510 520 530 540 pF1KA1 QAILEMDAIHHPGFCYSPEGGTKALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETAQDI :. : :: : .: : : ..: : ... ::. . .:.:.:. CCDS38 GALKE--PIHIPKT--APATRQK---GRRDGED---LDSQGDGSSQPDTISIASRTSQNT 1600 1610 1620 1630 1640 550 560 570 580 590 600 pF1KA1 QKVSREEGSPQLSSARPSPAQRNSQPSSSTMISVLRAGGALRNIWTDHQIRQALFPSRRS .. :. .:. CCDS38 LDSDKLSGGCELTVVIHDFTACNSNELTIRRGQTVEVLERPHDKPDWCLVRTTDRSPAAE 1650 1660 1670 1680 1690 1700 >>CCDS55429.1 ARHGEF9 gene_id:23229|Hs108|chrX (414 aa) initn: 381 init1: 120 opt: 445 Z-score: 412.2 bits: 87.0 E(32554): 1.2e-16 Smith-Waterman score: 460; 30.7% identity (61.0% similar) in 313 aa overlap (176-467:5-315) 150 160 170 180 190 200 pF1KA1 PRAQWRVDSNGAPKTIADSATSPKLLYVDRVVQEILETERTYVQDLKSIVEDYLDCIRDQ :..::. ::: :.. ::.: : :: : . CCDS55 MRANVINEIMSTERHYIKHLKDICEGYLKQCRKR 10 20 30 210 220 230 240 250 260 pF1KA1 TKLPLGTEERSALFGNIQDIYHFNSELLQDLENCEN--DP--VAIAECFVSKSEEFHIYT . .. :. ...::::.:::.:. ...:::. : :: :. ::. ... : ::. CCDS55 RDM-FSDEQLKVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFWIYS 40 50 60 70 80 90 270 280 290 300 310 pF1KA1 QYCTNYPRSVAVLTECMRNKILAKFFRERQETLKH--SLPLGSYLLKPVQRILKYHLLLH .::.:. . :.. :... .:: : . :.. .. . ..:: :::.: :: : : CCDS55 EYCNNHLDACMELSKLMKDSRYQHFF-EACRLLQQMIDIAIDGFLLTPVQKICKYPLQLA 100 110 120 130 140 150 320 330 340 350 360 370 pF1KA1 EIENHLDKDTEGYDVVLDAIDTMQRVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPD-LT :. .. .: : : :. .:. :. .::. ::. :. .. . :. . .:.: : : CCDS55 ELLKYTAQDHSDYRYVAAALAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDILD 160 170 180 190 200 210 380 390 400 410 420 430 pF1KA1 SYGELVLEGT----FRIQRAKNERTLFLFDKLLLITKK---RDDTFTYKAHILCGNLMLV .::. : .. ...:..::::. ... :: : : . ::..: . .: CCDS55 RSSELIYTGEMAWIYQPYGRNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYEVV 220 230 240 250 260 270 440 450 460 470 480 pF1KA1 EVIPKEPLSFSV-------FHYKNPKLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPA .. . .:.: .: :. . : ::. ..: :. CCDS55 DIEDGRDDDFNVSMKNAFKLHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEKIG 280 290 300 310 320 330 490 500 510 520 530 540 pF1KA1 KAKQAILEMDAIHHPGFCYSPEGGTKALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETA CCDS55 FEISENQKRQAAMTVRKVPKQKGVNSARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVFEF 340 350 360 370 380 390 >>CCDS55430.1 ARHGEF9 gene_id:23229|Hs108|chrX (463 aa) initn: 381 init1: 120 opt: 445 Z-score: 411.4 bits: 87.1 E(32554): 1.4e-16 Smith-Waterman score: 460; 30.7% identity (61.0% similar) in 313 aa overlap (176-467:54-364) 150 160 170 180 190 200 pF1KA1 PRAQWRVDSNGAPKTIADSATSPKLLYVDRVVQEILETERTYVQDLKSIVEDYLDCIRDQ :..::. ::: :.. ::.: : :: : . CCDS55 SDVQNGHLDPNSDCLCLGRPLQNRDQMRANVINEIMSTERHYIKHLKDICEGYLKQCRKR 30 40 50 60 70 80 210 220 230 240 250 260 pF1KA1 TKLPLGTEERSALFGNIQDIYHFNSELLQDLENCEN--DP--VAIAECFVSKSEEFHIYT . .. :. ...::::.:::.:. ...:::. : :: :. ::. ... : ::. CCDS55 RDM-FSDEQLKVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFWIYS 90 100 110 120 130 140 270 280 290 300 310 pF1KA1 QYCTNYPRSVAVLTECMRNKILAKFFRERQETLKH--SLPLGSYLLKPVQRILKYHLLLH .::.:. . :.. :... .:: : . :.. .. . ..:: :::.: :: : : CCDS55 EYCNNHLDACMELSKLMKDSRYQHFF-EACRLLQQMIDIAIDGFLLTPVQKICKYPLQLA 150 160 170 180 190 200 320 330 340 350 360 370 pF1KA1 EIENHLDKDTEGYDVVLDAIDTMQRVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPD-LT :. .. .: : : :. .:. :. .::. ::. :. .. . :. . .:.: : : CCDS55 ELLKYTAQDHSDYRYVAAALAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDILD 210 220 230 240 250 260 380 390 400 410 420 430 pF1KA1 SYGELVLEGT----FRIQRAKNERTLFLFDKLLLITKK---RDDTFTYKAHILCGNLMLV .::. : .. ...:..::::. ... :: : : . ::..: . .: CCDS55 RSSELIYTGEMAWIYQPYGRNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYEVV 270 280 290 300 310 320 440 450 460 470 480 pF1KA1 EVIPKEPLSFSV-------FHYKNPKLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPA .. . .:.: .: :. . : ::. ..: :. CCDS55 DIEDGRDDDFNVSMKNAFKLHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEKIG 330 340 350 360 370 380 490 500 510 520 530 540 pF1KA1 KAKQAILEMDAIHHPGFCYSPEGGTKALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETA CCDS55 FEISENQKRQAAMTVRKVPKQKGVNSARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVFEF 390 400 410 420 430 440 1444 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 19:55:54 2016 done: Thu Nov 3 19:55:55 2016 Total Scan time: 5.650 Total Display time: 0.360 Function used was FASTA [36.3.4 Apr, 2011]