FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1209, 1444 aa
1>>>pF1KA1209 1444 - 1444 aa - 1444 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.4676+/-0.00109; mu= 13.0088+/- 0.065
mean_var=120.7627+/-23.700, 0's: 0 Z-trim(106.5): 107 B-trim: 52 in 1/50
Lambda= 0.116710
statistics sampled from 8908 (9018) to 8908 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.625), E-opt: 0.2 (0.277), width: 16
Scan time: 5.650
The best scores are: opt bits E(32554)
CCDS34552.1 PLEKHG1 gene_id:57480|Hs108|chr6 (1385) 9170 1556.3 0
CCDS76690.1 PLEKHG3 gene_id:26030|Hs108|chr14 (1219) 1579 278.2 1e-73
CCDS33022.2 PLEKHG2 gene_id:64857|Hs108|chr19 (1386) 1119 200.7 2.4e-50
CCDS55514.1 MCF2 gene_id:4168|Hs108|chrX ( 821) 460 89.7 3.9e-17
CCDS55515.1 MCF2 gene_id:4168|Hs108|chrX ( 860) 460 89.7 4e-17
CCDS14667.1 MCF2 gene_id:4168|Hs108|chrX ( 925) 460 89.7 4.3e-17
CCDS48175.1 MCF2 gene_id:4168|Hs108|chrX ( 985) 460 89.7 4.5e-17
CCDS3883.1 TRIO gene_id:7204|Hs108|chr5 (3097) 464 90.6 7.7e-17
CCDS55429.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 414) 445 87.0 1.2e-16
CCDS55430.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 463) 445 87.1 1.4e-16
CCDS83477.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 495) 445 87.1 1.4e-16
CCDS66517.1 SPATA13 gene_id:221178|Hs108|chr13 ( 574) 446 87.3 1.5e-16
CCDS35315.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 516) 445 87.1 1.5e-16
CCDS66518.1 SPATA13 gene_id:221178|Hs108|chr13 ( 596) 446 87.3 1.5e-16
CCDS9305.1 SPATA13 gene_id:221178|Hs108|chr13 ( 652) 446 87.3 1.6e-16
CCDS55516.1 MCF2 gene_id:4168|Hs108|chrX ( 941) 447 87.5 2e-16
CCDS55517.1 MCF2 gene_id:4168|Hs108|chrX (1001) 447 87.5 2.1e-16
CCDS53857.1 SPATA13 gene_id:221178|Hs108|chr13 (1277) 446 87.4 2.9e-16
CCDS9521.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 646) 440 86.3 3.2e-16
CCDS2165.1 ARHGEF4 gene_id:50649|Hs108|chr2 ( 690) 434 85.3 6.9e-16
CCDS42754.1 ARHGEF4 gene_id:50649|Hs108|chr2 ( 670) 431 84.8 9.6e-16
CCDS45069.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 753) 428 84.3 1.5e-15
CCDS32009.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 782) 428 84.3 1.6e-15
CCDS45068.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 803) 428 84.3 1.6e-15
CCDS81781.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 547) 417 82.4 4.1e-15
CCDS81782.1 MCF2L gene_id:23263|Hs108|chr13 ( 984) 418 82.6 6.1e-15
CCDS9527.3 MCF2L gene_id:23263|Hs108|chr13 (1123) 418 82.7 6.8e-15
CCDS45070.2 MCF2L gene_id:23263|Hs108|chr13 (1125) 418 82.7 6.9e-15
CCDS78509.1 ARHGEF6 gene_id:9459|Hs108|chrX ( 622) 413 81.7 7.3e-15
CCDS14660.1 ARHGEF6 gene_id:9459|Hs108|chrX ( 776) 413 81.8 8.9e-15
CCDS3028.1 KALRN gene_id:8997|Hs108|chr3 (1289) 410 81.4 2e-14
CCDS8947.1 ARHGEF25 gene_id:115557|Hs108|chr12 ( 580) 398 79.2 4e-14
CCDS44931.1 ARHGEF25 gene_id:115557|Hs108|chr12 ( 619) 398 79.2 4.2e-14
CCDS82829.1 KALRN gene_id:8997|Hs108|chr3 (1654) 393 78.5 1.8e-13
CCDS3027.1 KALRN gene_id:8997|Hs108|chr3 (1663) 393 78.5 1.8e-13
CCDS73553.1 SPATA13 gene_id:221178|Hs108|chr13 ( 512) 381 76.3 2.6e-13
CCDS45512.1 PLEKHG4 gene_id:25894|Hs108|chr16 (1110) 374 75.3 1.2e-12
CCDS32466.1 PLEKHG4 gene_id:25894|Hs108|chr16 (1191) 374 75.3 1.2e-12
CCDS3243.1 MCF2L2 gene_id:23101|Hs108|chr3 (1114) 369 74.4 2.1e-12
CCDS34124.1 PLEKHG4B gene_id:153478|Hs108|chr5 (1271) 368 74.3 2.6e-12
CCDS6201.1 PREX2 gene_id:80243|Hs108|chr8 (1606) 363 73.5 5.7e-12
CCDS59341.1 VAV1 gene_id:7409|Hs108|chr19 ( 823) 356 72.2 7.2e-12
CCDS12174.1 VAV1 gene_id:7409|Hs108|chr19 ( 845) 356 72.2 7.4e-12
CCDS13410.1 PREX1 gene_id:57580|Hs108|chr20 (1659) 356 72.3 1.3e-11
CCDS785.1 VAV3 gene_id:10451|Hs108|chr1 ( 847) 341 69.7 4.3e-11
CCDS6979.1 VAV2 gene_id:7410|Hs108|chr9 ( 839) 337 69.0 6.8e-11
CCDS48053.1 VAV2 gene_id:7410|Hs108|chr9 ( 878) 337 69.0 7e-11
>>CCDS34552.1 PLEKHG1 gene_id:57480|Hs108|chr6 (1385 aa)
initn: 9170 init1: 9170 opt: 9170 Z-score: 8343.6 bits: 1556.3 E(32554): 0
Smith-Waterman score: 9170; 100.0% identity (100.0% similar) in 1385 aa overlap (60-1444:1-1385)
30 40 50 60 70 80
pF1KA1 QLRLEVPSAVTKVPHPKTTARRSCPQELKTMELSDSDRPVSFGSTSSSASSRDSHGSFGS
::::::::::::::::::::::::::::::
CCDS34 MELSDSDRPVSFGSTSSSASSRDSHGSFGS
10 20 30
90 100 110 120 130 140
pF1KA1 RMTLVSNSHMGLFNQDKEVGAIKLELIPARPFSSSELQRDNPATGQQNADEGSERPPRAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 RMTLVSNSHMGLFNQDKEVGAIKLELIPARPFSSSELQRDNPATGQQNADEGSERPPRAQ
40 50 60 70 80 90
150 160 170 180 190 200
pF1KA1 WRVDSNGAPKTIADSATSPKLLYVDRVVQEILETERTYVQDLKSIVEDYLDCIRDQTKLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 WRVDSNGAPKTIADSATSPKLLYVDRVVQEILETERTYVQDLKSIVEDYLDCIRDQTKLP
100 110 120 130 140 150
210 220 230 240 250 260
pF1KA1 LGTEERSALFGNIQDIYHFNSELLQDLENCENDPVAIAECFVSKSEEFHIYTQYCTNYPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LGTEERSALFGNIQDIYHFNSELLQDLENCENDPVAIAECFVSKSEEFHIYTQYCTNYPR
160 170 180 190 200 210
270 280 290 300 310 320
pF1KA1 SVAVLTECMRNKILAKFFRERQETLKHSLPLGSYLLKPVQRILKYHLLLHEIENHLDKDT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SVAVLTECMRNKILAKFFRERQETLKHSLPLGSYLLKPVQRILKYHLLLHEIENHLDKDT
220 230 240 250 260 270
330 340 350 360 370 380
pF1KA1 EGYDVVLDAIDTMQRVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSYGELVLEGTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 EGYDVVLDAIDTMQRVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSYGELVLEGTF
280 290 300 310 320 330
390 400 410 420 430 440
pF1KA1 RIQRAKNERTLFLFDKLLLITKKRDDTFTYKAHILCGNLMLVEVIPKEPLSFSVFHYKNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 RIQRAKNERTLFLFDKLLLITKKRDDTFTYKAHILCGNLMLVEVIPKEPLSFSVFHYKNP
340 350 360 370 380 390
450 460 470 480 490 500
pF1KA1 KLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPAKAKQAILEMDAIHHPGFCYSPEGGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 KLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPAKAKQAILEMDAIHHPGFCYSPEGGT
400 410 420 430 440 450
510 520 530 540 550 560
pF1KA1 KALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETAQDIQKVSREEGSPQLSSARPSPAQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 KALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETAQDIQKVSREEGSPQLSSARPSPAQR
460 470 480 490 500 510
570 580 590 600 610 620
pF1KA1 NSQPSSSTMISVLRAGGALRNIWTDHQIRQALFPSRRSPQENEDDEDDYQMFVPSFSSSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 NSQPSSSTMISVLRAGGALRNIWTDHQIRQALFPSRRSPQENEDDEDDYQMFVPSFSSSD
520 530 540 550 560 570
630 640 650 660 670 680
pF1KA1 LNSTRLCEDSTSSRPCSWHMGQMESTETSSSGHRIVRRASSAGESNTCPPEIGTSDRTRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LNSTRLCEDSTSSRPCSWHMGQMESTETSSSGHRIVRRASSAGESNTCPPEIGTSDRTRE
580 590 600 610 620 630
690 700 710 720 730 740
pF1KA1 LQNSPKTEGQEEMTPFGSSIELTIDDIDHVYDNISYEDLKLMVAKREEAESTPSKSARDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LQNSPKTEGQEEMTPFGSSIELTIDDIDHVYDNISYEDLKLMVAKREEAESTPSKSARDS
640 650 660 670 680 690
750 760 770 780 790 800
pF1KA1 VRPKSTPELAFTKRQAGHSKGSLYAQTDGTLSGGEASSQSTHELQAVEENIYDTIGLPDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 VRPKSTPELAFTKRQAGHSKGSLYAQTDGTLSGGEASSQSTHELQAVEENIYDTIGLPDP
700 710 720 730 740 750
810 820 830 840 850 860
pF1KA1 PSLGFKCSSLKRAKRSTFLGLEADFVCCDSLRPFVSQDSLQLSEDEAPYHQATPDHGYLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PSLGFKCSSLKRAKRSTFLGLEADFVCCDSLRPFVSQDSLQLSEDEAPYHQATPDHGYLS
760 770 780 790 800 810
870 880 890 900 910 920
pF1KA1 LLYDSPSGNLSMPHKPVSDKLSEEVDEIWNDLENYIKKNEDKARDRLLAAFPVSKDDVPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LLYDSPSGNLSMPHKPVSDKLSEEVDEIWNDLENYIKKNEDKARDRLLAAFPVSKDDVPD
820 830 840 850 860 870
930 940 950 960 970 980
pF1KA1 RLHAESTPELSRDVGRSVSTLSLPESQALLTPVKSRAGRASRANCPFEEDLISKEGSFMS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 RLHAESTPELSRDVGRSVSTLSLPESQALLTPVKSRAGRASRANCPFEEDLISKEGSFMS
880 890 900 910 920 930
990 1000 1010 1020 1030 1040
pF1KA1 LNRLSLASEMPLMDNPYDLANSGLSQTDPENPDLGMEATDKTKSRVFMMARQYSQKIKKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LNRLSLASEMPLMDNPYDLANSGLSQTDPENPDLGMEATDKTKSRVFMMARQYSQKIKKA
940 950 960 970 980 990
1050 1060 1070 1080 1090 1100
pF1KA1 NQLLKVKSLELEQPPASQHQKSMHKDLAAILEEKKQGGPAIGARIAEYSQLYDQIVFRES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 NQLLKVKSLELEQPPASQHQKSMHKDLAAILEEKKQGGPAIGARIAEYSQLYDQIVFRES
1000 1010 1020 1030 1040 1050
1110 1120 1130 1140 1150 1160
pF1KA1 PLKIQKDGWASPQESSLLRSVSPSQVHHGSGDWLLHSTYSNGELADFCLPPEQDLRSRYP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PLKIQKDGWASPQESSLLRSVSPSQVHHGSGDWLLHSTYSNGELADFCLPPEQDLRSRYP
1060 1070 1080 1090 1100 1110
1170 1180 1190 1200 1210 1220
pF1KA1 TFEINTKSTPRQLSAACSVPSLQTSDPLPGSVQRCSVVVSQPNKENWCQDHLYNSLGRKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 TFEINTKSTPRQLSAACSVPSLQTSDPLPGSVQRCSVVVSQPNKENWCQDHLYNSLGRKG
1120 1130 1140 1150 1160 1170
1230 1240 1250 1260 1270 1280
pF1KA1 ISAKSQPYHRSQSSSSVLINKSMDSINYPSDVGKQQLLSLHRSSRCESHQDLLPDIADSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 ISAKSQPYHRSQSSSSVLINKSMDSINYPSDVGKQQLLSLHRSSRCESHQDLLPDIADSH
1180 1190 1200 1210 1220 1230
1290 1300 1310 1320 1330 1340
pF1KA1 QQGTEKLSDLTLQDSQKVVVVNRNLPLNAQIATQNYFSNFKETDGDEDDYVEIKSEEDES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 QQGTEKLSDLTLQDSQKVVVVNRNLPLNAQIATQNYFSNFKETDGDEDDYVEIKSEEDES
1240 1250 1260 1270 1280 1290
1350 1360 1370 1380 1390 1400
pF1KA1 ELELSHNRRRKSDSKFVDADFSDNVCSGNTLHSLNSPRTPKKPVNSKLGLSPYLTPYNDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 ELELSHNRRRKSDSKFVDADFSDNVCSGNTLHSLNSPRTPKKPVNSKLGLSPYLTPYNDS
1300 1310 1320 1330 1340 1350
1410 1420 1430 1440
pF1KA1 DKLNDYLWRGPSPNQQNIVQSLREKFQCLSSSSFA
:::::::::::::::::::::::::::::::::::
CCDS34 DKLNDYLWRGPSPNQQNIVQSLREKFQCLSSSSFA
1360 1370 1380
>>CCDS76690.1 PLEKHG3 gene_id:26030|Hs108|chr14 (1219 aa)
initn: 1783 init1: 1114 opt: 1579 Z-score: 1436.7 bits: 278.2 E(32554): 1e-73
Smith-Waterman score: 1664; 34.6% identity (58.0% similar) in 1194 aa overlap (54-1204:2-1098)
30 40 50 60 70 80
pF1KA1 SITDGHQLRLEVPSAVTKVPHPKTTARRSCPQELKTMELSDSDRPVSFGST-SSSASSRD
: . . ....::::. :: :::.:: :
CCDS76 MPVSTSLHQDGSQERPVSLTSTTSSSGSSCD
10 20 30
90 100 110 120 130 140
pF1KA1 SHGSFGSRMTLVSNSHMGLFNQDKEVGAIKLELIPARPFSSSELQRDNPATGQQNADEGS
:. : : :.:. ::. ..: .: : ....... .
CCDS76 SR----SAMEEPSSSEA-----------------PAKNGAGSLRSRHLPNSNNNSSSWLN
40 50 60 70
150 160 170 180 190 200
pF1KA1 ERPPRAQWRVDSNGAPKTIADSATSPKLLYVDRVVQEILETERTYVQDLKSIVEDYLDCI
. : . . . ..: . :: :. :::.::.:::: :::::.::::::: :
CCDS76 VKGPLSPFNSRAAAGP-------AHHKLSYLGRVVREIVETERMYVQDLRSIVEDYLLKI
80 90 100 110 120
210 220 230 240 250 260
pF1KA1 RDQTKLPLGTEERSALFGNIQDIYHFNSELLQDLENCENDPVAIAECFVSKSEEFHIYTQ
: : : :. :::::::..:: .::.::.::..:..::::.: ::: .:.:: ::::
CCDS76 IDTPGL-LKPEQVSALFGNIENIYALNSQLLRDLDSCNSDPVAVASCFVERSQEFDIYTQ
130 140 150 160 170 180
270 280 290 300 310 320
pF1KA1 YCTNYPRSVAVLTECMRNKILAKFFRERQETLKHSLPLGSYLLKPVQRILKYHLLLHEIE
::.::: :::.::::::.: :::::.::: :.:::::::::::::::::::::::.::
CCDS76 YCNNYPNSVAALTECMRDKQQAKFFRDRQELLQHSLPLGSYLLKPVQRILKYHLLLQEIA
190 200 210 220 230 240
330 340 350 360 370 380
pF1KA1 NHLDKDTEGYDVVLDAIDTMQRVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSYGE
.:.:.. .:..:: :::::: :::.::::::.:::::::::::::: ::::::::.:::
CCDS76 KHFDEEEDGFEVVEDAIDTMTCVAWYINDMKRRHEHAVRLQEIQSLLINWKGPDLTTYGE
250 260 270 280 290 300
390 400 410 420 430 440
pF1KA1 LVLEGTFRIQRAKNERTLFLFDKLLLITKKRDDTFTYKAHILCGNLMLVEVIPKEPLSFS
::::::::..:..::::.::::: ::::::: : :.::..: :..:::.: .. : :.
CCDS76 LVLEGTFRVHRVRNERTFFLFDKTLLITKKRGDHFVYKGNIPCSSLMLIEST-RDSLCFT
310 320 330 340 350 360
450 460 470 480 490 500
pF1KA1 VFHYKNPKLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPAKAKQAILEMDAIHHPGFC
: :::. : :...:::. ..:: :. :.:::::::: : :: :::.::::::. . .
CCDS76 VTHYKHSKQQYSIQAKTVEEKRNWTHHIKRLILENHHATIPQKAKEAILEMDSYYPNRYR
370 380 390 400 410 420
510 520 530 540 550 560
pF1KA1 YSPEGGTKALFGSKEGSAPYRL-RRKSEPSSRSHKVLKTSETAQDIQKVSREEGSPQLSS
::: :: .. : :. : ::.:::... . :. . : .. .:.:. . ::
CCDS76 CSPERLKKAWSSQDEVSTNVRQGRRQSEPTKHLLRQLNEKARAAGMKGKGRRESESSRSS
430 440 450 460 470 480
570 580 590 600 610
pF1KA1 ARPSPAQRNSQPSSSTMISVLRAGGALRNIWTDHQI--RQALF-----PS-RRSPQENED
::: . .:.:. ... ..: .. : . .: .: :: ...:...:.
CCDS76 RRPS----GRSPTSTEKRMSFESISSLPEVEPDPEAGSEQEVFSAVEGPSAEETPSDTES
490 500 510 520 530
620 630 640 650 660
pF1KA1 DE------DDYQMFV---PSFSSSDLNSTRLCEDSTS-SRPCSWHMGQMESTETSSSGHR
: : .: .. : . :. ... :: . : .:: . :
CCDS76 PEVLETQLDAHQGLLGMDPPGDMVDFVAAESTEDLKALSSEEEEEMGGAAQEPESLLPPS
540 550 560 570 580 590
670 680 690 700 710 720
pF1KA1 IVRRASSAGESNTCPPEIGTSDRTRELQNSPKTEGQEEMTPFGSSIELTIDDIDHVYDNI
.. .:: .: . . : :. :.. :. : ::: .: ... . .
CCDS76 VLDQASVIAERFVS----SFSRRSSVAQEDSKSSG------FGSP-RL----VSRSSSVL
600 610 620 630 640
730 740 750 760 770 780
pF1KA1 SYEDLKLMVAKREEAESTPSKSARDSVRPKSTPELAFT---KRQAGHSKGSLYAQTDGTL
: : . .:.. :: ::. . .::. .. . . : ... . :
CCDS76 SLEGSEKGLARH--------GSATDSLSCQLSPEVDISVGVATEDSPSVNGMEPPSPGCP
650 660 670 680 690
790 800 810 820 830
pF1KA1 SGGEASSQSTHE--LQAVEENIYDTIGL----PDPPSLGFKCSSLKRAKRSTFL--GLEA
. :: . .: :.. .. . : : . . :: :..: . ... ::
CCDS76 VEPDRSSCKKKESALSTRDRLLLDKIKSYYENAEHHDAGF---SVRRRESLSYIPKGLVR
700 710 720 730 740 750
840 850 860 870 880
pF1KA1 DFVC-CDSL-RPFVSQDSLQLSEDEAPYHQATPDHGYLSLLYDSPSGNLSMPHKPVSD--
. . .:: :: : . . . .. .. . .:: .. :.::
CCDS76 NSISRFNSLPRP----DPEPVPPVGSKRQVGSRPTSWALFELPGPSQAVKGDPPPISDAE
760 770 780 790 800
890 900 910 920 930 940
pF1KA1 -KLSEEVDEIWNDLENYIKKNEDKARDRLLAAFPVSKDDVPDRLHAESTPELSRDVGRSV
. : :. .::. .:. . . .: :. . : ::. . .
CCDS76 FRPSSEIVKIWEGMESSGGSPGKGPGQGQANGF-----DLHEPLFILEEHELGA-ITEES
810 820 830 840 850 860
950 960 970 980 990 1000
pF1KA1 STLSLPESQALLTPVKSRAGRASRANCPFEEDLISKEGSFMSLNRLSLASEMPLMDNPYD
.: : :::. .:...: : :. : . :: : . ..: :: .
CCDS76 ATAS-PESS---SPTEGR----SPAHLARELKELVKELSSSTQGELV----APLHPRIVQ
870 880 890 900
1010 1020 1030 1040 1050 1060
pF1KA1 LANSGLSQTDPENPDLGMEATDKTKSRVFMMARQYSQKIKKANQLLKVKSLELEQPPASQ
:.. . ......:..:...::::: .::. . .. :. :. .
CCDS76 LSHV-----------MDSHVSERVKNKVYQLARQYSLRIKSNKPVMARPPLQWEKVAPER
910 920 930 940 950
1070 1080 1090 1100 1110 1120
pF1KA1 HQKSMHKDLAAILEEKKQGGPAIGARIAEYSQL-YDQIVFRE-SPLKIQKDGWASPQESS
:: . . :: . . : : : . :.:.. .: :: : .. : :::.
CCDS76 DGKS--PTVPCLQEEAGEPLGGKGKRKPVLSLFDYEQLMAQEHSPPKPSSAGEMSPQRFF
960 970 980 990 1000 1010
1130 1140 1150 1160 1170 1180
pF1KA1 LLRSVSPSQVHHGSGDWLLHSTYSNGELADFCLPPEQDLRSRYPTFEINTKS---TPR--
. :. ... .: .: : : : : ..: :.: . . .. ::
CCDS76 FNPSAVSQRTTSPGGRPSARSPLSPTE--TFSWPDVRELCSKYASRDEARRAGGGRPRGP
1020 1030 1040 1050 1060 1070
1190 1200 1210 1220 1230 1240
pF1KA1 QLSAACSVPSLQTSDPLPGSVQRCSVVVSQPNKENWCQDHLYNSLGRKGISAKSQPYHRS
.. . ::: .. :: : : ::
CCDS76 PVNRSHSVPENMVEPPLSGRVGRCRSLSTKRGRGGGEAAQSPGPLPQSKPDGGETLYVTA
1080 1090 1100 1110 1120 1130
>>CCDS33022.2 PLEKHG2 gene_id:64857|Hs108|chr19 (1386 aa)
initn: 1117 init1: 318 opt: 1119 Z-score: 1017.3 bits: 200.7 E(32554): 2.4e-50
Smith-Waterman score: 1188; 33.0% identity (59.1% similar) in 872 aa overlap (130-957:63-887)
100 110 120 130 140 150
pF1KA1 GLFNQDKEVGAIKLELIPARPFSSSELQRDNPATGQQNADEGSERPPRAQWRVDSNGAPK
.:: : : .:. : . . .:
CCDS33 ETRTAPAAPTMASPRGSGSSTSLSTVGSEGDPAPGPTPACSASRPEPLPGPPIRLHLSPV
40 50 60 70 80 90
160 170 180 190 200 210
pF1KA1 TIADSATSPKLLYVDRVVQEILETERTYVQDLKSIVEDYLDCIRDQTKLPLGTEERSALF
: :: .: .::..::.::::.::.::.::::::: . : : :..:. ..::
CCDS33 GIPGSARPSRL---ERVAREIVETERAYVRDLRSIVEDYLGPLLDGGVLGLSVEQVGTLF
100 110 120 130 140
220 230 240 250 260 270
pF1KA1 GNIQDIYHFNSELLQDLENCENDPVAIAECFVSKSEEFHIYTQYCTNYPRSVAVLTECMR
.::.:::.:.::::.:::: .. .::::::..::.: ::: :: ::: :.:.: :
CCDS33 ANIEDIYEFSSELLEDLENS-SSAGGIAECFVQRSEDFDIYTLYCMNYPSSLALLRELSL
150 160 170 180 190 200
280 290 300 310 320 330
pF1KA1 NKILAKFFRERQETLKHSLPLGSYLLKPVQRILKYHLLLHEIENHLDKD--TEGYDVVLD
. : ...::: :.::::: :.:::::::::::::::.:. .: . : : ..: .
CCDS33 SPPAALWLQERQAQLRHSLPLQSFLLKPVQRILKYHLLLQELGKHWAEGPGTGGREMVEE
210 220 230 240 250 260
340 350 360 370 380 390
pF1KA1 AIDTMQRVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSYGELVLEGTFRI-----Q
:: .: :::.:::::::.:::.::::.: : .: ::.:...:::::::.::
CCDS33 AIVSMTAVAWYINDMKRKQEHAARLQEVQRRLGGWTGPELSAFGELVLEGAFRGGGGGGP
270 280 290 300 310 320
400 410 420 430 440 450
pF1KA1 RAKN-ERTLFLFDKLLLITKKRDDTFTYKAHILCGNLMLVEVIPKEPLSFSVFHYKNPKL
: .. :: ::::...::..:.: .:::.::.: :: . : :..::.:.: ::
CCDS33 RLRGGERLLFLFSRMLLVAKRRGLEYTYKGHIFCCNLSVSES-PRDPLGFKVSDLTIPKH
330 340 350 360 370 380
460 470 480 490 500
pF1KA1 QHTVQAKSQQDKRLWVLHLKRLILENHAAKIPAKAKQAILEMDAIH-----HPGFC-YSP
.: .:::.:..::::. :.::..::: :.:::::::..:: ...: .: . .:
CCDS33 RHLLQAKNQEEKRLWIHCLQRLFFENHPASIPAKAKQVLLE-NSLHCAPKSKPVLEPLTP
390 400 410 420 430 440
510 520 530 540 550
pF1KA1 EGGT------KALFGSKEGSAP-------YRLRRKSEPSSRSHKVLKTSETAQDIQKVSR
:. ... .....:: : ::.::: .. :. ... .....
CCDS33 PLGSPRPRDARSFTPGRRNTAPSPGPSVIRRGRRQSEPV-KDPYVMFPQNAKPGFKHAGS
450 460 470 480 490 500
560 570 580 590 600
pF1KA1 E------EGSPQLSSARPSPAQRNSQPSSSTMISVLRAGGALRNIWTDHQIRQALFPSRR
: :..: .:.. : ... : . : .:. .: ..: . : ..:
CCDS33 EGELYPPESQPPVSGSAPPEDLEDAGPPT------LDPSGT--SI--TEEILELL--NQR
510 520 530 540 550
610 620 630 640 650 660
pF1KA1 SPQENEDDEDDYQMFVPSFSSSDLNSTRLCEDSTSSRPCSWHMGQ----MESTETSSSGH
. .. . : : :. :. .: : .. :: : . . .: : . :
CCDS33 GLRDPGPSTHDIPKF-PGDSQVPGDSETLTFQALPSRDSSEEEEEEEEGLEMDERGPSPL
560 570 580 590 600 610
670 680 690 700 710 720
pF1KA1 RIVRRASSAGESNTCPPEIGTSDRTRELQNSPKTEGQEEMTPFGSSIELTIDDIDHVYDN
.... :. .. : : . .. : :. .. :. : :: . ...::. :..
CCDS33 HVLEGLESSIAAEM--PSIPCLTKIPDVPNLPEIPSRCEI-PEGSRLP-SLSDISDVFEM
620 630 640 650 660
730 740 750 760 770
pF1KA1 ISYEDLKLMVAKREEAESTPSKSARDSVR-PKSTP-ELAFTKRQ--AGHSKGSLYAQTDG
. : . :::. : . .. : . : : :.:. .: . :.: .:
CCDS33 PCLPAIP-SVPNTPSLSSTPTLSCDSWLQGPLQEPAEAPATRRELFSGSNPGKLGEPPSG
670 680 690 700 710 720
780 790 800 810 820 830
pF1KA1 TLSGGEASSQSTHELQAVEENIYDTIGLPDPPSLGFK-CSSLKRAKRSTFLGLEADFVCC
.: : . ... . ... . :.:: :.:. :: .. : .. : :
CCDS33 GKAGPEEDEEGVSFTDFQPQDVTQHQGFPD--ELAFRSCSEIRSAWQALEQGQLA-----
730 740 750 760 770 780
840 850 860 870 880 890
pF1KA1 DSLRPFVSQDSLQLSEDEAPYHQATPDHGYLSLLYDSPSGNLSMPH-KPVSDKLSEEVDE
:: . : : ... ... : .::.. . . . .. ::....
CCDS33 ---RPGFPEPLLILEDSDLGGDSGSGKAG-------APSSERTASRVRELARLYSERIQQ
790 800 810 820 830
900 910 920 930 940 950
pF1KA1 IWNDLENYIKKNEDKARDRLLAAFPVSKDDVPDRLHAESTPELSRDVGRS-VSTLSLPES
. . :. . : . : :.:: : . .: . .. : : :. : :..: .
CCDS33 M-QRAETRASANAPRRRPRVLAQ-PQPSPCLP---QEQAEPGLLPAFGHVLVCELAFPLT
840 850 860 870 880
960 970 980 990 1000 1010
pF1KA1 QALLTPVKSRAGRASRANCPFEEDLISKEGSFMSLNRLSLASEMPLMDNPYDLANSGLSQ
:
CCDS33 CAQESVPLGPAVWVQAAIPLSKQGGSPDGQGLHVSNLPKQDLPGIHVSAATLLPEQGGSR
890 900 910 920 930 940
>>CCDS55514.1 MCF2 gene_id:4168|Hs108|chrX (821 aa)
initn: 319 init1: 151 opt: 460 Z-score: 421.2 bits: 89.7 E(32554): 3.9e-17
Smith-Waterman score: 487; 27.8% identity (58.5% similar) in 439 aa overlap (92-488:373-783)
70 80 90 100 110
pF1KA1 LSDSDRPVSFGSTSSSASSRDSHGSFGSRMTLVSNSHMGLFN-QDKEVGAIKLELIPA--
.. :.. :. : ::.: :.. ..:.
CCDS55 ETLQYEFDVILSPELKVQMKTIQLKLENIRSIFENQQAGFRNLADKHVRPIQF-VVPTPE
350 360 370 380 390 400
120 130 140 150 160 170
pF1KA1 ------RPFSSSELQRDNPATGQQNADEGSERPPRAQWRVDSNGAPKTIADSATSPKLLY
:: ::. . . .:.: : : : . :.: :.. :...: .:
CCDS55 NLVTSGTPFFSSKQGKKTWRQNQSNLK--IEVVPDCQEK-RSSG-PSSSLDNGNSLDVLK
410 420 430 440 450
180 190 200 210 220
pF1KA1 VDRVVQEILETERTYVQDLKSIVEDYLDCIRDQTKL-----PLGTEERSALFGNIQDIYH
..:..:...:::.::..: ... : . :. .. :: .... ::::. .::.
CCDS55 -NHVLNELIQTERVYVRELYTVLLGYRAEM-DNPEMFDLMPPLLRNKKDILFGNMAEIYE
460 470 480 490 500 510
230 240 250 260 270 280
pF1KA1 FNSEL-LQDLENCENDPVAIAECFVSKSEEFHIYTQYCTNYPRSVAV---LTECMRNKIL
:.... :..:::: . : .. ::. ....:..:..:: : ::: .. .::
CCDS55 FHNDIFLSSLENCAHAPERVGPCFLERKDDFQMYAKYCQNKPRSETIWRKYSECA-----
520 530 540 550 560 570
290 300 310 320 330 340
pF1KA1 AKFFRERQETLKHSLPLGSYLLKPVQRILKYHLLLHEIENHLDKDTEGYDVVLDAIDTMQ
::.: :. ::: : : :::::::::: ::.:::.:. .. .:: :: .. :.:.:
CCDS55 --FFQECQRKLKHRLRLDSYLLKPVQRITKYQLLLKELLKY-SKDCEGSALLKKALDAML
580 590 600 610 620
350 360 370 380 390
pF1KA1 RVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSYGELVLEGTFRIQ--------RAK
. .:: :. :. ... : .:. :.....: : . . :
CCDS55 DLLKSVND--SMHQIAI---------NGYIG-NLNELGKMIMQGGFSVWIGHKKGATKMK
630 640 650 660 670
400 410 420 430
pF1KA1 N-------ERTLFLFDKLLLITKKR------DDTFTYKAHILCGNL---MLVEVIPKEPL
. .: :::..: ... :.: .: . . : .. ..: . .
CCDS55 DLARFKPMQRHLFLYEKAIVFCKRRVESGEGSDRYPSYSFKHCWKMDEVGITEYVKGDNR
680 690 700 710 720 730
440 450 460 470 480 490
pF1KA1 SFSVFHYKNPKLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPAKAKQAILEMDAIHHP
.: ... .. .. . :::.. . : :. ... ..:... : ::
CCDS55 KFEIWYGEKEEV-YIVQASNVDVKMTWLKEIRNILLKQQELLTVKKRKQQDQLTERDKFQ
740 750 760 770 780 790
500 510 520 530 540 550
pF1KA1 GFCYSPEGGTKALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETAQDIQKVSREEGSPQL
CCDS55 ISLQQNDEDLCRRWLSYIDEATMSNGK
800 810 820
>>CCDS55515.1 MCF2 gene_id:4168|Hs108|chrX (860 aa)
initn: 319 init1: 151 opt: 460 Z-score: 420.8 bits: 89.7 E(32554): 4e-17
Smith-Waterman score: 487; 27.8% identity (58.5% similar) in 439 aa overlap (92-488:412-822)
70 80 90 100 110
pF1KA1 LSDSDRPVSFGSTSSSASSRDSHGSFGSRMTLVSNSHMGLFN-QDKEVGAIKLELIPA--
.. :.. :. : ::.: :.. ..:.
CCDS55 ETLQYEFDVILSPELKVQMKTIQLKLENIRSIFENQQAGFRNLADKHVRPIQF-VVPTPE
390 400 410 420 430 440
120 130 140 150 160 170
pF1KA1 ------RPFSSSELQRDNPATGQQNADEGSERPPRAQWRVDSNGAPKTIADSATSPKLLY
:: ::. . . .:.: : : : . :.: :.. :...: .:
CCDS55 NLVTSGTPFFSSKQGKKTWRQNQSNLK--IEVVPDCQEK-RSSG-PSSSLDNGNSLDVLK
450 460 470 480 490
180 190 200 210 220
pF1KA1 VDRVVQEILETERTYVQDLKSIVEDYLDCIRDQTKL-----PLGTEERSALFGNIQDIYH
..:..:...:::.::..: ... : . :. .. :: .... ::::. .::.
CCDS55 -NHVLNELIQTERVYVRELYTVLLGYRAEM-DNPEMFDLMPPLLRNKKDILFGNMAEIYE
500 510 520 530 540 550
230 240 250 260 270 280
pF1KA1 FNSEL-LQDLENCENDPVAIAECFVSKSEEFHIYTQYCTNYPRSVAV---LTECMRNKIL
:.... :..:::: . : .. ::. ....:..:..:: : ::: .. .::
CCDS55 FHNDIFLSSLENCAHAPERVGPCFLERKDDFQMYAKYCQNKPRSETIWRKYSECA-----
560 570 580 590 600
290 300 310 320 330 340
pF1KA1 AKFFRERQETLKHSLPLGSYLLKPVQRILKYHLLLHEIENHLDKDTEGYDVVLDAIDTMQ
::.: :. ::: : : :::::::::: ::.:::.:. .. .:: :: .. :.:.:
CCDS55 --FFQECQRKLKHRLRLDSYLLKPVQRITKYQLLLKELLKY-SKDCEGSALLKKALDAML
610 620 630 640 650 660
350 360 370 380 390
pF1KA1 RVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSYGELVLEGTFRIQ--------RAK
. .:: :. :. ... : .:. :.....: : . . :
CCDS55 DLLKSVND--SMHQIAI---------NGYIG-NLNELGKMIMQGGFSVWIGHKKGATKMK
670 680 690 700 710
400 410 420 430
pF1KA1 N-------ERTLFLFDKLLLITKKR------DDTFTYKAHILCGNL---MLVEVIPKEPL
. .: :::..: ... :.: .: . . : .. ..: . .
CCDS55 DLARFKPMQRHLFLYEKAIVFCKRRVESGEGSDRYPSYSFKHCWKMDEVGITEYVKGDNR
720 730 740 750 760 770
440 450 460 470 480 490
pF1KA1 SFSVFHYKNPKLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPAKAKQAILEMDAIHHP
.: ... .. .. . :::.. . : :. ... ..:... : ::
CCDS55 KFEIWYGEKEEV-YIVQASNVDVKMTWLKEIRNILLKQQELLTVKKRKQQDQLTERDKFQ
780 790 800 810 820 830
500 510 520 530 540 550
pF1KA1 GFCYSPEGGTKALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETAQDIQKVSREEGSPQL
CCDS55 ISLQQNDEDLCRRWLSYIDEATMSNGK
840 850 860
>>CCDS14667.1 MCF2 gene_id:4168|Hs108|chrX (925 aa)
initn: 319 init1: 151 opt: 460 Z-score: 420.4 bits: 89.7 E(32554): 4.3e-17
Smith-Waterman score: 487; 27.8% identity (58.5% similar) in 439 aa overlap (92-488:412-822)
70 80 90 100 110
pF1KA1 LSDSDRPVSFGSTSSSASSRDSHGSFGSRMTLVSNSHMGLFN-QDKEVGAIKLELIPA--
.. :.. :. : ::.: :.. ..:.
CCDS14 ETLQYEFDVILSPELKVQMKTIQLKLENIRSIFENQQAGFRNLADKHVRPIQF-VVPTPE
390 400 410 420 430 440
120 130 140 150 160 170
pF1KA1 ------RPFSSSELQRDNPATGQQNADEGSERPPRAQWRVDSNGAPKTIADSATSPKLLY
:: ::. . . .:.: : : : . :.: :.. :...: .:
CCDS14 NLVTSGTPFFSSKQGKKTWRQNQSNLK--IEVVPDCQEK-RSSG-PSSSLDNGNSLDVLK
450 460 470 480 490
180 190 200 210 220
pF1KA1 VDRVVQEILETERTYVQDLKSIVEDYLDCIRDQTKL-----PLGTEERSALFGNIQDIYH
..:..:...:::.::..: ... : . :. .. :: .... ::::. .::.
CCDS14 -NHVLNELIQTERVYVRELYTVLLGYRAEM-DNPEMFDLMPPLLRNKKDILFGNMAEIYE
500 510 520 530 540 550
230 240 250 260 270 280
pF1KA1 FNSEL-LQDLENCENDPVAIAECFVSKSEEFHIYTQYCTNYPRSVAV---LTECMRNKIL
:.... :..:::: . : .. ::. ....:..:..:: : ::: .. .::
CCDS14 FHNDIFLSSLENCAHAPERVGPCFLERKDDFQMYAKYCQNKPRSETIWRKYSECA-----
560 570 580 590 600
290 300 310 320 330 340
pF1KA1 AKFFRERQETLKHSLPLGSYLLKPVQRILKYHLLLHEIENHLDKDTEGYDVVLDAIDTMQ
::.: :. ::: : : :::::::::: ::.:::.:. .. .:: :: .. :.:.:
CCDS14 --FFQECQRKLKHRLRLDSYLLKPVQRITKYQLLLKELLKY-SKDCEGSALLKKALDAML
610 620 630 640 650 660
350 360 370 380 390
pF1KA1 RVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSYGELVLEGTFRIQ--------RAK
. .:: :. :. ... : .:. :.....: : . . :
CCDS14 DLLKSVND--SMHQIAI---------NGYIG-NLNELGKMIMQGGFSVWIGHKKGATKMK
670 680 690 700 710
400 410 420 430
pF1KA1 N-------ERTLFLFDKLLLITKKR------DDTFTYKAHILCGNL---MLVEVIPKEPL
. .: :::..: ... :.: .: . . : .. ..: . .
CCDS14 DLARFKPMQRHLFLYEKAIVFCKRRVESGEGSDRYPSYSFKHCWKMDEVGITEYVKGDNR
720 730 740 750 760 770
440 450 460 470 480 490
pF1KA1 SFSVFHYKNPKLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPAKAKQAILEMDAIHHP
.: ... .. .. . :::.. . : :. ... ..:... : ::
CCDS14 KFEIWYGEKEEV-YIVQASNVDVKMTWLKEIRNILLKQQELLTVKKRKQQDQLTERDKFQ
780 790 800 810 820 830
500 510 520 530 540 550
pF1KA1 GFCYSPEGGTKALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETAQDIQKVSREEGSPQL
CCDS14 ISLQQNDEKQQGAFISTEETELEHTSTVVEVCEAIASVQAEANTVWTEASQSAEISEEPA
840 850 860 870 880 890
>>CCDS48175.1 MCF2 gene_id:4168|Hs108|chrX (985 aa)
initn: 319 init1: 151 opt: 460 Z-score: 419.9 bits: 89.7 E(32554): 4.5e-17
Smith-Waterman score: 487; 27.8% identity (58.5% similar) in 439 aa overlap (92-488:472-882)
70 80 90 100 110
pF1KA1 LSDSDRPVSFGSTSSSASSRDSHGSFGSRMTLVSNSHMGLFN-QDKEVGAIKLELIPA--
.. :.. :. : ::.: :.. ..:.
CCDS48 ETLQYEFDVILSPELKVQMKTIQLKLENIRSIFENQQAGFRNLADKHVRPIQF-VVPTPE
450 460 470 480 490 500
120 130 140 150 160 170
pF1KA1 ------RPFSSSELQRDNPATGQQNADEGSERPPRAQWRVDSNGAPKTIADSATSPKLLY
:: ::. . . .:.: : : : . :.: :.. :...: .:
CCDS48 NLVTSGTPFFSSKQGKKTWRQNQSNLK--IEVVPDCQEK-RSSG-PSSSLDNGNSLDVLK
510 520 530 540 550
180 190 200 210 220
pF1KA1 VDRVVQEILETERTYVQDLKSIVEDYLDCIRDQTKL-----PLGTEERSALFGNIQDIYH
..:..:...:::.::..: ... : . :. .. :: .... ::::. .::.
CCDS48 -NHVLNELIQTERVYVRELYTVLLGYRAEM-DNPEMFDLMPPLLRNKKDILFGNMAEIYE
560 570 580 590 600 610
230 240 250 260 270 280
pF1KA1 FNSEL-LQDLENCENDPVAIAECFVSKSEEFHIYTQYCTNYPRSVAV---LTECMRNKIL
:.... :..:::: . : .. ::. ....:..:..:: : ::: .. .::
CCDS48 FHNDIFLSSLENCAHAPERVGPCFLERKDDFQMYAKYCQNKPRSETIWRKYSECA-----
620 630 640 650 660
290 300 310 320 330 340
pF1KA1 AKFFRERQETLKHSLPLGSYLLKPVQRILKYHLLLHEIENHLDKDTEGYDVVLDAIDTMQ
::.: :. ::: : : :::::::::: ::.:::.:. .. .:: :: .. :.:.:
CCDS48 --FFQECQRKLKHRLRLDSYLLKPVQRITKYQLLLKELLKY-SKDCEGSALLKKALDAML
670 680 690 700 710 720
350 360 370 380 390
pF1KA1 RVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSYGELVLEGTFRIQ--------RAK
. .:: :. :. ... : .:. :.....: : . . :
CCDS48 DLLKSVND--SMHQIAI---------NGYIG-NLNELGKMIMQGGFSVWIGHKKGATKMK
730 740 750 760 770
400 410 420 430
pF1KA1 N-------ERTLFLFDKLLLITKKR------DDTFTYKAHILCGNL---MLVEVIPKEPL
. .: :::..: ... :.: .: . . : .. ..: . .
CCDS48 DLARFKPMQRHLFLYEKAIVFCKRRVESGEGSDRYPSYSFKHCWKMDEVGITEYVKGDNR
780 790 800 810 820 830
440 450 460 470 480 490
pF1KA1 SFSVFHYKNPKLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPAKAKQAILEMDAIHHP
.: ... .. .. . :::.. . : :. ... ..:... : ::
CCDS48 KFEIWYGEKEEV-YIVQASNVDVKMTWLKEIRNILLKQQELLTVKKRKQQDQLTERDKFQ
840 850 860 870 880 890
500 510 520 530 540 550
pF1KA1 GFCYSPEGGTKALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETAQDIQKVSREEGSPQL
CCDS48 ISLQQNDEKQQGAFISTEETELEHTSTVVEVCEAIASVQAEANTVWTEASQSAEISEEPA
900 910 920 930 940 950
>>CCDS3883.1 TRIO gene_id:7204|Hs108|chr5 (3097 aa)
initn: 391 init1: 142 opt: 464 Z-score: 415.8 bits: 90.6 E(32554): 7.7e-17
Smith-Waterman score: 475; 25.6% identity (53.3% similar) in 621 aa overlap (47-644:1849-2430)
20 30 40 50 60 70
pF1KA1 TNRVLGQSITDGHQLRLEVPSAVTKVPHPKTTARRSCPQELKTMELSDS-DRPVSFGSTS
... .:: .: . : .:. : .. .
CCDS38 DDSAATPQDETVEERGRNEGLSSGTLSKSSSSGMQSCGEE-EGEEGADAVPLPPPMAIQQ
1820 1830 1840 1850 1860 1870
80 90 100 110 120 130
pF1KA1 SSASSRDSHGSFGSRMTLVSNSHMGLFNQDKEVGAIKLELIPARPFSSSELQRDNPATGQ
: . ::. . .: :: . . . :.::. ::. .:. .: :..
CCDS38 HSLLQPDSQDDKASSRLLVRPTSSETPSAAELVSAIE-ELV-----KSKMALEDRPSSLL
1880 1890 1900 1910 1920 1930
140 150 160 170 180 190
pF1KA1 QNADEGSERPPR---AQWRVDSNGAPKTIADSATSPKLLYVDRVVQEILETERTYVQDLK
.:.:. : .. . :...: . : .: :.::..:::: ::.::
CCDS38 --VDQGDSSSPSFNPSDNSLLSSSSPIDEMEERKSSSLKRRHYVLQELVETERDYVRDLG
1940 1950 1960 1970 1980
200 210 220 230 240 250
pF1KA1 SIVEDYLDCIRDQTKLPLGTEERSAL-FGNIQDIYHFNSEL-LQDLENCENDPVAIAECF
.:: :. .... .: . .. . ::::..:: .. .. : .::.: .:: .. :
CCDS38 YVVEGYMALMKEDG-VPDDMKGKDKIVFGNIHQIYDWHRDFFLGELEKCLEDPEKLGSLF
1990 2000 2010 2020 2030 2040
260 270 280 290 300 310
pF1KA1 VSKSEEFHIYTQYCTNYPRSVAVLTECMRNKILAKFFRERQETLKHSLPLGSYLLKPVQR
:.. ...:.: :: : :.: ...: . ::.. .. : : : : . :.:::::
CCDS38 VKHERRLHMYIAYCQNKPKSEHIVSE-----YIDTFFEDLKQRLGHRLQLTDLLIKPVQR
2050 2060 2070 2080 2090 2100
320 330 340 350 360 370
pF1KA1 ILKYHLLLHEIENHLDKDTEGYDVVLDAIDTMQRVAWHINDMKRKHEHAVRLQEIQSLLT
:.::.:::... .. : . . . :...: : . ::: .. :::
CCDS38 IMKYQLLLKDFLKYSKKASLDTSELERAVEVMCIVPRRCNDMM----NVGRLQ-------
2110 2120 2130 2140 2150
380 390 400 410
pF1KA1 NWKGPDLTSYGELVLEGTFRI--QRAK-----NERTLFLFDKLLLITKKRDDT-------
.. : ... :.:.:. :: . : : :: .:::........ :
CCDS38 GFDGK-IVAQGKLLLQDTFLVTDQDAGLLPRCRERRIFLFEQIVIFSEPLDKKKGFSMPG
2160 2170 2180 2190 2200 2210
420 430 440 450 460 470
pF1KA1 FTYKAHILCGNLMLVEVIPKEPLSFSVFHYKNPKLQHTV-QAKSQQDKRLWVLHLKRLIL
: .: : . : : : . ..: .:.. . .. . ...: . .. :. : ::
CCDS38 FLFKNSIKVSCLCLEENVENDPCKFALTSRTGDVVETFILHSSSPSVRQTWI-HEINQIL
2220 2230 2240 2250 2260 2270
480 490 500 510 520 530
pF1KA1 ENHAAKIPAKAKQAILEMDAIHHPGFCYSPEGGTKALFGSKEGSAPYRLRRKSE-PSSRS
::. . .: . .:.. : : . ::. . :: :.:: .: ::: .
CCDS38 ENQRNFL--NALTSPIEYQRNHSGGGGGGGSGGSGGGGGSGGGGAPSGGSGHSGGPSSCG
2280 2290 2300 2310 2320
540 550 560 570 580 590
pF1KA1 HKVLKTSETAQDIQKVSREEGSPQLSSARPSPAQRNSQPSSSTMISVLRAGGALRNIWTD
. . : . :.. .::: : :. ... ..:: : :: . .
CCDS38 GAPSTSRSRPSRIPQPVRHHPPVLVSSAASSQAEADKMSGTSTPGPSLPPPGAAPEAGPS
2330 2340 2350 2360 2370 2380
600 610 620 630 640 650
pF1KA1 HQIRQALFPSRRSPQENEDDEDDYQMFVPSFSSSDLNSTRL-CEDSTSSRPCSWHMGQME
:::: : . . . .:... :.: : ....: :
CCDS38 A-------PSRRPPGADAEGSEREAEPIPKMKV--LESPRKGAANASGSSPDAPAKDARA
2390 2400 2410 2420 2430
660 670 680 690 700 710
pF1KA1 STETSSSGHRIVRRASSAGESNTCPPEIGTSDRTRELQNSPKTEGQEEMTPFGSSIELTI
CCDS38 SLGTLPLGKPRAGAASPLNSPLSSAVPSLGKEPFPPSSPLQKGGSFWSSIPASPASRPGS
2440 2450 2460 2470 2480 2490
>--
initn: 277 init1: 111 opt: 432 Z-score: 386.7 bits: 85.2 E(32554): 3.2e-15
Smith-Waterman score: 468; 28.3% identity (59.6% similar) in 403 aa overlap (176-560:1296-1661)
150 160 170 180 190 200
pF1KA1 PRAQWRVDSNGAPKTIADSATSPKLLYVDRVVQEILETERTYVQDLKSIVEDYL-DCIRD
.. :...::..::.::. .. :: .
CCDS38 ASIPGSEVKLRDAAHELNEEKRKSARRKEFIMAELIQTEKAYVRDLRECMDTYLWEMTSG
1270 1280 1290 1300 1310 1320
210 220 230 240 250 260
pF1KA1 QTKLPLGTEERS-ALFGNIQDIYHF-NSELLQDLENCENDPVAIAECFVSKSEEFHIYTQ
..: : .. .:::.:.::.: :. .:..::. :. : ...:::. ...:..:.
CCDS38 VEEIPPGIVNKELIIFGNMQEIYEFHNNIFLKELEKYEQLPEDVGHCFVTWADKFQMYVT
1330 1340 1350 1360 1370 1380
270 280 290 300 310 320
pF1KA1 YCTNYPRSVAVLTECMRNKILAKFFRERQETLKHSLP--LGSYLLKPVQRILKYHLLLHE
:: : : :. .. : ...: : :. .:.: ..:::.:::::: ::.:::.:
CCDS38 YCKNKPDSTQLILEHA-----GSYFDEIQQ--RHGLANSISSYLIKPVQRITKYQLLLKE
1390 1400 1410 1420 1430
330 340 350 360 370 380
pF1KA1 IENHLDKDTEGYDVVLDAIDTMQRVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPDLTSY
. : :: . :....: : . :: :..:. .... : . :
CCDS38 L---LTCCEEGKGEIKDGLEVMLSVPKRAND-------AMHLSMLEGFDEN-----IESQ
1440 1450 1460 1470 1480
390 400 410 420
pF1KA1 GELVLEGTFRIQRAKN------ERTLFLFDKLLLITKKRDDT-----FTYKAHILCGNLM
:::.:. .:.. :. :: ::::. :...:. :. . ::.... ..:
CCDS38 GELILQESFQVWDPKTLIRKGRERHLFLFEMSLVFSKEVKDSSGRSKYLYKSKLFTSELG
1490 1500 1510 1520 1530 1540
430 440 450 460 470 480
pF1KA1 LVEVIPKEPLSFSVFHYKNPKLQHTV--QAKSQQDKRLWVLHLKRLILENHAAKIPAKAK
..: . .: .:... ..: .. . .:.: ..:. :. :....: : . :
CCDS38 VTEHVEGDPCKFALWVGRTPTSDNKIVLKASSIENKQDWIKHIREVIQER-----TIHLK
1550 1560 1570 1580 1590
490 500 510 520 530 540
pF1KA1 QAILEMDAIHHPGFCYSPEGGTKALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETAQDI
:. : :: : .: : : ..: : ... ::. . .:.:.:.
CCDS38 GALKE--PIHIPKT--APATRQK---GRRDGED---LDSQGDGSSQPDTISIASRTSQNT
1600 1610 1620 1630 1640
550 560 570 580 590 600
pF1KA1 QKVSREEGSPQLSSARPSPAQRNSQPSSSTMISVLRAGGALRNIWTDHQIRQALFPSRRS
.. :. .:.
CCDS38 LDSDKLSGGCELTVVIHDFTACNSNELTIRRGQTVEVLERPHDKPDWCLVRTTDRSPAAE
1650 1660 1670 1680 1690 1700
>>CCDS55429.1 ARHGEF9 gene_id:23229|Hs108|chrX (414 aa)
initn: 381 init1: 120 opt: 445 Z-score: 412.2 bits: 87.0 E(32554): 1.2e-16
Smith-Waterman score: 460; 30.7% identity (61.0% similar) in 313 aa overlap (176-467:5-315)
150 160 170 180 190 200
pF1KA1 PRAQWRVDSNGAPKTIADSATSPKLLYVDRVVQEILETERTYVQDLKSIVEDYLDCIRDQ
:..::. ::: :.. ::.: : :: : .
CCDS55 MRANVINEIMSTERHYIKHLKDICEGYLKQCRKR
10 20 30
210 220 230 240 250 260
pF1KA1 TKLPLGTEERSALFGNIQDIYHFNSELLQDLENCEN--DP--VAIAECFVSKSEEFHIYT
. .. :. ...::::.:::.:. ...:::. : :: :. ::. ... : ::.
CCDS55 RDM-FSDEQLKVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFWIYS
40 50 60 70 80 90
270 280 290 300 310
pF1KA1 QYCTNYPRSVAVLTECMRNKILAKFFRERQETLKH--SLPLGSYLLKPVQRILKYHLLLH
.::.:. . :.. :... .:: : . :.. .. . ..:: :::.: :: : :
CCDS55 EYCNNHLDACMELSKLMKDSRYQHFF-EACRLLQQMIDIAIDGFLLTPVQKICKYPLQLA
100 110 120 130 140 150
320 330 340 350 360 370
pF1KA1 EIENHLDKDTEGYDVVLDAIDTMQRVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPD-LT
:. .. .: : : :. .:. :. .::. ::. :. .. . :. . .:.: : :
CCDS55 ELLKYTAQDHSDYRYVAAALAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDILD
160 170 180 190 200 210
380 390 400 410 420 430
pF1KA1 SYGELVLEGT----FRIQRAKNERTLFLFDKLLLITKK---RDDTFTYKAHILCGNLMLV
.::. : .. ...:..::::. ... :: : : . ::..: . .:
CCDS55 RSSELIYTGEMAWIYQPYGRNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYEVV
220 230 240 250 260 270
440 450 460 470 480
pF1KA1 EVIPKEPLSFSV-------FHYKNPKLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPA
.. . .:.: .: :. . : ::. ..: :.
CCDS55 DIEDGRDDDFNVSMKNAFKLHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEKIG
280 290 300 310 320 330
490 500 510 520 530 540
pF1KA1 KAKQAILEMDAIHHPGFCYSPEGGTKALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETA
CCDS55 FEISENQKRQAAMTVRKVPKQKGVNSARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVFEF
340 350 360 370 380 390
>>CCDS55430.1 ARHGEF9 gene_id:23229|Hs108|chrX (463 aa)
initn: 381 init1: 120 opt: 445 Z-score: 411.4 bits: 87.1 E(32554): 1.4e-16
Smith-Waterman score: 460; 30.7% identity (61.0% similar) in 313 aa overlap (176-467:54-364)
150 160 170 180 190 200
pF1KA1 PRAQWRVDSNGAPKTIADSATSPKLLYVDRVVQEILETERTYVQDLKSIVEDYLDCIRDQ
:..::. ::: :.. ::.: : :: : .
CCDS55 SDVQNGHLDPNSDCLCLGRPLQNRDQMRANVINEIMSTERHYIKHLKDICEGYLKQCRKR
30 40 50 60 70 80
210 220 230 240 250 260
pF1KA1 TKLPLGTEERSALFGNIQDIYHFNSELLQDLENCEN--DP--VAIAECFVSKSEEFHIYT
. .. :. ...::::.:::.:. ...:::. : :: :. ::. ... : ::.
CCDS55 RDM-FSDEQLKVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFWIYS
90 100 110 120 130 140
270 280 290 300 310
pF1KA1 QYCTNYPRSVAVLTECMRNKILAKFFRERQETLKH--SLPLGSYLLKPVQRILKYHLLLH
.::.:. . :.. :... .:: : . :.. .. . ..:: :::.: :: : :
CCDS55 EYCNNHLDACMELSKLMKDSRYQHFF-EACRLLQQMIDIAIDGFLLTPVQKICKYPLQLA
150 160 170 180 190 200
320 330 340 350 360 370
pF1KA1 EIENHLDKDTEGYDVVLDAIDTMQRVAWHINDMKRKHEHAVRLQEIQSLLTNWKGPD-LT
:. .. .: : : :. .:. :. .::. ::. :. .. . :. . .:.: : :
CCDS55 ELLKYTAQDHSDYRYVAAALAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDILD
210 220 230 240 250 260
380 390 400 410 420 430
pF1KA1 SYGELVLEGT----FRIQRAKNERTLFLFDKLLLITKK---RDDTFTYKAHILCGNLMLV
.::. : .. ...:..::::. ... :: : : . ::..: . .:
CCDS55 RSSELIYTGEMAWIYQPYGRNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYEVV
270 280 290 300 310 320
440 450 460 470 480
pF1KA1 EVIPKEPLSFSV-------FHYKNPKLQHTVQAKSQQDKRLWVLHLKRLILENHAAKIPA
.. . .:.: .: :. . : ::. ..: :.
CCDS55 DIEDGRDDDFNVSMKNAFKLHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEKIG
330 340 350 360 370 380
490 500 510 520 530 540
pF1KA1 KAKQAILEMDAIHHPGFCYSPEGGTKALFGSKEGSAPYRLRRKSEPSSRSHKVLKTSETA
CCDS55 FEISENQKRQAAMTVRKVPKQKGVNSARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVFEF
390 400 410 420 430 440
1444 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 19:55:54 2016 done: Thu Nov 3 19:55:55 2016
Total Scan time: 5.650 Total Display time: 0.360
Function used was FASTA [36.3.4 Apr, 2011]