FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDF0128, 1519 aa
1>>>pF1KSDF0128 1519 - 1519 aa - 1519 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.3831+/-0.000928; mu= 7.6267+/- 0.056
mean_var=269.0796+/-55.732, 0's: 0 Z-trim(115.2): 68 B-trim: 158 in 1/53
Lambda= 0.078187
statistics sampled from 15667 (15732) to 15667 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.774), E-opt: 0.2 (0.483), width: 16
Scan time: 5.530
The best scores are: opt bits E(32554)
CCDS32041.1 ARHGEF40 gene_id:55701|Hs108|chr14 (1519) 10331 1179.7 0
CCDS32466.1 PLEKHG4 gene_id:25894|Hs108|chr16 (1191) 1182 147.6 2.1e-34
CCDS45512.1 PLEKHG4 gene_id:25894|Hs108|chr16 (1110) 1123 141.0 2e-32
CCDS34124.1 PLEKHG4B gene_id:153478|Hs108|chr5 (1271) 917 117.8 2.2e-25
CCDS33467.1 KIAA1755 gene_id:85449|Hs108|chr20 (1200) 637 86.2 6.8e-16
>>CCDS32041.1 ARHGEF40 gene_id:55701|Hs108|chr14 (1519 aa)
initn: 10331 init1: 10331 opt: 10331 Z-score: 6307.1 bits: 1179.7 E(32554): 0
Smith-Waterman score: 10331; 99.9% identity (99.9% similar) in 1519 aa overlap (1-1519:1-1519)
10 20 30 40 50 60
pF1KSD MEPEPVEDCVQSTLAALYPPFEATAPTLLGQVFQVVERTYREDALRYTLDFLVPAKHLLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MEPEPVEDCVQSTLAALYPPFEATAPTLLGQVFQVVERTYREDALRYTLDFLVPAKHLLA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD KVQQEACAQYSGFLFFHEGWPLCLHEQVVVQLAALPWQLLRPGDFYLQVVPSAAQAPRLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 KVQQEACAQYSGFLFFHEGWPLCLHEQVVVQLAALPWQLLRPGDFYLQVVPSAAQAPRLA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD LKCLAPGGGRVQEVPVPNEACAYLFTPEWLQGINKDRPTGRLSTCLLSAPSGIQRLPWAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 LKCLAPGGGRVQEVPVPNEACAYLFTPEWLQGINKDRPTGRLSTCLLSAPSGIQRLPWAE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD LICPRFVHKEGLMVGHQPSTLPPELPSGPPGLPSPPLPEEALGTRSPGDGHNAPVEGPEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 LICPRFVHKEGLMVGHQPSTLPPELPSGPPGLPSPPLPEEALGTRSPGDGHNAPVEGPEG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD EYVELLEVTLPVRGSPTDAEGSPGLSRVRTVPTRKGAGGKGRHRRHRAWMHQKGLGPRGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 EYVELLEVTLPVRGSPTDAEGSPGLSRVRTVPTRKGAGGKGRHRRHRAWMHQKGLGPRGQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD DGARPPGEGSSTGASPESPPGAEAVPEAAVLEVSEPPAEAVGEASGSCPLRPGELRGGGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 DGARPPGEGSSTGASPESPPGAEAVPEAAVLEVSEPPAEAVGEASGSCPLRPGELRGGGG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD GGQGAEGPPGTPRRTGKGNRRKKRAAGRGALSRGGDSAPLSPGDKEDASHQEALGNLPSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 GGQGAEGPPGTPRRTGKGNRRKKRAAGRGALSRGGDSAPLSPGDKEDASHQEALGNLPSP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD SEHKLPECHLVKEEYEGSGKPESEPKELKTAGEKEPQLSEACGPTEEGAGERELEGPGLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 SEHKLPECHLVKEEYEGSGKPESEPKELKTAGEKEPQLSEACGPTEEGAGERELEGPGLL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD CMAGHTGPEGPLSDTPTPPLETVQEGKGDNIPEEALAVSVSDHPDVAWDLMASGFLILTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 CMAGHTGPEGPLSDTPTPPLETVQEGKGDNIPEEALAVSVSDHPDVAWDLMASGFLILTG
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD GVDQSGRALLTITPPCPPEEPPPSRDTLNTTLHYLHSLLRPDLQTLGLSVLLDLRQAPPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 GVDQSGRALLTITPPCPPEEPPPSRDTLNTTLHYLHSLLRPDLQTLGLSVLLDLRQAPPL
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD PPALIPALSQLQDSGDPPLVQRLLILIHDDLPTELCGFQGAEVLSENDLKRVAKPEELQW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 PPALIPALSQLQDSGDPPLVQRLLILIHDDLPTELCGFQGAEVLSENDLKRVAKPEELQW
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD ELGGHRDPSPSHWVEIHQEVVRLCRLCQGVLGSVRQAIEELEGAAEPEEEEAVGMPKPLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 ELGGHRDPSPSHWVEIHQEVVRLCRLCQGVLGSVRQAIEELEGAAEPEEEEAVGMPKPLQ
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD KVLADPRLTALQRDGGAILMRLRSTPSSKLEGQGPATLYQEVDEAIHQLVRLSNLHVQQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 KVLADPRLTALQRDGGAILMRLRSTPSSKLEGQGPATLYQEVDEAIHQLVRLSNLHVQQQ
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD EQRQCLRRLQQVLQWLSGPGEEQLASFAMPGDTLSALQETELRFRAFSAEVQERLAQARE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 EQRQCLRRLQQVLQWLSGPGEEQLASFAMPGDTLSALQETELRFRAFSAEVQERLAQARE
790 800 810 820 830 840
850 860 870 880 890 900
pF1KSD ALALEENATSQKVLDIFEQRLEQVESGLHRALRLQRFFQQAHEWVDEGFARLAGAGPGRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 ALALEENATSQKVLDIFEQRLEQVESGLHRALRLQRFFQQAHEWVDEGFARLAGAGPGRE
850 860 870 880 890 900
910 920 930 940 950 960
pF1KSD AVLAALALRRAPEPSAGTFQEMRALALDLGSPAALREWGRCQARCQELERRIQQHLGEEA
:::::::::::::::::::::::::::::::::::::::::::::::::::::::.::::
CCDS32 AVLAALALRRAPEPSAGTFQEMRALALDLGSPAALREWGRCQARCQELERRIQQHVGEEA
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KSD SPRGYRRRRADGASSGGAQWGPRSPSPSLSSLLLPSSPGPRPAPSHCSLAPCGEDYEEEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 SPRGYRRRRADGASSGGAQWGPRSPSPSLSSLLLPSSPGPRPAPSHCSLAPCGEDYEEEG
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KSD PELAPEAEGRPPRAVLIRGLEVTSTEVVDRTCSPREHVLLGRARGPDGPWGVGTPRMERK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 PELAPEAEGRPPRAVLIRGLEVTSTEVVDRTCSPREHVLLGRARGPDGPWGVGTPRMERK
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KSD RSISAQQRLVSELIACEQDYVATLSEPVPPPGPELTPELRGTWAAALSARERLRSFHRTH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 RSISAQQRLVSELIACEQDYVATLSEPVPPPGPELTPELRGTWAAALSARERLRSFHRTH
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KSD FLRELQGCATHPLRIGACFLRHGDQFSLYAQYVKHRHKLENGLAALSPSSKGSMEAGPYL
:::::::::::::::::::::::::::::::::::::::::::::::: :::::::::::
CCDS32 FLRELQGCATHPLRIGACFLRHGDQFSLYAQYVKHRHKLENGLAALSPLSKGSMEAGPYL
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KSD PRALQQPLEQLTRYGRLLEELLREAGPELSSECRALGAAVQLLREQEARGRDLLAVEAVR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 PRALQQPLEQLTRYGRLLEELLREAGPELSSECRALGAAVQLLREQEARGRDLLAVEAVR
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KSD GCEIDLKEQGQLLHRDPFTVICGRKKCLRHVFLFEHLLLFSKLKGPEGGSEMFVYKQAFK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 GCEIDLKEQGQLLHRDPFTVICGRKKCLRHVFLFEHLLLFSKLKGPEGGSEMFVYKQAFK
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KSD TADMGLTENIGDSGLCFELWFRRRRAREAYTLQATSPEIKLKWTSSIAQLLWRQAAHNKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 TADMGLTENIGDSGLCFELWFRRRRAREAYTLQATSPEIKLKWTSSIAQLLWRQAAHNKE
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KSD LRVQQMVSMGIGNKPFLDIKALGERTLSALLTGRAARTRASVAVSSFEHAGPSLPGLSPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 LRVQQMVSMGIGNKPFLDIKALGERTLSALLTGRAARTRASVAVSSFEHAGPSLPGLSPG
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KSD ACSLPARVEEEAWDLDVKQISLAPETLDSSGDVSPGPRNSPSLQPPHPGSSTPTLASRGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 ACSLPARVEEEAWDLDVKQISLAPETLDSSGDVSPGPRNSPSLQPPHPGSSTPTLASRGI
1450 1460 1470 1480 1490 1500
1510
pF1KSD LGLSRQSHARALSDPTTPL
:::::::::::::::::::
CCDS32 LGLSRQSHARALSDPTTPL
1510
>>CCDS32466.1 PLEKHG4 gene_id:25894|Hs108|chr16 (1191 aa)
initn: 1058 init1: 627 opt: 1182 Z-score: 731.1 bits: 147.6 E(32554): 2.1e-34
Smith-Waterman score: 1456; 32.4% identity (56.8% similar) in 1136 aa overlap (369-1444:46-1108)
340 350 360 370 380 390
pF1KSD EAVGEASGSCPLRPGELRGGGGGGQGAEGPPGTPRRTGKGNRRKKRAAGRGALSRGGDSA
:: :: . : . .. : . ::: .
CCDS32 GHATDWRFAVCSFRDAWEEEEPASQMHVKDPGPPRPPA-GATQDEELQG-SPLSRKFQLP
20 30 40 50 60 70
400 410 420 430 440 450
pF1KSD PLSP--GDKEDASHQEA--LGNLPSPSEHKLPECHLVKEEYEGSGKPESEPKELKTAGEK
: . :: . .. . . :.. :.:: . : . .. ..: ::. . .:.
CCDS32 PAADESGDAQRGTVESSSVLSEGPGPSGVESLLCPMSSHLSLAQG--ESDTPGVGLVGDP
80 90 100 110 120 130
460 470 480 490 500 510
pF1KSD EPQLSEACGPTEEGAGERELEGPGLLCMAGHTGPEGPLSDTPTPPLETVQEGKGDNIPEE
:. . : . :: . . : : :::. . ::.. :.: : .
CCDS32 GPSRAMPSGLSP-GALDSDPVGLG-----------DPLSEI-SKLLEAAPSGSGLPKPAD
140 150 160 170
520 530 540 550 560 570
pF1KSD ALAVSVSDHPDVAWDLMASGFLILTGGVDQSGRALLTITPPCPPE-EPPPSRDTLNTTLH
: .. :. :.:.:::. : : : .:::.: . : . : . : :
CCDS32 CLLAQ-----DLCWELLASGMATLPGTRDVQGRAVLLLCAHSPAWLQSECSSQELIRLLL
180 190 200 210 220 230
580 590 600 610 620 630
pF1KSD YLHSLLRPDLQTLGLSVLLDLRQAPPLPPALIPALSQLQDSGDPPLVQRLLI--LIHDDL
::.:. ::..:.:::.::.: : : .:. .:::::... . : ::. . ..
CCDS32 YLRSIPRPEVQALGLTVLVDARICAP-SSSLFSGLSQLQEAAPGAVYQVLLVGSTLLKEV
240 250 260 270 280 290
640 650 660 670 680 690
pF1KSD PTELCGFQGAEVLSENDLKRVAKPEELQWELGGHRDPSPSHWVEIHQEVVRLCRLCQGVL
:. :.: .. :.. : .. : ::: . :....... : . ::..
CCDS32 PS---GLQLEQLPSQSLLTHIPTAG-LPTSLGGGLPYCHQAWLDFRRRLEALLQNCQAAC
300 310 320 330 340
700 710 720 730 740
pF1KSD GSVRQAIEELEGAAEPEEEEAVG--MPKP---LQKVLADPRLTALQRDGGAILMRLRS--
. .. ::: .... .: : :: . . .:.:: .: :. :: .:: : :..
CCDS32 ALLQGAIESVKAVPQPMEPGEVGQLLQQTEVLMQQVLDSPWLAWLQCQGGRELTWLKQEV
350 360 370 380 390 400
750 760 770 780 790
pF1KSD -----TPSSKLEGQGPATLYQEVDEAIHQLVRLSNLHVQQQEQRQCLRR----LQQVLQW
.:. . . ::..:: .:::. :: ..: : : :. :.:. :
CCDS32 PEVTLSPDYRTAMDKADELYDRVDGLLHQLTLQSNQRIQALELVQTLEARESGLHQIEVW
410 420 430 440 450 460
800 810 820 830 840
pF1KSD LSGPGEEQLASFAMPGDTLSALQETELRFRAFSAEVQERLAQAREAL-------ALEENA
:. : : . : .:. : ... :. . .::.. :... : : : .
CCDS32 LQQVGWPALEEAGEP--SLDMLLQAQGSFQELYQVAQEQVRQGEKFLQPLTGWEAAELDP
470 480 490 500 510 520
850 860 870 880 890
pF1KSD TSQKVLDI------FEQRLEQVESGLHRALRLQRFFQQAHEWVDEG---FARLAGAGPGR
. . : . : . : : . : : :: ..:..: :..:: .:.: ::
CCDS32 PGARFLALRAQLTEFSRALAQRCQRLADAERLFQLFREALTWAEEGQRVLAELEQERPG-
530 540 550 560 570 580
900 910 920 930 940 950
pF1KSD EAVLAALALR--RAPEPSAGTFQEMRALALDLGSPAALREWGRCQARCQELERRIQQHLG
.:: : :. : :. . :..: ::: ::: : .: ::::. ..:.:
CCDS32 -VVLQQLQLHWTRHPDLPPAHFRKMWALATGLGSEAIRQECRWAWARCQDTWLALDQKL-
590 600 610 620 630 640
960 970 980 990 1000 1010
pF1KSD EEASPRGYRRRRADGASSGGAQWGPRSPSPSLSSLLLPSSPGPRPAPSHCSLAPCGEDYE
::: . : : : .:: . . :. ::.: : .
CCDS32 -EASLKL-----------------P--PVGSTASLCVSQVPA---APAHPPLRKAYSFDR
650 660 670 680
1020 1030 1040 1050 1060 1070
pF1KSD EEGPELAPEAEGRPPRAVLIRGLEVTSTEVVDRTCSPREHVLLGRARGPDGPWGVGTPRM
. : :. : :.. .: : : . :.. : :
CCDS32 NLGQSLSEPACHCHHAATIA-------------ACRRPEA---GGGALPQASPTVPPPGS
690 700 710 720
1080 1090 1100 1110 1120 1130
pF1KSD ERKRSISAQQRLVSELIACEQDYVATLSEPVPPPGPEL----TPE-LRGTWAAALSARER
::.. : ...:..: :..:: .: . ::: .:. ::: : .. :.
CCDS32 SDPRSLNRLQLVLAEMVATEREYVRALEYTMENYFPELDRPDVPQGLRGQRAHLFGNLEK
730 740 750 760 770 780
1140 1150 1160 1170 1180 1190
pF1KSD LRSFHRTHFLRELQGCATHPLRIGACFLRHGDQFSLYAQYVKHRHKLENGLAALSPSS-K
::.:: :::::..:. :: :.. :::: ::..:: : :.. . . ... . . :
CCDS32 LRDFHCHFFLRELEACTRHPPRVAYAFLRHRVQFGMYALYSKNKPRSDALMSSYGHTFFK
790 800 810 820 830 840
1200 1210 1220 1230 1240
pF1KSD GSMEA-GPYLPRA--LQQPLEQLTRYGRLLEELLREAGPELSSECRALGAAVQLLREQEA
...: : .: : : .:.... .:. ::.:: : : ..: :: : .:.. :
CCDS32 DKQQALGDHLDLASYLLKPIQRMGKYALLLQELARACGGP-TQELSALREAQSLVHFQLR
850 860 870 880 890 900
1250 1260 1270 1280 1290 1300
pF1KSD RGRDLLAVEAVRGCEIDLKEQGQLLHRDPFTVICGRKKCLRHVFLFEHLLLFSKLKGPEG
.: ::::..:..::...:::::::...: :.: ::.: .:..::::.:::::: .
CCDS32 HGNDLLAMDAIQGCDVNLKEQGQLVRQDEFVVRTGRHKSVRRIFLFEELLLFSKPRHGPT
910 920 930 940 950 960
1310 1320 1330 1340 1350 1360
pF1KSD GSEMFVYKQAFKTADMGLTENIGDSGLCFELWFRRRRAREAYTLQATSPEIKLKWTSSIA
: . :.::..:: ::.:::: :.:.: ::.:::::.::....:::.: :: ::..:.
CCDS32 GVDTFAYKRSFKMADLGLTECCGNSNLRFEIWFRRRKARDTFVLQASSLAIKQAWTADIS
970 980 990 1000 1010 1020
1370 1380 1390 1400 1410 1420
pF1KSD QLLWRQAAHNKELRVQQMVSMGIGNKPFLDI----KALGERTLSALLTGRAARTRASVAV
.::::::.::::.:. .:::::.::: : :: .:...::.. .: : .:.:::.::
CCDS32 HLLWRQAVHNKEVRMAEMVSMGVGNKAFRDIAPSEEAINDRTVNYVLKCREVRSRASIAV
1030 1040 1050 1060 1070 1080
1430 1440 1450 1460 1470
pF1KSD SSFEH------AGPSLPGLSPGACSLPARVEEEAWDLDVKQISLAPETLDSSGDVSPGPR
. :.: :. :::: .:..::.
CCDS32 APFDHDSLYLGASNSLPG-DPASCSVLGSLNLHLYRDPALLGLRCPLYPSFPEEAALEAE
1090 1100 1110 1120 1130 1140
>>CCDS45512.1 PLEKHG4 gene_id:25894|Hs108|chr16 (1110 aa)
initn: 1058 init1: 627 opt: 1123 Z-score: 695.5 bits: 141.0 E(32554): 2e-32
Smith-Waterman score: 1384; 33.0% identity (57.3% similar) in 1044 aa overlap (466-1444:35-1027)
440 450 460 470 480 490
pF1KSD EGSGKPESEPKELKTAGEKEPQLSEACGPTEEGAGERELEGPGL-LCMAGHTGPE----G
:: :.. ... :: :: : : .
CCDS45 LENGDESPDSQGHATDWRFAVCSFRDAWEEEEPASQMHVKDPGPPRPPAGATQDEELQGS
10 20 30 40 50 60
500 510 520 530 540
pF1KSD PLSDT-PTPPLETVQEGKGDNIPEEALAVSVSDHPDVAWDL---MASGFLILTGGVDQSG
::: :: . . : . ..: . :. . .: :.: . . : : .:
CCDS45 PLSRKFQLPPAADESGDAQRGTVESSSVLSEGPGPSGVESLLCPMSSHLSLAQGTRDVQG
70 80 90 100 110 120
550 560 570 580 590 600
pF1KSD RALLTITPPCPPE-EPPPSRDTLNTTLHYLHSLLRPDLQTLGLSVLLDLRQAPPLPPALI
::.: . : . : . : : ::.:. ::..:.:::.::.: : : .:.
CCDS45 RAVLLLCAHSPAWLQSECSSQELIRLLLYLRSIPRPEVQALGLTVLVDARICAP-SSSLF
130 140 150 160 170 180
610 620 630 640 650 660
pF1KSD PALSQLQDSGDPPLVQRLLI--LIHDDLPTELCGFQGAEVLSENDLKRVAKPEELQWELG
.:::::... . : ::. . ..:. :.: .. :.. : .. : ::
CCDS45 SGLSQLQEAAPGAVYQVLLVGSTLLKEVPS---GLQLEQLPSQSLLTHIPTAG-LPTSLG
190 200 210 220 230
670 680 690 700 710
pF1KSD GHRDPSPSHWVEIHQEVVRLCRLCQGVLGSVRQAIEELEGAAEPEEEEAVG--MPKP---
: . :....... : . ::.. . .. ::: .... .: : :: . .
CCDS45 GGLPYCHQAWLDFRRRLEALLQNCQAACALLQGAIESVKAVPQPMEPGEVGQLLQQTEVL
240 250 260 270 280 290
720 730 740 750 760 770
pF1KSD LQKVLADPRLTALQRDGGAILMRLRS-------TPSSKLEGQGPATLYQEVDEAIHQLVR
.:.:: .: :. :: .:: : :.. .:. . . ::..:: .:::.
CCDS45 MQQVLDSPWLAWLQCQGGRELTWLKQEVPEVTLSPDYRTAMDKADELYDRVDGLLHQLTL
300 310 320 330 340 350
780 790 800 810 820
pF1KSD LSNLHVQQQEQRQCLRR----LQQVLQWLSGPGEEQLASFAMPGDTLSALQETELRFRAF
:: ..: : : :. :.:. ::. : : . : .:. : ... :. .
CCDS45 QSNQRIQALELVQTLEARESGLHQIEVWLQQVGWPALEEAGEP--SLDMLLQAQGSFQEL
360 370 380 390 400 410
830 840 850 860 870
pF1KSD SAEVQERLAQAREAL-------ALEENATSQKVLDI------FEQRLEQVESGLHRALRL
.::.. :... : : : . . . : . : . : : . : : ::
CCDS45 YQVAQEQVRQGEKFLQPLTGWEAAELDPPGARFLALRAQLTEFSRALAQRCQRLADAERL
420 430 440 450 460 470
880 890 900 910 920
pF1KSD QRFFQQAHEWVDEG---FARLAGAGPGREAVLAALALR--RAPEPSAGTFQEMRALALDL
..:..: :..:: .:.: :: .:: : :. : :. . :..: ::: :
CCDS45 FQLFREALTWAEEGQRVLAELEQERPG--VVLQQLQLHWTRHPDLPPAHFRKMWALATGL
480 490 500 510 520 530
930 940 950 960 970 980
pF1KSD GSPAALREWGRCQARCQELERRIQQHLGEEASPRGYRRRRADGASSGGAQWGPRSPSPSL
:: : .: ::::. ..:.: ::: . : : :
CCDS45 GSEAIRQECRWAWARCQDTWLALDQKL--EASLKL-----------------P--PVGST
540 550 560 570
990 1000 1010 1020 1030 1040
pF1KSD SSLLLPSSPGPRPAPSHCSLAPCGEDYEEEGPELAPEAEGRPPRAVLIRGLEVTSTEVVD
.:: . . :. ::.: : .. : :. : :..
CCDS45 ASLCVSQVPA---APAHPPLRKAYSFDRNLGQSLSEPACHCHHAATIA------------
580 590 600 610
1050 1060 1070 1080 1090 1100
pF1KSD RTCSPREHVLLGRARGPDGPWGVGTPRMERKRSISAQQRLVSELIACEQDYVATLSEPVP
.: : : . :.. : : ::.. : ...:..: :..:: .: .
CCDS45 -ACRRPEA---GGGALPQASPTVPPPGSSDPRSLNRLQLVLAEMVATEREYVRALEYTME
620 630 640 650 660 670
1110 1120 1130 1140 1150 1160
pF1KSD PPGPEL----TPE-LRGTWAAALSARERLRSFHRTHFLRELQGCATHPLRIGACFLRHGD
::: .:. ::: : .. :.::.:: :::::..:. :: :.. ::::
CCDS45 NYFPELDRPDVPQGLRGQRAHLFGNLEKLRDFHCHFFLRELEACTRHPPRVAYAFLRHRV
680 690 700 710 720 730
1170 1180 1190 1200 1210 1220
pF1KSD QFSLYAQYVKHRHKLENGLAALSPSS-KGSMEA-GPYLPRA--LQQPLEQLTRYGRLLEE
::..:: : :.. . . ... . . : ...: : .: : : .:.... .:. ::.:
CCDS45 QFGMYALYSKNKPRSDALMSSYGHTFFKDKQQALGDHLDLASYLLKPIQRMGKYALLLQE
740 750 760 770 780 790
1230 1240 1250 1260 1270 1280
pF1KSD LLREAGPELSSECRALGAAVQLLREQEARGRDLLAVEAVRGCEIDLKEQGQLLHRDPFTV
: : : ..: :: : .:.. : .: ::::..:..::...:::::::...: :.:
CCDS45 LARACGGP-TQELSALREAQSLVHFQLRHGNDLLAMDAIQGCDVNLKEQGQLVRQDEFVV
800 810 820 830 840 850
1290 1300 1310 1320 1330 1340
pF1KSD ICGRKKCLRHVFLFEHLLLFSKLKGPEGGSEMFVYKQAFKTADMGLTENIGDSGLCFELW
::.: .:..::::.:::::: . : . :.::..:: ::.:::: :.:.: ::.:
CCDS45 RTGRHKSVRRIFLFEELLLFSKPRHGPTGVDTFAYKRSFKMADLGLTECCGNSNLRFEIW
860 870 880 890 900 910
1350 1360 1370 1380 1390
pF1KSD FRRRRAREAYTLQATSPEIKLKWTSSIAQLLWRQAAHNKELRVQQMVSMGIGNKPFLDI-
::::.::....:::.: :: ::..:..::::::.::::.:. .:::::.::: : ::
CCDS45 FRRRKARDTFVLQASSLAIKQAWTADISHLLWRQAVHNKEVRMAEMVSMGVGNKAFRDIA
920 930 940 950 960 970
1400 1410 1420 1430 1440 1450
pF1KSD ---KALGERTLSALLTGRAARTRASVAVSSFEH------AGPSLPGLSPGACSLPARVEE
.:...::.. .: : .:.:::.::. :.: :. :::: .:..::.
CCDS45 PSEEAINDRTVNYVLKCREVRSRASIAVAPFDHDSLYLGASNSLPG-DPASCSVLGSLNL
980 990 1000 1010 1020 1030
1460 1470 1480 1490 1500 1510
pF1KSD EAWDLDVKQISLAPETLDSSGDVSPGPRNSPSLQPPHPGSSTPTLASRGILGLSRQSHAR
CCDS45 HLYRDPALLGLRCPLYPSFPEEAALEAEAELGGQPSLTAEDSEISSQCPSASGSSGSDSS
1040 1050 1060 1070 1080 1090
>>CCDS34124.1 PLEKHG4B gene_id:153478|Hs108|chr5 (1271 aa)
initn: 1115 init1: 460 opt: 917 Z-score: 569.2 bits: 117.8 E(32554): 2.2e-25
Smith-Waterman score: 1373; 31.1% identity (55.1% similar) in 1197 aa overlap (344-1432:38-1183)
320 330 340 350 360 370
pF1KSD ASPESPPGAEAVPEAAVLEVSEPPAEAVGEASGSCPLRPGELRGGGGGGQGAEGPPGTPR
:::. : :: . : ::
CCDS34 MPLGSSEEALGDLACSSLTGASRDLGTGAVASGTQEETSGP-RGDPQQTPSLEKERHTPS
10 20 30 40 50 60
380 390 400 410 420 430
pF1KSD RTGKGNRRKKRAAGRGALSRGGDSAPLSPGDKEDASHQEALGNLPSPSEHKLPECHLVKE
::: : :::: .: : . : .: ... : : : . : . : :: .
CCDS34 RTGPG------AAGR-TLPRRSRSWERAPRSSRGA--QAAACHTSHHSAGSRPGGHLGGQ
70 80 90 100 110
440 450 460 470 480 490
pF1KSD EYEGSGKPESEPKELKTAGEKEPQL-SEACGPTEEGAGERELEGPGLLCMAGHTGPEGPL
. : :. : : ..: : : :: :. :. : : :. : ::
CCDS34 ---AVGTPNCVPVEGPGCTKEEDVLASSACVSTDGGS---------LHC---HN-PSGP-
120 130 140 150 160
500 510 520 530 540
pF1KSD SDTPT----PPLETVQEGKGD---NIPEEALAVSVSDHPDVAWDLMASGFLILTGGVDQS
::.:. : : : :: ..:...: ::. .:. :: . : : :.
CCDS34 SDVPARQPHPEQEGWPPGTGDFPSQVPKQVL--------DVSQELLQSGVVTLPGTRDRH
170 180 190 200 210
550 560 570 580 590 600
pF1KSD GRALLTI-TPPCPPEEPPPSRDTLNTTLHYLHSLLRPDLQTLGLSVLLDLRQAPPLPPAL
:::.. . : . : :. : :.::. : ... ::: ::.: :..: ::.
CCDS34 GRAVVQVRTRSLLWTREHSSCAELTRLLLYFHSIPRKEVRDLGLVVLVDARRSPA-APAV
220 230 240 250 260 270
610 620 630 640 650 660
pF1KSD IPALSQLQDSGDPPLVQRLLILIHDDL---PTELCGFQGAEVLSENDLKRVAKPEELQWE
::: ::.. :... .:.:. . : . .: : : . ... . .: .
CCDS34 SQALSGLQNN-TSPIIHSILLLVDKESAFRPDKDAIIQCEVVSSLKAVHKFVDSCQLTAD
280 290 300 310 320 330
670 680 690 700 710
pF1KSD LGGHRDPSPSHWVEIHQEVVRLCRLCQGVLGSVRQAIEELEGAAEP----EEEEAVGMPK
: : : . :. ..:.. .. :. .. ..... :. : : : . . .
CCDS34 LDGSFPYSHGDWICFRQRLEHFAANCEEAIIFLQNSFCSLNTHRTPRTAQEVAELIDQHE
340 350 360 370 380 390
720 730 740 750 760 770
pF1KSD PLQK-VLADPRLTALQRDGGAILMRLR----STPSSKLEGQGPATLYQEVDEAIHQLVRL
..: :: :: :..:. .::..: ::: .: .:. .. ..::..::: .:.::
CCDS34 TMMKLVLEDPLLVSLRLEGGTVLARLRREELGTEDSRDTLEAATSLYDRVDEEVHRLVLT
400 410 420 430 440 450
780 790 800 810 820 830
pF1KSD SNLHVQQQEQRQCLRRLQQVLQWLSGPGEEQLASFAMPGDTLSALQETELRFRAFSAEVQ
:: ..:: :. . : : . . : :::. : : .:. .: :..:: :.
CCDS34 SNNRLQQLEHLRELASLLEGNDQQSCQKGLQLAK-ENPQRTEEMVQD--FR-RGLSAVVS
460 470 480 490 500
840 850 860 870 880 890
pF1KSD ERLAQAREALALEENATSQKVLDIFEQRLEQVESGLHRALRLQRFFQQAHEWVDEGFARL
. :. ::. : . . :... . . . .. . . . ... :. :. .
CCDS34 Q--AECREG-ELARWTRSSELCETVSSWMGPLDPEACPSSPVAECLRSCHQ---EATSVA
510 520 530 540 550 560
900 910 920 930 940 950
pF1KSD AGAGPGRE-AVLAALALRRAPEPSAGTFQEMRALALDLGSPAALREWGRCQARCQELERR
: : :: ::: :: . . . .. : : :: : . . : .
CCDS34 AEAFPGAGVAVLKPHALGKPWASQQDLWLQYPQTRLRL--EEALSE-AAPDPSLPPLAQS
570 580 590 600 610
960 970 980 990
pF1KSD IQQHL-GEEASPRGYRRRRADGASSGGAQWGPRSP------------------SPSLSSL
.: ..:: : . ...:::. : : .: :.: .:
CCDS34 PPKHERAQEAMRRHQKPPSFPSTDSGGGAWEPAQPLSGLPGRALLCGQDGETLRPGLCAL
620 630 640 650 660 670
1000 1010 1020
pF1KSD LLPSS-----PGPRPAPSH------CSLAPCG------------------EDYEEEGPEL
: : :: . .: :: : ...: :.
CCDS34 WDPLSLLRGLPGAGATTAHLEDSSACSSEPTQTLASRPRKHPQKKMIKKTQSFEIPQPDS
680 690 700 710 720 730
1030 1040 1050 1060 1070
pF1KSD APEAEGRPPR-AVLIRGLEVTSTEVVDRTCSPREHVL---LGRARGPDGPWGVGTPRMER
.:. .: . .:. .::::::: .... .:. . ..:. ..: :. : :
CCDS34 GPRDSCQPDHTSVFSKGLEVTSTVATEKKLPLWQHARSPPVTQSRSLSSPSGLH-PAEED
740 750 760 770 780 790
1080 1090 1100 1110 1120 1130
pF1KSD KRSISAQQRL---VSELIACEQDYVATLSEPVPPPGPELT----PE-LRGTWAAALSARE
:. ...:: ..:.:: :..:. :. . ::. :. ::: . .. :
CCDS34 GRQQVGSSRLRHIMAEMIATEREYIRCLGYVIDNYFPEMERMDLPQGLRGKHHVIFGNLE
800 810 820 830 840 850
1140 1150 1160 1170 1180
pF1KSD RLRSFHRTHFLRELQGCATHPLRIGACFLRHGDQFSLYAQYVKHRHKLENGLAALSPS--
.:..::. ::::::. : :: .: :::: .::..:. : :.. . . :.. . .
CCDS34 KLHDFHQQHFLRELERCQHCPLAVGRSFLRHEEQFGMYVIYSKNKPQSDALLSSHGNAFF
860 870 880 890 900 910
1190 1200 1210 1220 1230 1240
pF1KSD SKGSMEAGPYLPRA--LQQPLEQLTRYGRLLEELLREA--GPELSSECRALGAAVQLLRE
. . : : . : : .:......:. ::..::.:: : ..: : :: ..
CCDS34 KDKQRELGDKMDLASYLLRPVQRVAKYALLLQDLLKEASCGLAQGQELGELRAAEVVVCF
920 930 940 950 960 970
1250 1260 1270 1280 1290 1300
pF1KSD QEARGRDLLAVEAVRGCEIDLKEQGQLLHRDPFTVICGRKKCLRHVFLFEHLLLFSKLKG
: .: ::::..:.:::...::::::: :: : : ::::: :::::::: :.:::: .
CCDS34 QLRHGNDLLAMDAIRGCDVNLKEQGQLRCRDEFIVCCGRKKYLRHVFLFEDLILFSKTQK
980 990 1000 1010 1020 1030
1310 1320 1330 1340 1350 1360
pF1KSD PEGGSEMFVYKQAFKTADMGLTENIGDSGLCFELWFRRRR-AREAYTLQATSPEIKLKWT
::. ....:::.::::..:.:::.::::: ::.:::::: ....: :::.: :.: ::
CCDS34 VEGSHDVYLYKQSFKTAEIGMTENVGDSGLRFEIWFRRRRKSQDTYILQASSAEVKSAWT
1040 1050 1060 1070 1080 1090
1370 1380 1390 1400
pF1KSD SSIAQLLWRQAAHNKELRVQQMVSMGIGNKPFLDIK-------------------ALGER
. :...::::: ...:::.:.:.::::::.::.:.: ....:
CCDS34 DVIGRILWRQALKSRELRIQEMASMGIGNQPFMDVKPRDRTPDCAVISDRAPKCAVMSDR
1100 1110 1120 1130 1140 1150
1410 1420 1430 1440 1450 1460
pF1KSD TLSALLTGRAARTRASVAVSSFEHAGPSLPGLSPGACSLPARVEEEAWDLDVKQISLAPE
. .... : .. :.:.:::: .::.:
CCDS34 VPDSIVKGTESQMRGSTAVSSSDHAAPFKRPHSTISDSSTSSSSSQSSSILGSLGLLVSS
1160 1170 1180 1190 1200 1210
>>CCDS33467.1 KIAA1755 gene_id:85449|Hs108|chr20 (1200 aa)
initn: 829 init1: 626 opt: 637 Z-score: 398.8 bits: 86.2 E(32554): 6.8e-16
Smith-Waterman score: 1008; 28.2% identity (52.4% similar) in 1218 aa overlap (1-1077:1-1172)
10 20 30 40 50 60
pF1KSD MEPEPVEDCVQSTLAALYPPFEATAPTLLGQVFQVVERTYREDALRYTLDFLVPAKHLLA
:.: .. .: .::.:::::::::::.:::::.... .. :.: . ::::.:::.:
CCDS33 MDPPSLDTAIQHALAGLYPPFEATAPTVLGQVFRLLDSGFQGDGLSFLLDFLIPAKRLCE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD KVQQEACAQYSGFLFFHEGWPLCLHEQVVVQLAALPWQLLRPGDFYLQVVPSAAQAPRLA
.:.. ::: :: ::.::::::::...:::.:: : ::: ::::::: :. :. .
CCDS33 QVREAACAPYSHCLFLHEGWPLCLRDEVVVHLAPLNPLLLRQGDFYLQVEPQEEQSVCIM
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD LKCLAPGGGRVQEVPVPNEACAYLFTPEWLQGINKDRPTGRLSTCLLSAPSGIQRLPWAE
.:::. :.. :::. : ::: :::..::.: . : .::... .:: .::..
CCDS33 IKCLSLDLCTVDKKPVPEPAYPILFTQEWLEAINSDFEGNPLHNCLVASENGIAPVPWTK
130 140 150 160 170 180
190 200 210 220
pF1KSD LICPRFVHKEGLMV-------GHQPS-----TLPPEL--PSGPPG--LPSPPLPE---EA
. :.:: . .: : : . : :: :.: . ::. : . ..
CCDS33 ITSPEFVDDRPQVVNALCQAWGPLPLEALDLSSPQELHQASSPDNQVLPAQSLAKGKGRT
190 200 210 220 230 240
230 240 250 260
pF1KSD LGTRSPG-----DGHNAPV---------EGPEGEYVELLEVTLPVRG-SPTDAEGSPGLS
:.. :: ... . : . ::.:: :: . :: ::. :. :
CCDS33 YGSKYPGLIKVEQARCGEVAFRMDEVVSQDFEGDYVALLGFSQESRGESPSREAGTS--S
250 260 270 280 290
270 280 290 300 310
pF1KSD RVRTVPTRKGAGGKGRHRRHRAW-MHQKGLGPRGQDGA---------RPPGEGSSTGASP
. .. :: : .. . . . :: . : :: . : ..
CCDS33 GCTSGALEEIAGTKETPLFQKILPLSEANEGPSLGNRACTKPESSEERPYNLGFRRKVNL
300 310 320 330 340 350
320 330 340 350 360 370
pF1KSD ESPP-GAEAVPEAAVLEVSEPPAEAVGEASGSCPLRPGELRGGGGGGQGAEGPPGTPRRT
..: ..: :... ..: : .:. ::: :: : . ... . .:: :.:.
CCDS33 KAPTHNSERPPQGSYMNVLE---DALDCASG---LRAGVSQEPAASKM--QGPLGNPENM
360 370 380 390 400 410
380 390 400 410 420
pF1KSD GKGNRRKKRAAGRGALSRGGDSAPLSPGDKEDASHQEALGNLPSP-------SEHKLPEC
. : : :. :: .. .: : : ... .: : ::.: . :
CCDS33 VQL-RPGPRQASSPRLSPASPAAAASE-TKIEVKTKERNGRLPKPMPCPSRNTSSPEPPT
420 430 440 450 460
430 440 450 460 470
pF1KSD HLVKEEY-EGSGKPESEPKE--LKTAGEKE-------PQLSEACGPTEEGAGERELEGPG
.: . .:. .: :.. :. : . :. ..: . . :. . . ::.
CCDS33 PGLKFSFLRGQRQPSVTPEKASLQHNGPWKVLCSLYSPKPNRAKSLGKAGTTQTKTSGPA
470 480 490 500 510 520
480 490 500 510 520 530
pF1KSD LLCMAGHTGPEGPLSDTPT--PPLETVQEGKGDNIPEEALAVSVSDHPDVAW---DLMAS
:.: .::.. . : . . .: .. :: . .: .. .. :
CCDS33 -------TAP-SPLTEEKAALPEASAGSPERGPTLEEEP----PGPEPRIGALGVKVFRS
530 540 550 560 570
540 550 560 570 580 590
pF1KSD GFLILTGGVDQSGRALLTITPPCPPEEPPP-SRDTLNTTLHYLHSLLRPDLQTLGLSVLL
. : :: :..:: :: .. : : . . .. : :: .. ::. .. ::.::.
CCDS33 RIACLPGGRDRAGRPLLLVSTTEGAWEAPWCTVSEVTKLLSYLCTIPRPEDKAKGLAVLI
580 590 600 610 620 630
600 610 620 630 640 650
pF1KSD DLRQAPPLPPALIPALSQLQDSGDPPLVQRLLILIHDDLPTELCGFQGAEVLSENDLKRV
: :. :: :.:. ::. : . : .. .:.: . . .: . ..: ..:: .
CCDS33 DARRQPP-QPGLVSALQATQ-AQVPASIRAILFLGEKEAALQLQTLPDVQVEVLTSLKAL
640 650 660 670 680 690
660 670 680 690 700
pF1KSD AK---PEELQWELGGHRDPSPSHWVEIHQEV-VRLCRLCQGVLGSVRQA-IEELEGAAEP
.. : .: : : ..::.. :.. : : :. .:. :: :::.: : :
CCDS33 SHHVDPSQLPAVLEGPFPYCHTEWVHFFQKLDPFLADLHQA--SSLLQASIEEFEKADPP
700 710 720 730 740 750
710 720 730 740 750
pF1KSD ----EEEEAVGMPKPLQK-VLADPRLTALQRDGGAILMRLRS-------TPSSKLEGQGP
: . .. : :.. :: :: : .:::.::: : ::. .:. . . .
CCDS33 GGMQEATRCLSKSKELMEAVLRDPGLLGLQREGGATLARLQHDASRLDFSPDVRSHLAAA
760 770 780 790 800 810
760 770 780 790 800 810
pF1KSD ATLYQEVDEAIHQLVRLSNLHVQQQEQRQCLRRLQ----QVLQWLSGPGEEQLASFAMPG
..::. ::: .: :: :: . . : : : ::. :: .:. :.. : :..
CCDS33 TALYSLVDEQLHVLVTASNSLLGKLELRVRLGRLEAAIHQVSDWMEQEGRRCLQSLTPKD
820 830 840 850 860 870
820 830 840
pF1KSD DTLSALQETELRFRAF--SAEVQERL------------AQAREALALEEN--------AT
.: ...... .:. : .: .: : : :: : :. :.
CCDS33 GSLETVEKAHAEFENFFLQAAAQYRRGLELSKQAAQLGATARGAGEAERAEFPELAAFAS
880 890 900 910 920 930
850 860 870 880 890
pF1KSD SQKVLDI----FEQRLEQVESGLHRALRLQRFFQQA---HEWVDEGFARL-----AGAGP
.:.... : . :. .. :. :.:.:: .. : .. .:.: . ..:
CCDS33 TQRAFQAELTHFYMAAERQRTDLETLLHLHRFCKRMTWFHMDCQDLMAQLRLDKTSRVSP
940 950 960 970 980 990
900 910 920 930 940 950
pF1KSD GREAVLAALALRRAPEPSAGTFQEMRALALDLGS--PAALRE--WGRCQARCQELERRIQ
: . : : : : : ... :..:...: :.: . : . . : .:.. ..
CCDS33 GDQRRLHRYLQRLASEFPA---EKLAAVGLQVASLSRAGLGQELWEEARIRHEEIRMLLE
1000 1010 1020 1030 1040
960 970 980 990
pF1KSD QHLGEEASP--------RGYRR---RRADGAS---SGGAQWGPRSPSPSLSSLLLPSSPG
. : . . : : :: ...:.: .. ..: . : ::. ::.:
CCDS33 KALTHSSCPEAPAAHSARPERRGVAAKGQGVSVEVTSKGRWD-QPPLDSLGMDHLPKSYW
1050 1060 1070 1080 1090 1100
1000 1010 1020 1030 1040 1050
pF1KSD PRPAPSHCSLAPCGEDYEEEGPELAPEAEGRPPRAVLIRGLEVTSTEVVDRTCSPREHVL
: :.: : ::. . :. :. .: .: : .. : :::.:
CCDS33 P-PGP------PRGEQNRTFQAGSPPQEAGQAAEAEDGKG----SHKLPD---PAREHLL
1110 1120 1130 1140 1150
1060 1070 1080 1090 1100 1110
pF1KSD LGRARGPDGPWGVGTPRMERKRSISAQQRLVSELIACEQDYVATLSEPVPPPGPELTPEL
. : .::.
CCDS33 ATTFFRQQPPRQSQVPRLTGGSFSSEGTDSQTSLEDSPQTSPLASL
1160 1170 1180 1190 1200
1519 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 19:24:20 2016 done: Thu Nov 3 19:24:21 2016
Total Scan time: 5.530 Total Display time: 0.360
Function used was FASTA [36.3.4 Apr, 2011]