FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDF0128, 1519 aa 1>>>pF1KSDF0128 1519 - 1519 aa - 1519 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.3831+/-0.000928; mu= 7.6267+/- 0.056 mean_var=269.0796+/-55.732, 0's: 0 Z-trim(115.2): 68 B-trim: 158 in 1/53 Lambda= 0.078187 statistics sampled from 15667 (15732) to 15667 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.774), E-opt: 0.2 (0.483), width: 16 Scan time: 5.530 The best scores are: opt bits E(32554) CCDS32041.1 ARHGEF40 gene_id:55701|Hs108|chr14 (1519) 10331 1179.7 0 CCDS32466.1 PLEKHG4 gene_id:25894|Hs108|chr16 (1191) 1182 147.6 2.1e-34 CCDS45512.1 PLEKHG4 gene_id:25894|Hs108|chr16 (1110) 1123 141.0 2e-32 CCDS34124.1 PLEKHG4B gene_id:153478|Hs108|chr5 (1271) 917 117.8 2.2e-25 CCDS33467.1 KIAA1755 gene_id:85449|Hs108|chr20 (1200) 637 86.2 6.8e-16 >>CCDS32041.1 ARHGEF40 gene_id:55701|Hs108|chr14 (1519 aa) initn: 10331 init1: 10331 opt: 10331 Z-score: 6307.1 bits: 1179.7 E(32554): 0 Smith-Waterman score: 10331; 99.9% identity (99.9% similar) in 1519 aa overlap (1-1519:1-1519) 10 20 30 40 50 60 pF1KSD MEPEPVEDCVQSTLAALYPPFEATAPTLLGQVFQVVERTYREDALRYTLDFLVPAKHLLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MEPEPVEDCVQSTLAALYPPFEATAPTLLGQVFQVVERTYREDALRYTLDFLVPAKHLLA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD KVQQEACAQYSGFLFFHEGWPLCLHEQVVVQLAALPWQLLRPGDFYLQVVPSAAQAPRLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 KVQQEACAQYSGFLFFHEGWPLCLHEQVVVQLAALPWQLLRPGDFYLQVVPSAAQAPRLA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD LKCLAPGGGRVQEVPVPNEACAYLFTPEWLQGINKDRPTGRLSTCLLSAPSGIQRLPWAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LKCLAPGGGRVQEVPVPNEACAYLFTPEWLQGINKDRPTGRLSTCLLSAPSGIQRLPWAE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD LICPRFVHKEGLMVGHQPSTLPPELPSGPPGLPSPPLPEEALGTRSPGDGHNAPVEGPEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LICPRFVHKEGLMVGHQPSTLPPELPSGPPGLPSPPLPEEALGTRSPGDGHNAPVEGPEG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD EYVELLEVTLPVRGSPTDAEGSPGLSRVRTVPTRKGAGGKGRHRRHRAWMHQKGLGPRGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 EYVELLEVTLPVRGSPTDAEGSPGLSRVRTVPTRKGAGGKGRHRRHRAWMHQKGLGPRGQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD DGARPPGEGSSTGASPESPPGAEAVPEAAVLEVSEPPAEAVGEASGSCPLRPGELRGGGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DGARPPGEGSSTGASPESPPGAEAVPEAAVLEVSEPPAEAVGEASGSCPLRPGELRGGGG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD GGQGAEGPPGTPRRTGKGNRRKKRAAGRGALSRGGDSAPLSPGDKEDASHQEALGNLPSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 GGQGAEGPPGTPRRTGKGNRRKKRAAGRGALSRGGDSAPLSPGDKEDASHQEALGNLPSP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD SEHKLPECHLVKEEYEGSGKPESEPKELKTAGEKEPQLSEACGPTEEGAGERELEGPGLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SEHKLPECHLVKEEYEGSGKPESEPKELKTAGEKEPQLSEACGPTEEGAGERELEGPGLL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KSD CMAGHTGPEGPLSDTPTPPLETVQEGKGDNIPEEALAVSVSDHPDVAWDLMASGFLILTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 CMAGHTGPEGPLSDTPTPPLETVQEGKGDNIPEEALAVSVSDHPDVAWDLMASGFLILTG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KSD GVDQSGRALLTITPPCPPEEPPPSRDTLNTTLHYLHSLLRPDLQTLGLSVLLDLRQAPPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 GVDQSGRALLTITPPCPPEEPPPSRDTLNTTLHYLHSLLRPDLQTLGLSVLLDLRQAPPL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KSD PPALIPALSQLQDSGDPPLVQRLLILIHDDLPTELCGFQGAEVLSENDLKRVAKPEELQW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PPALIPALSQLQDSGDPPLVQRLLILIHDDLPTELCGFQGAEVLSENDLKRVAKPEELQW 610 620 630 640 650 660 670 680 690 700 710 720 pF1KSD ELGGHRDPSPSHWVEIHQEVVRLCRLCQGVLGSVRQAIEELEGAAEPEEEEAVGMPKPLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 ELGGHRDPSPSHWVEIHQEVVRLCRLCQGVLGSVRQAIEELEGAAEPEEEEAVGMPKPLQ 670 680 690 700 710 720 730 740 750 760 770 780 pF1KSD KVLADPRLTALQRDGGAILMRLRSTPSSKLEGQGPATLYQEVDEAIHQLVRLSNLHVQQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 KVLADPRLTALQRDGGAILMRLRSTPSSKLEGQGPATLYQEVDEAIHQLVRLSNLHVQQQ 730 740 750 760 770 780 790 800 810 820 830 840 pF1KSD EQRQCLRRLQQVLQWLSGPGEEQLASFAMPGDTLSALQETELRFRAFSAEVQERLAQARE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 EQRQCLRRLQQVLQWLSGPGEEQLASFAMPGDTLSALQETELRFRAFSAEVQERLAQARE 790 800 810 820 830 840 850 860 870 880 890 900 pF1KSD ALALEENATSQKVLDIFEQRLEQVESGLHRALRLQRFFQQAHEWVDEGFARLAGAGPGRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 ALALEENATSQKVLDIFEQRLEQVESGLHRALRLQRFFQQAHEWVDEGFARLAGAGPGRE 850 860 870 880 890 900 910 920 930 940 950 960 pF1KSD AVLAALALRRAPEPSAGTFQEMRALALDLGSPAALREWGRCQARCQELERRIQQHLGEEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::.:::: CCDS32 AVLAALALRRAPEPSAGTFQEMRALALDLGSPAALREWGRCQARCQELERRIQQHVGEEA 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KSD SPRGYRRRRADGASSGGAQWGPRSPSPSLSSLLLPSSPGPRPAPSHCSLAPCGEDYEEEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SPRGYRRRRADGASSGGAQWGPRSPSPSLSSLLLPSSPGPRPAPSHCSLAPCGEDYEEEG 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KSD PELAPEAEGRPPRAVLIRGLEVTSTEVVDRTCSPREHVLLGRARGPDGPWGVGTPRMERK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PELAPEAEGRPPRAVLIRGLEVTSTEVVDRTCSPREHVLLGRARGPDGPWGVGTPRMERK 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KSD RSISAQQRLVSELIACEQDYVATLSEPVPPPGPELTPELRGTWAAALSARERLRSFHRTH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 RSISAQQRLVSELIACEQDYVATLSEPVPPPGPELTPELRGTWAAALSARERLRSFHRTH 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KSD FLRELQGCATHPLRIGACFLRHGDQFSLYAQYVKHRHKLENGLAALSPSSKGSMEAGPYL :::::::::::::::::::::::::::::::::::::::::::::::: ::::::::::: CCDS32 FLRELQGCATHPLRIGACFLRHGDQFSLYAQYVKHRHKLENGLAALSPLSKGSMEAGPYL 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KSD PRALQQPLEQLTRYGRLLEELLREAGPELSSECRALGAAVQLLREQEARGRDLLAVEAVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PRALQQPLEQLTRYGRLLEELLREAGPELSSECRALGAAVQLLREQEARGRDLLAVEAVR 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KSD GCEIDLKEQGQLLHRDPFTVICGRKKCLRHVFLFEHLLLFSKLKGPEGGSEMFVYKQAFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 GCEIDLKEQGQLLHRDPFTVICGRKKCLRHVFLFEHLLLFSKLKGPEGGSEMFVYKQAFK 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KSD TADMGLTENIGDSGLCFELWFRRRRAREAYTLQATSPEIKLKWTSSIAQLLWRQAAHNKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 TADMGLTENIGDSGLCFELWFRRRRAREAYTLQATSPEIKLKWTSSIAQLLWRQAAHNKE 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KSD LRVQQMVSMGIGNKPFLDIKALGERTLSALLTGRAARTRASVAVSSFEHAGPSLPGLSPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LRVQQMVSMGIGNKPFLDIKALGERTLSALLTGRAARTRASVAVSSFEHAGPSLPGLSPG 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KSD ACSLPARVEEEAWDLDVKQISLAPETLDSSGDVSPGPRNSPSLQPPHPGSSTPTLASRGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 ACSLPARVEEEAWDLDVKQISLAPETLDSSGDVSPGPRNSPSLQPPHPGSSTPTLASRGI 1450 1460 1470 1480 1490 1500 1510 pF1KSD LGLSRQSHARALSDPTTPL ::::::::::::::::::: CCDS32 LGLSRQSHARALSDPTTPL 1510 >>CCDS32466.1 PLEKHG4 gene_id:25894|Hs108|chr16 (1191 aa) initn: 1058 init1: 627 opt: 1182 Z-score: 731.1 bits: 147.6 E(32554): 2.1e-34 Smith-Waterman score: 1456; 32.4% identity (56.8% similar) in 1136 aa overlap (369-1444:46-1108) 340 350 360 370 380 390 pF1KSD EAVGEASGSCPLRPGELRGGGGGGQGAEGPPGTPRRTGKGNRRKKRAAGRGALSRGGDSA :: :: . : . .. : . ::: . CCDS32 GHATDWRFAVCSFRDAWEEEEPASQMHVKDPGPPRPPA-GATQDEELQG-SPLSRKFQLP 20 30 40 50 60 70 400 410 420 430 440 450 pF1KSD PLSP--GDKEDASHQEA--LGNLPSPSEHKLPECHLVKEEYEGSGKPESEPKELKTAGEK : . :: . .. . . :.. :.:: . : . .. ..: ::. . .:. CCDS32 PAADESGDAQRGTVESSSVLSEGPGPSGVESLLCPMSSHLSLAQG--ESDTPGVGLVGDP 80 90 100 110 120 130 460 470 480 490 500 510 pF1KSD EPQLSEACGPTEEGAGERELEGPGLLCMAGHTGPEGPLSDTPTPPLETVQEGKGDNIPEE :. . : . :: . . : : :::. . ::.. :.: : . CCDS32 GPSRAMPSGLSP-GALDSDPVGLG-----------DPLSEI-SKLLEAAPSGSGLPKPAD 140 150 160 170 520 530 540 550 560 570 pF1KSD ALAVSVSDHPDVAWDLMASGFLILTGGVDQSGRALLTITPPCPPE-EPPPSRDTLNTTLH : .. :. :.:.:::. : : : .:::.: . : . : . : : CCDS32 CLLAQ-----DLCWELLASGMATLPGTRDVQGRAVLLLCAHSPAWLQSECSSQELIRLLL 180 190 200 210 220 230 580 590 600 610 620 630 pF1KSD YLHSLLRPDLQTLGLSVLLDLRQAPPLPPALIPALSQLQDSGDPPLVQRLLI--LIHDDL ::.:. ::..:.:::.::.: : : .:. .:::::... . : ::. . .. CCDS32 YLRSIPRPEVQALGLTVLVDARICAP-SSSLFSGLSQLQEAAPGAVYQVLLVGSTLLKEV 240 250 260 270 280 290 640 650 660 670 680 690 pF1KSD PTELCGFQGAEVLSENDLKRVAKPEELQWELGGHRDPSPSHWVEIHQEVVRLCRLCQGVL :. :.: .. :.. : .. : ::: . :....... : . ::.. CCDS32 PS---GLQLEQLPSQSLLTHIPTAG-LPTSLGGGLPYCHQAWLDFRRRLEALLQNCQAAC 300 310 320 330 340 700 710 720 730 740 pF1KSD GSVRQAIEELEGAAEPEEEEAVG--MPKP---LQKVLADPRLTALQRDGGAILMRLRS-- . .. ::: .... .: : :: . . .:.:: .: :. :: .:: : :.. CCDS32 ALLQGAIESVKAVPQPMEPGEVGQLLQQTEVLMQQVLDSPWLAWLQCQGGRELTWLKQEV 350 360 370 380 390 400 750 760 770 780 790 pF1KSD -----TPSSKLEGQGPATLYQEVDEAIHQLVRLSNLHVQQQEQRQCLRR----LQQVLQW .:. . . ::..:: .:::. :: ..: : : :. :.:. : CCDS32 PEVTLSPDYRTAMDKADELYDRVDGLLHQLTLQSNQRIQALELVQTLEARESGLHQIEVW 410 420 430 440 450 460 800 810 820 830 840 pF1KSD LSGPGEEQLASFAMPGDTLSALQETELRFRAFSAEVQERLAQAREAL-------ALEENA :. : : . : .:. : ... :. . .::.. :... : : : . CCDS32 LQQVGWPALEEAGEP--SLDMLLQAQGSFQELYQVAQEQVRQGEKFLQPLTGWEAAELDP 470 480 490 500 510 520 850 860 870 880 890 pF1KSD TSQKVLDI------FEQRLEQVESGLHRALRLQRFFQQAHEWVDEG---FARLAGAGPGR . . : . : . : : . : : :: ..:..: :..:: .:.: :: CCDS32 PGARFLALRAQLTEFSRALAQRCQRLADAERLFQLFREALTWAEEGQRVLAELEQERPG- 530 540 550 560 570 580 900 910 920 930 940 950 pF1KSD EAVLAALALR--RAPEPSAGTFQEMRALALDLGSPAALREWGRCQARCQELERRIQQHLG .:: : :. : :. . :..: ::: ::: : .: ::::. ..:.: CCDS32 -VVLQQLQLHWTRHPDLPPAHFRKMWALATGLGSEAIRQECRWAWARCQDTWLALDQKL- 590 600 610 620 630 640 960 970 980 990 1000 1010 pF1KSD EEASPRGYRRRRADGASSGGAQWGPRSPSPSLSSLLLPSSPGPRPAPSHCSLAPCGEDYE ::: . : : : .:: . . :. ::.: : . CCDS32 -EASLKL-----------------P--PVGSTASLCVSQVPA---APAHPPLRKAYSFDR 650 660 670 680 1020 1030 1040 1050 1060 1070 pF1KSD EEGPELAPEAEGRPPRAVLIRGLEVTSTEVVDRTCSPREHVLLGRARGPDGPWGVGTPRM . : :. : :.. .: : : . :.. : : CCDS32 NLGQSLSEPACHCHHAATIA-------------ACRRPEA---GGGALPQASPTVPPPGS 690 700 710 720 1080 1090 1100 1110 1120 1130 pF1KSD ERKRSISAQQRLVSELIACEQDYVATLSEPVPPPGPEL----TPE-LRGTWAAALSARER ::.. : ...:..: :..:: .: . ::: .:. ::: : .. :. CCDS32 SDPRSLNRLQLVLAEMVATEREYVRALEYTMENYFPELDRPDVPQGLRGQRAHLFGNLEK 730 740 750 760 770 780 1140 1150 1160 1170 1180 1190 pF1KSD LRSFHRTHFLRELQGCATHPLRIGACFLRHGDQFSLYAQYVKHRHKLENGLAALSPSS-K ::.:: :::::..:. :: :.. :::: ::..:: : :.. . . ... . . : CCDS32 LRDFHCHFFLRELEACTRHPPRVAYAFLRHRVQFGMYALYSKNKPRSDALMSSYGHTFFK 790 800 810 820 830 840 1200 1210 1220 1230 1240 pF1KSD GSMEA-GPYLPRA--LQQPLEQLTRYGRLLEELLREAGPELSSECRALGAAVQLLREQEA ...: : .: : : .:.... .:. ::.:: : : ..: :: : .:.. : CCDS32 DKQQALGDHLDLASYLLKPIQRMGKYALLLQELARACGGP-TQELSALREAQSLVHFQLR 850 860 870 880 890 900 1250 1260 1270 1280 1290 1300 pF1KSD RGRDLLAVEAVRGCEIDLKEQGQLLHRDPFTVICGRKKCLRHVFLFEHLLLFSKLKGPEG .: ::::..:..::...:::::::...: :.: ::.: .:..::::.:::::: . CCDS32 HGNDLLAMDAIQGCDVNLKEQGQLVRQDEFVVRTGRHKSVRRIFLFEELLLFSKPRHGPT 910 920 930 940 950 960 1310 1320 1330 1340 1350 1360 pF1KSD GSEMFVYKQAFKTADMGLTENIGDSGLCFELWFRRRRAREAYTLQATSPEIKLKWTSSIA : . :.::..:: ::.:::: :.:.: ::.:::::.::....:::.: :: ::..:. CCDS32 GVDTFAYKRSFKMADLGLTECCGNSNLRFEIWFRRRKARDTFVLQASSLAIKQAWTADIS 970 980 990 1000 1010 1020 1370 1380 1390 1400 1410 1420 pF1KSD QLLWRQAAHNKELRVQQMVSMGIGNKPFLDI----KALGERTLSALLTGRAARTRASVAV .::::::.::::.:. .:::::.::: : :: .:...::.. .: : .:.:::.:: CCDS32 HLLWRQAVHNKEVRMAEMVSMGVGNKAFRDIAPSEEAINDRTVNYVLKCREVRSRASIAV 1030 1040 1050 1060 1070 1080 1430 1440 1450 1460 1470 pF1KSD SSFEH------AGPSLPGLSPGACSLPARVEEEAWDLDVKQISLAPETLDSSGDVSPGPR . :.: :. :::: .:..::. CCDS32 APFDHDSLYLGASNSLPG-DPASCSVLGSLNLHLYRDPALLGLRCPLYPSFPEEAALEAE 1090 1100 1110 1120 1130 1140 >>CCDS45512.1 PLEKHG4 gene_id:25894|Hs108|chr16 (1110 aa) initn: 1058 init1: 627 opt: 1123 Z-score: 695.5 bits: 141.0 E(32554): 2e-32 Smith-Waterman score: 1384; 33.0% identity (57.3% similar) in 1044 aa overlap (466-1444:35-1027) 440 450 460 470 480 490 pF1KSD EGSGKPESEPKELKTAGEKEPQLSEACGPTEEGAGERELEGPGL-LCMAGHTGPE----G :: :.. ... :: :: : : . CCDS45 LENGDESPDSQGHATDWRFAVCSFRDAWEEEEPASQMHVKDPGPPRPPAGATQDEELQGS 10 20 30 40 50 60 500 510 520 530 540 pF1KSD PLSDT-PTPPLETVQEGKGDNIPEEALAVSVSDHPDVAWDL---MASGFLILTGGVDQSG ::: :: . . : . ..: . :. . .: :.: . . : : .: CCDS45 PLSRKFQLPPAADESGDAQRGTVESSSVLSEGPGPSGVESLLCPMSSHLSLAQGTRDVQG 70 80 90 100 110 120 550 560 570 580 590 600 pF1KSD RALLTITPPCPPE-EPPPSRDTLNTTLHYLHSLLRPDLQTLGLSVLLDLRQAPPLPPALI ::.: . : . : . : : ::.:. ::..:.:::.::.: : : .:. CCDS45 RAVLLLCAHSPAWLQSECSSQELIRLLLYLRSIPRPEVQALGLTVLVDARICAP-SSSLF 130 140 150 160 170 180 610 620 630 640 650 660 pF1KSD PALSQLQDSGDPPLVQRLLI--LIHDDLPTELCGFQGAEVLSENDLKRVAKPEELQWELG .:::::... . : ::. . ..:. :.: .. :.. : .. : :: CCDS45 SGLSQLQEAAPGAVYQVLLVGSTLLKEVPS---GLQLEQLPSQSLLTHIPTAG-LPTSLG 190 200 210 220 230 670 680 690 700 710 pF1KSD GHRDPSPSHWVEIHQEVVRLCRLCQGVLGSVRQAIEELEGAAEPEEEEAVG--MPKP--- : . :....... : . ::.. . .. ::: .... .: : :: . . CCDS45 GGLPYCHQAWLDFRRRLEALLQNCQAACALLQGAIESVKAVPQPMEPGEVGQLLQQTEVL 240 250 260 270 280 290 720 730 740 750 760 770 pF1KSD LQKVLADPRLTALQRDGGAILMRLRS-------TPSSKLEGQGPATLYQEVDEAIHQLVR .:.:: .: :. :: .:: : :.. .:. . . ::..:: .:::. CCDS45 MQQVLDSPWLAWLQCQGGRELTWLKQEVPEVTLSPDYRTAMDKADELYDRVDGLLHQLTL 300 310 320 330 340 350 780 790 800 810 820 pF1KSD LSNLHVQQQEQRQCLRR----LQQVLQWLSGPGEEQLASFAMPGDTLSALQETELRFRAF :: ..: : : :. :.:. ::. : : . : .:. : ... :. . CCDS45 QSNQRIQALELVQTLEARESGLHQIEVWLQQVGWPALEEAGEP--SLDMLLQAQGSFQEL 360 370 380 390 400 410 830 840 850 860 870 pF1KSD SAEVQERLAQAREAL-------ALEENATSQKVLDI------FEQRLEQVESGLHRALRL .::.. :... : : : . . . : . : . : : . : : :: CCDS45 YQVAQEQVRQGEKFLQPLTGWEAAELDPPGARFLALRAQLTEFSRALAQRCQRLADAERL 420 430 440 450 460 470 880 890 900 910 920 pF1KSD QRFFQQAHEWVDEG---FARLAGAGPGREAVLAALALR--RAPEPSAGTFQEMRALALDL ..:..: :..:: .:.: :: .:: : :. : :. . :..: ::: : CCDS45 FQLFREALTWAEEGQRVLAELEQERPG--VVLQQLQLHWTRHPDLPPAHFRKMWALATGL 480 490 500 510 520 530 930 940 950 960 970 980 pF1KSD GSPAALREWGRCQARCQELERRIQQHLGEEASPRGYRRRRADGASSGGAQWGPRSPSPSL :: : .: ::::. ..:.: ::: . : : : CCDS45 GSEAIRQECRWAWARCQDTWLALDQKL--EASLKL-----------------P--PVGST 540 550 560 570 990 1000 1010 1020 1030 1040 pF1KSD SSLLLPSSPGPRPAPSHCSLAPCGEDYEEEGPELAPEAEGRPPRAVLIRGLEVTSTEVVD .:: . . :. ::.: : .. : :. : :.. CCDS45 ASLCVSQVPA---APAHPPLRKAYSFDRNLGQSLSEPACHCHHAATIA------------ 580 590 600 610 1050 1060 1070 1080 1090 1100 pF1KSD RTCSPREHVLLGRARGPDGPWGVGTPRMERKRSISAQQRLVSELIACEQDYVATLSEPVP .: : : . :.. : : ::.. : ...:..: :..:: .: . CCDS45 -ACRRPEA---GGGALPQASPTVPPPGSSDPRSLNRLQLVLAEMVATEREYVRALEYTME 620 630 640 650 660 670 1110 1120 1130 1140 1150 1160 pF1KSD PPGPEL----TPE-LRGTWAAALSARERLRSFHRTHFLRELQGCATHPLRIGACFLRHGD ::: .:. ::: : .. :.::.:: :::::..:. :: :.. :::: CCDS45 NYFPELDRPDVPQGLRGQRAHLFGNLEKLRDFHCHFFLRELEACTRHPPRVAYAFLRHRV 680 690 700 710 720 730 1170 1180 1190 1200 1210 1220 pF1KSD QFSLYAQYVKHRHKLENGLAALSPSS-KGSMEA-GPYLPRA--LQQPLEQLTRYGRLLEE ::..:: : :.. . . ... . . : ...: : .: : : .:.... .:. ::.: CCDS45 QFGMYALYSKNKPRSDALMSSYGHTFFKDKQQALGDHLDLASYLLKPIQRMGKYALLLQE 740 750 760 770 780 790 1230 1240 1250 1260 1270 1280 pF1KSD LLREAGPELSSECRALGAAVQLLREQEARGRDLLAVEAVRGCEIDLKEQGQLLHRDPFTV : : : ..: :: : .:.. : .: ::::..:..::...:::::::...: :.: CCDS45 LARACGGP-TQELSALREAQSLVHFQLRHGNDLLAMDAIQGCDVNLKEQGQLVRQDEFVV 800 810 820 830 840 850 1290 1300 1310 1320 1330 1340 pF1KSD ICGRKKCLRHVFLFEHLLLFSKLKGPEGGSEMFVYKQAFKTADMGLTENIGDSGLCFELW ::.: .:..::::.:::::: . : . :.::..:: ::.:::: :.:.: ::.: CCDS45 RTGRHKSVRRIFLFEELLLFSKPRHGPTGVDTFAYKRSFKMADLGLTECCGNSNLRFEIW 860 870 880 890 900 910 1350 1360 1370 1380 1390 pF1KSD FRRRRAREAYTLQATSPEIKLKWTSSIAQLLWRQAAHNKELRVQQMVSMGIGNKPFLDI- ::::.::....:::.: :: ::..:..::::::.::::.:. .:::::.::: : :: CCDS45 FRRRKARDTFVLQASSLAIKQAWTADISHLLWRQAVHNKEVRMAEMVSMGVGNKAFRDIA 920 930 940 950 960 970 1400 1410 1420 1430 1440 1450 pF1KSD ---KALGERTLSALLTGRAARTRASVAVSSFEH------AGPSLPGLSPGACSLPARVEE .:...::.. .: : .:.:::.::. :.: :. :::: .:..::. CCDS45 PSEEAINDRTVNYVLKCREVRSRASIAVAPFDHDSLYLGASNSLPG-DPASCSVLGSLNL 980 990 1000 1010 1020 1030 1460 1470 1480 1490 1500 1510 pF1KSD EAWDLDVKQISLAPETLDSSGDVSPGPRNSPSLQPPHPGSSTPTLASRGILGLSRQSHAR CCDS45 HLYRDPALLGLRCPLYPSFPEEAALEAEAELGGQPSLTAEDSEISSQCPSASGSSGSDSS 1040 1050 1060 1070 1080 1090 >>CCDS34124.1 PLEKHG4B gene_id:153478|Hs108|chr5 (1271 aa) initn: 1115 init1: 460 opt: 917 Z-score: 569.2 bits: 117.8 E(32554): 2.2e-25 Smith-Waterman score: 1373; 31.1% identity (55.1% similar) in 1197 aa overlap (344-1432:38-1183) 320 330 340 350 360 370 pF1KSD ASPESPPGAEAVPEAAVLEVSEPPAEAVGEASGSCPLRPGELRGGGGGGQGAEGPPGTPR :::. : :: . : :: CCDS34 MPLGSSEEALGDLACSSLTGASRDLGTGAVASGTQEETSGP-RGDPQQTPSLEKERHTPS 10 20 30 40 50 60 380 390 400 410 420 430 pF1KSD RTGKGNRRKKRAAGRGALSRGGDSAPLSPGDKEDASHQEALGNLPSPSEHKLPECHLVKE ::: : :::: .: : . : .: ... : : : . : . : :: . CCDS34 RTGPG------AAGR-TLPRRSRSWERAPRSSRGA--QAAACHTSHHSAGSRPGGHLGGQ 70 80 90 100 110 440 450 460 470 480 490 pF1KSD EYEGSGKPESEPKELKTAGEKEPQL-SEACGPTEEGAGERELEGPGLLCMAGHTGPEGPL . : :. : : ..: : : :: :. :. : : :. : :: CCDS34 ---AVGTPNCVPVEGPGCTKEEDVLASSACVSTDGGS---------LHC---HN-PSGP- 120 130 140 150 160 500 510 520 530 540 pF1KSD SDTPT----PPLETVQEGKGD---NIPEEALAVSVSDHPDVAWDLMASGFLILTGGVDQS ::.:. : : : :: ..:...: ::. .:. :: . : : :. CCDS34 SDVPARQPHPEQEGWPPGTGDFPSQVPKQVL--------DVSQELLQSGVVTLPGTRDRH 170 180 190 200 210 550 560 570 580 590 600 pF1KSD GRALLTI-TPPCPPEEPPPSRDTLNTTLHYLHSLLRPDLQTLGLSVLLDLRQAPPLPPAL :::.. . : . : :. : :.::. : ... ::: ::.: :..: ::. CCDS34 GRAVVQVRTRSLLWTREHSSCAELTRLLLYFHSIPRKEVRDLGLVVLVDARRSPA-APAV 220 230 240 250 260 270 610 620 630 640 650 660 pF1KSD IPALSQLQDSGDPPLVQRLLILIHDDL---PTELCGFQGAEVLSENDLKRVAKPEELQWE ::: ::.. :... .:.:. . : . .: : : . ... . .: . CCDS34 SQALSGLQNN-TSPIIHSILLLVDKESAFRPDKDAIIQCEVVSSLKAVHKFVDSCQLTAD 280 290 300 310 320 330 670 680 690 700 710 pF1KSD LGGHRDPSPSHWVEIHQEVVRLCRLCQGVLGSVRQAIEELEGAAEP----EEEEAVGMPK : : : . :. ..:.. .. :. .. ..... :. : : : . . . CCDS34 LDGSFPYSHGDWICFRQRLEHFAANCEEAIIFLQNSFCSLNTHRTPRTAQEVAELIDQHE 340 350 360 370 380 390 720 730 740 750 760 770 pF1KSD PLQK-VLADPRLTALQRDGGAILMRLR----STPSSKLEGQGPATLYQEVDEAIHQLVRL ..: :: :: :..:. .::..: ::: .: .:. .. ..::..::: .:.:: CCDS34 TMMKLVLEDPLLVSLRLEGGTVLARLRREELGTEDSRDTLEAATSLYDRVDEEVHRLVLT 400 410 420 430 440 450 780 790 800 810 820 830 pF1KSD SNLHVQQQEQRQCLRRLQQVLQWLSGPGEEQLASFAMPGDTLSALQETELRFRAFSAEVQ :: ..:: :. . : : . . : :::. : : .:. .: :..:: :. CCDS34 SNNRLQQLEHLRELASLLEGNDQQSCQKGLQLAK-ENPQRTEEMVQD--FR-RGLSAVVS 460 470 480 490 500 840 850 860 870 880 890 pF1KSD ERLAQAREALALEENATSQKVLDIFEQRLEQVESGLHRALRLQRFFQQAHEWVDEGFARL . :. ::. : . . :... . . . .. . . . ... :. :. . CCDS34 Q--AECREG-ELARWTRSSELCETVSSWMGPLDPEACPSSPVAECLRSCHQ---EATSVA 510 520 530 540 550 560 900 910 920 930 940 950 pF1KSD AGAGPGRE-AVLAALALRRAPEPSAGTFQEMRALALDLGSPAALREWGRCQARCQELERR : : :: ::: :: . . . .. : : :: : . . : . CCDS34 AEAFPGAGVAVLKPHALGKPWASQQDLWLQYPQTRLRL--EEALSE-AAPDPSLPPLAQS 570 580 590 600 610 960 970 980 990 pF1KSD IQQHL-GEEASPRGYRRRRADGASSGGAQWGPRSP------------------SPSLSSL .: ..:: : . ...:::. : : .: :.: .: CCDS34 PPKHERAQEAMRRHQKPPSFPSTDSGGGAWEPAQPLSGLPGRALLCGQDGETLRPGLCAL 620 630 640 650 660 670 1000 1010 1020 pF1KSD LLPSS-----PGPRPAPSH------CSLAPCG------------------EDYEEEGPEL : : :: . .: :: : ...: :. CCDS34 WDPLSLLRGLPGAGATTAHLEDSSACSSEPTQTLASRPRKHPQKKMIKKTQSFEIPQPDS 680 690 700 710 720 730 1030 1040 1050 1060 1070 pF1KSD APEAEGRPPR-AVLIRGLEVTSTEVVDRTCSPREHVL---LGRARGPDGPWGVGTPRMER .:. .: . .:. .::::::: .... .:. . ..:. ..: :. : : CCDS34 GPRDSCQPDHTSVFSKGLEVTSTVATEKKLPLWQHARSPPVTQSRSLSSPSGLH-PAEED 740 750 760 770 780 790 1080 1090 1100 1110 1120 1130 pF1KSD KRSISAQQRL---VSELIACEQDYVATLSEPVPPPGPELT----PE-LRGTWAAALSARE :. ...:: ..:.:: :..:. :. . ::. :. ::: . .. : CCDS34 GRQQVGSSRLRHIMAEMIATEREYIRCLGYVIDNYFPEMERMDLPQGLRGKHHVIFGNLE 800 810 820 830 840 850 1140 1150 1160 1170 1180 pF1KSD RLRSFHRTHFLRELQGCATHPLRIGACFLRHGDQFSLYAQYVKHRHKLENGLAALSPS-- .:..::. ::::::. : :: .: :::: .::..:. : :.. . . :.. . . CCDS34 KLHDFHQQHFLRELERCQHCPLAVGRSFLRHEEQFGMYVIYSKNKPQSDALLSSHGNAFF 860 870 880 890 900 910 1190 1200 1210 1220 1230 1240 pF1KSD SKGSMEAGPYLPRA--LQQPLEQLTRYGRLLEELLREA--GPELSSECRALGAAVQLLRE . . : : . : : .:......:. ::..::.:: : ..: : :: .. CCDS34 KDKQRELGDKMDLASYLLRPVQRVAKYALLLQDLLKEASCGLAQGQELGELRAAEVVVCF 920 930 940 950 960 970 1250 1260 1270 1280 1290 1300 pF1KSD QEARGRDLLAVEAVRGCEIDLKEQGQLLHRDPFTVICGRKKCLRHVFLFEHLLLFSKLKG : .: ::::..:.:::...::::::: :: : : ::::: :::::::: :.:::: . CCDS34 QLRHGNDLLAMDAIRGCDVNLKEQGQLRCRDEFIVCCGRKKYLRHVFLFEDLILFSKTQK 980 990 1000 1010 1020 1030 1310 1320 1330 1340 1350 1360 pF1KSD PEGGSEMFVYKQAFKTADMGLTENIGDSGLCFELWFRRRR-AREAYTLQATSPEIKLKWT ::. ....:::.::::..:.:::.::::: ::.:::::: ....: :::.: :.: :: CCDS34 VEGSHDVYLYKQSFKTAEIGMTENVGDSGLRFEIWFRRRRKSQDTYILQASSAEVKSAWT 1040 1050 1060 1070 1080 1090 1370 1380 1390 1400 pF1KSD SSIAQLLWRQAAHNKELRVQQMVSMGIGNKPFLDIK-------------------ALGER . :...::::: ...:::.:.:.::::::.::.:.: ....: CCDS34 DVIGRILWRQALKSRELRIQEMASMGIGNQPFMDVKPRDRTPDCAVISDRAPKCAVMSDR 1100 1110 1120 1130 1140 1150 1410 1420 1430 1440 1450 1460 pF1KSD TLSALLTGRAARTRASVAVSSFEHAGPSLPGLSPGACSLPARVEEEAWDLDVKQISLAPE . .... : .. :.:.:::: .::.: CCDS34 VPDSIVKGTESQMRGSTAVSSSDHAAPFKRPHSTISDSSTSSSSSQSSSILGSLGLLVSS 1160 1170 1180 1190 1200 1210 >>CCDS33467.1 KIAA1755 gene_id:85449|Hs108|chr20 (1200 aa) initn: 829 init1: 626 opt: 637 Z-score: 398.8 bits: 86.2 E(32554): 6.8e-16 Smith-Waterman score: 1008; 28.2% identity (52.4% similar) in 1218 aa overlap (1-1077:1-1172) 10 20 30 40 50 60 pF1KSD MEPEPVEDCVQSTLAALYPPFEATAPTLLGQVFQVVERTYREDALRYTLDFLVPAKHLLA :.: .. .: .::.:::::::::::.:::::.... .. :.: . ::::.:::.: CCDS33 MDPPSLDTAIQHALAGLYPPFEATAPTVLGQVFRLLDSGFQGDGLSFLLDFLIPAKRLCE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD KVQQEACAQYSGFLFFHEGWPLCLHEQVVVQLAALPWQLLRPGDFYLQVVPSAAQAPRLA .:.. ::: :: ::.::::::::...:::.:: : ::: ::::::: :. :. . CCDS33 QVREAACAPYSHCLFLHEGWPLCLRDEVVVHLAPLNPLLLRQGDFYLQVEPQEEQSVCIM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD LKCLAPGGGRVQEVPVPNEACAYLFTPEWLQGINKDRPTGRLSTCLLSAPSGIQRLPWAE .:::. :.. :::. : ::: :::..::.: . : .::... .:: .::.. CCDS33 IKCLSLDLCTVDKKPVPEPAYPILFTQEWLEAINSDFEGNPLHNCLVASENGIAPVPWTK 130 140 150 160 170 180 190 200 210 220 pF1KSD LICPRFVHKEGLMV-------GHQPS-----TLPPEL--PSGPPG--LPSPPLPE---EA . :.:: . .: : : . : :: :.: . ::. : . .. CCDS33 ITSPEFVDDRPQVVNALCQAWGPLPLEALDLSSPQELHQASSPDNQVLPAQSLAKGKGRT 190 200 210 220 230 240 230 240 250 260 pF1KSD LGTRSPG-----DGHNAPV---------EGPEGEYVELLEVTLPVRG-SPTDAEGSPGLS :.. :: ... . : . ::.:: :: . :: ::. :. : CCDS33 YGSKYPGLIKVEQARCGEVAFRMDEVVSQDFEGDYVALLGFSQESRGESPSREAGTS--S 250 260 270 280 290 270 280 290 300 310 pF1KSD RVRTVPTRKGAGGKGRHRRHRAW-MHQKGLGPRGQDGA---------RPPGEGSSTGASP . .. :: : .. . . . :: . : :: . : .. CCDS33 GCTSGALEEIAGTKETPLFQKILPLSEANEGPSLGNRACTKPESSEERPYNLGFRRKVNL 300 310 320 330 340 350 320 330 340 350 360 370 pF1KSD ESPP-GAEAVPEAAVLEVSEPPAEAVGEASGSCPLRPGELRGGGGGGQGAEGPPGTPRRT ..: ..: :... ..: : .:. ::: :: : . ... . .:: :.:. CCDS33 KAPTHNSERPPQGSYMNVLE---DALDCASG---LRAGVSQEPAASKM--QGPLGNPENM 360 370 380 390 400 410 380 390 400 410 420 pF1KSD GKGNRRKKRAAGRGALSRGGDSAPLSPGDKEDASHQEALGNLPSP-------SEHKLPEC . : : :. :: .. .: : : ... .: : ::.: . : CCDS33 VQL-RPGPRQASSPRLSPASPAAAASE-TKIEVKTKERNGRLPKPMPCPSRNTSSPEPPT 420 430 440 450 460 430 440 450 460 470 pF1KSD HLVKEEY-EGSGKPESEPKE--LKTAGEKE-------PQLSEACGPTEEGAGERELEGPG .: . .:. .: :.. :. : . :. ..: . . :. . . ::. CCDS33 PGLKFSFLRGQRQPSVTPEKASLQHNGPWKVLCSLYSPKPNRAKSLGKAGTTQTKTSGPA 470 480 490 500 510 520 480 490 500 510 520 530 pF1KSD LLCMAGHTGPEGPLSDTPT--PPLETVQEGKGDNIPEEALAVSVSDHPDVAW---DLMAS :.: .::.. . : . . .: .. :: . .: .. .. : CCDS33 -------TAP-SPLTEEKAALPEASAGSPERGPTLEEEP----PGPEPRIGALGVKVFRS 530 540 550 560 570 540 550 560 570 580 590 pF1KSD GFLILTGGVDQSGRALLTITPPCPPEEPPP-SRDTLNTTLHYLHSLLRPDLQTLGLSVLL . : :: :..:: :: .. : : . . .. : :: .. ::. .. ::.::. CCDS33 RIACLPGGRDRAGRPLLLVSTTEGAWEAPWCTVSEVTKLLSYLCTIPRPEDKAKGLAVLI 580 590 600 610 620 630 600 610 620 630 640 650 pF1KSD DLRQAPPLPPALIPALSQLQDSGDPPLVQRLLILIHDDLPTELCGFQGAEVLSENDLKRV : :. :: :.:. ::. : . : .. .:.: . . .: . ..: ..:: . CCDS33 DARRQPP-QPGLVSALQATQ-AQVPASIRAILFLGEKEAALQLQTLPDVQVEVLTSLKAL 640 650 660 670 680 690 660 670 680 690 700 pF1KSD AK---PEELQWELGGHRDPSPSHWVEIHQEV-VRLCRLCQGVLGSVRQA-IEELEGAAEP .. : .: : : ..::.. :.. : : :. .:. :: :::.: : : CCDS33 SHHVDPSQLPAVLEGPFPYCHTEWVHFFQKLDPFLADLHQA--SSLLQASIEEFEKADPP 700 710 720 730 740 750 710 720 730 740 750 pF1KSD ----EEEEAVGMPKPLQK-VLADPRLTALQRDGGAILMRLRS-------TPSSKLEGQGP : . .. : :.. :: :: : .:::.::: : ::. .:. . . . CCDS33 GGMQEATRCLSKSKELMEAVLRDPGLLGLQREGGATLARLQHDASRLDFSPDVRSHLAAA 760 770 780 790 800 810 760 770 780 790 800 810 pF1KSD ATLYQEVDEAIHQLVRLSNLHVQQQEQRQCLRRLQ----QVLQWLSGPGEEQLASFAMPG ..::. ::: .: :: :: . . : : : ::. :: .:. :.. : :.. CCDS33 TALYSLVDEQLHVLVTASNSLLGKLELRVRLGRLEAAIHQVSDWMEQEGRRCLQSLTPKD 820 830 840 850 860 870 820 830 840 pF1KSD DTLSALQETELRFRAF--SAEVQERL------------AQAREALALEEN--------AT .: ...... .:. : .: .: : : :: : :. :. CCDS33 GSLETVEKAHAEFENFFLQAAAQYRRGLELSKQAAQLGATARGAGEAERAEFPELAAFAS 880 890 900 910 920 930 850 860 870 880 890 pF1KSD SQKVLDI----FEQRLEQVESGLHRALRLQRFFQQA---HEWVDEGFARL-----AGAGP .:.... : . :. .. :. :.:.:: .. : .. .:.: . ..: CCDS33 TQRAFQAELTHFYMAAERQRTDLETLLHLHRFCKRMTWFHMDCQDLMAQLRLDKTSRVSP 940 950 960 970 980 990 900 910 920 930 940 950 pF1KSD GREAVLAALALRRAPEPSAGTFQEMRALALDLGS--PAALRE--WGRCQARCQELERRIQ : . : : : : : ... :..:...: :.: . : . . : .:.. .. CCDS33 GDQRRLHRYLQRLASEFPA---EKLAAVGLQVASLSRAGLGQELWEEARIRHEEIRMLLE 1000 1010 1020 1030 1040 960 970 980 990 pF1KSD QHLGEEASP--------RGYRR---RRADGAS---SGGAQWGPRSPSPSLSSLLLPSSPG . : . . : : :: ...:.: .. ..: . : ::. ::.: CCDS33 KALTHSSCPEAPAAHSARPERRGVAAKGQGVSVEVTSKGRWD-QPPLDSLGMDHLPKSYW 1050 1060 1070 1080 1090 1100 1000 1010 1020 1030 1040 1050 pF1KSD PRPAPSHCSLAPCGEDYEEEGPELAPEAEGRPPRAVLIRGLEVTSTEVVDRTCSPREHVL : :.: : ::. . :. :. .: .: : .. : :::.: CCDS33 P-PGP------PRGEQNRTFQAGSPPQEAGQAAEAEDGKG----SHKLPD---PAREHLL 1110 1120 1130 1140 1150 1060 1070 1080 1090 1100 1110 pF1KSD LGRARGPDGPWGVGTPRMERKRSISAQQRLVSELIACEQDYVATLSEPVPPPGPELTPEL . : .::. CCDS33 ATTFFRQQPPRQSQVPRLTGGSFSSEGTDSQTSLEDSPQTSPLASL 1160 1170 1180 1190 1200 1519 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 19:24:20 2016 done: Thu Nov 3 19:24:21 2016 Total Scan time: 5.530 Total Display time: 0.360 Function used was FASTA [36.3.4 Apr, 2011]