FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1112, 670 aa
1>>>pF1KSDA1112 670 - 670 aa - 670 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.3011+/-0.000927; mu= 10.9037+/- 0.055
mean_var=151.2098+/-31.259, 0's: 0 Z-trim(110.6): 153 B-trim: 0 in 0/50
Lambda= 0.104300
statistics sampled from 11587 (11765) to 11587 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.706), E-opt: 0.2 (0.361), width: 16
Scan time: 3.990
The best scores are: opt bits E(32554)
CCDS42754.1 ARHGEF4 gene_id:50649|Hs108|chr2 ( 670) 4617 707.0 2.1e-203
CCDS2165.1 ARHGEF4 gene_id:50649|Hs108|chr2 ( 690) 4426 678.3 9.8e-195
CCDS9305.1 SPATA13 gene_id:221178|Hs108|chr13 ( 652) 2225 347.1 4.7e-95
CCDS53857.1 SPATA13 gene_id:221178|Hs108|chr13 (1277) 2225 347.3 7.8e-95
CCDS66517.1 SPATA13 gene_id:221178|Hs108|chr13 ( 574) 2193 342.2 1.2e-93
CCDS66518.1 SPATA13 gene_id:221178|Hs108|chr13 ( 596) 2190 341.8 1.7e-93
CCDS35315.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 516) 2044 319.8 6.2e-87
CCDS83477.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 495) 1961 307.3 3.5e-83
CCDS55430.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 463) 1726 271.9 1.4e-72
CCDS55429.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 414) 1694 267.0 3.7e-71
CCDS73553.1 SPATA13 gene_id:221178|Hs108|chr13 ( 512) 1516 240.3 5.1e-63
CCDS6201.1 PREX2 gene_id:80243|Hs108|chr8 (1606) 675 114.2 1.5e-24
CCDS13410.1 PREX1 gene_id:57580|Hs108|chr20 (1659) 648 110.1 2.6e-23
CCDS76690.1 PLEKHG3 gene_id:26030|Hs108|chr14 (1219) 487 85.8 4e-16
CCDS34552.1 PLEKHG1 gene_id:57480|Hs108|chr6 (1385) 431 77.4 1.5e-13
CCDS45069.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 753) 402 72.8 2e-12
CCDS32009.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 782) 402 72.8 2e-12
CCDS45068.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 803) 402 72.8 2.1e-12
CCDS33424.1 FARP2 gene_id:9855|Hs108|chr2 (1054) 386 70.5 1.4e-11
CCDS9521.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 646) 379 69.3 1.9e-11
CCDS33022.2 PLEKHG2 gene_id:64857|Hs108|chr19 (1386) 384 70.3 2.1e-11
CCDS82664.1 ITSN1 gene_id:6453|Hs108|chr21 (1716) 377 69.3 5e-11
CCDS33545.1 ITSN1 gene_id:6453|Hs108|chr21 (1721) 377 69.3 5e-11
CCDS6979.1 VAV2 gene_id:7410|Hs108|chr9 ( 839) 367 67.6 8.2e-11
>>CCDS42754.1 ARHGEF4 gene_id:50649|Hs108|chr2 (670 aa)
initn: 4617 init1: 4617 opt: 4617 Z-score: 3765.1 bits: 707.0 E(32554): 2.1e-203
Smith-Waterman score: 4617; 100.0% identity (100.0% similar) in 670 aa overlap (1-670:1-670)
10 20 30 40 50 60
pF1KSD MPWEEPAGEKPSCSHSQKAFHMEPAQKPCFTTDMVTWALLCISAETVRGEAPSQPRGIPH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 MPWEEPAGEKPSCSHSQKAFHMEPAQKPCFTTDMVTWALLCISAETVRGEAPSQPRGIPH
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD RSPVSVDDLWLEKTQRKKLQKQAHVERRLHIGAVHKDGVKCWRKTIITSPESLNLPRRSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 RSPVSVDDLWLEKTQRKKLQKQAHVERRLHIGAVHKDGVKCWRKTIITSPESLNLPRRSH
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD PLSQSAPTGLNHMGWPEHTPGTAMPDGALDTAVCADEVGSEEDLYDDLHSSSHHYSHPGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 PLSQSAPTGLNHMGWPEHTPGTAMPDGALDTAVCADEVGSEEDLYDDLHSSSHHYSHPGG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD GGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGDVIEVMDATNREWWWGRVADGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGDVIEVMDATNREWWWGRVADGE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD GWFPASFVRLRVNQDEPADDDAPLAGNSGAEDGGAEAQSSKDQMRTNVINEILSTERDYI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GWFPASFVRLRVNQDEPADDDAPLAGNSGAEDGGAEAQSSKDQMRTNVINEILSTERDYI
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD KHLRDICEGYVRQCRKRADMFSEEQLRTIFGNIEDIYRCQKAFVKALEQRFNRERPHLSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 KHLRDICEGYVRQCRKRADMFSEEQLRTIFGNIEDIYRCQKAFVKALEQRFNRERPHLSE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD LGACFLEHQADFQIYSEYCNNHPNACVELSRLTKLSKYVYFFEACRLLQKMIDISLDGFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 LGACFLEHQADFQIYSEYCNNHPNACVELSRLTKLSKYVYFFEACRLLQKMIDISLDGFL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD LTPVQKICKYPLQLAELLKYTHPQHRDFKDVEAALHAMKNVAQLINERKRRLENIDKIAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 LTPVQKICKYPLQLAELLKYTHPQHRDFKDVEAALHAMKNVAQLINERKRRLENIDKIAQ
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD WQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQAKSQQRMFFLFDHQLIYCKKDLLRRDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 WQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQAKSQQRMFFLFDHQLIYCKKDLLRRDV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD LYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAFRLHRGATGDSHLLCTRKPEQKQRWLKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 LYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAFRLHRGATGDSHLLCTRKPEQKQRWLKA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD FAREREQVQLDQETGFSITELQRKQAMLNASKQQVTGKPKGRRTAAPPPRLPGPYPADII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 FAREREQVQLDQETGFSITELQRKQAMLNASKQQVTGKPKGRRTAAPPPRLPGPYPADII
610 620 630 640 650 660
670
pF1KSD PFSEPQSQAS
::::::::::
CCDS42 PFSEPQSQAS
670
>>CCDS2165.1 ARHGEF4 gene_id:50649|Hs108|chr2 (690 aa)
initn: 4401 init1: 4401 opt: 4426 Z-score: 3609.6 bits: 678.3 E(32554): 9.8e-195
Smith-Waterman score: 4426; 96.2% identity (97.3% similar) in 676 aa overlap (1-670:1-676)
10 20 30 40 50 60
pF1KSD MPWEEPAGEKPSCSHSQKAFHMEPAQKPCFTTDMVTWALLCISAETVRGEAPSQPRGIPH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 MPWEEPAGEKPSCSHSQKAFHMEPAQKPCFTTDMVTWALLCISAETVRGEAPSQPRGIPH
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD RSPVSVDDLWLEKTQRKKLQKQAHVERRLHIGAVHKDGVKCWRKTIITSPESLNLPRRSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 RSPVSVDDLWLEKTQRKKLQKQAHVERRLHIGAVHKDGVKCWRKTIITSPESLNLPRRSH
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD PLSQSAPTGLNHMGWPEHTPGTAMPDGALDTAVCADEVGSEEDLYDDLHSSSHHYSHPGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 PLSQSAPTGLNHMGWPEHTPGTAMPDGALDTAVCADEVGSEEDLYDDLHSSSHHYSHPGG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD GGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGDVIEVMDATNREWWWGRVADGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 GGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGDVIEVMDATNREWWWGRVADGE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD GWFPASFVRLRVNQDEPADDDAPLAGNSGAEDGGAEAQSSKDQMRTNVINEILSTERDYI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 GWFPASFVRLRVNQDEPADDDAPLAGNSGAEDGGAEAQSSKDQMRTNVINEILSTERDYI
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD KHLRDICEGYVRQCRKRADMFSEEQLRTIFGNIEDIYRCQKAFVKALEQRFNRERPHLSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 KHLRDICEGYVRQCRKRADMFSEEQLRTIFGNIEDIYRCQKAFVKALEQRFNRERPHLSE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD LGACFLEHQADFQIYSEYCNNHPNACVELSRLTKLSKYVYFFEACRLLQKMIDISLDGFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 LGACFLEHQADFQIYSEYCNNHPNACVELSRLTKLSKYVYFFEACRLLQKMIDISLDGFL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD LTPVQKICKYPLQLAELLKYTHPQHRDFKDVEAALHAMKNVAQLINERKRRLENIDKIAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 LTPVQKICKYPLQLAELLKYTHPQHRDFKDVEAALHAMKNVAQLINERKRRLENIDKIAQ
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD WQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQAKSQQRMFFLFDHQLIYCKKDLLRRDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 WQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQAKSQQRMFFLFDHQLIYCKKDLLRRDV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD LYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAFRLHRGATGDSHLLCTRKPEQKQRWLKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS21 LYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAFRLHRGATGDSHLLCTRKPEQKQRWLKA
550 560 570 580 590 600
610 620 630 640 650
pF1KSD FAREREQVQLDQETGFSITELQRKQAMLNASKQQVTGKPK--GRR---TAAPPPRLPGPY
:::::::::::::::::::::::::::::::::::::::: :: : : ::.
CCDS21 FAREREQVQLDQETGFSITELQRKQAMLNASKQQVTGKPKAVGRPCYLTRQKHPALPSNR
610 620 630 640 650 660
660 670
pF1KSD PAD-IIPFSEPQSQAS
: . .. ..::. . :
CCDS21 PQQQVLVLAEPRRKPSTFWHSISRLAPFRK
670 680 690
>>CCDS9305.1 SPATA13 gene_id:221178|Hs108|chr13 (652 aa)
initn: 1611 init1: 1140 opt: 2225 Z-score: 1820.0 bits: 347.1 E(32554): 4.7e-95
Smith-Waterman score: 2225; 60.5% identity (81.1% similar) in 562 aa overlap (118-668:71-626)
90 100 110 120 130 140
pF1KSD RLHIGAVHKDGVKCWRKTIITSPESLNLPRRSHPLSQSAPTGLNHMGWPEHTPGTAMP-D
: .:::.: ::...: .. .. . :
CCDS93 ELDNLLTQPASRPPMPAHQVPPYKAVSARFRPFTFSQSTPIGLDRVGRRRQMRASNVSSD
50 60 70 80 90 100
150 160 170 180 190 200
pF1KSD GALDTAVCADEVGSEEDL-YDDLHSSSHHYSHPGGGGEQLAINELISDGSVVCAEALWDH
:. . .. .:. :::::. :.:: ..: .: .::: ::::::::::::.::::::::::
CCDS93 GGTEPSALVDDNGSEEDFSYEDLCQASPRYLQPGG--EQLAINELISDGNVVCAEALWDH
110 120 130 140 150
210 220 230 240 250 260
pF1KSD VTMDDQELGFKAGDVIEVMDATNREWWWGRVADGEGWFPASFVRLRVNQDEPADDDAPLA
::::::::::::::::.:..:.:..::::: : :.:::::::::::::.: .....
CCDS93 VTMDDQELGFKAGDVIQVLEASNKDWWWGRSEDKEAWFPASFVRLRVNQEELSENSSSTP
160 170 180 190 200 210
270 280 290 300 310 320
pF1KSD GNSGAEDGGAEAQS---SKDQMRTNVINEILSTERDYIKHLRDICEGYVRQCRKRADMFS
.. :... . .:.::::::: ::..::: ::::::::::::.:::::.. ::.
CCDS93 SEEQDEEASQSRHRHCENKQQMRTNVIREIMDTERVYIKHLRDICEGYIRQCRKHTGMFT
220 230 240 250 260 270
330 340 350 360 370 380
pF1KSD EEQLRTIFGNIEDIYRCQKAFVKALEQRFNRERPHLSELGACFLEHQADFQIYSEYCNNH
:: ::::::::::. :. :.: ::...:.:.:::::.:.:::..: : :::::::::
CCDS93 VAQLATIFGNIEDIYKFQRKFLKDLEKQYNKEEPHLSEIGSCFLQNQEGFAIYSEYCNNH
280 290 300 310 320 330
390 400 410 420 430 440
pF1KSD PNACVELSRLTKLSKYVYFFEACRLLQKMIDISLDGFLLTPVQKICKYPLQLAELLKYTH
:.::.::. : : .:: .:::::::::.::::..:::::::::::::::::::::::::
CCDS93 PGACLELANLMKQGKYRHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTT
340 350 360 370 380 390
450 460 470 480 490 500
pF1KSD PQHRDFKDVEAALHAMKNVAQLINERKRRLENIDKIAQWQSSIEDWEGEDLLVRSSELIY
.: :.....:: .:::::: :::::::.::.:::::.:: :: ::: :.: ::::::.
CCDS93 QEHGDYSNIKAAYEAMKNVACLINERKRKLESIDKIARWQVSIVGWEGLDILDRSSELIH
400 410 420 430 440 450
510 520 530 540 550 560
pF1KSD SGELTRVTQPQAKSQQRMFFLFDHQLIYCKKDLLRRDVLYYKGRLDMDGLEVVDLEDGKD
:::::..:. :.::::: ::::::::. :::::::::.:::::::::: .:.::: ::.:
CCDS93 SGELTKITK-QGKSQQRTFFLFDHQLVSCKKDLLRRDMLYYKGRLDMDEMELVDLGDGRD
460 470 480 490 500 510
570 580 590 600 610 620
pF1KSD RDLHVSIKNAFRLHRGATGDSHLLCTRKPEQKQRWLKAFAREREQVQLDQETGFSITELQ
.: ..:.::::.: .: . .:.:..: :.: :::.: : ::..:: :.: :. :.: :
CCDS93 KDCNLSVKNAFKLVSRTTDEVYLFCAKKQEDKARWLQACADERRRVQEDKEMGMEISENQ
520 530 540 550 560 570
630 640 650 660 670
pF1KSD RKQAMLNASKQQVTGKPKG--RRTAAPPPRLPGPYPAD----IIPFSEPQSQAS
.: :::::.: :: :: : .::: . : .: .: : ::.:
CCDS93 KKLAMLNAQKAG-HGKSKGYNRCPVAPPHQ--GLHPIHQRHITMPTSVPQQQVFGLAEPK
580 590 600 610 620 630
CCDS93 RKSSLFWHTFNRLTPFRK
640 650
>>CCDS53857.1 SPATA13 gene_id:221178|Hs108|chr13 (1277 aa)
initn: 1611 init1: 1140 opt: 2225 Z-score: 1816.0 bits: 347.3 E(32554): 7.8e-95
Smith-Waterman score: 2225; 60.5% identity (81.1% similar) in 562 aa overlap (118-668:696-1251)
90 100 110 120 130 140
pF1KSD RLHIGAVHKDGVKCWRKTIITSPESLNLPRRSHPLSQSAPTGLNHMGWPEHTPGTAMP-D
: .:::.: ::...: .. .. . :
CCDS53 ELDNLLTQPASRPPMPAHQVPPYKAVSARFRPFTFSQSTPIGLDRVGRRRQMRASNVSSD
670 680 690 700 710 720
150 160 170 180 190 200
pF1KSD GALDTAVCADEVGSEEDL-YDDLHSSSHHYSHPGGGGEQLAINELISDGSVVCAEALWDH
:. . .. .:. :::::. :.:: ..: .: .::: ::::::::::::.::::::::::
CCDS53 GGTEPSALVDDNGSEEDFSYEDLCQASPRYLQPGG--EQLAINELISDGNVVCAEALWDH
730 740 750 760 770 780
210 220 230 240 250 260
pF1KSD VTMDDQELGFKAGDVIEVMDATNREWWWGRVADGEGWFPASFVRLRVNQDEPADDDAPLA
::::::::::::::::.:..:.:..::::: : :.:::::::::::::.: .....
CCDS53 VTMDDQELGFKAGDVIQVLEASNKDWWWGRSEDKEAWFPASFVRLRVNQEELSENSSSTP
790 800 810 820 830 840
270 280 290 300 310 320
pF1KSD GNSGAEDGGAEAQS---SKDQMRTNVINEILSTERDYIKHLRDICEGYVRQCRKRADMFS
.. :... . .:.::::::: ::..::: ::::::::::::.:::::.. ::.
CCDS53 SEEQDEEASQSRHRHCENKQQMRTNVIREIMDTERVYIKHLRDICEGYIRQCRKHTGMFT
850 860 870 880 890 900
330 340 350 360 370 380
pF1KSD EEQLRTIFGNIEDIYRCQKAFVKALEQRFNRERPHLSELGACFLEHQADFQIYSEYCNNH
:: ::::::::::. :. :.: ::...:.:.:::::.:.:::..: : :::::::::
CCDS53 VAQLATIFGNIEDIYKFQRKFLKDLEKQYNKEEPHLSEIGSCFLQNQEGFAIYSEYCNNH
910 920 930 940 950 960
390 400 410 420 430 440
pF1KSD PNACVELSRLTKLSKYVYFFEACRLLQKMIDISLDGFLLTPVQKICKYPLQLAELLKYTH
:.::.::. : : .:: .:::::::::.::::..:::::::::::::::::::::::::
CCDS53 PGACLELANLMKQGKYRHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTT
970 980 990 1000 1010 1020
450 460 470 480 490 500
pF1KSD PQHRDFKDVEAALHAMKNVAQLINERKRRLENIDKIAQWQSSIEDWEGEDLLVRSSELIY
.: :.....:: .:::::: :::::::.::.:::::.:: :: ::: :.: ::::::.
CCDS53 QEHGDYSNIKAAYEAMKNVACLINERKRKLESIDKIARWQVSIVGWEGLDILDRSSELIH
1030 1040 1050 1060 1070 1080
510 520 530 540 550 560
pF1KSD SGELTRVTQPQAKSQQRMFFLFDHQLIYCKKDLLRRDVLYYKGRLDMDGLEVVDLEDGKD
:::::..:. :.::::: ::::::::. :::::::::.:::::::::: .:.::: ::.:
CCDS53 SGELTKITK-QGKSQQRTFFLFDHQLVSCKKDLLRRDMLYYKGRLDMDEMELVDLGDGRD
1090 1100 1110 1120 1130 1140
570 580 590 600 610 620
pF1KSD RDLHVSIKNAFRLHRGATGDSHLLCTRKPEQKQRWLKAFAREREQVQLDQETGFSITELQ
.: ..:.::::.: .: . .:.:..: :.: :::.: : ::..:: :.: :. :.: :
CCDS53 KDCNLSVKNAFKLVSRTTDEVYLFCAKKQEDKARWLQACADERRRVQEDKEMGMEISENQ
1150 1160 1170 1180 1190 1200
630 640 650 660 670
pF1KSD RKQAMLNASKQQVTGKPKG--RRTAAPPPRLPGPYPAD----IIPFSEPQSQAS
.: :::::.: :: :: : .::: . : .: .: : ::.:
CCDS53 KKLAMLNAQKAG-HGKSKGYNRCPVAPPHQ--GLHPIHQRHITMPTSVPQQQVFGLAEPK
1210 1220 1230 1240 1250
CCDS53 RKSSLFWHTFNRLTPFRK
1260 1270
>>CCDS66517.1 SPATA13 gene_id:221178|Hs108|chr13 (574 aa)
initn: 1642 init1: 1140 opt: 2193 Z-score: 1794.7 bits: 342.2 E(32554): 1.2e-93
Smith-Waterman score: 2193; 61.1% identity (81.2% similar) in 543 aa overlap (135-668:11-548)
110 120 130 140 150 160
pF1KSD TIITSPESLNLPRRSHPLSQSAPTGLNHMGWPEHTPGTAMPDGALDTAVCADEVGSEEDL
: .. . ::. . .. .:. :::::.
CCDS66 MVARGEIARFWSLESLHLVSSDGGTEPSALVDDNGSEEDF
10 20 30 40
170 180 190 200 210 220
pF1KSD -YDDLHSSSHHYSHPGGGGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGDVIEV
:.:: ..: .: .:: :::::::::::::.::::::::::::::::::::::::::.:
CCDS66 SYEDLCQASPRYLQPG--GEQLAINELISDGNVVCAEALWDHVTMDDQELGFKAGDVIQV
50 60 70 80 90
230 240 250 260 270 280
pF1KSD MDATNREWWWGRVADGEGWFPASFVRLRVNQDEPADDDAPLAGNSGAEDGGAEAQS---S
..:.:..::::: : :.:::::::::::::.: ..... .. :... . .
CCDS66 LEASNKDWWWGRSEDKEAWFPASFVRLRVNQEELSENSSSTPSEEQDEEASQSRHRHCEN
100 110 120 130 140 150
290 300 310 320 330 340
pF1KSD KDQMRTNVINEILSTERDYIKHLRDICEGYVRQCRKRADMFSEEQLRTIFGNIEDIYRCQ
:.::::::: ::..::: ::::::::::::.:::::.. ::. :: ::::::::::. :
CCDS66 KQQMRTNVIREIMDTERVYIKHLRDICEGYIRQCRKHTGMFTVAQLATIFGNIEDIYKFQ
160 170 180 190 200 210
350 360 370 380 390 400
pF1KSD KAFVKALEQRFNRERPHLSELGACFLEHQADFQIYSEYCNNHPNACVELSRLTKLSKYVY
. :.: ::...:.:.:::::.:.:::..: : ::::::::::.::.::. : : .:: .
CCDS66 RKFLKDLEKQYNKEEPHLSEIGSCFLQNQEGFAIYSEYCNNHPGACLELANLMKQGKYRH
220 230 240 250 260 270
410 420 430 440 450 460
pF1KSD FFEACRLLQKMIDISLDGFLLTPVQKICKYPLQLAELLKYTHPQHRDFKDVEAALHAMKN
:::::::::.::::..::::::::::::::::::::::::: .: :.....:: .::::
CCDS66 FFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTTQEHGDYSNIKAAYEAMKN
280 290 300 310 320 330
470 480 490 500 510 520
pF1KSD VAQLINERKRRLENIDKIAQWQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQAKSQQRM
:: :::::::.::.:::::.:: :: ::: :.: ::::::.:::::..:. :.:::::
CCDS66 VACLINERKRKLESIDKIARWQVSIVGWEGLDILDRSSELIHSGELTKITK-QGKSQQRT
340 350 360 370 380 390
530 540 550 560 570 580
pF1KSD FFLFDHQLIYCKKDLLRRDVLYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAFRLHRGAT
::::::::. :::::::::.:::::::::: .:.::: ::.:.: ..:.::::.: .:
CCDS66 FFLFDHQLVSCKKDLLRRDMLYYKGRLDMDEMELVDLGDGRDKDCNLSVKNAFKLVSRTT
400 410 420 430 440 450
590 600 610 620 630 640
pF1KSD GDSHLLCTRKPEQKQRWLKAFAREREQVQLDQETGFSITELQRKQAMLNASKQQVTGKPK
. .:.:..: :.: :::.: : ::..:: :.: :. :.: :.: :::::.: :: :
CCDS66 DEVYLFCAKKQEDKARWLQACADERRRVQEDKEMGMEISENQKKLAMLNAQKAG-HGKSK
460 470 480 490 500 510
650 660 670
pF1KSD GR-RTAAPPPRLPGPYPAD----IIPFSEPQSQAS
: : . ::. : .: .: : ::.:
CCDS66 GYNRCPVAPPH-QGLHPIHQRHITMPTSVPQQQVFGLAEPKRKSSLFWHTFNRLTPFRK
520 530 540 550 560 570
>>CCDS66518.1 SPATA13 gene_id:221178|Hs108|chr13 (596 aa)
initn: 1642 init1: 1140 opt: 2190 Z-score: 1792.1 bits: 341.8 E(32554): 1.7e-93
Smith-Waterman score: 2190; 62.2% identity (82.1% similar) in 532 aa overlap (146-668:44-570)
120 130 140 150 160 170
pF1KSD PRRSHPLSQSAPTGLNHMGWPEHTPGTAMPDGALDTAVCADEVGSEEDL-YDDLHSSSHH
::. . .. .:. :::::. :.:: ..: .
CCDS66 RKKLDQGLILKKEKYRKEKKCASLSFEVSSDGGTEPSALVDDNGSEEDFSYEDLCQASPR
20 30 40 50 60 70
180 190 200 210 220 230
pF1KSD YSHPGGGGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGDVIEVMDATNREWWWG
: .:: :::::::::::::.::::::::::::::::::::::::::.:..:.:..::::
CCDS66 YLQPG--GEQLAINELISDGNVVCAEALWDHVTMDDQELGFKAGDVIQVLEASNKDWWWG
80 90 100 110 120 130
240 250 260 270 280 290
pF1KSD RVADGEGWFPASFVRLRVNQDEPADDDAPLAGNSGAEDGGAEAQS---SKDQMRTNVINE
: : :.:::::::::::::.: ..... .. :... . .:.::::::: :
CCDS66 RSEDKEAWFPASFVRLRVNQEELSENSSSTPSEEQDEEASQSRHRHCENKQQMRTNVIRE
140 150 160 170 180 190
300 310 320 330 340 350
pF1KSD ILSTERDYIKHLRDICEGYVRQCRKRADMFSEEQLRTIFGNIEDIYRCQKAFVKALEQRF
:..::: ::::::::::::.:::::.. ::. :: ::::::::::. :. :.: ::...
CCDS66 IMDTERVYIKHLRDICEGYIRQCRKHTGMFTVAQLATIFGNIEDIYKFQRKFLKDLEKQY
200 210 220 230 240 250
360 370 380 390 400 410
pF1KSD NRERPHLSELGACFLEHQADFQIYSEYCNNHPNACVELSRLTKLSKYVYFFEACRLLQKM
:.:.:::::.:.:::..: : ::::::::::.::.::. : : .:: .:::::::::.:
CCDS66 NKEEPHLSEIGSCFLQNQEGFAIYSEYCNNHPGACLELANLMKQGKYRHFFEACRLLQQM
260 270 280 290 300 310
420 430 440 450 460 470
pF1KSD IDISLDGFLLTPVQKICKYPLQLAELLKYTHPQHRDFKDVEAALHAMKNVAQLINERKRR
:::..::::::::::::::::::::::::: .: :.....:: .:::::: :::::::.
CCDS66 IDIAIDGFLLTPVQKICKYPLQLAELLKYTTQEHGDYSNIKAAYEAMKNVACLINERKRK
320 330 340 350 360 370
480 490 500 510 520 530
pF1KSD LENIDKIAQWQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQAKSQQRMFFLFDHQLIYC
::.:::::.:: :: ::: :.: ::::::.:::::..:. :.::::: ::::::::. :
CCDS66 LESIDKIARWQVSIVGWEGLDILDRSSELIHSGELTKITK-QGKSQQRTFFLFDHQLVSC
380 390 400 410 420 430
540 550 560 570 580 590
pF1KSD KKDLLRRDVLYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAFRLHRGATGDSHLLCTRKP
::::::::.:::::::::: .:.::: ::.:.: ..:.::::.: .: . .:.:..:
CCDS66 KKDLLRRDMLYYKGRLDMDEMELVDLGDGRDKDCNLSVKNAFKLVSRTTDEVYLFCAKKQ
440 450 460 470 480 490
600 610 620 630 640 650
pF1KSD EQKQRWLKAFAREREQVQLDQETGFSITELQRKQAMLNASKQQVTGKPKGR-RTAAPPPR
:.: :::.: : ::..:: :.: :. :.: :.: :::::.: :: :: : . ::.
CCDS66 EDKARWLQACADERRRVQEDKEMGMEISENQKKLAMLNAQKAG-HGKSKGYNRCPVAPPH
500 510 520 530 540
660 670
pF1KSD LPGPYPAD----IIPFSEPQSQAS
: .: .: : ::.:
CCDS66 -QGLHPIHQRHITMPTSVPQQQVFGLAEPKRKSSLFWHTFNRLTPFRK
550 560 570 580 590
>>CCDS35315.1 ARHGEF9 gene_id:23229|Hs108|chrX (516 aa)
initn: 2052 init1: 1674 opt: 2044 Z-score: 1674.2 bits: 319.8 E(32554): 6.2e-87
Smith-Waterman score: 2044; 61.1% identity (81.8% similar) in 488 aa overlap (190-668:4-490)
160 170 180 190 200 210
pF1KSD SEEDLYDDLHSSSHHYSHPGGGGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGD
::. :.: :::.:::::: ..::.:::::
CCDS35 MTLLITGDSIVSAEAVWDHVTMANRELAFKAGD
10 20 30
220 230 240 250 260 270
pF1KSD VIEVMDATNREWWWGRVADGEGWFPASFVRLRVNQDE-----PAD-DDAPLAGNSGAEDG
::.:.::.:..::::.. : ::::::::::: :::.. :.: ... : ::
CCDS35 VIKVLDASNKDWWWGQIDDEEGWFPASFVRLWVNQEDEVEEGPSDVQNGHLDPNSDCLCL
40 50 60 70 80 90
280 290 300 310 320 330
pF1KSD GAEAQSSKDQMRTNVINEILSTERDYIKHLRDICEGYVRQCRKRADMFSEEQLRTIFGNI
: :. .::::.::::::.:::: :::::.::::::..::::: ::::.:::..:::::
CCDS35 GRPLQN-RDQMRANVINEIMSTERHYIKHLKDICEGYLKQCRKRRDMFSDEQLKVIFGNI
100 110 120 130 140 150
340 350 360 370 380 390
pF1KSD EDIYRCQKAFVKALEQRFNRERPHLSELGACFLEHQADFQIYSEYCNNHPNACVELSRLT
::::: : .::. ::...: . :::::.: :::::: : ::::::::: .::.:::.:
CCDS35 EDIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFWIYSEYCNNHLDACMELSKLM
160 170 180 190 200 210
400 410 420 430 440 450
pF1KSD KLSKYVYFFEACRLLQKMIDISLDGFLLTPVQKICKYPLQLAELLKYTHPQHRDFKDVEA
: :.: .:::::::::.::::..::::::::::::::::::::::::: .: :.. : :
CCDS35 KDSRYQHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTAQDHSDYRYVAA
220 230 240 250 260 270
460 470 480 490 500 510
pF1KSD ALHAMKNVAQLINERKRRLENIDKIAQWQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQ
:: .:.::.: ::::::::::::::::::.:. ::::::.: :::::::.::.. . ::
CCDS35 ALAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDILDRSSELIYTGEMAWIYQPY
280 290 300 310 320 330
520 530 540 550 560 570
pF1KSD AKSQQRMFFLFDHQLIYCKKDLLRRDVLYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAF
...:::.:::::::.. :::::.:::.::::::.::: ::::.:::.: :..::.::::
CCDS35 GRNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYEVVDIEDGRDDDFNVSMKNAF
340 350 360 370 380 390
580 590 600 610 620 630
pF1KSD RLHRGATGDSHLLCTRKPEQKQRWLKAFAREREQVQLDQETGFSITELQRKQAMLNASK-
.:: : . ::. ..: :.: :::.:: .::..:: :.. :: :.: :..:: ... :
CCDS35 KLHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEKIGFEISENQKRQAAMTVRKV
400 410 420 430 440 450
640 650 660 670
pF1KSD --QQVTGKPKGRRTAAPPPRLPGPYPADIIPFSEPQSQAS
:. ... .. . :::. : . ..: . :::
CCDS35 PKQKGVNSARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVFEFTEPKRSQSPFWQNFSRLT
460 470 480 490 500 510
CCDS35 PFKK
>>CCDS83477.1 ARHGEF9 gene_id:23229|Hs108|chrX (495 aa)
initn: 1969 init1: 1674 opt: 1961 Z-score: 1607.0 bits: 307.3 E(32554): 3.5e-83
Smith-Waterman score: 1961; 60.9% identity (81.7% similar) in 470 aa overlap (208-668:1-469)
180 190 200 210 220 230
pF1KSD PGGGGEQLAINELISDGSVVCAEALWDHVTMDDQELGFKAGDVIEVMDATNREWWWGRVA
: ..::.:::::::.:.::.:..::::..
CCDS83 MANRELAFKAGDVIKVLDASNKDWWWGQID
10 20 30
240 250 260 270 280 290
pF1KSD DGEGWFPASFVRLRVNQDE-----PAD-DDAPLAGNSGAEDGGAEAQSSKDQMRTNVINE
: ::::::::::: :::.. :.: ... : :: : :. .::::.:::::
CCDS83 DEEGWFPASFVRLWVNQEDEVEEGPSDVQNGHLDPNSDCLCLGRPLQN-RDQMRANVINE
40 50 60 70 80
300 310 320 330 340 350
pF1KSD ILSTERDYIKHLRDICEGYVRQCRKRADMFSEEQLRTIFGNIEDIYRCQKAFVKALEQRF
:.:::: :::::.::::::..::::: ::::.:::..:::::::::: : .::. ::...
CCDS83 IMSTERHYIKHLKDICEGYLKQCRKRRDMFSDEQLKVIFGNIEDIYRFQMGFVRDLEKQY
90 100 110 120 130 140
360 370 380 390 400 410
pF1KSD NRERPHLSELGACFLEHQADFQIYSEYCNNHPNACVELSRLTKLSKYVYFFEACRLLQKM
: . :::::.: :::::: : ::::::::: .::.:::.: : :.: .:::::::::.:
CCDS83 NNDDPHLSEIGPCFLEHQDGFWIYSEYCNNHLDACMELSKLMKDSRYQHFFEACRLLQQM
150 160 170 180 190 200
420 430 440 450 460 470
pF1KSD IDISLDGFLLTPVQKICKYPLQLAELLKYTHPQHRDFKDVEAALHAMKNVAQLINERKRR
:::..::::::::::::::::::::::::: .: :.. : ::: .:.::.: :::::::
CCDS83 IDIAIDGFLLTPVQKICKYPLQLAELLKYTAQDHSDYRYVAAALAVMRNVTQQINERKRR
210 220 230 240 250 260
480 490 500 510 520 530
pF1KSD LENIDKIAQWQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQAKSQQRMFFLFDHQLIYC
:::::::::::.:. ::::::.: :::::::.::.. . :: ...:::.:::::::.. :
CCDS83 LENIDKIAQWQASVLDWEGEDILDRSSELIYTGEMAWIYQPYGRNQQRVFFLFDHQMVLC
270 280 290 300 310 320
540 550 560 570 580 590
pF1KSD KKDLLRRDVLYYKGRLDMDGLEVVDLEDGKDRDLHVSIKNAFRLHRGATGDSHLLCTRKP
::::.:::.::::::.::: ::::.:::.: :..::.::::.:: : . ::. ..:
CCDS83 KKDLIRRDILYYKGRIDMDKYEVVDIEDGRDDDFNVSMKNAFKLHNKETEEIHLFFAKKL
330 340 350 360 370 380
600 610 620 630 640
pF1KSD EQKQRWLKAFAREREQVQLDQETGFSITELQRKQAMLNASK---QQVTGKPKGRRTAAPP
:.: :::.:: .::..:: :.. :: :.: :..:: ... : :. ... .. . ::
CCDS83 EEKIRWLRAFREERKMVQEDEKIGFEISENQKRQAAMTVRKVPKQKGVNSARSVPPSYPP
390 400 410 420 430 440
650 660 670
pF1KSD PRLPGPYPADIIPFSEPQSQAS
:. : . ..: . :::
CCDS83 PQDPLNHGQYLVPDGIAQSQVFEFTEPKRSQSPFWQNFSRLTPFKK
450 460 470 480 490
>>CCDS55430.1 ARHGEF9 gene_id:23229|Hs108|chrX (463 aa)
initn: 1717 init1: 1674 opt: 1726 Z-score: 1416.3 bits: 271.9 E(32554): 1.4e-72
Smith-Waterman score: 1726; 59.2% identity (80.0% similar) in 436 aa overlap (242-668:3-437)
220 230 240 250 260
pF1KSD ELGFKAGDVIEVMDATNREWWWGRVADGEGWFPASFVRLRVNQDE-----PAD-DDAPLA
:. .. : :::.. :.: ... :
CCDS55 MQWIRGGSGMLWVNQEDEVEEGPSDVQNGHLD
10 20 30
270 280 290 300 310 320
pF1KSD GNSGAEDGGAEAQSSKDQMRTNVINEILSTERDYIKHLRDICEGYVRQCRKRADMFSEEQ
:: : :. .::::.::::::.:::: :::::.::::::..::::: ::::.::
CCDS55 PNSDCLCLGRPLQN-RDQMRANVINEIMSTERHYIKHLKDICEGYLKQCRKRRDMFSDEQ
40 50 60 70 80 90
330 340 350 360 370 380
pF1KSD LRTIFGNIEDIYRCQKAFVKALEQRFNRERPHLSELGACFLEHQADFQIYSEYCNNHPNA
:..:::::::::: : .::. ::...: . :::::.: :::::: : ::::::::: .:
CCDS55 LKVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFWIYSEYCNNHLDA
100 110 120 130 140 150
390 400 410 420 430 440
pF1KSD CVELSRLTKLSKYVYFFEACRLLQKMIDISLDGFLLTPVQKICKYPLQLAELLKYTHPQH
:.:::.: : :.: .:::::::::.::::..::::::::::::::::::::::::: .:
CCDS55 CMELSKLMKDSRYQHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTAQDH
160 170 180 190 200 210
450 460 470 480 490 500
pF1KSD RDFKDVEAALHAMKNVAQLINERKRRLENIDKIAQWQSSIEDWEGEDLLVRSSELIYSGE
:.. : ::: .:.::.: ::::::::::::::::::.:. ::::::.: :::::::.::
CCDS55 SDYRYVAAALAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDILDRSSELIYTGE
220 230 240 250 260 270
510 520 530 540 550 560
pF1KSD LTRVTQPQAKSQQRMFFLFDHQLIYCKKDLLRRDVLYYKGRLDMDGLEVVDLEDGKDRDL
.. . :: ...:::.:::::::.. :::::.:::.::::::.::: ::::.:::.: :.
CCDS55 MAWIYQPYGRNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYEVVDIEDGRDDDF
280 290 300 310 320 330
570 580 590 600 610 620
pF1KSD HVSIKNAFRLHRGATGDSHLLCTRKPEQKQRWLKAFAREREQVQLDQETGFSITELQRKQ
.::.::::.:: : . ::. ..: :.: :::.:: .::..:: :.. :: :.: :..:
CCDS55 NVSMKNAFKLHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEKIGFEISENQKRQ
340 350 360 370 380 390
630 640 650 660 670
pF1KSD AMLNASK---QQVTGKPKGRRTAAPPPRLPGPYPADIIPFSEPQSQAS
: ... : :. ... .. . :::. : . ..: . :::
CCDS55 AAMTVRKVPKQKGVNSARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVFEFTEPKRSQSPF
400 410 420 430 440 450
CCDS55 WQNFSRLTPFKK
460
>>CCDS55429.1 ARHGEF9 gene_id:23229|Hs108|chrX (414 aa)
initn: 1702 init1: 1659 opt: 1694 Z-score: 1390.9 bits: 267.0 E(32554): 3.7e-71
Smith-Waterman score: 1694; 62.9% identity (83.5% similar) in 388 aa overlap (284-668:1-388)
260 270 280 290 300 310
pF1KSD QDEPADDDAPLAGNSGAEDGGAEAQSSKDQMRTNVINEILSTERDYIKHLRDICEGYVRQ
::.::::::.:::: :::::.::::::..:
CCDS55 MRANVINEIMSTERHYIKHLKDICEGYLKQ
10 20 30
320 330 340 350 360 370
pF1KSD CRKRADMFSEEQLRTIFGNIEDIYRCQKAFVKALEQRFNRERPHLSELGACFLEHQADFQ
:::: ::::.:::..:::::::::: : .::. ::...: . :::::.: :::::: :
CCDS55 CRKRRDMFSDEQLKVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSEIGPCFLEHQDGFW
40 50 60 70 80 90
380 390 400 410 420 430
pF1KSD IYSEYCNNHPNACVELSRLTKLSKYVYFFEACRLLQKMIDISLDGFLLTPVQKICKYPLQ
::::::::: .::.:::.: : :.: .:::::::::.::::..:::::::::::::::::
CCDS55 IYSEYCNNHLDACMELSKLMKDSRYQHFFEACRLLQQMIDIAIDGFLLTPVQKICKYPLQ
100 110 120 130 140 150
440 450 460 470 480 490
pF1KSD LAELLKYTHPQHRDFKDVEAALHAMKNVAQLINERKRRLENIDKIAQWQSSIEDWEGEDL
:::::::: .: :.. : ::: .:.::.: ::::::::::::::::::.:. ::::::.
CCDS55 LAELLKYTAQDHSDYRYVAAALAVMRNVTQQINERKRRLENIDKIAQWQASVLDWEGEDI
160 170 180 190 200 210
500 510 520 530 540 550
pF1KSD LVRSSELIYSGELTRVTQPQAKSQQRMFFLFDHQLIYCKKDLLRRDVLYYKGRLDMDGLE
: :::::::.::.. . :: ...:::.:::::::.. :::::.:::.::::::.::: :
CCDS55 LDRSSELIYTGEMAWIYQPYGRNQQRVFFLFDHQMVLCKKDLIRRDILYYKGRIDMDKYE
220 230 240 250 260 270
560 570 580 590 600 610
pF1KSD VVDLEDGKDRDLHVSIKNAFRLHRGATGDSHLLCTRKPEQKQRWLKAFAREREQVQLDQE
:::.:::.: :..::.::::.:: : . ::. ..: :.: :::.:: .::..:: :..
CCDS55 VVDIEDGRDDDFNVSMKNAFKLHNKETEEIHLFFAKKLEEKIRWLRAFREERKMVQEDEK
280 290 300 310 320 330
620 630 640 650 660 670
pF1KSD TGFSITELQRKQAMLNASK---QQVTGKPKGRRTAAPPPRLPGPYPADIIPFSEPQSQAS
:: :.: :..:: ... : :. ... .. . :::. : . ..: . :::
CCDS55 IGFEISENQKRQAAMTVRKVPKQKGVNSARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVF
340 350 360 370 380 390
CCDS55 EFTEPKRSQSPFWQNFSRLTPFKK
400 410
670 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 05:02:56 2016 done: Thu Nov 3 05:02:57 2016
Total Scan time: 3.990 Total Display time: 0.160
Function used was FASTA [36.3.4 Apr, 2011]