FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3981, 182 aa
1>>>pF1KB3981 182 - 182 aa - 182 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.5365+/-0.000931; mu= 11.6234+/- 0.057
mean_var=86.8093+/-18.804, 0's: 0 Z-trim(106.1): 167 B-trim: 251 in 1/49
Lambda= 0.137655
statistics sampled from 8618 (8818) to 8618 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.655), E-opt: 0.2 (0.271), width: 16
Scan time: 1.870
The best scores are: opt bits E(32554)
CCDS7538.1 ARL3 gene_id:403|Hs108|chr10 ( 182) 1189 245.8 1.1e-65
CCDS8088.1 ARL2 gene_id:402|Hs108|chr11 ( 184) 663 141.4 3e-34
CCDS8774.1 ARF3 gene_id:377|Hs108|chr12 ( 181) 541 117.1 5.9e-27
CCDS1565.1 ARF1 gene_id:375|Hs108|chr1 ( 181) 536 116.1 1.2e-26
CCDS34745.1 ARF5 gene_id:381|Hs108|chr7 ( 180) 531 115.2 2.3e-26
CCDS44958.1 ARL1 gene_id:400|Hs108|chr12 ( 181) 524 113.8 6.1e-26
CCDS9695.1 ARF6 gene_id:382|Hs108|chr14 ( 175) 514 111.8 2.3e-25
CCDS7131.1 ARL5B gene_id:221079|Hs108|chr10 ( 179) 506 110.2 7.2e-25
CCDS2884.1 ARF4 gene_id:378|Hs108|chr3 ( 180) 505 110.0 8.3e-25
CCDS3987.1 TRIM23 gene_id:373|Hs108|chr5 ( 574) 509 111.2 1.2e-24
CCDS2195.1 ARL5A gene_id:26225|Hs108|chr2 ( 179) 486 106.2 1.1e-23
CCDS55770.1 ARL2 gene_id:402|Hs108|chr11 ( 157) 481 105.2 2e-23
CCDS9419.1 ARL11 gene_id:115761|Hs108|chr13 ( 196) 468 102.7 1.4e-22
CCDS3192.1 ARL14 gene_id:80117|Hs108|chr3 ( 192) 467 102.5 1.6e-22
CCDS43322.1 TRIM23 gene_id:373|Hs108|chr5 ( 569) 460 101.4 9.8e-22
CCDS73510.1 ARL1 gene_id:400|Hs108|chr12 ( 135) 425 94.0 4e-20
CCDS2928.1 ARL6 gene_id:84100|Hs108|chr3 ( 186) 426 94.3 4.5e-20
CCDS3986.1 TRIM23 gene_id:373|Hs108|chr5 ( 546) 428 95.1 7.7e-20
CCDS2512.1 ARL4C gene_id:10123|Hs108|chr2 ( 192) 415 92.1 2.1e-19
CCDS63169.1 ARL4C gene_id:10123|Hs108|chr2 ( 201) 415 92.2 2.2e-19
CCDS45664.1 ARL5C gene_id:390790|Hs108|chr17 ( 179) 407 90.5 6e-19
CCDS11463.1 ARL4D gene_id:379|Hs108|chr17 ( 201) 405 90.2 8.6e-19
CCDS5359.1 ARL4A gene_id:10124|Hs108|chr7 ( 200) 401 89.4 1.5e-18
CCDS13533.1 ARFRP1 gene_id:10139|Hs108|chr20 ( 201) 397 88.6 2.6e-18
CCDS46425.1 ARL5A gene_id:26225|Hs108|chr2 ( 142) 391 87.3 4.5e-18
CCDS2566.1 ARL8B gene_id:55207|Hs108|chr3 ( 186) 370 83.2 1e-16
CCDS2925.1 ARL13B gene_id:200894|Hs108|chr3 ( 428) 371 83.7 1.6e-16
CCDS1421.1 ARL8A gene_id:127829|Hs108|chr1 ( 186) 356 80.4 6.9e-16
CCDS46630.1 ARFRP1 gene_id:10139|Hs108|chr20 ( 173) 346 78.4 2.6e-15
CCDS68172.1 ARFRP1 gene_id:10139|Hs108|chr20 ( 154) 327 74.6 3.2e-14
CCDS4400.1 ARL10 gene_id:285598|Hs108|chr5 ( 244) 320 73.4 1.2e-13
CCDS54850.1 ARL15 gene_id:54622|Hs108|chr5 ( 204) 314 72.1 2.4e-13
CCDS7298.1 SAR1A gene_id:56681|Hs108|chr10 ( 198) 281 65.5 2.2e-11
CCDS4177.1 SAR1B gene_id:51128|Hs108|chr5 ( 198) 276 64.5 4.4e-11
>>CCDS7538.1 ARL3 gene_id:403|Hs108|chr10 (182 aa)
initn: 1189 init1: 1189 opt: 1189 Z-score: 1292.9 bits: 245.8 E(32554): 1.1e-65
Smith-Waterman score: 1189; 100.0% identity (100.0% similar) in 182 aa overlap (1-182:1-182)
10 20 30 40 50 60
pF1KB3 MGLLSILRKLKSAPDQEVRILLLGLDNAGKTTLLKQLASEDISHITPTQGFNIKSVQSQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 MGLLSILRKLKSAPDQEVRILLLGLDNAGKTTLLKQLASEDISHITPTQGFNIKSVQSQG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 FKLNVWDIGGQRKIRPYWKNYFENTDILIYVIDSADRKRFEETGQELAELLEEEKLSCVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 FKLNVWDIGGQRKIRPYWKNYFENTDILIYVIDSADRKRFEETGQELAELLEEEKLSCVP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 VLIFANKQDLLTAAPASEIAEGLNLHTIRDRVWQIQSCSALTGEGVQDGMNWVCKNVNAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 VLIFANKQDLLTAAPASEIAEGLNLHTIRDRVWQIQSCSALTGEGVQDGMNWVCKNVNAK
130 140 150 160 170 180
pF1KB3 KK
::
CCDS75 KK
>>CCDS8088.1 ARL2 gene_id:402|Hs108|chr11 (184 aa)
initn: 661 init1: 594 opt: 663 Z-score: 728.3 bits: 141.4 E(32554): 3e-34
Smith-Waterman score: 663; 53.3% identity (83.9% similar) in 180 aa overlap (1-180:1-179)
10 20 30 40 50 60
pF1KB3 MGLLSILRKLKSAPDQEVRILLLGLDNAGKTTLLKQLASEDISHITPTQGFNIKSVQSQG
::::.::.:.:. ..:.:.:.::::::::::.::.. .:::. :.:: :::::... .:
CCDS80 MGLLTILKKMKQK-ERELRLLMLGLDNAGKTTILKKFNGEDIDTISPTLGFNIKTLEHRG
10 20 30 40 50
70 80 90 100 110 120
pF1KB3 FKLNVWDIGGQRKIRPYWKNYFENTDILIYVIDSADRKRFEETGQELAELLEEEKLSCVP
::::.::.:::...: ::.::::.:: ::.:.:::::.:... .:: :: ::.:. .
CCDS80 FKLNIWDVGGQKSLRSYWRNYFESTDGLIWVVDSADRQRMQDCQRELQSLLVEERLAGAT
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB3 VLIFANKQDLLTAAPASEIAEGLNLHTIRDRVWQIQSCSALTGEGVQDGMNWVCKNVNAK
.::::::::: : .. : : :.: .::.. : ::.:::.:::.. :..:. .....
CCDS80 LLIFANKQDLPGALSSNAIREVLELDSIRSHHWCIQGCSAVTGENLLPGIDWLLDDISSR
120 130 140 150 160 170
pF1KB3 KK
CCDS80 IFTAD
180
>>CCDS8774.1 ARF3 gene_id:377|Hs108|chr12 (181 aa)
initn: 541 init1: 541 opt: 541 Z-score: 597.5 bits: 117.1 E(32554): 5.9e-27
Smith-Waterman score: 541; 46.4% identity (78.9% similar) in 166 aa overlap (16-181:16-181)
10 20 30 40 50 60
pF1KB3 MGLLSILRKLKSAPDQEVRILLLGLDNAGKTTLLKQLASEDISHITPTQGFNIKSVQSQG
.:.:::..::: :::::.: .: .: :: :::...:. ..
CCDS87 MGNIFGNLLKSLIGKKEMRILMVGLDAAGKTTILYKLKLGEIVTTIPTIGFNVETVEYKN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 FKLNVWDIGGQRKIRPYWKNYFENTDILIYVIDSADRKRFEETGQELAELLEEEKLSCVP
....:::.::: :::: :..::.::. ::.:.:: ::.: .:. .:: ..: :..: .
CCDS87 ISFTVWDVGGQDKIRPLWRHYFQNTQGLIFVVDSNDRERVNEAREELMRMLAEDELRDAV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 VLIFANKQDLLTAAPASEIAEGLNLHTIRDRVWQIQSCSALTGEGVQDGMNWVCKNVNAK
.:.::::::: .: :.::.. :.::..: : : ::. : .:.:. .:..:. .... :
CCDS87 LLVFANKQDLPNAMNAAEITDKLGLHSLRHRNWYIQATCATSGDGLYEGLDWLANQLKNK
130 140 150 160 170 180
pF1KB3 KK
:
CCDS87 K
>>CCDS1565.1 ARF1 gene_id:375|Hs108|chr1 (181 aa)
initn: 554 init1: 536 opt: 536 Z-score: 592.1 bits: 116.1 E(32554): 1.2e-26
Smith-Waterman score: 536; 45.8% identity (78.3% similar) in 166 aa overlap (16-181:16-181)
10 20 30 40 50 60
pF1KB3 MGLLSILRKLKSAPDQEVRILLLGLDNAGKTTLLKQLASEDISHITPTQGFNIKSVQSQG
.:.:::..::: :::::.: .: .: :: :::...:. ..
CCDS15 MGNIFANLFKGLFGKKEMRILMVGLDAAGKTTILYKLKLGEIVTTIPTIGFNVETVEYKN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 FKLNVWDIGGQRKIRPYWKNYFENTDILIYVIDSADRKRFEETGQELAELLEEEKLSCVP
....:::.::: :::: :..::.::. ::.:.:: ::.: .:. .:: ..: :..: .
CCDS15 ISFTVWDVGGQDKIRPLWRHYFQNTQGLIFVVDSNDRERVNEAREELMRMLAEDELRDAV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 VLIFANKQDLLTAAPASEIAEGLNLHTIRDRVWQIQSCSALTGEGVQDGMNWVCKNVNAK
.:.::::::: .: :.::.. :.::..: : : ::. : .:.:. .:..:. ... .
CCDS15 LLVFANKQDLPNAMNAAEITDKLGLHSLRHRNWYIQATCATSGDGLYEGLDWLSNQLRNQ
130 140 150 160 170 180
pF1KB3 KK
:
CCDS15 K
>>CCDS34745.1 ARF5 gene_id:381|Hs108|chr7 (180 aa)
initn: 549 init1: 531 opt: 531 Z-score: 586.8 bits: 115.2 E(32554): 2.3e-26
Smith-Waterman score: 531; 43.6% identity (79.4% similar) in 165 aa overlap (16-180:16-180)
10 20 30 40 50 60
pF1KB3 MGLLSILRKLKSAPDQEVRILLLGLDNAGKTTLLKQLASEDISHITPTQGFNIKSVQSQG
...:::..::: :::::.: .: .: :: :::...:. ..
CCDS34 MGLTVSALFSRIFGKKQMRILMVGLDAAGKTTILYKLKLGEIVTTIPTIGFNVETVEYKN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 FKLNVWDIGGQRKIRPYWKNYFENTDILIYVIDSADRKRFEETGQELAELLEEEKLSCVP
. ..:::.::: :::: :..::.::. ::.:.:: ::.: .:...:: ..:.:..: .
CCDS34 ICFTVWDVGGQDKIRPLWRHYFQNTQGLIFVVDSNDRERVQESADELQKMLQEDELRDAV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 VLIFANKQDLLTAAPASEIAEGLNLHTIRDRVWQIQSCSALTGEGVQDGMNWVCKNVNAK
.:.::::::. .: :.::... :.:. .:.:.: .:. : : :. ::..:. .... .
CCDS34 LLVFANKQDMPNAMPVSELTDKLGLQHLRSRTWYVQATCATQGTGLYDGLDWLSHELSKR
130 140 150 160 170 180
pF1KB3 KK
>>CCDS44958.1 ARL1 gene_id:400|Hs108|chr12 (181 aa)
initn: 524 init1: 524 opt: 524 Z-score: 579.2 bits: 113.8 E(32554): 6.1e-26
Smith-Waterman score: 524; 45.2% identity (78.3% similar) in 166 aa overlap (16-181:16-181)
10 20 30 40 50 60
pF1KB3 MGLLSILRKLKSAPDQEVRILLLGLDNAGKTTLLKQLASEDISHITPTQGFNIKSVQSQG
.:.:::.::::.:::::.: .: .. :: :::...: ..
CCDS44 MGGFFSSIFSSLFGTREMRILILGLDGAGKTTILYRLQVGEVVTTIPTIGFNVETVTYKN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 FKLNVWDIGGQRKIRPYWKNYFENTDILIYVIDSADRKRFEETGQELAELLEEEKLSCVP
.:..:::.::: .:::::. :. ::: .:::.:: :: :. . .::. .::::.: .
CCDS44 LKFQVWDLGGQTSIRPYWRCYYSNTDAVIYVVDSCDRDRIGISKSELVAMLEEEELRKAI
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 VLIFANKQDLLTAAPASEIAEGLNLHTIRDRVWQIQSCSALTGEGVQDGMNWVCKNVNAK
...::::::. : .::.:..:.: ...:: ::: . :: : :....:.:. ......
CCDS44 LVVFANKQDMEQAMTSSEMANSLGLPALKDRKWQIFKTSATKGTGLDEAMEWLVETLKSR
130 140 150 160 170 180
pF1KB3 KK
.
CCDS44 Q
>>CCDS9695.1 ARF6 gene_id:382|Hs108|chr14 (175 aa)
initn: 519 init1: 501 opt: 514 Z-score: 568.7 bits: 111.8 E(32554): 2.3e-25
Smith-Waterman score: 514; 46.6% identity (76.1% similar) in 163 aa overlap (15-176:11-172)
10 20 30 40 50
pF1KB3 MGLLSILRKLKSAPDQEVRILLLGLDNAGKTTLLKQLA-SEDISHITPTQGFNIKSVQSQ
..:.:::.:::: :::::.: .: ..... : :: :::...: .
CCDS96 MGKVLSKIFGNKEMRILMLGLDAAGKTTILYKLKLGQSVTTI-PTVGFNVETVTYK
10 20 30 40 50
60 70 80 90 100 110
pF1KB3 GFKLNVWDIGGQRKIRPYWKNYFENTDILIYVIDSADRKRFEETGQELAELLEEEKLSCV
. :.::::.::: :::: :..:. .:. ::.:.: ::: :..:. ::: ........ .
CCDS96 NVKFNVWDVGGQDKIRPLWRHYYTGTQGLIFVVDCADRDRIDEARQELHRIINDREMRDA
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB3 PVLIFANKQDLLTAAPASEIAEGLNLHTIRDRVWQIQSCSALTGEGVQDGMNWVCKNVNA
.::::::::: : :: : :.: :::: : .: : .:.:. .:..:. .:
CCDS96 IILIFANKQDLPDAMKPHEIQEKLGLTRIRDRNWYVQPSCATSGDGLYEGLTWLTSNYKS
120 130 140 150 160 170
180
pF1KB3 KKK
>>CCDS7131.1 ARL5B gene_id:221079|Hs108|chr10 (179 aa)
initn: 517 init1: 499 opt: 506 Z-score: 560.0 bits: 110.2 E(32554): 7.2e-25
Smith-Waterman score: 506; 43.1% identity (74.6% similar) in 181 aa overlap (1-180:1-179)
10 20 30 40 50
pF1KB3 MGLLSILRKLKSAP-DQEVRILLLGLDNAGKTTLLKQLASEDISHITPTQGFNIKSVQSQ
::: :. :: : .:: .....:::::::::.: :. ... : .:: : :.. . .
CCDS71 MGL--IFAKLWSLFCNQEHKVIIVGLDNAGKTTILYQFLMNEVVHTSPTIGSNVEEIVVK
10 20 30 40 50
60 70 80 90 100 110
pF1KB3 GFKLNVWDIGGQRKIRPYWKNYFENTDILIYVIDSADRKRFEETGQELAELLEEEKLSCV
. .. .::::::...: :..:. ::...: :.:: ::.:. : .:: ..: .: : .
CCDS71 NTHFLMWDIGGQESLRSSWNTYYSNTEFIILVVDSIDRERLAITKEELYRMLAHEDLRKA
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB3 PVLIFANKQDLLTAAPASEIAEGLNLHTIRDRVWQIQSCSALTGEGVQDGMNWVCKNVNA
:::::::::. :.::.. :.: .:.:. :.:::: ::::::. .:..:. . ...
CCDS71 AVLIFANKQDMKGCMTAAEISKYLTLSSIKDHPWHIQSCCALTGEGLCQGLEWMTSRIGV
120 130 140 150 160 170
180
pF1KB3 KKK
.
CCDS71 R
>>CCDS2884.1 ARF4 gene_id:378|Hs108|chr3 (180 aa)
initn: 522 init1: 504 opt: 505 Z-score: 558.9 bits: 110.0 E(32554): 8.3e-25
Smith-Waterman score: 505; 41.2% identity (75.8% similar) in 182 aa overlap (1-180:1-180)
10 20 30 40 50
pF1KB3 MGLL--SILRKLKSAPDQEVRILLLGLDNAGKTTLLKQLASEDISHITPTQGFNIKSVQS
::: :.. .: . ...:::..::: :::::.: .: .: :: :::...:.
CCDS28 MGLTISSLFSRLFGK--KQMRILMVGLDAAGKTTILYKLKLGEIVTTIPTIGFNVETVEY
10 20 30 40 50
60 70 80 90 100 110
pF1KB3 QGFKLNVWDIGGQRKIRPYWKNYFENTDILIYVIDSADRKRFEETGQELAELLEEEKLSC
... ..:::.::: .::: ::.::.::. ::.:.:: ::.:..:...:: ..: ..:
CCDS28 KNICFTVWDVGGQDRIRPLWKHYFQNTQGLIFVVDSNDRERIQEVADELQKMLLVDELRD
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB3 VPVLIFANKQDLLTAAPASEIAEGLNLHTIRDRVWQIQSCSALTGEGVQDGMNWVCKNVN
. .:.::::::: .: ::... :.:...:.:.: .:. : : :. .:..:. ....
CCDS28 AVLLLFANKQDLPNAMAISEMTDKLGLQSLRNRTWYVQATCATQGTGLYEGLDWLSNELS
120 130 140 150 160 170
180
pF1KB3 AKKK
.
CCDS28 KR
180
>>CCDS3987.1 TRIM23 gene_id:373|Hs108|chr5 (574 aa)
initn: 397 init1: 397 opt: 509 Z-score: 556.3 bits: 111.2 E(32554): 1.2e-24
Smith-Waterman score: 509; 41.9% identity (77.9% similar) in 172 aa overlap (9-179:396-567)
10 20 30
pF1KB3 MGLLSILRKLKSAPDQEVRILLLGLDNAGKTTLLKQLA
... .: .:.:.. ::::.:::::.: .:
CCDS39 TLQKQQQQFTEVADHIQLDASIPVTFTKDNRVHIGPKMEIRVVTLGLDGAGKTTILFKLK
370 380 390 400 410 420
40 50 60 70 80 90
pF1KB3 SEDISHITPTQGFNIKSVQSQGFKLNVWDIGGQRKIRPYWKNYFENTDILIYVIDSADRK
.... . :: :::...:. ...:...::.::..:.:: ::.:. ::. ...:.::. :
CCDS39 QDEFMQPIPTIGFNVETVEYKNLKFTIWDVGGKHKLRPLWKHYYLNTQAVVFVVDSSHRD
430 440 450 460 470 480
100 110 120 130 140 150
pF1KB3 RFEETGQELAELLEEEKLSCVPVLIFANKQDLLTAAPASEIAEGLNLHTIR-DRVWQIQS
:. :. .:::.:: :..: . .::::::::. : . ::.: :.:: . : : ::.
CCDS39 RISEAHSELAKLLTEKELRDALLLIFANKQDVAGALSVEEITELLSLHKLCCGRSWYIQG
490 500 510 520 530 540
160 170 180
pF1KB3 CSALTGEGVQDGMNWVCKNVNAKKK
:.: .: :. .:..:. ... :
CCDS39 CDARSGMGLYEGLDWLSRQLVAAGVLDVA
550 560 570
182 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 05:30:03 2016 done: Sat Nov 5 05:30:04 2016
Total Scan time: 1.870 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]