FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB4929, 198 aa 1>>>pF1KB4929 198 - 198 aa - 198 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.0919+/-0.000966; mu= 14.4684+/- 0.059 mean_var=77.8412+/-16.379, 0's: 0 Z-trim(105.8): 115 B-trim: 351 in 1/49 Lambda= 0.145368 statistics sampled from 8501 (8640) to 8501 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.652), E-opt: 0.2 (0.265), width: 16 Scan time: 1.970 The best scores are: opt bits E(32554) CCDS4177.1 SAR1B gene_id:51128|Hs108|chr5 ( 198) 1312 284.5 2.9e-77 CCDS7298.1 SAR1A gene_id:56681|Hs108|chr10 ( 198) 1215 264.1 3.9e-71 CCDS9695.1 ARF6 gene_id:382|Hs108|chr14 ( 175) 320 76.4 1.1e-14 CCDS8088.1 ARL2 gene_id:402|Hs108|chr11 ( 184) 313 74.9 3.3e-14 CCDS1565.1 ARF1 gene_id:375|Hs108|chr1 ( 181) 311 74.5 4.3e-14 CCDS8774.1 ARF3 gene_id:377|Hs108|chr12 ( 181) 307 73.7 7.7e-14 CCDS3192.1 ARL14 gene_id:80117|Hs108|chr3 ( 192) 307 73.7 8.1e-14 CCDS9419.1 ARL11 gene_id:115761|Hs108|chr13 ( 196) 306 73.5 9.5e-14 CCDS43322.1 TRIM23 gene_id:373|Hs108|chr5 ( 569) 306 73.9 2.1e-13 CCDS34745.1 ARF5 gene_id:381|Hs108|chr7 ( 180) 298 71.8 2.9e-13 CCDS2928.1 ARL6 gene_id:84100|Hs108|chr3 ( 186) 298 71.8 2.9e-13 CCDS11463.1 ARL4D gene_id:379|Hs108|chr17 ( 201) 296 71.4 4.1e-13 CCDS3986.1 TRIM23 gene_id:373|Hs108|chr5 ( 546) 300 72.6 4.8e-13 CCDS2566.1 ARL8B gene_id:55207|Hs108|chr3 ( 186) 294 71.0 5.2e-13 CCDS3987.1 TRIM23 gene_id:373|Hs108|chr5 ( 574) 297 72.0 7.8e-13 CCDS2884.1 ARF4 gene_id:378|Hs108|chr3 ( 180) 284 68.8 2.2e-12 CCDS1421.1 ARL8A gene_id:127829|Hs108|chr1 ( 186) 283 68.7 2.6e-12 CCDS7538.1 ARL3 gene_id:403|Hs108|chr10 ( 182) 276 67.2 7e-12 CCDS2925.1 ARL13B gene_id:200894|Hs108|chr3 ( 428) 278 67.9 9.9e-12 CCDS44958.1 ARL1 gene_id:400|Hs108|chr12 ( 181) 266 65.1 3e-11 CCDS5359.1 ARL4A gene_id:10124|Hs108|chr7 ( 200) 261 64.1 6.7e-11 >>CCDS4177.1 SAR1B gene_id:51128|Hs108|chr5 (198 aa) initn: 1312 init1: 1312 opt: 1312 Z-score: 1500.5 bits: 284.5 E(32554): 2.9e-77 Smith-Waterman score: 1312; 100.0% identity (100.0% similar) in 198 aa overlap (1-198:1-198) 10 20 30 40 50 60 pF1KB4 MSFIFDWIYSGFSSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 MSFIFDWIYSGFSSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 SEELTIAGMTFTTFDLGGHVQARRVWKNYLPAINGIVFLVDCADHERLLESKEELDSLMT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SEELTIAGMTFTTFDLGGHVQARRVWKNYLPAINGIVFLVDCADHERLLESKEELDSLMT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 DETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSISLKELNARPLEVFMCSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 DETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSISLKELNARPLEVFMCSV 130 140 150 160 170 180 190 pF1KB4 LKRQGYGEGFRWMAQYID :::::::::::::::::: CCDS41 LKRQGYGEGFRWMAQYID 190 >>CCDS7298.1 SAR1A gene_id:56681|Hs108|chr10 (198 aa) initn: 1215 init1: 1215 opt: 1215 Z-score: 1390.5 bits: 264.1 E(32554): 3.9e-71 Smith-Waterman score: 1215; 89.9% identity (98.0% similar) in 198 aa overlap (1-198:1-198) 10 20 30 40 50 60 pF1KB4 MSFIFDWIYSGFSSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPT :::::.:::.::::::::::::::.::::::::::::::::::::::::::::::::::: CCDS72 MSFIFEWIYNGFSSVLQFLGLYKKSGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB4 SEELTIAGMTFTTFDLGGHVQARRVWKNYLPAINGIVFLVDCADHERLLESKEELDSLMT ::::::::::::::::::: ::::::::::::::::::::::::: ::.::: ::..::: CCDS72 SEELTIAGMTFTTFDLGGHEQARRVWKNYLPAINGIVFLVDCADHSRLVESKVELNALMT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB4 DETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSISLKELNARPLEVFMCSV ::::.::::::::::::: .:::::.:::.:::::::::::...::::::::.::::::: CCDS72 DETISNVPILILGNKIDRTDAISEEKLREIFGLYGQTTGKGNVTLKELNARPMEVFMCSV 130 140 150 160 170 180 190 pF1KB4 LKRQGYGEGFRWMAQYID ::::::::::::..:::: CCDS72 LKRQGYGEGFRWLSQYID 190 >>CCDS9695.1 ARF6 gene_id:382|Hs108|chr14 (175 aa) initn: 318 init1: 318 opt: 320 Z-score: 376.8 bits: 76.4 E(32554): 1.1e-14 Smith-Waterman score: 320; 38.3% identity (74.4% similar) in 133 aa overlap (24-153:12-141) 10 20 30 40 50 pF1KB4 MSFIFDWIYSGFSSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHV---PTL : ....:::: :::::.:. :: ::: : ::. CCDS96 MGKVLSKIFGNKEMRILMLGLDAAGKTTILYKLK---LGQSVTTIPTV 10 20 30 40 60 70 80 90 100 110 pF1KB4 HPTSEELTIAGMTFTTFDLGGHVQARRVWKNYLPAINGIVFLVDCADHERLLESKEELDS . : .: .. :...:.::. . : .:..: . .:..:.:::::..:. :...:: CCDS96 GFNVETVTYKNVKFNVWDVGGQDKIRPLWRHYYTGTQGLIFVVDCADRDRIDEARQELHR 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB4 LMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSISLKELNARPLEVFM ...:. . .. :::..:: : :.:.. ....: .:: CCDS96 IINDREMRDAIILIFANKQDLPDAMKPHEIQEKLGLTRIRDRNWYVQPSCATSGDGLYEG 110 120 130 140 150 160 180 190 pF1KB4 CSVLKRQGYGEGFRWMAQYID CCDS96 LTWLTSNYKS 170 >>CCDS8088.1 ARL2 gene_id:402|Hs108|chr11 (184 aa) initn: 293 init1: 293 opt: 313 Z-score: 368.6 bits: 74.9 E(32554): 3.3e-14 Smith-Waterman score: 313; 34.3% identity (72.0% similar) in 143 aa overlap (11-153:2-144) 10 20 30 40 50 60 pF1KB4 MSFIFDWIYSGFSSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPT :. ..:. . .. .:..::::::::::.:. .. . . ::: . CCDS80 MGLLTILKKMKQKERELRLLMLGLDNAGKTTILKKFNGEDIDTISPTLGFN 10 20 30 40 50 70 80 90 100 110 120 pF1KB4 SEELTIAGMTFTTFDLGGHVQARRVWKNYLPAINGIVFLVDCADHERLLESKEELDSLMT . : :. .. .:.::. . : :.::. . .:....:: ::..:. . ..::.::.. CCDS80 IKTLEHRGFKLNIWDVGGQKSLRSYWRNYFESTDGLIWVVDSADRQRMQDCQRELQSLLV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB4 DETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSISLKELNARPLEVFMCSV .: .:.. .::..:: : : :.: . .::.. : CCDS80 EERLAGATLLIFANKQDLPGALSSNAIREVLELDSIRSHHWCIQGCSAVTGENLLPGIDW 120 130 140 150 160 170 190 pF1KB4 LKRQGYGEGFRWMAQYID CCDS80 LLDDISSRIFTAD 180 >>CCDS1565.1 ARF1 gene_id:375|Hs108|chr1 (181 aa) initn: 301 init1: 301 opt: 311 Z-score: 366.4 bits: 74.5 E(32554): 4.3e-14 Smith-Waterman score: 312; 29.8% identity (66.3% similar) in 181 aa overlap (18-197:9-177) 10 20 30 40 50 pF1KB4 MSFIFDWIYSGFSSVLQFLGLY-KKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHP : ::. :: .....::: :::::.:. :: .. .::. CCDS15 MGNIFANLFKGLFGKKEMRILMVGLDAAGKTTILYKLKLGEIVTTIPTIGF 10 20 30 40 50 60 70 80 90 100 110 pF1KB4 TSEELTIAGMTFTTFDLGGHVQARRVWKNYLPAINGIVFLVDCADHERLLESKEELDSLM . : . ...::..:.::. . : .:..:. .:..:.:: :.::. :..::: .. CCDS15 NVETVEYKNISFTVWDVGGQDKIRPLWRHYFQNTQGLIFVVDSNDRERVNEAREELMRML 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB4 TDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSISLKELNARPLEVFMCS ... . .. .:...:: : :.:.. .. . .::. ::.. : . :. CCDS15 AEDELRDAVLLVFANKQDLPNAMNAAEITDKLGLH---------SLRHRNWYIQAT--CA 120 130 140 150 160 180 190 pF1KB4 VLKRQGYGEGFRWMAQYID . . .: ::. :... . CCDS15 T-SGDGLYEGLDWLSNQLRNQK 170 180 >>CCDS8774.1 ARF3 gene_id:377|Hs108|chr12 (181 aa) initn: 301 init1: 301 opt: 307 Z-score: 361.9 bits: 73.7 E(32554): 7.7e-14 Smith-Waterman score: 312; 29.6% identity (66.7% similar) in 186 aa overlap (12-197:5-177) 10 20 30 40 50 60 pF1KB4 MSFIFDWIYSGFSSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPT :...:. : . :: .....::: :::::.:. :: .. .::. . CCDS87 MGNIFGNLLKSL-IGKKEMRILMVGLDAAGKTTILYKLKLGEIVTTIPTIGFN 10 20 30 40 50 70 80 90 100 110 120 pF1KB4 SEELTIAGMTFTTFDLGGHVQARRVWKNYLPAINGIVFLVDCADHERLLESKEELDSLMT : . ...::..:.::. . : .:..:. .:..:.:: :.::. :..::: ... CCDS87 VETVEYKNISFTVWDVGGQDKIRPLWRHYFQNTQGLIFVVDSNDRERVNEAREELMRMLA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB4 DETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSISLKELNARPLEVFMCSV .. . .. .:...:: : :.:.. .. . .::. ::.. : . :.. CCDS87 EDELRDAVLLVFANKQDLPNAMNAAEITDKLGLH---------SLRHRNWYIQAT--CAT 120 130 140 150 160 190 pF1KB4 LKRQGYGEGFRWMAQYID . .: ::. :.:. . CCDS87 -SGDGLYEGLDWLANQLKNKK 170 180 >>CCDS3192.1 ARL14 gene_id:80117|Hs108|chr3 (192 aa) initn: 322 init1: 230 opt: 307 Z-score: 361.6 bits: 73.7 E(32554): 8.1e-14 Smith-Waterman score: 327; 32.0% identity (65.7% similar) in 175 aa overlap (24-197:12-175) 10 20 30 40 50 60 pF1KB4 MSFIFDWIYSGFSSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPT : .....::::.:::.:::. :: . .::. . CCDS31 MGSLGSKNPQTKQAQVLLLGLDSAGKSTLLYKLKLAKDITTIPTIGFN 10 20 30 40 70 80 90 100 110 pF1KB4 SEELTIA-GMTFTTFDLGGHVQARRVWKNYLPAINGIVFLVDCADHERLLESKEELDSLM : . . ....:..:.::. . : :: : .:.:..:: .:..:: ::..... .. CCDS31 VEMIELERNLSLTVWDVGGQEKMRTVWGCYCENTDGLVYVVDSTDKQRLEESQRQFEHIL 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB4 TDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSISLKELNARPLEVFMCS .: : :::...:.:: : : :.. : . .:: . : : .. ..: : CCDS31 KNEHIKNVPVVLLANKQDMPGALTAEDITRMFKV------KKLCSDRNWYVQP-----CC 110 120 130 140 150 180 190 pF1KB4 VLKRQGYGEGFRWMAQYID .: .: ..::: .. .. CCDS31 ALTGEGLAQGFRKLTGFVKSHMKSRGDTLAFFKQN 160 170 180 190 >>CCDS9419.1 ARL11 gene_id:115761|Hs108|chr13 (196 aa) initn: 278 init1: 178 opt: 306 Z-score: 360.3 bits: 73.5 E(32554): 9.5e-14 Smith-Waterman score: 309; 33.3% identity (65.5% similar) in 174 aa overlap (22-192:9-170) 10 20 30 40 50 60 pF1KB4 MSFIFDWIYSGFSSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPT .: ...:..:::.:::::::. :: .: . .::. . CCDS94 MGSVNSRGHKAEAQVVMMGLDSAGKTTLLYKLKGHQLVETLPTVGFN 10 20 30 40 70 80 90 100 110 pF1KB4 SEELTIAG-MTFTTFDLGGHVQARRVWKNYLPAINGIVFLVDCADHERLLESKEELDSLM : : : ...: .:.::.. : ::.:: . . .:...: .:. :: :: :: .. CCDS94 VEPLKAPGHVSLTLWDVGGQAPLRASWKDYLEGTDILVYVLDSTDEARLPESAAELTEVL 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB4 TDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSISLKELNARPLEVFMCS .: ..:.::.:.:.:: . :.:. ..:. .::.... . :. :: CCDS94 NDPNMAGVPFLVLANKQEAPDALPLLKIRN------------RLSLERFQDHCWELRGCS 110 120 130 140 150 180 190 pF1KB4 VLKRQGYGEGFR--WMAQYID .: .: :... : CCDS94 ALTGEGLPEALQSLWSLLKSRSCMCLQARAHGAERGDSKRS 160 170 180 190 >>CCDS43322.1 TRIM23 gene_id:373|Hs108|chr5 (569 aa) initn: 258 init1: 258 opt: 306 Z-score: 354.2 bits: 73.9 E(32554): 2.1e-13 Smith-Waterman score: 306; 34.2% identity (69.1% similar) in 152 aa overlap (27-178:406-556) 10 20 30 40 50 pF1KB4 MSFIFDWIYSGFSSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPT ..: ::::.:::::.: ::.:.. : .:: CCDS43 EVADHIQLDASIPVTFTKDNRVHIGPKMEIRVVTLGLDGAGKTTILFKLKQDEFMQPIPT 380 390 400 410 420 430 60 70 80 90 100 110 pF1KB4 LHPTSEELTIAGMTFTTFDLGGHVQARRVWKNYLPAINGIVFLVDCADHERLLESKEELD . . : . .. :: .:.::. . : .::.: ...::.:: . ..:. :.. :: CCDS43 IGFNVETVEYKNLKFTIWDVGGKHKLRPLWKHYYLNTQAVVFVVDSSHRDRISEAHSELA 440 450 460 470 480 490 120 130 140 150 160 170 pF1KB4 SLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSISLKELNARPLEVF .:.:.. . .. .::..:: : :.: :.. :...:. :. : .. .:: . . CCDS43 KLLTEKELRDALLLIFANKQDVAGALSVEEITELLSLHKLCCGR-SWYIQGCDARSVFQI 500 510 520 530 540 550 180 190 pF1KB4 MCSVLKRQGYGEGFRWMAQYID .: CCDS43 ICDQYTGKEVVTEKG 560 >>CCDS34745.1 ARF5 gene_id:381|Hs108|chr7 (180 aa) initn: 298 init1: 298 opt: 298 Z-score: 351.7 bits: 71.8 E(32554): 2.9e-13 Smith-Waterman score: 301; 28.9% identity (63.0% similar) in 173 aa overlap (23-195:15-175) 10 20 30 40 50 60 pF1KB4 MSFIFDWIYSGFSSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPT :: .....::: :::::.:. :: .. .::. . CCDS34 MGLTVSALFSRIFGKKQMRILMVGLDAAGKTTILYKLKLGEIVTTIPTIGFN 10 20 30 40 50 70 80 90 100 110 120 pF1KB4 SEELTIAGMTFTTFDLGGHVQARRVWKNYLPAINGIVFLVDCADHERLLESKEELDSLMT : . .. ::..:.::. . : .:..:. .:..:.:: :.::. :: .::.... CCDS34 VETVEYKNICFTVWDVGGQDKIRPLWRHYFQNTQGLIFVVDSNDRERVQESADELQKMLQ 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB4 DETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSISLKELNARPLEVFMCSV .. . .. .:...:: : :.:. .: . .:: ..: .: : . CCDS34 EDELRDAVLLVFANKQDMPNAMPVSELTDKLGL------------QHLRSRTWYVQATCA 120 130 140 150 160 190 pF1KB4 LKRQGYGEGFRWMAQYID . : .:. :... CCDS34 TQGTGLYDGLDWLSHELSKR 170 180 198 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 06:07:29 2016 done: Sat Nov 5 06:07:29 2016 Total Scan time: 1.970 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]