FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA0609, 704 aa
1>>>pF1KA0609 704 - 704 aa - 704 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.2622+/-0.00115; mu= 14.9169+/- 0.069
mean_var=80.6138+/-15.743, 0's: 0 Z-trim(102.7): 21 B-trim: 0 in 0/49
Lambda= 0.142846
statistics sampled from 7071 (7081) to 7071 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.575), E-opt: 0.2 (0.218), width: 16
Scan time: 2.800
The best scores are: opt bits E(32554)
CCDS13912.1 LARGE1 gene_id:9215|Hs108|chr22 ( 756) 2531 532.0 1.2e-150
CCDS31473.1 LARGE2 gene_id:120071|Hs108|chr11 ( 721) 1333 285.1 2.4e-76
CCDS76399.1 LARGE2 gene_id:120071|Hs108|chr11 ( 690) 1332 284.9 2.7e-76
CCDS8136.1 B4GAT1 gene_id:11041|Hs108|chr11 ( 415) 359 84.3 3.9e-16
>>CCDS13912.1 LARGE1 gene_id:9215|Hs108|chr22 (756 aa)
initn: 2530 init1: 2530 opt: 2531 Z-score: 2818.0 bits: 532.0 E(32554): 1.2e-150
Smith-Waterman score: 4502; 92.9% identity (92.9% similar) in 736 aa overlap (1-684:1-736)
10 20 30 40 50 60
pF1KA0 MLGICRGRRKFLAASLSLLCIPAITWIYLFSGSFEDGKPVSLSPLESQAHSPRYTASSQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MLGICRGRRKFLAASLSLLCIPAITWIYLFSGSFEDGKPVSLSPLESQAHSPRYTASSQR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA0 ERESLEVRMREVEEENRALRRQLSLAQGRAPSHRRGNHSKTYSMEEGTGDSENLRAGIVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 ERESLEVRMREVEEENRALRRQLSLAQGRAPSHRRGNHSKTYSMEEGTGDSENLRAGIVA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA0 GNSSECGQQPVVEKCETIHVAIVCAGYNASRDVVTLVKSVLFHRRNPLHFHLIADSIAEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 GNSSECGQQPVVEKCETIHVAIVCAGYNASRDVVTLVKSVLFHRRNPLHFHLIADSIAEQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA0 ILATLFQTWMVPAVRVDFYNADELKSEVSWIPNKHYSGIYGLMKLVLTKTLPANLERVIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 ILATLFQTWMVPAVRVDFYNADELKSEVSWIPNKHYSGIYGLMKLVLTKTLPANLERVIV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA0 LDTDITFATDIAELWAVFHKFKGQQVLGLVENQSDWYLGNLWKNHRPWPALGRGYNTGVI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LDTDITFATDIAELWAVFHKFKGQQVLGLVENQSDWYLGNLWKNHRPWPALGRGYNTGVI
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA0 LLLLDKLRKMKWEQMWRLTAERELMGMLSTSLADQDIFNAVIKQNPFLVYQLPCFWNVQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LLLLDKLRKMKWEQMWRLTAERELMGMLSTSLADQDIFNAVIKQNPFLVYQLPCFWNVQL
310 320 330 340 350 360
370
pF1KA0 SDHTRSEQCYRDVSDLK-------------------------------------------
:::::::::::::::::
CCDS13 SDHTRSEQCYRDVSDLKVIHWNSPKKLRVKNKHVEFFRNLYLTFLEYDGNLLRRELFGCP
370 380 390 400 410 420
380 390 400 410 420
pF1KA0 ---------LQKQLSELDEDDLCYEFRRERFTVHRTHLYFLHYEYEPAADSTDVTLVAQL
:::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SEADVNSENLQKQLSELDEDDLCYEFRRERFTVHRTHLYFLHYEYEPAADSTDVTLVAQL
430 440 450 460 470 480
430 440 450 460 470 480
pF1KA0 SMDRLQMLEAICKHWEGPISLALYLSDAEAQQFLRYAQGSEVLMSRHNVGYHIVYKEGQF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SMDRLQMLEAICKHWEGPISLALYLSDAEAQQFLRYAQGSEVLMSRHNVGYHIVYKEGQF
490 500 510 520 530 540
490 500 510 520 530 540
pF1KA0 YPVNLLRNVAMKHISTPYMFLSDIDFLPMYGLYEYLRKSVIQLDLANTKKAMIVPAFETL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 YPVNLLRNVAMKHISTPYMFLSDIDFLPMYGLYEYLRKSVIQLDLANTKKAMIVPAFETL
550 560 570 580 590 600
550 560 570 580 590 600
pF1KA0 RYRLSFPKSKAELLSMLDMGTLFTFRYHVWTKGHAPTNFAKWRTATTPYRVEWEADFEPY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 RYRLSFPKSKAELLSMLDMGTLFTFRYHVWTKGHAPTNFAKWRTATTPYRVEWEADFEPY
610 620 630 640 650 660
610 620 630 640 650 660
pF1KA0 VVVRRDCPEYDRRFVGFGWNKVAHIMELDVQEYEFIVLPNAYMIHMPHAPSFDITKFRSN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 VVVRRDCPEYDRRFVGFGWNKVAHIMELDVQEYEFIVLPNAYMIHMPHAPSFDITKFRSN
670 680 690 700 710 720
670 680 690 700
pF1KA0 KQYRICLKTLKEEFQQDMSRRYGFAALKYLTAENNS
::::::::::::::::
CCDS13 KQYRICLKTLKEEFQQDMSRRYGFAALKYLTAENNS
730 740 750
>>CCDS31473.1 LARGE2 gene_id:120071|Hs108|chr11 (721 aa)
initn: 2724 init1: 1298 opt: 1333 Z-score: 1484.0 bits: 285.1 E(32554): 2.4e-76
Smith-Waterman score: 2671; 60.6% identity (80.0% similar) in 650 aa overlap (89-684:55-695)
60 70 80 90 100 110
pF1KA0 QRERESLEVRMREVEEENRALRRQLSLAQGRAPSHRRGNHSKTYSMEEGTGDSENLRAGI
:.: : .. . . . :.: ...
CCDS31 LLFGGDLGCERREPGGRAGAPGCFPGPLMPRVPPDGRLRRAAALDGDPGAGPGDH-----
30 40 50 60 70
120 130 140 150 160 170
pF1KA0 VAGNSSECGQQPVVE-KCETIHVAIVCAGYNASRDVVTLVKSVLFHRRNPLHFHLIADSI
: :.:: :: ::: .::::::::.:.::::.:::::.::.:.::::.::..:..
CCDS31 ---NRSDCGPQPPPPPKCELLHVAIVCAGHNSSRDVITLVKSMLFYRKNPLHLHLVTDAV
80 90 100 110 120 130
180 190 200 210 220 230
pF1KA0 AEQILATLFQTWMVPAVRVDFYNADELKSEVSWIPNKHYSGIYGLMKLVLTKTLPANLER
:..:: :::.:::::::::.::.::.:: .:::::::::::.:::::::: ..:::.: :
CCDS31 ARNILETLFHTWMVPAVRVSFYHADQLKPQVSWIPNKHYSGLYGLMKLVLPSALPAELAR
140 150 160 170 180 190
240 250 260 270 280 290
pF1KA0 VIVLDTDITFATDIAELWAVFHKFKGQQVLGLVENQSDWYLGNLWKNHRPWPALGRGYNT
:::::::.:::.::.::::.: .:. :..:::::::::::::::::::::::::::.::
CCDS31 VIVLDTDVTFASDISELWALFAHFSDTQAIGLVENQSDWYLGNLWKNHRPWPALGRGFNT
200 210 220 230 240 250
300 310 320 330 340 350
pF1KA0 GVILLLLDKLRKMKWEQMWRLTAERELMGMLSTSLADQDIFNAVIKQNPFLVYQLPCFWN
::::: ::.::. :::::::::.:::... .::::::::::::::..: :: .::: ::
CCDS31 GVILLRLDRLRQAGWEQMWRLTARRELLSLPATSLADQDIFNAVIKEHPGLVQRLPCVWN
260 270 280 290 300 310
360 370
pF1KA0 VQLSDHTRSEQCYRDVSDLK----------------------------------------
::::::: .:.:: ..::::
CCDS31 VQLSDHTLAERCYSEASDLKVIHWNSPKKLRVKNKHVEFFRNFYLTFLEYDGNLLRRELF
320 330 340 350 360 370
380 390 400 410 420
pF1KA0 ------------LQKQLSELDEDDLCYEFRRERFTVHRTHLYFLHYEYEPAADSTDVTLV
::. :..:::.: :.:::....::::.:. :: .: : :::::
CCDS31 VCPSQPPPGAEQLQQALAQLDEEDPCFEFRQQQLTVHRVHVTFLPHE-PPPPRPHDVTLV
380 390 400 410 420 430
430 440 450 460 470 480
pF1KA0 AQLSMDRLQMLEAICKHWEGPISLALYLSDAEAQQFLRYAQGSEVLMSRHNVGYHIVYKE
:::::::::::::.:.:: ::.::::::.::::::::.....: :: .:..:.::.::.:
CCDS31 AQLSMDRLQMLEALCRHWPGPMSLALYLTDAEAQQFLHFVEASPVLAARQDVAYHVVYRE
440 450 460 470 480 490
490 500 510 520 530 540
pF1KA0 GQFYPVNLLRNVAMKHISTPYMFLSDIDFLPMYGLYEYLRKSVIQLDLANTKKA-MIVPA
: .:::: :::::. . :::.::::::::: :.::.::: :. :: :.. .:: ..:::
CCDS31 GPLYPVNQLRNVALAQALTPYVFLSDIDFLPAYSLYDYLRASIEQLGLGSRRKAALVVPA
500 510 520 530 540 550
550 560 570 580 590 600
pF1KA0 FETLRYRLSFPKSKAELLSMLDMGTLFTFRYHVWTKGHAPTNFAKWRTATTPYRVEWEAD
:::::::.:::.::.:::..:: :::.::::: : .:::::..:.:: : .::::.: :.
CCDS31 FETLRYRFSFPHSKVELLALLDAGTLYTFRYHEWPRGHAPTDYARWREAQAPYRVQWAAN
560 570 580 590 600 610
610 620 630 640 650 660
pF1KA0 FEPYVVVRRDCPEYDRRFVGFGWNKVAHIMELDVQEYEFIVLPNAYMIHMPHAPSFDITK
.:::::: ::::.:: :::::::::::::.:::.::::..:::.:. ::.:::::.::..
CCDS31 YEPYVVVPRDCPRYDPRFVGFGWNKVAHIVELDAQEYELLVLPEAFTIHLPHAPSLDISR
620 630 640 650 660 670
670 680 690 700
pF1KA0 FRSNKQYRICLKTLKEEFQQDMSRRYGFAALKYLTAENNS
:::. :: ::..::.::.:
CCDS31 FRSSPTYRDCLQALKDEFHQDLSRHHGAAALKYLPALQQPQSPARG
680 690 700 710 720
>>CCDS76399.1 LARGE2 gene_id:120071|Hs108|chr11 (690 aa)
initn: 2724 init1: 1298 opt: 1332 Z-score: 1483.2 bits: 284.9 E(32554): 2.7e-76
Smith-Waterman score: 2670; 62.8% identity (81.4% similar) in 623 aa overlap (116-684:43-664)
90 100 110 120 130 140
pF1KA0 AQGRAPSHRRGNHSKTYSMEEGTGDSENLRAGIVAGNSSECGQQPVVE-KCETIHVAIVC
:: : :.:: :: ::: .::::::
CCDS76 AALLLLLLLLGFLLFDGRLRRAAALDGDPGAGPGDHNRSDCGPQPPPPPKCELLHVAIVC
20 30 40 50 60 70
150 160 170 180 190 200
pF1KA0 AGYNASRDVVTLVKSVLFHRRNPLHFHLIADSIAEQILATLFQTWMVPAVRVDFYNADEL
::.:.::::.:::::.::.:.::::.::..:..:..:: :::.:::::::::.::.::.:
CCDS76 AGHNSSRDVITLVKSMLFYRKNPLHLHLVTDAVARNILETLFHTWMVPAVRVSFYHADQL
80 90 100 110 120 130
210 220 230 240 250 260
pF1KA0 KSEVSWIPNKHYSGIYGLMKLVLTKTLPANLERVIVLDTDITFATDIAELWAVFHKFKGQ
: .:::::::::::.:::::::: ..:::.: ::::::::.:::.::.::::.: .:.
CCDS76 KPQVSWIPNKHYSGLYGLMKLVLPSALPAELARVIVLDTDVTFASDISELWALFAHFSDT
140 150 160 170 180 190
270 280 290 300 310 320
pF1KA0 QVLGLVENQSDWYLGNLWKNHRPWPALGRGYNTGVILLLLDKLRKMKWEQMWRLTAEREL
:..:::::::::::::::::::::::::::.::::::: ::.::. :::::::::.:::
CCDS76 QAIGLVENQSDWYLGNLWKNHRPWPALGRGFNTGVILLRLDRLRQAGWEQMWRLTARREL
200 210 220 230 240 250
330 340 350 360 370
pF1KA0 MGMLSTSLADQDIFNAVIKQNPFLVYQLPCFWNVQLSDHTRSEQCYRDVSDLK-------
... .::::::::::::::..: :: .::: ::::::::: .:.:: ..::::
CCDS76 LSLPATSLADQDIFNAVIKEHPGLVQRLPCVWNVQLSDHTLAERCYSEASDLKVIHWNSP
260 270 280 290 300 310
380 390
pF1KA0 ---------------------------------------------LQKQLSELDEDDLCY
::. :..:::.: :.
CCDS76 KKLRVKNKHVEFFRNFYLTFLEYDGNLLRRELFVCPSQPPPGAEQLQQALAQLDEEDPCF
320 330 340 350 360 370
400 410 420 430 440 450
pF1KA0 EFRRERFTVHRTHLYFLHYEYEPAADSTDVTLVAQLSMDRLQMLEAICKHWEGPISLALY
:::....::::.:. :: .: : ::::::::::::::::::.:.:: ::.:::::
CCDS76 EFRQQQLTVHRVHVTFLPHE-PPPPRPHDVTLVAQLSMDRLQMLEALCRHWPGPMSLALY
380 390 400 410 420 430
460 470 480 490 500 510
pF1KA0 LSDAEAQQFLRYAQGSEVLMSRHNVGYHIVYKEGQFYPVNLLRNVAMKHISTPYMFLSDI
:.::::::::.....: :: .:..:.::.::.:: .:::: :::::. . :::.:::::
CCDS76 LTDAEAQQFLHFVEASPVLAARQDVAYHVVYREGPLYPVNQLRNVALAQALTPYVFLSDI
440 450 460 470 480 490
520 530 540 550 560 570
pF1KA0 DFLPMYGLYEYLRKSVIQLDLANTKKA-MIVPAFETLRYRLSFPKSKAELLSMLDMGTLF
:::: :.::.::: :. :: :.. .:: ..::::::::::.:::.::.:::..:: :::.
CCDS76 DFLPAYSLYDYLRASIEQLGLGSRRKAALVVPAFETLRYRFSFPHSKVELLALLDAGTLY
500 510 520 530 540 550
580 590 600 610 620 630
pF1KA0 TFRYHVWTKGHAPTNFAKWRTATTPYRVEWEADFEPYVVVRRDCPEYDRRFVGFGWNKVA
::::: : .:::::..:.:: : .::::.: :..:::::: ::::.:: :::::::::::
CCDS76 TFRYHEWPRGHAPTDYARWREAQAPYRVQWAANYEPYVVVPRDCPRYDPRFVGFGWNKVA
560 570 580 590 600 610
640 650 660 670 680 690
pF1KA0 HIMELDVQEYEFIVLPNAYMIHMPHAPSFDITKFRSNKQYRICLKTLKEEFQQDMSRRYG
::.:::.::::..:::.:. ::.:::::.::..:::. :: ::..::.::.:
CCDS76 HIVELDAQEYELLVLPEAFTIHLPHAPSLDISRFRSSPTYRDCLQALKDEFHQDLSRHHG
620 630 640 650 660 670
700
pF1KA0 FAALKYLTAENNS
CCDS76 AAALKYLPALQQPQSPARG
680 690
>>CCDS8136.1 B4GAT1 gene_id:11041|Hs108|chr11 (415 aa)
initn: 339 init1: 123 opt: 359 Z-score: 403.1 bits: 84.3 E(32554): 3.9e-16
Smith-Waterman score: 395; 28.7% identity (54.9% similar) in 328 aa overlap (418-690:91-408)
390 400 410 420 430 440
pF1KA0 DDLCYEFRRERFTVHRTHLYFLHYEYEPAADSTDVTLVAQLSMDRLQMLEAICKHWEGPI
: .:: :... :.: : : .. ..::::.
CCDS81 AQLRTALASGGVLDASGDYRVYRGLLKTTMDPNDVILATHASVDNLLHLSGLLERWEGPL
70 80 90 100 110 120
450 460 470 480
pF1KA0 SLALYLSDAEAQQF---LRYAQGSEVLMSRHNVGYHIV------------YKEGQF----
:.... . : :. : :: .:. : :..:.: . :.:
CCDS81 SVSVFAATKEEAQLATVLAYALSSHCPDMRARVAMHLVCPSRYEAAVPDPREPGEFALLR
130 140 150 160 170 180
490 500 510 520
pF1KA0 --------------------------YPVNLLRNVAMKHISTPYMFLSDIDFLPMYGLYE
:: :::::.: . .. : .. :.:..: ::..
CCDS81 SCQEVFDKLARVAQPGINYALGTNVSYPNNLLRNLARE--GANYALVIDVDMVPSEGLWR
190 200 210 220 230
530 540 550 560 570 580
pF1KA0 YLRKSVIQLDLANT--KKAMIVPAFETLRYRLSFPKSKAELLSMLDMGTLFTFRYHVWTK
::. .:: .: :..::::: : : .: .: ::... ..: . : : . :
CCDS81 GLRE---MLDQSNQWGGTALVVPAFEIRRAR-RMPMNKNELVQLYQVGEVRPFYYGLCTP
240 250 260 270 280 290
590 600 610 620 630
pF1KA0 GHAPTNFAKW-----RTATTP-YRVEWEADFEPYVVVRRDCPEYDRRFVGFGWNKVAHIM
.::::...: .. : : : :. .::. :. : .:.:: .:.:....
CCDS81 CQAPTNYSRWVNLPEESLLRPAYVVPWQDPWEPFYVAGGKVPTFDERFRQYGFNRISQAC
300 310 320 330 340 350
640 650 660 670 680 690
pF1KA0 ELDVQEYEFIVLPNAYMIH--MPHAPSFDITKFRSNKQYRICLKTLKEEFQQDMSRRYGF
:: : ..: :: .....: . .: .: : :.. .: : ..:.:... .:
CCDS81 ELHVAGFDFEVLNEGFLVHKGFKEALKFHPQKEAENQHNKI----LYRQFKQELKAKYPN
360 370 380 390 400 410
700
pF1KA0 AALKYLTAENNS
CCDS81 SPRRC
704 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 19:25:16 2016 done: Wed Nov 2 19:25:17 2016
Total Scan time: 2.800 Total Display time: 0.050
Function used was FASTA [36.3.4 Apr, 2011]