FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2393, 498 aa
1>>>pF1KE2393 498 - 498 aa - 498 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.6980+/-0.000922; mu= 11.2345+/- 0.055
mean_var=90.3422+/-17.962, 0's: 0 Z-trim(107.8): 78 B-trim: 71 in 1/50
Lambda= 0.134936
statistics sampled from 9704 (9784) to 9704 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.666), E-opt: 0.2 (0.301), width: 16
Scan time: 3.000
The best scores are: opt bits E(32554)
CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 498) 3350 662.4 3.3e-190
CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 ( 502) 2080 415.1 8.8e-116
CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 494) 1460 294.4 1.9e-79
CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 479) 1317 266.6 4.4e-71
CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 489) 1292 261.7 1.3e-69
CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 505) 1292 261.7 1.3e-69
CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 ( 627) 1284 260.2 4.8e-69
CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 529) 1281 259.6 6.2e-69
CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 514) 1201 244.0 2.9e-64
CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 ( 458) 1190 241.9 1.2e-63
CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 468) 1151 234.3 2.3e-61
CCDS2261.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 457) 1116 227.4 2.5e-59
CCDS10027.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 502) 1052 215.0 1.5e-55
CCDS53924.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 531) 1052 215.0 1.6e-55
CCDS3459.1 CHRNA9 gene_id:55584|Hs108|chr4 ( 479) 964 197.9 2.1e-50
CCDS33331.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 482) 964 197.9 2.1e-50
CCDS7745.1 CHRNA10 gene_id:57053|Hs108|chr11 ( 450) 953 195.7 8.9e-50
CCDS58392.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 231) 780 161.9 6.7e-40
CCDS11106.1 CHRNB1 gene_id:1140|Hs108|chr17 ( 501) 777 161.5 2e-39
CCDS58754.1 CHRND gene_id:1144|Hs108|chr2 ( 502) 765 159.1 1e-38
CCDS32184.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 412) 749 156.0 7.4e-38
CCDS53710.1 HTR3A gene_id:3359|Hs108|chr11 ( 463) 672 141.0 2.7e-33
CCDS8365.2 HTR3A gene_id:3359|Hs108|chr11 ( 484) 671 140.8 3.2e-33
CCDS33400.1 CHRNG gene_id:1146|Hs108|chr2 ( 517) 669 140.4 4.4e-33
CCDS8366.2 HTR3A gene_id:3359|Hs108|chr11 ( 516) 583 123.7 4.8e-28
CCDS2494.1 CHRND gene_id:1144|Hs108|chr2 ( 517) 564 120.0 6.3e-27
CCDS11058.1 CHRNE gene_id:1145|Hs108|chr17 ( 493) 557 118.6 1.6e-26
CCDS58868.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 549 117.1 4.3e-26
CCDS3251.1 HTR3E gene_id:285242|Hs108|chr3 ( 471) 541 115.5 1.3e-25
CCDS42008.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 321) 538 114.9 1.4e-25
CCDS8364.1 HTR3B gene_id:9177|Hs108|chr11 ( 441) 540 115.3 1.4e-25
CCDS3250.1 HTR3C gene_id:170572|Hs108|chr3 ( 447) 496 106.7 5.3e-23
CCDS58869.1 HTR3E gene_id:285242|Hs108|chr3 ( 441) 462 100.1 5.2e-21
CCDS58870.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 462 100.1 5.3e-21
CCDS58871.1 HTR3E gene_id:285242|Hs108|chr3 ( 482) 380 84.2 3.6e-16
CCDS76786.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 160) 362 80.5 1.5e-15
CCDS3471.1 GABRA2 gene_id:2555|Hs108|chr4 ( 451) 334 75.2 1.7e-13
CCDS82921.1 GABRA2 gene_id:2555|Hs108|chr4 ( 511) 334 75.2 1.9e-13
CCDS4375.1 GABRP gene_id:2568|Hs108|chr5 ( 440) 327 73.8 4.2e-13
CCDS4359.1 GABRG2 gene_id:2566|Hs108|chr5 ( 475) 317 71.9 1.7e-12
CCDS4358.1 GABRG2 gene_id:2566|Hs108|chr5 ( 467) 314 71.3 2.6e-12
CCDS45194.1 GABRA5 gene_id:2558|Hs108|chr15 ( 462) 310 70.5 4.4e-12
CCDS14706.1 GABRA3 gene_id:2556|Hs108|chrX ( 492) 307 70.0 6.9e-12
CCDS4356.1 GABRA6 gene_id:2559|Hs108|chr5 ( 453) 305 69.6 8.4e-12
CCDS3473.1 GABRA4 gene_id:2557|Hs108|chr4 ( 554) 305 69.6 1e-11
CCDS75368.1 GABRP gene_id:2568|Hs108|chr5 ( 289) 299 68.3 1.3e-11
CCDS4357.1 GABRA1 gene_id:2554|Hs108|chr5 ( 456) 300 68.6 1.7e-11
CCDS45195.1 GABRG3 gene_id:2567|Hs108|chr15 ( 467) 299 68.4 1.9e-11
CCDS4354.1 GABRB2 gene_id:2561|Hs108|chr5 ( 474) 299 68.4 2e-11
CCDS4355.1 GABRB2 gene_id:2561|Hs108|chr5 ( 512) 299 68.4 2.1e-11
>>CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 (498 aa)
initn: 3350 init1: 3350 opt: 3350 Z-score: 3528.3 bits: 662.4 E(32554): 3.3e-190
Smith-Waterman score: 3350; 100.0% identity (100.0% similar) in 498 aa overlap (1-498:1-498)
10 20 30 40 50 60
pF1KE2 MRRAPSLVLFFLVALCGRGNCRVANAEEKLMDDLLNKTRYNNLIRPATSSSQLISIKLQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MRRAPSLVLFFLVALCGRGNCRVANAEEKLMDDLLNKTRYNNLIRPATSSSQLISIKLQL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 SLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKRIWLPDIVLYNN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKRIWLPDIVLYNN
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 ADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTLKFRSWTYDHTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTLKFRSWTYDHTE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 IDMVLMTPTASMDDFTPSGEWDIVALPGRRTVNPQDPSYVDVTYDFIIKRKPLFYTINLI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 IDMVLMTPTASMDDFTPSGEWDIVALPGRRTVNPQDPSYVDVTYDFIIKRKPLFYTINLI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 IPCVLTTLLAILVFYLPSDCGEKMTLCISVLLALTFFLLLISKIVPPTSLDVPLIGKYLM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 IPCVLTTLLAILVFYLPSDCGEKMTLCISVLLALTFFLLLISKIVPPTSLDVPLIGKYLM
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 FTMVLVTFSIVTSVCVLNVHHRSPSTHTMAPWVKRCFLHKLPTFLFMKRPGPDSSPARAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 FTMVLVTFSIVTSVCVLNVHHRSPSTHTMAPWVKRCFLHKLPTFLFMKRPGPDSSPARAF
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 PPSKSCVTKPEATATSTSPSNFYGNSMYFVNPASAASKSPAGSTPVAIPRDFWLRSSGRF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PPSKSCVTKPEATATSTSPSNFYGNSMYFVNPASAASKSPAGSTPVAIPRDFWLRSSGRF
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 RQDVQEALEGVSFIAQHMKNDDEDQSVVEDWKYVAMVVDRLFLWVFMFVCVLGTVGLFLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RQDVQEALEGVSFIAQHMKNDDEDQSVVEDWKYVAMVVDRLFLWVFMFVCVLGTVGLFLP
430 440 450 460 470 480
490
pF1KE2 PLFQTHAASEGPYAAQRD
::::::::::::::::::
CCDS10 PLFQTHAASEGPYAAQRD
490
>>CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 (502 aa)
initn: 2087 init1: 1763 opt: 2080 Z-score: 2192.1 bits: 415.1 E(32554): 8.8e-116
Smith-Waterman score: 2080; 64.8% identity (83.1% similar) in 486 aa overlap (7-489:11-489)
10 20 30 40 50
pF1KE2 MRRAPSLVLFFLVALCGRGNCRVANAEEKLMDDLLNKTRYNNLIRPATSSSQLISI
:. : :. ::. . ...::.:.. ::. .:::.::::::..:.:...
CCDS10 MARRCGPVALLLGFGLLRLCS--GVWGTDTEERLVEHLLDPSRYNKLIRPATNGSELVTV
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 KLQLSLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKRIWLPDIV
.:..::::::::.:::::::::::: ::: ::::::. ...... .:.:.:.:::::.:
CCDS10 QLMVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHIWLPDVV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 LYNNADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTLKFRSWTY
::::::: :::: :.: .: .::..::::::::::::::::.:::::::::.:::::::
CCDS10 LYNNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMKFRSWTY
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 DHTEIDMVLMTPTASMDDFTPSGEWDIVALPGRRTVNPQDPSYVDVTYDFIIKRKPLFYT
:.::::.:: . .::.::::::::::::::::::. ::.: .:::.::::::.:::::::
CCDS10 DRTEIDLVLKSEVASLDDFTPSGEWDIVALPGRRNENPDDSTYVDITYDFIIRRKPLFYT
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 INLIIPCVLTTLLAILVFYLPSDCGEKMTLCISVLLALTFFLLLISKIVPPTSLDVPLIG
::::::::: : ::::::::::::::::::::::::::: ::::::::::::::::::.:
CCDS10 INLIIPCVLITSLAILVFYLPSDCGEKMTLCISVLLALTVFLLLISKIVPPTSLDVPLVG
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 KYLMFTMVLVTFSIVTSVCVLNVHHRSPSTHTMAPWVKRCFLHKLPTFLFMKRPGPDSSP
::::::::::::::::::::::::::::.::::::::: ::.:::..:::..: .
CCDS10 KYLMFTMVLVTFSIVTSVCVLNVHHRSPTTHTMAPWVKVVFLEKLPALLFMQQPRHHCAR
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 ARAFPPSKSCVTKPEATATSTSPSNFYGNSMYFVNPASA---ASKSPAGSTPVAIPRDFW
: . . . : : . . ::: ::. :. : .::: :
CCDS10 QR-LRLRRRQREREGAGALFFREAPGADSCTCFVNRASVQGLAGAFGAEPAPVAGPG---
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE2 LRSSGRFRQDVQEALEGVSFIAQHMKNDDEDQSVVEDWKYVAMVVDRLFLWVFMFVCVLG
::. ..::..:: :::.::...:.:::: :::::::::.::::::.:.::::.:
CCDS10 -RSGEPCGCGLREAVDGVRFIADHMRSEDDDQSVSEDWKYVAMVIDRLFLWIFVFVCVFG
420 430 440 450 460 470
480 490
pF1KE2 TVGLFLPPLFQTHAASEGPYAAQRD
:.:.:: ::::.....
CCDS10 TIGMFLQPLFQNYTTTTFLHSDHSAPSSK
480 490 500
>>CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 (494 aa)
initn: 1301 init1: 718 opt: 1460 Z-score: 1539.9 bits: 294.4 E(32554): 1.9e-79
Smith-Waterman score: 1460; 45.6% identity (73.8% similar) in 474 aa overlap (21-483:28-488)
10 20 30 40 50
pF1KE2 MRRAPSLVLFFLVALCGRGNCRVANAEEKLMDDLLNKTRYNNLIRPATSSSQL
: .::.:. :. ..::..:::. . :.
CCDS61 MLTSKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLF--SHYNQFIRPVENVSDP
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 ISIKLQLSLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKRIWLP
..........:: .:.: .::: ::.::.. :.::.: :. .:.:.. ::.:: .:: :
CCDS61 VTVHFEVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVPADKIWKP
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 DIVLYNNADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTLKFRS
:::::::: : ..: :. ... :: . : ::::.::.: ... .::::.:::.::: :
CCDS61 DIVLYNNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGS
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 WTYDHTEIDMVLMTPTASMDDFTPSGEWDIVALPGRR---TVNPQDPSYVDVTYDFIIKR
::::..:::.... ..:.:: ..::.:. : . : . :.:.::.: :.:
CCDS61 WTYDKAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRR
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 KPLFYTINLIIPCVLTTLLAILVFYLPSDCGEKMTLCISVLLALTFFLLLISKIVPPTSL
:.::::::::::.. ..:..::::::::::::.::::::::.:: :::.:.. .: :::
CCDS61 LPMFYTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSL
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 DVPLIGKYLMFTMVLVTFSIVTSVCVLNVHHRSPSTHTMAPWVKRCFLHKLPTFLFMKRP
:::.:.::.:::..::.:::..: :::.:.:.:.:::: ::: ::. :: :.:. :
CCDS61 VVPLVGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMRWP
300 310 320 330 340 350
360 370 380 390 400
pF1KE2 -------GPDSSP-ARAFPPSKSCVTKPEATATSTSPSNFYGNSMYFVNPASAASKSPAG
: :. : . : :.:. . :. : .. . :.:: .
CCDS61 LDKTRGTGSDAVPRGLARRPAKGKL------ASHGEPRHLKECFHCHKSNELATSKRRLS
360 370 380 390 400 410
410 420 430 440 450 460
pF1KE2 STPVAIPRDFWLRSSGRFRQDVQEALEGVSFIAQHMKNDDEDQSVVEDWKYVAMVVDRLF
:. :. ... .:......:.:::..::. .: . : .:::::::::::.:
CCDS61 HQPLQ-----WVVENSEHSPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVF
420 430 440 450 460
470 480 490
pF1KE2 LWVFMFVCVLGTVGLFLPPLFQTHAASEGPYAAQRD
::::..:::.::.:::: ::.
CCDS61 LWVFIIVCVFGTAGLFLQPLLGNTGKS
470 480 490
>>CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 (479 aa)
initn: 1216 init1: 597 opt: 1317 Z-score: 1389.7 bits: 266.6 E(32554): 4.4e-71
Smith-Waterman score: 1361; 43.9% identity (71.1% similar) in 474 aa overlap (21-483:28-473)
10 20 30 40 50
pF1KE2 MRRAPSLVLFFLVALCGRGNCRVANAEEKLMDDLLNKTRYNNLIRPATSSSQL
: .::.:. :. ..::..:::. . :.
CCDS56 MLTSKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLF--SHYNQFIRPVENVSDP
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 ISIKLQLSLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKRIWLP
..........:: .: :.::.: :. .:.:.. ::.:: .:: :
CCDS56 VTVHFEVAITQLANVI---------------WNDYKLRWDPMEYDGIETLRVPADKIWKP
60 70 80 90 100
120 130 140 150 160 170
pF1KE2 DIVLYNNADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTLKFRS
:::::::: : ..: :. ... :: . : ::::.::.: ... .::::.:::.::: :
CCDS56 DIVLYNNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGS
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE2 WTYDHTEIDMVLMTPTASMDDFTPSGEWDIVALPGRR---TVNPQDPSYVDVTYDFIIKR
::::..:::.... ..:.:: ..::.:. : . : . :.:.::.: :.:
CCDS56 WTYDKAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRR
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE2 KPLFYTINLIIPCVLTTLLAILVFYLPSDCGEKMTLCISVLLALTFFLLLISKIVPPTSL
:.::::::::::.. ..:..::::::::::::.::::::::.:: :::.:.. .: :::
CCDS56 LPMFYTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSL
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE2 DVPLIGKYLMFTMVLVTFSIVTSVCVLNVHHRSPSTHTMAPWVKRCFLHKLPTFLFMKRP
:::.:.::.:::..::.:::..: :::.:.:.:.:::: ::: ::. :: :.:. :
CCDS56 VVPLVGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMRWP
290 300 310 320 330 340
360 370 380 390 400
pF1KE2 -------GPDSSP-ARAFPPSKSCVTKPEATATSTSPSNFYGNSMYFVNPASAASKSPAG
: :. : . : :.:. . :. : .. . :.:: .
CCDS56 LDKTRGTGSDAVPRGLARRPAKGKL------ASHGEPRHLKECFHCHKSNELATSKRRLS
350 360 370 380 390
410 420 430 440 450 460
pF1KE2 STPVAIPRDFWLRSSGRFRQDVQEALEGVSFIAQHMKNDDEDQSVVEDWKYVAMVVDRLF
:. :. ... .:......:.:::..::. .: . : .:::::::::::.:
CCDS56 HQPLQ-----WVVENSEHSPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVF
400 410 420 430 440 450
470 480 490
pF1KE2 LWVFMFVCVLGTVGLFLPPLFQTHAASEGPYAAQRD
::::..:::.::.:::: ::.
CCDS56 LWVFIIVCVFGTAGLFLQPLLGNTGKS
460 470
>>CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 (489 aa)
initn: 1310 init1: 670 opt: 1292 Z-score: 1363.2 bits: 261.7 E(32554): 1.3e-69
Smith-Waterman score: 1315; 45.1% identity (73.3% similar) in 450 aa overlap (5-443:15-460)
10 20 30 40 50
pF1KE2 MRRAPSLVLFFLVALCGRGNCRVANAEEKLMDDLLNKTRYNNLIRPATSS
: :.:..:..: . :...::..:.. :.. ::..:::...
CCDS53 MGSGPLSLPLALSPPRLLLLLLLSLLPVA--RASEAEHRLFERLFED--YNEIIRPVANV
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 SQLISIKLQLSLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKRI
:. . :....:..::..:.: .::: ::.:::: :.::.: :: : : :....:.::..:
CCDS53 SDPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKI
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 WLPDIVLYNNADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTLK
: ::::::::: : ..:. :. ... .: : :.::::.::.:::.: ::::: ::::.:
CCDS53 WKPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMK
120 130 140 150 160 170
180 190 200 210 220
pF1KE2 FRSWTYDHTEIDMVLMTPTASMDDFTPSGEWDIVALPGRR---TVNPQDPSYVDVTYDFI
: ::.::...::.::. . .. :. :::: :. :: . : . : :.::..
CCDS53 FGSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYSLY
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE2 IKRKPLFYTINLIIPCVLTTLLAILVFYLPSDCGEKMTLCISVLLALTFFLLLISKIVPP
:.: ::::::::::::.: ..:..::::::::::::.::::::::.:: :::.:.. .:
CCDS53 IRRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPS
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE2 TSLDVPLIGKYLMFTMVLVTFSIVTSVCVLNVHHRSPSTHTMAPWVKRCFLHKLPTFLFM
::: .::::.::.:::..::.::: .: :::::.:.:.:::: ::: ::. :: .::
CCDS53 TSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMFM
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE2 KRPGPDSSPARAFPP-------SKSCVTKPEATATSTSPSNFYGNSMYFVNPASAASKSP
:: . . :. : . .: .. :. . . . : : . :.
CCDS53 TRPTSNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDGMCGYCHHRRIKISNFS
360 370 380 390 400 410
410 420 430 440 450
pF1KE2 AGSTPVAIPRDF-WLRSSGRFRQDVQEALEGVSFIAQHMKNDDEDQSVVEDWKYVAMVVD
:. : . .. . : . . ...::...:..::..:: ..:
CCDS53 ANLTRSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNEAKEEQKAQEIQQLKRK
420 430 440 450 460 470
460 470 480 490
pF1KE2 RLFLWVFMFVCVLGTVGLFLPPLFQTHAASEGPYAAQRD
CCDS53 EKSTETSDQEPGL
480
>>CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 (505 aa)
initn: 1514 init1: 670 opt: 1292 Z-score: 1363.0 bits: 261.7 E(32554): 1.3e-69
Smith-Waterman score: 1519; 46.5% identity (74.1% similar) in 495 aa overlap (5-488:15-505)
10 20 30 40 50
pF1KE2 MRRAPSLVLFFLVALCGRGNCRVANAEEKLMDDLLNKTRYNNLIRPATSS
: :.:..:..: . :...::..:.. :.. ::..:::...
CCDS10 MGSGPLSLPLALSPPRLLLLLLLSLLPVA--RASEAEHRLFERLFED--YNEIIRPVANV
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 SQLISIKLQLSLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKRI
:. . :....:..::..:.: .::: ::.:::: :.::.: :: : : :....:.::..:
CCDS10 SDPVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKI
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 WLPDIVLYNNADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTLK
: ::::::::: : ..:. :. ... .: : :.::::.::.:::.: ::::: ::::.:
CCDS10 WKPDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMK
120 130 140 150 160 170
180 190 200 210 220
pF1KE2 FRSWTYDHTEIDMVLMTPTASMDDFTPSGEWDIVALPGRR---TVNPQDPSYVDVTYDFI
: ::.::...::.::. . .. :. :::: :. :: . : . : :.::..
CCDS10 FGSWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYSLY
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE2 IKRKPLFYTINLIIPCVLTTLLAILVFYLPSDCGEKMTLCISVLLALTFFLLLISKIVPP
:.: ::::::::::::.: ..:..::::::::::::.::::::::.:: :::.:.. .:
CCDS10 IRRLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPS
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE2 TSLDVPLIGKYLMFTMVLVTFSIVTSVCVLNVHHRSPSTHTMAPWVKRCFLHKLPTFLFM
::: .::::.::.:::..::.::: .: :::::.:.:.:::: ::: ::. :: .::
CCDS10 TSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMFM
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE2 KRPGPDSSPARAFPP-------SKSCVTKPEATATSTSPSNFYGNSMYFVNPASAASKSP
:: . . :. : . .: .. :. . . . : : . :.
CCDS10 TRPTSNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGYPCQDGMCGYCHHRRIKISNFS
360 370 380 390 400 410
410 420 430 440 450
pF1KE2 AGSTPVAIPRDF-WLRSSGRFRQDVQEALEGVSFIAQHMKNDDEDQSVVEDWKYVAMVVD
:. : . .. . : . . ...::...:..::..:: ..: . . .::::::::.:
CCDS10 ANLTRSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNEAKEIQDDWKYVAMVID
420 430 440 450 460 470
460 470 480 490
pF1KE2 RLFLWVFMFVCVLGTVGLFLPPLFQTHAASEGPYAAQRD
:.::::: .::.:::.:::: ::. . :
CCDS10 RIFLWVFTLVCILGTAGLFLQPLMAREDA
480 490 500
>>CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 (627 aa)
initn: 1537 init1: 645 opt: 1284 Z-score: 1353.1 bits: 260.2 E(32554): 4.8e-69
Smith-Waterman score: 1287; 49.4% identity (73.5% similar) in 419 aa overlap (2-405:10-425)
10 20 30 40
pF1KE2 MRRAPSLVLFFLVALCGRGNCRV---ANAEEKLMDDLLNKTRYNNLIRPATS
: : :.:.. ..: :.. .: :.:::.:. :. . ::. ::...
CCDS13 MELGGPGAPRLLPPLLLLLGTGLL-RASSHVETRAHAEERLLKKLF--SGYNKWSRPVAN
10 20 30 40 50
50 60 70 80 90 100
pF1KE2 SSQLISIKLQLSLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKR
:... ... ::.::::.:.:..:.::::::.:::: ::.: :. . ::.:. .:::..
CCDS13 ISDVVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTSIRIPSEL
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE2 IWLPDIVLYNNADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTL
:: ::::::::::: . :. :. . .: : : :::::::.:.:.: .:::::::::.
CCDS13 IWRPDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPFDQQNCTM
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE2 KFRSWTYDHTEIDMVLMTPTASMDDFTPSGEWDIVALPGRRTVNPQD---PSYVDVTYDF
:: :::::...::.: : ... :: :::: :: : .. . : :.:: :
CCDS13 KFGSWTYDKAKIDLVNMHSRVDQLDFWESGEWVIVDAVGTYNTRKYECCAEIYPDITYAF
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE2 IIKRKPLFYTINLIIPCVLTTLLAILVFYLPSDCGEKMTLCISVLLALTFFLLLISKIVP
.:.: ::::::::::::.: . :..:::::::.::::.::::::::.:: :::::..:.:
CCDS13 VIRRLPLFYTINLIIPCLLISCLTVLVFYLPSECGEKITLCISVLLSLTVFLLLITEIIP
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE2 PTSLDVPLIGKYLMFTMVLVTFSIVTSVCVLNVHHRSPSTHTMAPWVKRCFLHKLPTFLF
::: .::::.::.:::..::.::: .: ::::::::: :::: ::.: :: .: .:.
CCDS13 STSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPRTHTMPTWVRRVFLDIVPRLLL
300 310 320 330 340 350
350 360 370 380 390
pF1KE2 MKRPGPDSSPARAFPPSKSCVT-------KPEATATSTSPS-NFYGNSMYFVNPASA-AS
::::. .. : . : .. .::. .:: . ... : : : .. :
CCDS13 MKRPSVVKDNCRRLIESMHKMASAPRFWPEPEGEPPATSGTQSLHPPSPSFCVPLDVPAE
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE2 KSPAGSTPVAIPRDFWLRSSGRFRQDVQEALEGVSFIAQHMKNDDEDQSVVEDWKYVAMV
.:. ..:
CCDS13 PGPSCKSPSDQLPPQQPLEAEKASPHPSPGPCRPPHGTQAPGLAKARSLSVQHMSSPGEA
420 430 440 450 460 470
>>CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 (529 aa)
initn: 1560 init1: 672 opt: 1281 Z-score: 1351.1 bits: 259.6 E(32554): 6.2e-69
Smith-Waterman score: 1540; 50.2% identity (73.9% similar) in 472 aa overlap (27-483:59-525)
10 20 30 40 50
pF1KE2 MRRAPSLVLFFLVALCGRGNCRVANAEEKLMDDLLNKTRYNNLIRPATSSSQLISI
:..:. :. :: ::. ..:... .
CCDS60 AKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRG--YNRWARPVPNTSDVVIV
30 40 50 60 70 80
60 70 80 90 100 110
pF1KE2 KLQLSLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKRIWLPDIV
.. ::.::::.:.:..:.:::::::::::.::.: :: . . ... ::.:.. ::.::::
CCDS60 RFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVPSEMIWIPDIV
90 100 110 120 130 140
120 130 140 150 160 170
pF1KE2 LYNNADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTLKFRSWTY
::::::: . :. .:. . :.:.: :.:::::::.:.:.: .:::::::: .:: ::::
CCDS60 LYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQNCKMKFGSWTY
150 160 170 180 190 200
180 190 200 210 220 230
pF1KE2 DHTEIDMVLMTPTASMDDFTPSGEWDIVALPGRRTVNPQD---PSYVDVTYDFIIKRKPL
:...::. : :... :. :::: :: : . . : : :::: :.:.: ::
CCDS60 DKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVTYAFVIRRLPL
210 220 230 240 250 260
240 250 260 270 280 290
pF1KE2 FYTINLIIPCVLTTLLAILVFYLPSDCGEKMTLCISVLLALTFFLLLISKIVPPTSLDVP
::::::::::.: . :..::::::::::::.::::::::.:: :::::..:.: ::: .:
CCDS60 FYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITEIIPSTSLVIP
270 280 290 300 310 320
300 310 320 330 340 350
pF1KE2 LIGKYLMFTMVLVTFSIVTSVCVLNVHHRSPSTHTMAPWVKRCFLHKLPTFLFMKRPGPD
:::.::.:::..::.::: .: :::::::::::::: ::. .: .: .:.:.:: :
CCDS60 LIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTMPHWVRGALLGCVPRWLLMNRPPPP
330 340 350 360 370 380
360 370 380 390 400
pF1KE2 ---SSPAR-AFPPS----KSCVTKPEATATSTSPSNFY--GNSMYFVNPASAASKSPAGS
: : . :: .: : : .. . . :. :. . .. .:.
CCDS60 VELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTLCSHGHLHSGA
390 400 410 420 430 440
410 420 430 440 450 460
pF1KE2 TPVAIPRDFWLRSSGRF--RQDVQEALEGVSFIAQHMKNDDEDQSVVEDWKYVAMVVDRL
. :. : . :.. .:.::::: .::.:....: :.:: :::::::::.::.
CCDS60 SG---PKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSVKEDWKYVAMVIDRI
450 460 470 480 490 500
470 480 490
pF1KE2 FLWVFMFVCVLGTVGLFLPPLFQTHAASEGPYAAQRD
:::.:..:: :::.::::::..
CCDS60 FLWLFIIVCFLGTIGLFLPPFLAGMI
510 520
>>CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 (514 aa)
initn: 1483 init1: 621 opt: 1201 Z-score: 1267.1 bits: 244.0 E(32554): 2.9e-64
Smith-Waterman score: 1460; 51.7% identity (74.2% similar) in 431 aa overlap (68-483:83-510)
40 50 60 70 80 90
pF1KE2 TRYNNLIRPATSSSQLISIKLQLSLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRY
:.:..:.:::::::::::.::.: :: . .
CCDS64 GSHTETEDRLFKHLFRGYNRWARPVPNTSDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDF
60 70 80 90 100 110
100 110 120 130 140 150
pF1KE2 EGVNILRIPAKRIWLPDIVLYNNADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEV
... ::.:.. ::.::::::::::: . :. .:. . :.:.: :.:::::::.:.:.:
CCDS64 GNITSLRVPSEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDV
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE2 KYFPFDQQNCTLKFRSWTYDHTEIDMVLMTPTASMDDFTPSGEWDIVALPGRRTVNPQD-
.:::::::: .:: :::::...::. : :... :. :::: :: : . . :
CCDS64 TFFPFDQQNCKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDC
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE2 --PSYVDVTYDFIIKRKPLFYTINLIIPCVLTTLLAILVFYLPSDCGEKMTLCISVLLAL
: :::: :.:.: ::::::::::::.: . :..::::::::::::.::::::::.:
CCDS64 CAEIYPDVTYAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSL
240 250 260 270 280 290
280 290 300 310 320 330
pF1KE2 TFFLLLISKIVPPTSLDVPLIGKYLMFTMVLVTFSIVTSVCVLNVHHRSPSTHTMAPWVK
: :::::..:.: ::: .::::.::.:::..::.::: .: :::::::::::::: ::.
CCDS64 TVFLLLITEIIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTMPHWVR
300 310 320 330 340 350
340 350 360 370 380
pF1KE2 RCFLHKLPTFLFMKRPGPD---SSPAR-AFPPS----KSCVTKPEATATSTSPSNFY--G
.: .: .:.:.:: : : : . :: .: : : .. . . :
CCDS64 GALLGCVPRWLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAG
360 370 380 390 400 410
390 400 410 420 430 440
pF1KE2 NSMYFVNPASAASKSPAGSTPVAIPRDFWLRSSGRF--RQDVQEALEGVSFIAQHMKNDD
. :. . .. .:.. :. : . :.. .:.::::: .::.:....:
CCDS64 HVAPSVGTLCSHGHLHSGASG---PKAEALLQEGELLLSPHMQKALEGVHYIADHLRSED
420 430 440 450 460
450 460 470 480 490
pF1KE2 EDQSVVEDWKYVAMVVDRLFLWVFMFVCVLGTVGLFLPPLFQTHAASEGPYAAQRD
:.:: :::::::::.::.:::.:..:: :::.::::::..
CCDS64 ADSSVKEDWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI
470 480 490 500 510
>>CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 (458 aa)
initn: 1229 init1: 667 opt: 1190 Z-score: 1256.4 bits: 241.9 E(32554): 1.2e-63
Smith-Waterman score: 1294; 43.0% identity (71.7% similar) in 467 aa overlap (19-482:21-450)
10 20 30 40 50
pF1KE2 MRRAPSLVLFFLVALCGRGNCRVANAEEKLMDDLLNKTRYNNLIRPATSSSQLISIKL
: .:. :. :. :.. :.. .::. :.. :.. .
CCDS61 MLPDFMLVLIVLGIPSSATTGFNSIAENEDALLRHLFQG--YQKWVRPVLHSNDTIKVYF
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 QLSLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKRIWLPDIVLY
:...::..:.:..:.:::::::::::::..: :: . : :.. ...:.. .:::::::.
CCDS61 GLKISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHSIKVPSESLWLPDIVLF
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 NNADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTLKFRSWTYDH
.:::: .: :..:..::.:::.:.: ::: :::.: ..: .::::.:::..:: :::::
CCDS61 ENADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPFDRQNCSMKFGSWTYDG
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 TEIDMVLMTPTASMDDFTPSGEWDIVALPGRRTVNPQDP--SYVDVTYDFIIKRKPLFYT
: .:..:.. ... :: .:::.:. : . : .: :: .::.:...: :::::
CCDS61 TMVDLILINENVDRKDFFDNGEWEILNAKGMKG-NRRDGVYSYPFITYSFVLRRLPLFYT
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 INLIIPCVLTTLLAILVFYLPSDCGEKMTLCISVLLALTFFLLLISKIVPPTSLDVPLIG
. :::::. ..:..:::::::: :::..: :::..:: :::.: .:.: .: .::::
CCDS61 LFLIIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVIEEIIPSSSKVIPLIG
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 KYLMFTMVLVTFSIVTSVCVLNVHHRSPST-HTMAPWVKRCFLHKLPTFLFMKRPGPDSS
.::.: :..::.::...: :.:::::: :: : ::::::: ::.::: .: :: :
CCDS61 EYLLFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQKLPKLLCMK----DHV
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 PARAFPPSKSCVTKPEATATSTSPSNFYGNSMYFVNPASAASKSPAGSTPVAIPRDFWLR
. : .. ..: . :. . . .:. . . : . :
CCDS61 DRYSSPEKEE--SQPVVK----------GKVL-----EKKKQKQLSDGEKVLVA--F---
360 370 380 390
420 430 440 450 460 470
pF1KE2 SSGRFRQDVQEALEGVSFIAQHMKNDDEDQSVVEDWKYVAMVVDRLFLWVFMFVCVLGTV
...: ... .:..:.:.. ..::.:::.::.:.::.:::.:..: : :.:
CCDS61 --------LEKAADSIRYISRHVKKEHFISQVVQDWKFVAQVLDRIFLWLFLIVSVTGSV
400 410 420 430 440
480 490
pF1KE2 GLFLPPLFQTHAASEGPYAAQRD
.: : :
CCDS61 LIFTPALKMWLHSYH
450
498 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 09:28:59 2016 done: Sun Nov 6 09:28:59 2016
Total Scan time: 3.000 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]