FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7757, 447 aa
1>>>pF1KB7757 447 - 447 aa - 447 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.4962+/-0.00104; mu= 3.8611+/- 0.061
mean_var=257.9613+/-57.252, 0's: 0 Z-trim(112.8): 803 B-trim: 729 in 1/51
Lambda= 0.079854
statistics sampled from 12560 (13507) to 12560 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.748), E-opt: 0.2 (0.415), width: 16
Scan time: 3.340
The best scores are: opt bits E(32554)
CCDS3136.1 ZIC1 gene_id:7545|Hs108|chr3 ( 447) 3133 374.2 1.4e-103
CCDS14663.1 ZIC3 gene_id:7547|Hs108|chrX ( 467) 1790 219.5 5.6e-57
CCDS83494.1 ZIC3 gene_id:7547|Hs108|chrX ( 457) 1594 196.9 3.5e-50
CCDS9495.1 ZIC2 gene_id:7546|Hs108|chr13 ( 532) 1477 183.5 4.4e-46
CCDS43160.1 ZIC4 gene_id:84107|Hs108|chr3 ( 334) 1457 181.0 1.6e-45
CCDS54653.1 ZIC4 gene_id:84107|Hs108|chr3 ( 372) 1457 181.1 1.7e-45
CCDS54652.1 ZIC4 gene_id:84107|Hs108|chr3 ( 384) 1457 181.1 1.7e-45
CCDS9494.2 ZIC5 gene_id:85416|Hs108|chr13 ( 663) 1028 131.9 1.9e-30
CCDS10511.1 GLIS2 gene_id:84662|Hs108|chr16 ( 524) 624 85.3 1.7e-16
CCDS6451.1 GLIS3 gene_id:169792|Hs108|chr9 ( 775) 607 83.5 8.4e-16
CCDS43784.1 GLIS3 gene_id:169792|Hs108|chr9 ( 930) 607 83.6 9.5e-16
CCDS5465.1 GLI3 gene_id:2737|Hs108|chr7 (1580) 606 83.7 1.5e-15
CCDS33283.1 GLI2 gene_id:2736|Hs108|chr2 (1586) 596 82.5 3.3e-15
CCDS53806.1 GLI1 gene_id:2735|Hs108|chr12 (1065) 588 81.4 4.7e-15
CCDS8940.1 GLI1 gene_id:2735|Hs108|chr12 (1106) 588 81.5 4.9e-15
CCDS53807.1 GLI1 gene_id:2735|Hs108|chr12 ( 978) 583 80.8 6.7e-15
CCDS582.1 GLIS1 gene_id:148979|Hs108|chr1 ( 620) 571 79.2 1.3e-14
CCDS58857.1 ZIC4 gene_id:84107|Hs108|chr3 ( 128) 464 66.2 2.2e-11
>>CCDS3136.1 ZIC1 gene_id:7545|Hs108|chr3 (447 aa)
initn: 3133 init1: 3133 opt: 3133 Z-score: 1972.8 bits: 374.2 E(32554): 1.4e-103
Smith-Waterman score: 3133; 100.0% identity (100.0% similar) in 447 aa overlap (1-447:1-447)
10 20 30 40 50 60
pF1KB7 MLLDAGPQYPAIGVTTFGASRHHSAGDVAERDVGLGINPFADGMGAFKLNPSSHELASAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MLLDAGPQYPAIGVTTFGASRHHSAGDVAERDVGLGINPFADGMGAFKLNPSSHELASAG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 QTAFTSQAPGYAAAAALGHHHHPGHVGSYSSAAFNSTRDFLFRNRGFGDAAAAASAQHSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 QTAFTSQAPGYAAAAALGHHHHPGHVGSYSSAAFNSTRDFLFRNRGFGDAAAAASAQHSL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 FAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASPNVVNGQMRLGFSGDMYPRPEQYGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 FAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASPNVVNGQMRLGFSGDMYPRPEQYGQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 VTSPRSEHYAAPQLHGYGPMNVNMAAHHGAGAFFRYMRQPIKQELICKWIEPEQLANPKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 VTSPRSEHYAAPQLHGYGPMNVNMAAHHGAGAFFRYMRQPIKQELICKWIEPEQLANPKK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 SCNKTFSTMHELVTHVTVEHVGGPEQSNHICFWEECPREGKPFKAKYKLVNHIRVHTGEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SCNKTFSTMHELVTHVTVEHVGGPEQSNHICFWEECPREGKPFKAKYKLVNHIRVHTGEK
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 PFPCPFPGCGKVFARSENLKIHKRTHTGEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 PFPCPFPGCGKVFARSENLKIHKRTHTGEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 PYLCKMCDKSYTHPSSLRKHMKVHESSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 PYLCKMCDKSYTHPSSLRKHMKVHESSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTS
370 380 390 400 410 420
430 440
pF1KB7 SLSPSSSAVHHTAGHSALSSNFNEWYV
:::::::::::::::::::::::::::
CCDS31 SLSPSSSAVHHTAGHSALSSNFNEWYV
430 440
>>CCDS14663.1 ZIC3 gene_id:7547|Hs108|chrX (467 aa)
initn: 1851 init1: 1275 opt: 1790 Z-score: 1136.4 bits: 219.5 E(32554): 5.6e-57
Smith-Waterman score: 2017; 64.4% identity (81.7% similar) in 475 aa overlap (1-447:3-467)
10 20 30 40
pF1KB7 MLLDAGPQYPAIGVTTFGASRHHSAGDVAERDVGLGINPFADGM---------GAFKL
::::.:::.:..:: .::: ::: . .. .:.:.:::.:. .::::
CCDS14 MTMLLDGGPQFPGLGVGSFGAPRHHEMPN--REPAGMGLNPFGDSTHAAAAAAAAAAFKL
10 20 30 40 50
50 60 70 80 90
pF1KB7 NPSS-HELASAGQTAFTSQAPGYAAAAALGHHHHPGH-------VGSY---SSAAFNSTR
.:.. :.:.:. ..::: :. ::: : :::::: : : :: .::::::::
CCDS14 SPAAAHDLSSGQSSAFTPQGSGYANA--LGHHHHHHHHHHHTSQVPSYGGAASAAFNSTR
60 70 80 90 100 110
100 110 120 130 140 150
pF1KB7 DFLFRNRGFG-DAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASP-
.::::.:. : . ::....::.:::.::... .: : . ..:::::::::.::: ::
CCDS14 EFLFRQRSSGLSEAASGGGQHGLFAGSASSLHAPAGIPEPPSYLLFPGLHEQGAGHPSPT
120 130 140 150 160 170
160 170 180 190 200 210
pF1KB7 -NVVNGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAA-PQLHGYGPMNVNM----AAHHGA
.: :.:..::. :... : . : :.:::.. ::: :. .:.:::.:: :::::
CCDS14 GHVDNNQVHLGLRGELFGRADPYRPVASPRTDPYAAGAQFPNYSPMNMNMGVNVAAHHGP
180 190 200 210 220 230
220 230 240 250 260 270
pF1KB7 GAFFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQSNHI
::::::::::::::: ::::. ::. :::::..:::::::::::::.::::::::.::.
CCDS14 GAFFRYMRQPIKQELSCKWIDEAQLSRPKKSCDRTFSTMHELVTHVTMEHVGGPEQNNHV
240 250 260 270 280 290
280 290 300 310 320 330
pF1KB7 CFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHTGEK
:.::::::::: :::::::::::::::::::::::::::::.::::::::::::::::::
CCDS14 CYWEECPREGKSFKAKYKLVNHIRVHTGEKPFPCPFPGCGKIFARSENLKIHKRTHTGEK
300 310 320 330 340 350
340 350 360 370 380 390
pF1KB7 PFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKMCDKSYTHPSSLRKHMKVHESSSQG
::::::::::::::::::::::::::::::::.::.::::::::::::::::::: :::
CCDS14 PFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYICKVCDKSYTHPSSLRKHMKVHE--SQG
360 370 380 390 400 410
400 410 420 430 440
pF1KB7 SQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEWYV
:. ::::::::::::::.:.: .. . ::.. : .... :. : : :::::::
CCDS14 SDSSPAASSGYESSTPPAIASANSKD-TTKTPSAVQTSTSHNPG---LPPNFNEWYV
420 430 440 450 460
>>CCDS83494.1 ZIC3 gene_id:7547|Hs108|chrX (457 aa)
initn: 1506 init1: 1233 opt: 1594 Z-score: 1014.5 bits: 196.9 E(32554): 3.5e-50
Smith-Waterman score: 1821; 65.9% identity (83.0% similar) in 411 aa overlap (1-382:3-408)
10 20 30 40
pF1KB7 MLLDAGPQYPAIGVTTFGASRHHSAGDVAERD-VGLGINPFADGM---------GAFK
::::.:::.:..:: .::: ::: .. .:. .:.:.:::.:. .:::
CCDS83 MTMLLDGGPQFPGLGVGSFGAPRHH---EMPNREPAGMGLNPFGDSTHAAAAAAAAAAFK
10 20 30 40 50
50 60 70 80 90
pF1KB7 LNPSS-HELASAGQTAFTSQAPGYAAAAALGHHHHPGH-------VGSY---SSAAFNST
:.:.. :.:.:. ..::: :. ::: : :::::: : : :: .:::::::
CCDS83 LSPAAAHDLSSGQSSAFTPQGSGYANA--LGHHHHHHHHHHHTSQVPSYGGAASAAFNST
60 70 80 90 100 110
100 110 120 130 140 150
pF1KB7 RDFLFRNRGFG-DAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASP
:.::::.:. : . ::....::.:::.::... .: : . ..:::::::::.::: ::
CCDS83 REFLFRQRSSGLSEAASGGGQHGLFAGSASSLHAPAGIPEPPSYLLFPGLHEQGAGHPSP
120 130 140 150 160 170
160 170 180 190 200
pF1KB7 --NVVNGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAA-PQLHGYGPMNVNM----AAHHG
.: :.:..::. :... : . : :.:::.. ::: :. .:.:::.:: :::::
CCDS83 TGHVDNNQVHLGLRGELFGRADPYRPVASPRTDPYAAGAQFPNYSPMNMNMGVNVAAHHG
180 190 200 210 220 230
210 220 230 240 250 260
pF1KB7 AGAFFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQSNH
::::::::::::::: ::::. ::. :::::..:::::::::::::.::::::::.::
CCDS83 PGAFFRYMRQPIKQELSCKWIDEAQLSRPKKSCDRTFSTMHELVTHVTMEHVGGPEQNNH
240 250 260 270 280 290
270 280 290 300 310 320
pF1KB7 ICFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHTGE
.:.::::::::: :::::::::::::::::::::::::::::.:::::::::::::::::
CCDS83 VCYWEECPREGKSFKAKYKLVNHIRVHTGEKPFPCPFPGCGKIFARSENLKIHKRTHTGE
300 310 320 330 340 350
330 340 350 360 370 380
pF1KB7 KPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKMCDKSYTHPSSLRKHMKVHESSSQ
:::::::::::::::::::::::::::::::::.::.::::::::::::::::
CCDS83 KPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYICKVCDKSYTHPSSLRKHMKCCPAWYP
360 370 380 390 400 410
390 400 410 420 430 440
pF1KB7 GSQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEWYV
CCDS83 GQSLIPDEELDTDVGMQQPALHNTTYPKCRVNAEPTVQEMIY
420 430 440 450
>>CCDS9495.1 ZIC2 gene_id:7546|Hs108|chr13 (532 aa)
initn: 2393 init1: 1400 opt: 1477 Z-score: 940.9 bits: 183.5 E(32554): 4.4e-46
Smith-Waterman score: 2154; 69.6% identity (83.3% similar) in 473 aa overlap (1-437:1-468)
10 20 30 40
pF1KB7 MLLDAGPQYPAIGVTTFGASRHHSAGDVA-------ERDVGLGI--NPFADG----MGAF
::::::::.::::: .:. .::::. .: .:...:. : :.:. ::::
CCDS94 MLLDAGPQFPAIGVGSFARHHHHSAAAAAAAAAEMQDRELSLAAAQNGFVDSAAAHMGAF
10 20 30 40 50 60
50 60 70 80 90
pF1KB7 KLNPSSHELASAGQTAFTSQAPGY--------AAAAALGHHHHPGHVGSYSSAAFNSTRD
::::..:::. . ..:::::.:: ::::::: : .::::::. ::::::
CCDS94 KLNPGAHELSPGQSSAFTSQGPGAYPGSAAAAAAAAALGP--HAAHVGSYSGPPFNSTRD
70 80 90 100 110
100 110 120 130 140 150
pF1KB7 FLFRNRGFGDAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASPNVV
::::.:::::.: ... ::.::. .:::. :.:.:: :::::::: :: . :.: ::.
CCDS94 FLFRSRGFGDSAPGGG-QHGLFGPGAGGLH--HAHSDAQGHLLFPGLPEQHGPHGSQNVL
120 130 140 150 160 170
160 170 180 190 200
pF1KB7 NGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAAPQLHG-YGPMNVNM-------AAHHG--
:::::::. :... : ::: ::.:::.. :.: :::. :::::.:: ::::
CCDS94 NGQMRLGLPGEVFGRSEQYRQVASPRTDPYSAAQLHNQYGPMNMNMGMNMAAAAAHHHHH
180 190 200 210 220 230
210 220 230 240 250 260
pF1KB7 ----AGAFFRYMRQP-IKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGP
::::::::: ::::::::::.::::.::::::::::::::::::::.:::::::
CCDS94 HHHHPGAFFRYMRQQCIKQELICKWIDPEQLSNPKKSCNKTFSTMHELVTHVSVEHVGGP
240 250 260 270 280 290
270 280 290 300 310 320
pF1KB7 EQSNHICFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKR
:::::.::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 EQSNHVCFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKR
300 310 320 330 340 350
330 340 350 360 370 380
pF1KB7 THTGEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKMCDKSYTHPSSLRKHMKVH
::::::::.:::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 THTGEKPFQCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKMCDKSYTHPSSLRKHMKVH
360 370 380 390 400 410
390 400 410 420 430 440
pF1KB7 ESSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNE
::: :::. :::::::::::::: .::::.. ..:.:::...:. .:. .:
CCDS94 ESSPQGSESSPAASSGYESSTPPGLVSPSAEPQSSSNLSPAAAAAAAAAAAAAAAVSAVH
420 430 440 450 460 470
pF1KB7 WYV
CCDS94 RGGGSGSGGAGGGSGGGSGSGGGGGGAGGGGGGSSGGGSGTAGGHSGLSSNFNEWYV
480 490 500 510 520 530
>>CCDS43160.1 ZIC4 gene_id:84107|Hs108|chr3 (334 aa)
initn: 1624 init1: 865 opt: 1457 Z-score: 930.9 bits: 181.0 E(32554): 1.6e-45
Smith-Waterman score: 1457; 68.2% identity (81.3% similar) in 321 aa overlap (122-436:23-333)
100 110 120 130 140 150
pF1KB7 AAFNSTRDFLFRNRGFGDAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAA
..:..: ::. : :.. .::::::.
CCDS43 MRYKTSLVMRKRLRLYRNTLKESSSSSGHHGPQ-LTAASSPSVFPGLHEEPP
10 20 30 40 50
160 170 180 190 200
pF1KB7 GHASPNV-VNGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAAPQ-LHGYGPMN--VNMAAH
.:::. .:: .:::. :::: ::: . . ::. :: ::::: :: ::.::
CCDS43 -QASPSRPLNGLLRLGLPGDMYARPEPFPPGPAARSDALAAAAALHGYGGMNLTVNLAAP
60 70 80 90 100 110
210 220 230 240 250 260
pF1KB7 HGAGAFFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQS
:: :::::::::::::::::::. . :.:. :.:::::::::::::::::::::::.
CCDS43 HGPGAFFRYMRQPIKQELICKWLAADGTATPSL-CSKTFSTMHELVTHVTVEHVGGPEQA
120 130 140 150 160
270 280 290 300 310 320
pF1KB7 NHICFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT
:::::::::::.::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NHICFWEECPRQGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT
170 180 190 200 210 220
330 340 350 360 370 380
pF1KB7 GEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKM--CDKSYTHPSSLRKHMKVHE
:::::.::::::.:::::::::::: ::::::::: ::. ::: ::::::::::::::
CCDS43 GEKPFRCEFEGCERRFANSSDRKKHSHVHTSDKPYTCKVRGCDKCYTHPSSLRKHMKVH-
230 240 250 260 270 280
390 400 410 420 430 440
pF1KB7 SSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEW
: .: : ::::.:.:: ..::::.: :... :.... .:: :
CCDS43 ----GRSPPP--SSGYDSATPSALVSPSSDCGHKSQVASSAAVAARTADLSE
290 300 310 320 330
pF1KB7 YV
>>CCDS54653.1 ZIC4 gene_id:84107|Hs108|chr3 (372 aa)
initn: 1624 init1: 865 opt: 1457 Z-score: 930.3 bits: 181.1 E(32554): 1.7e-45
Smith-Waterman score: 1457; 68.2% identity (81.3% similar) in 321 aa overlap (122-436:61-371)
100 110 120 130 140 150
pF1KB7 AAFNSTRDFLFRNRGFGDAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAA
..:..: ::. : :.. .::::::.
CCDS54 DSKAQSQKMRYKTSLVMRKRLRLYRNTLKESSSSSGHHGPQ-LTAASSPSVFPGLHEEPP
40 50 60 70 80
160 170 180 190 200
pF1KB7 GHASPNV-VNGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAAPQ-LHGYGPMN--VNMAAH
.:::. .:: .:::. :::: ::: . . ::. :: ::::: :: ::.::
CCDS54 -QASPSRPLNGLLRLGLPGDMYARPEPFPPGPAARSDALAAAAALHGYGGMNLTVNLAAP
90 100 110 120 130 140
210 220 230 240 250 260
pF1KB7 HGAGAFFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQS
:: :::::::::::::::::::. . :.:. :.:::::::::::::::::::::::.
CCDS54 HGPGAFFRYMRQPIKQELICKWLAADGTATPSL-CSKTFSTMHELVTHVTVEHVGGPEQA
150 160 170 180 190 200
270 280 290 300 310 320
pF1KB7 NHICFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT
:::::::::::.::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 NHICFWEECPRQGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT
210 220 230 240 250 260
330 340 350 360 370 380
pF1KB7 GEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKM--CDKSYTHPSSLRKHMKVHE
:::::.::::::.:::::::::::: ::::::::: ::. ::: ::::::::::::::
CCDS54 GEKPFRCEFEGCERRFANSSDRKKHSHVHTSDKPYTCKVRGCDKCYTHPSSLRKHMKVH-
270 280 290 300 310 320
390 400 410 420 430 440
pF1KB7 SSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEW
: .: : ::::.:.:: ..::::.: :... :.... .:: :
CCDS54 ----GRSPPP--SSGYDSATPSALVSPSSDCGHKSQVASSAAVAARTADLSE
330 340 350 360 370
pF1KB7 YV
>>CCDS54652.1 ZIC4 gene_id:84107|Hs108|chr3 (384 aa)
initn: 1624 init1: 865 opt: 1457 Z-score: 930.1 bits: 181.1 E(32554): 1.7e-45
Smith-Waterman score: 1457; 68.2% identity (81.3% similar) in 321 aa overlap (122-436:73-383)
100 110 120 130 140 150
pF1KB7 AAFNSTRDFLFRNRGFGDAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAA
..:..: ::. : :.. .::::::.
CCDS54 WEKAQSQKMRYKTSLVMRKRLRLYRNTLKESSSSSGHHGPQ-LTAASSPSVFPGLHEEPP
50 60 70 80 90 100
160 170 180 190 200
pF1KB7 GHASPNV-VNGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAAPQ-LHGYGPMN--VNMAAH
.:::. .:: .:::. :::: ::: . . ::. :: ::::: :: ::.::
CCDS54 -QASPSRPLNGLLRLGLPGDMYARPEPFPPGPAARSDALAAAAALHGYGGMNLTVNLAAP
110 120 130 140 150 160
210 220 230 240 250 260
pF1KB7 HGAGAFFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQS
:: :::::::::::::::::::. . :.:. :.:::::::::::::::::::::::.
CCDS54 HGPGAFFRYMRQPIKQELICKWLAADGTATPSL-CSKTFSTMHELVTHVTVEHVGGPEQA
170 180 190 200 210
270 280 290 300 310 320
pF1KB7 NHICFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT
:::::::::::.::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 NHICFWEECPRQGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT
220 230 240 250 260 270
330 340 350 360 370 380
pF1KB7 GEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKM--CDKSYTHPSSLRKHMKVHE
:::::.::::::.:::::::::::: ::::::::: ::. ::: ::::::::::::::
CCDS54 GEKPFRCEFEGCERRFANSSDRKKHSHVHTSDKPYTCKVRGCDKCYTHPSSLRKHMKVH-
280 290 300 310 320 330
390 400 410 420 430 440
pF1KB7 SSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEW
: .: : ::::.:.:: ..::::.: :... :.... .:: :
CCDS54 ----GRSPPP--SSGYDSATPSALVSPSSDCGHKSQVASSAAVAARTADLSE
340 350 360 370 380
pF1KB7 YV
>>CCDS9494.2 ZIC5 gene_id:85416|Hs108|chr13 (663 aa)
initn: 1150 init1: 874 opt: 1028 Z-score: 660.1 bits: 131.9 E(32554): 1.9e-30
Smith-Waterman score: 1286; 52.9% identity (65.1% similar) in 418 aa overlap (106-447:224-625)
80 90 100 110 120 130
pF1KB7 ALGHHHHPGHVGSYSSAAFNSTRDFLFRNRGFGDAAAAASAQHS--LFAASAGGFGGPHG
: :. : :: .: ...: ..:: :
CCDS94 SRDFVLRRDLSATAPAAAMHGAPLGGEQRSGTGSPQHPAPPPHSAGMFISASGTYAGPDG
200 210 220 230 240 250
140 150 160 170 180
pF1KB7 HTDAAGHLLFPGLHEQ-AAGHASPNVVNGQMRLGFSGDMYPRP-EQYGQVT---SPRS--
..: :::.::. .: . :. .:::::::... : ::.. .:::
CCDS94 ---SGGPALFPALHDTPGAPGGHPHPLNGQMRLGLAAAAAAAAAELYGRAEPPFAPRSGD
260 270 280 290 300 310
190 200
pF1KB7 EHY------AAPQLHGYGP--MNVNMAA--------------HHG---------------
:: :: ::::: .:.:.:: ::.
CCDS94 AHYGAVAAAAAAALHGYGAVNLNLNLAAAAAAAAAGPGPHLQHHAPPPAPPPPPAPAQHP
320 330 340 350 360 370
210 220 230 240
pF1KB7 ----------AGAFFRYMRQPIKQELICKWIEPEQLAN-PK-----------------KS
::::.::::::::::::::::.:..::. : :
CCDS94 HQHHPHLPGAAGAFLRYMRQPIKQELICKWIDPDELAGLPPPPPPPPPPPPPPPAGGAKP
380 390 400 410 420 430
250 260 270 280 290 300
pF1KB7 CNKTFSTMHELVTHVTVEHVGGPEQSNHICFWEECPREGKPFKAKYKLVNHIRVHTGEKP
:.:::.::::::.:::::::::::::.:.::::.::::::::::::::.:::::::::::
CCDS94 CSKTFGTMHELVNHVTVEHVGGPEQSSHVCFWEDCPREGKPFKAKYKLINHIRVHTGEKP
440 450 460 470 480 490
310 320 330 340 350 360
pF1KB7 FPCPFPGCGKVFARSENLKIHKRTHTGEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDKP
:::::::::::::::::::::::::::::::::::.::::.:::::::::: ::::::::
CCDS94 FPCPFPGCGKVFARSENLKIHKRTHTGEKPFKCEFDGCDRKFANSSDRKKHSHVHTSDKP
500 510 520 530 540 550
370 380 390 400 410
pF1KB7 YLCKM--CDKSYTHPSSLRKHMKVHESSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTT
: ::. ::::::::::::::::.: .: :::. :: : :. : .
CCDS94 YYCKIRGCDKSYTHPSSLRKHMKIHCKS---PPPSPGPL-GYSSVGTPV------GAPLS
560 570 580 590 600
420 430 440
pF1KB7 SSLSPSSSAVHHTAGHSALSSNFNEWYV
:.:. : :.. : .:.:::::
CCDS94 PVLDPARS---HSSTLSPQVTNLNEWYVCQASGAPSHLHTPSSNGTTSETEDEEIYGNPE
610 620 630 640 650
>>CCDS10511.1 GLIS2 gene_id:84662|Hs108|chr16 (524 aa)
initn: 548 init1: 298 opt: 624 Z-score: 409.8 bits: 85.3 E(32554): 1.7e-16
Smith-Waterman score: 629; 36.8% identity (59.5% similar) in 304 aa overlap (151-438:87-370)
130 140 150 160 170
pF1KB7 FAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASPNVVNG--QMRLGFSGDMYPRPEQY
.: ::: .. : : .::. : :
CCDS10 SGFLLNSKFPEKVEGRFSAAPLVDLSLSPPSGLDSPNGSSSLSPERQG-NGDLPPVPSAS
60 70 80 90 100 110
180 190 200 210 220 230
pF1KB7 GQVTSPRSEHYAAPQ-LHGYGPMNVNMAAHHGAGAFFRYMRQ-------PIKQELICKWI
.: ..:. .. . :.. . : : :..:. .. :. ..:.:.:
CCDS10 D--FQPLRYLDGVPSSFQFFLPLGSGGALHLPASSFLTPPKDKCLSPDLPLPKQLVCRWA
120 130 140 150 160 170
240 250 260 270 280 290
pF1KB7 EPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQSNHICFWEECPREGKPFKAKYKLV
. ::. : ...:: ::. :: ..... : :: : :.:. :.:.::..
CCDS10 K----------CNQLFELLQDLVDHVNDYHVKPEKDAGYCCHWEGCARHGRGFNARYKML
180 190 200 210 220
300 310 320 330 340 350
pF1KB7 NHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHTGEKPFKCEFEGCDRRFANSSDRK
:::.::.::: :: :.: :.: ::::::.:.::::::. : .:::..:..:::::
CCDS10 IHIRTHTNEKPHRCP--TCSKSFSRLENLKIHNRSHTGEKPYVCPYEGCNKRYSNSSDRF
230 240 250 260 270 280
360 370 380 390 400
pF1KB7 KHMHVHTSDKPYLCKM--CDKSYTHPSSLRKHMKVHESSSQGSQPSPAASSGYESSTPPT
:: ..: :::: ::: : : :: :::::::.:.: : : . . ::
CCDS10 KHTRTHYVDKPYYCKMPGCHKRYTDPSSLRKHIKAH-----GHFVSHEQQELLQLRPPPK
290 300 310 320 330
410 420 430 440
pF1KB7 IVSPSTDN-PTTSS---LSPSSSAVHHTAGHSALSSNFNEWYV
:. :. : .:. . :. .:. : .:
CCDS10 PPLPAPDGGPYVSGAQIIIPNPAALFGGPGLPGLPLPLAPGPLDLSALACGNGGGSGGGG
340 350 360 370 380 390
CCDS10 GMGPGLPGPVLPLNLAKNPLLPSPFGAGGLGLPVVSLLAGAAGGKAEGEKGRGSVPTRAL
400 410 420 430 440 450
>>CCDS6451.1 GLIS3 gene_id:169792|Hs108|chr9 (775 aa)
initn: 729 init1: 497 opt: 607 Z-score: 397.2 bits: 83.5 E(32554): 8.4e-16
Smith-Waterman score: 631; 31.4% identity (55.3% similar) in 436 aa overlap (19-436:135-545)
10 20 30 40
pF1KB7 MLLDAGPQYPAIGVTTFGASRHHSAGDVAERDVGLGINPFADGMGA--
..: ::: . . .:...:..::.:
CCDS64 MSSNSVSNSLPSYLFGTESSHSPYPSPRHSSTRSHSARS---KKRALSLSPLSDGIGIDF
110 120 130 140 150 160
50 60 70 80 90 100
pF1KB7 ---FKLNPSSHELASAGQTAFTSQAPGYAAAAALGHHHHPGHVGS---YSSAAFNSTRDF
.. .:.: :. : .:. . . : : :: . .: .
CCDS64 NTIIRTSPTSLVAYINGSRA----SPANLSPQPEVYGHFLGVRGSCIPQPRPVPGSQKGV
170 180 190 200 210
110 120 130 140 150
pF1KB7 LFRNRGFGDAAAA---ASAQHSLFAASAGGFG-GPHGHTDAAGHLLFPGLHEQAAGHASP
: :.. : . : .. . ::. : .: .. : : :: :.:: .
CCDS64 LVAPGGLALPAYGEDGALEHERMQQLEHGGLQPGLVNHM-VVQHGL-PGPDSQSAGLFKT
220 230 240 250 260 270
160 170 180 190 200 210
pF1KB7 NVVNGQMRLGFSGDMYPRPE--QYGQVTSPRSEHYAAPQLHG--YGPMNVNMAAHHGAGA
. . . : . :. : : .: ..: .:: :: ..: ...
CCDS64 ERL--EEFPGSTVDLPPAPPLPPLPPPPGPPPPYHAHAHLHHPELGPHAQQLALPQATLD
280 290 300 310 320 330
220 230 240 250 260 270
pF1KB7 FFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQSNHICF
: . : . :.::. :. .. ..::: :. :. . . ::
CCDS64 DDGEM-DGIGGKHCCRWID----------CSALYDQQEELVRHIEKVHIDQRKGEDFTCF
340 350 360 370 380
280 290 300 310 320 330
pF1KB7 WEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHTGEKPF
: :::. :::.:.:::. :.:::.:::: : : :: :.:.: :::::: :.::::::.
CCDS64 WAGCPRRYKPFNARYKLLIHMRVHSGEKPNKCTFEGCEKAFSRLENLKIHLRSHTGEKPY
390 400 410 420 430 440
340 350 360 370 380 390
pF1KB7 KCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKM--CDKSYTHPSSLRKHMKVHESSSQG
:. ::.. :.::::: ::...: . ::: :.. : : :: :::::::.:.: :. :
CCDS64 LCQHPGCQKAFSNSSDRAKHQRTHLDTKPYACQIPGCTKRYTDPSSLRKHVKAHSSKEQQ
450 460 470 480 490 500
400 410 420 430 440
pF1KB7 SQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEWYV
.. . .:. . . .. .. .:.: :: ..:.. :.:.:
CCDS64 ARKKLRSSTELHPDLLTDCLTVQSLQPAT---SPRDAAAEGTVGRSPGPGPDLYSAPIFS
510 520 530 540 550
CCDS64 SNYSSRSGTAAGAVPPPHPVSHPSPGHNVQGSPHNPSSQLPPLTAVDAGAERFAPSAPSP
560 570 580 590 600 610
447 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 22:10:53 2016 done: Fri Nov 4 22:10:54 2016
Total Scan time: 3.340 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]