FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7757, 447 aa 1>>>pF1KB7757 447 - 447 aa - 447 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.4962+/-0.00104; mu= 3.8611+/- 0.061 mean_var=257.9613+/-57.252, 0's: 0 Z-trim(112.8): 803 B-trim: 729 in 1/51 Lambda= 0.079854 statistics sampled from 12560 (13507) to 12560 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.748), E-opt: 0.2 (0.415), width: 16 Scan time: 3.340 The best scores are: opt bits E(32554) CCDS3136.1 ZIC1 gene_id:7545|Hs108|chr3 ( 447) 3133 374.2 1.4e-103 CCDS14663.1 ZIC3 gene_id:7547|Hs108|chrX ( 467) 1790 219.5 5.6e-57 CCDS83494.1 ZIC3 gene_id:7547|Hs108|chrX ( 457) 1594 196.9 3.5e-50 CCDS9495.1 ZIC2 gene_id:7546|Hs108|chr13 ( 532) 1477 183.5 4.4e-46 CCDS43160.1 ZIC4 gene_id:84107|Hs108|chr3 ( 334) 1457 181.0 1.6e-45 CCDS54653.1 ZIC4 gene_id:84107|Hs108|chr3 ( 372) 1457 181.1 1.7e-45 CCDS54652.1 ZIC4 gene_id:84107|Hs108|chr3 ( 384) 1457 181.1 1.7e-45 CCDS9494.2 ZIC5 gene_id:85416|Hs108|chr13 ( 663) 1028 131.9 1.9e-30 CCDS10511.1 GLIS2 gene_id:84662|Hs108|chr16 ( 524) 624 85.3 1.7e-16 CCDS6451.1 GLIS3 gene_id:169792|Hs108|chr9 ( 775) 607 83.5 8.4e-16 CCDS43784.1 GLIS3 gene_id:169792|Hs108|chr9 ( 930) 607 83.6 9.5e-16 CCDS5465.1 GLI3 gene_id:2737|Hs108|chr7 (1580) 606 83.7 1.5e-15 CCDS33283.1 GLI2 gene_id:2736|Hs108|chr2 (1586) 596 82.5 3.3e-15 CCDS53806.1 GLI1 gene_id:2735|Hs108|chr12 (1065) 588 81.4 4.7e-15 CCDS8940.1 GLI1 gene_id:2735|Hs108|chr12 (1106) 588 81.5 4.9e-15 CCDS53807.1 GLI1 gene_id:2735|Hs108|chr12 ( 978) 583 80.8 6.7e-15 CCDS582.1 GLIS1 gene_id:148979|Hs108|chr1 ( 620) 571 79.2 1.3e-14 CCDS58857.1 ZIC4 gene_id:84107|Hs108|chr3 ( 128) 464 66.2 2.2e-11 >>CCDS3136.1 ZIC1 gene_id:7545|Hs108|chr3 (447 aa) initn: 3133 init1: 3133 opt: 3133 Z-score: 1972.8 bits: 374.2 E(32554): 1.4e-103 Smith-Waterman score: 3133; 100.0% identity (100.0% similar) in 447 aa overlap (1-447:1-447) 10 20 30 40 50 60 pF1KB7 MLLDAGPQYPAIGVTTFGASRHHSAGDVAERDVGLGINPFADGMGAFKLNPSSHELASAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MLLDAGPQYPAIGVTTFGASRHHSAGDVAERDVGLGINPFADGMGAFKLNPSSHELASAG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 QTAFTSQAPGYAAAAALGHHHHPGHVGSYSSAAFNSTRDFLFRNRGFGDAAAAASAQHSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QTAFTSQAPGYAAAAALGHHHHPGHVGSYSSAAFNSTRDFLFRNRGFGDAAAAASAQHSL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 FAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASPNVVNGQMRLGFSGDMYPRPEQYGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 FAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASPNVVNGQMRLGFSGDMYPRPEQYGQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 VTSPRSEHYAAPQLHGYGPMNVNMAAHHGAGAFFRYMRQPIKQELICKWIEPEQLANPKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 VTSPRSEHYAAPQLHGYGPMNVNMAAHHGAGAFFRYMRQPIKQELICKWIEPEQLANPKK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 SCNKTFSTMHELVTHVTVEHVGGPEQSNHICFWEECPREGKPFKAKYKLVNHIRVHTGEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SCNKTFSTMHELVTHVTVEHVGGPEQSNHICFWEECPREGKPFKAKYKLVNHIRVHTGEK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 PFPCPFPGCGKVFARSENLKIHKRTHTGEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PFPCPFPGCGKVFARSENLKIHKRTHTGEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 PYLCKMCDKSYTHPSSLRKHMKVHESSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PYLCKMCDKSYTHPSSLRKHMKVHESSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTS 370 380 390 400 410 420 430 440 pF1KB7 SLSPSSSAVHHTAGHSALSSNFNEWYV ::::::::::::::::::::::::::: CCDS31 SLSPSSSAVHHTAGHSALSSNFNEWYV 430 440 >>CCDS14663.1 ZIC3 gene_id:7547|Hs108|chrX (467 aa) initn: 1851 init1: 1275 opt: 1790 Z-score: 1136.4 bits: 219.5 E(32554): 5.6e-57 Smith-Waterman score: 2017; 64.4% identity (81.7% similar) in 475 aa overlap (1-447:3-467) 10 20 30 40 pF1KB7 MLLDAGPQYPAIGVTTFGASRHHSAGDVAERDVGLGINPFADGM---------GAFKL ::::.:::.:..:: .::: ::: . .. .:.:.:::.:. .:::: CCDS14 MTMLLDGGPQFPGLGVGSFGAPRHHEMPN--REPAGMGLNPFGDSTHAAAAAAAAAAFKL 10 20 30 40 50 50 60 70 80 90 pF1KB7 NPSS-HELASAGQTAFTSQAPGYAAAAALGHHHHPGH-------VGSY---SSAAFNSTR .:.. :.:.:. ..::: :. ::: : :::::: : : :: .:::::::: CCDS14 SPAAAHDLSSGQSSAFTPQGSGYANA--LGHHHHHHHHHHHTSQVPSYGGAASAAFNSTR 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB7 DFLFRNRGFG-DAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASP- .::::.:. : . ::....::.:::.::... .: : . ..:::::::::.::: :: CCDS14 EFLFRQRSSGLSEAASGGGQHGLFAGSASSLHAPAGIPEPPSYLLFPGLHEQGAGHPSPT 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB7 -NVVNGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAA-PQLHGYGPMNVNM----AAHHGA .: :.:..::. :... : . : :.:::.. ::: :. .:.:::.:: ::::: CCDS14 GHVDNNQVHLGLRGELFGRADPYRPVASPRTDPYAAGAQFPNYSPMNMNMGVNVAAHHGP 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB7 GAFFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQSNHI ::::::::::::::: ::::. ::. :::::..:::::::::::::.::::::::.::. CCDS14 GAFFRYMRQPIKQELSCKWIDEAQLSRPKKSCDRTFSTMHELVTHVTMEHVGGPEQNNHV 240 250 260 270 280 290 280 290 300 310 320 330 pF1KB7 CFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHTGEK :.::::::::: :::::::::::::::::::::::::::::.:::::::::::::::::: CCDS14 CYWEECPREGKSFKAKYKLVNHIRVHTGEKPFPCPFPGCGKIFARSENLKIHKRTHTGEK 300 310 320 330 340 350 340 350 360 370 380 390 pF1KB7 PFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKMCDKSYTHPSSLRKHMKVHESSSQG ::::::::::::::::::::::::::::::::.::.::::::::::::::::::: ::: CCDS14 PFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYICKVCDKSYTHPSSLRKHMKVHE--SQG 360 370 380 390 400 410 400 410 420 430 440 pF1KB7 SQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEWYV :. ::::::::::::::.:.: .. . ::.. : .... :. : : ::::::: CCDS14 SDSSPAASSGYESSTPPAIASANSKD-TTKTPSAVQTSTSHNPG---LPPNFNEWYV 420 430 440 450 460 >>CCDS83494.1 ZIC3 gene_id:7547|Hs108|chrX (457 aa) initn: 1506 init1: 1233 opt: 1594 Z-score: 1014.5 bits: 196.9 E(32554): 3.5e-50 Smith-Waterman score: 1821; 65.9% identity (83.0% similar) in 411 aa overlap (1-382:3-408) 10 20 30 40 pF1KB7 MLLDAGPQYPAIGVTTFGASRHHSAGDVAERD-VGLGINPFADGM---------GAFK ::::.:::.:..:: .::: ::: .. .:. .:.:.:::.:. .::: CCDS83 MTMLLDGGPQFPGLGVGSFGAPRHH---EMPNREPAGMGLNPFGDSTHAAAAAAAAAAFK 10 20 30 40 50 50 60 70 80 90 pF1KB7 LNPSS-HELASAGQTAFTSQAPGYAAAAALGHHHHPGH-------VGSY---SSAAFNST :.:.. :.:.:. ..::: :. ::: : :::::: : : :: .::::::: CCDS83 LSPAAAHDLSSGQSSAFTPQGSGYANA--LGHHHHHHHHHHHTSQVPSYGGAASAAFNST 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB7 RDFLFRNRGFG-DAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASP :.::::.:. : . ::....::.:::.::... .: : . ..:::::::::.::: :: CCDS83 REFLFRQRSSGLSEAASGGGQHGLFAGSASSLHAPAGIPEPPSYLLFPGLHEQGAGHPSP 120 130 140 150 160 170 160 170 180 190 200 pF1KB7 --NVVNGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAA-PQLHGYGPMNVNM----AAHHG .: :.:..::. :... : . : :.:::.. ::: :. .:.:::.:: ::::: CCDS83 TGHVDNNQVHLGLRGELFGRADPYRPVASPRTDPYAAGAQFPNYSPMNMNMGVNVAAHHG 180 190 200 210 220 230 210 220 230 240 250 260 pF1KB7 AGAFFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQSNH ::::::::::::::: ::::. ::. :::::..:::::::::::::.::::::::.:: CCDS83 PGAFFRYMRQPIKQELSCKWIDEAQLSRPKKSCDRTFSTMHELVTHVTMEHVGGPEQNNH 240 250 260 270 280 290 270 280 290 300 310 320 pF1KB7 ICFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHTGE .:.::::::::: :::::::::::::::::::::::::::::.::::::::::::::::: CCDS83 VCYWEECPREGKSFKAKYKLVNHIRVHTGEKPFPCPFPGCGKIFARSENLKIHKRTHTGE 300 310 320 330 340 350 330 340 350 360 370 380 pF1KB7 KPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKMCDKSYTHPSSLRKHMKVHESSSQ :::::::::::::::::::::::::::::::::.::.:::::::::::::::: CCDS83 KPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYICKVCDKSYTHPSSLRKHMKCCPAWYP 360 370 380 390 400 410 390 400 410 420 430 440 pF1KB7 GSQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEWYV CCDS83 GQSLIPDEELDTDVGMQQPALHNTTYPKCRVNAEPTVQEMIY 420 430 440 450 >>CCDS9495.1 ZIC2 gene_id:7546|Hs108|chr13 (532 aa) initn: 2393 init1: 1400 opt: 1477 Z-score: 940.9 bits: 183.5 E(32554): 4.4e-46 Smith-Waterman score: 2154; 69.6% identity (83.3% similar) in 473 aa overlap (1-437:1-468) 10 20 30 40 pF1KB7 MLLDAGPQYPAIGVTTFGASRHHSAGDVA-------ERDVGLGI--NPFADG----MGAF ::::::::.::::: .:. .::::. .: .:...:. : :.:. :::: CCDS94 MLLDAGPQFPAIGVGSFARHHHHSAAAAAAAAAEMQDRELSLAAAQNGFVDSAAAHMGAF 10 20 30 40 50 60 50 60 70 80 90 pF1KB7 KLNPSSHELASAGQTAFTSQAPGY--------AAAAALGHHHHPGHVGSYSSAAFNSTRD ::::..:::. . ..:::::.:: ::::::: : .::::::. :::::: CCDS94 KLNPGAHELSPGQSSAFTSQGPGAYPGSAAAAAAAAALGP--HAAHVGSYSGPPFNSTRD 70 80 90 100 110 100 110 120 130 140 150 pF1KB7 FLFRNRGFGDAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASPNVV ::::.:::::.: ... ::.::. .:::. :.:.:: :::::::: :: . :.: ::. CCDS94 FLFRSRGFGDSAPGGG-QHGLFGPGAGGLH--HAHSDAQGHLLFPGLPEQHGPHGSQNVL 120 130 140 150 160 170 160 170 180 190 200 pF1KB7 NGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAAPQLHG-YGPMNVNM-------AAHHG-- :::::::. :... : ::: ::.:::.. :.: :::. :::::.:: :::: CCDS94 NGQMRLGLPGEVFGRSEQYRQVASPRTDPYSAAQLHNQYGPMNMNMGMNMAAAAAHHHHH 180 190 200 210 220 230 210 220 230 240 250 260 pF1KB7 ----AGAFFRYMRQP-IKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGP ::::::::: ::::::::::.::::.::::::::::::::::::::.::::::: CCDS94 HHHHPGAFFRYMRQQCIKQELICKWIDPEQLSNPKKSCNKTFSTMHELVTHVSVEHVGGP 240 250 260 270 280 290 270 280 290 300 310 320 pF1KB7 EQSNHICFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKR :::::.:::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 EQSNHVCFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKR 300 310 320 330 340 350 330 340 350 360 370 380 pF1KB7 THTGEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKMCDKSYTHPSSLRKHMKVH ::::::::.::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 THTGEKPFQCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKMCDKSYTHPSSLRKHMKVH 360 370 380 390 400 410 390 400 410 420 430 440 pF1KB7 ESSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNE ::: :::. :::::::::::::: .::::.. ..:.:::...:. .:. .: CCDS94 ESSPQGSESSPAASSGYESSTPPGLVSPSAEPQSSSNLSPAAAAAAAAAAAAAAAVSAVH 420 430 440 450 460 470 pF1KB7 WYV CCDS94 RGGGSGSGGAGGGSGGGSGSGGGGGGAGGGGGGSSGGGSGTAGGHSGLSSNFNEWYV 480 490 500 510 520 530 >>CCDS43160.1 ZIC4 gene_id:84107|Hs108|chr3 (334 aa) initn: 1624 init1: 865 opt: 1457 Z-score: 930.9 bits: 181.0 E(32554): 1.6e-45 Smith-Waterman score: 1457; 68.2% identity (81.3% similar) in 321 aa overlap (122-436:23-333) 100 110 120 130 140 150 pF1KB7 AAFNSTRDFLFRNRGFGDAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAA ..:..: ::. : :.. .::::::. CCDS43 MRYKTSLVMRKRLRLYRNTLKESSSSSGHHGPQ-LTAASSPSVFPGLHEEPP 10 20 30 40 50 160 170 180 190 200 pF1KB7 GHASPNV-VNGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAAPQ-LHGYGPMN--VNMAAH .:::. .:: .:::. :::: ::: . . ::. :: ::::: :: ::.:: CCDS43 -QASPSRPLNGLLRLGLPGDMYARPEPFPPGPAARSDALAAAAALHGYGGMNLTVNLAAP 60 70 80 90 100 110 210 220 230 240 250 260 pF1KB7 HGAGAFFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQS :: :::::::::::::::::::. . :.:. :.:::::::::::::::::::::::. CCDS43 HGPGAFFRYMRQPIKQELICKWLAADGTATPSL-CSKTFSTMHELVTHVTVEHVGGPEQA 120 130 140 150 160 270 280 290 300 310 320 pF1KB7 NHICFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT :::::::::::.:::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 NHICFWEECPRQGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT 170 180 190 200 210 220 330 340 350 360 370 380 pF1KB7 GEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKM--CDKSYTHPSSLRKHMKVHE :::::.::::::.:::::::::::: ::::::::: ::. ::: :::::::::::::: CCDS43 GEKPFRCEFEGCERRFANSSDRKKHSHVHTSDKPYTCKVRGCDKCYTHPSSLRKHMKVH- 230 240 250 260 270 280 390 400 410 420 430 440 pF1KB7 SSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEW : .: : ::::.:.:: ..::::.: :... :.... .:: : CCDS43 ----GRSPPP--SSGYDSATPSALVSPSSDCGHKSQVASSAAVAARTADLSE 290 300 310 320 330 pF1KB7 YV >>CCDS54653.1 ZIC4 gene_id:84107|Hs108|chr3 (372 aa) initn: 1624 init1: 865 opt: 1457 Z-score: 930.3 bits: 181.1 E(32554): 1.7e-45 Smith-Waterman score: 1457; 68.2% identity (81.3% similar) in 321 aa overlap (122-436:61-371) 100 110 120 130 140 150 pF1KB7 AAFNSTRDFLFRNRGFGDAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAA ..:..: ::. : :.. .::::::. CCDS54 DSKAQSQKMRYKTSLVMRKRLRLYRNTLKESSSSSGHHGPQ-LTAASSPSVFPGLHEEPP 40 50 60 70 80 160 170 180 190 200 pF1KB7 GHASPNV-VNGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAAPQ-LHGYGPMN--VNMAAH .:::. .:: .:::. :::: ::: . . ::. :: ::::: :: ::.:: CCDS54 -QASPSRPLNGLLRLGLPGDMYARPEPFPPGPAARSDALAAAAALHGYGGMNLTVNLAAP 90 100 110 120 130 140 210 220 230 240 250 260 pF1KB7 HGAGAFFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQS :: :::::::::::::::::::. . :.:. :.:::::::::::::::::::::::. CCDS54 HGPGAFFRYMRQPIKQELICKWLAADGTATPSL-CSKTFSTMHELVTHVTVEHVGGPEQA 150 160 170 180 190 200 270 280 290 300 310 320 pF1KB7 NHICFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT :::::::::::.:::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 NHICFWEECPRQGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT 210 220 230 240 250 260 330 340 350 360 370 380 pF1KB7 GEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKM--CDKSYTHPSSLRKHMKVHE :::::.::::::.:::::::::::: ::::::::: ::. ::: :::::::::::::: CCDS54 GEKPFRCEFEGCERRFANSSDRKKHSHVHTSDKPYTCKVRGCDKCYTHPSSLRKHMKVH- 270 280 290 300 310 320 390 400 410 420 430 440 pF1KB7 SSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEW : .: : ::::.:.:: ..::::.: :... :.... .:: : CCDS54 ----GRSPPP--SSGYDSATPSALVSPSSDCGHKSQVASSAAVAARTADLSE 330 340 350 360 370 pF1KB7 YV >>CCDS54652.1 ZIC4 gene_id:84107|Hs108|chr3 (384 aa) initn: 1624 init1: 865 opt: 1457 Z-score: 930.1 bits: 181.1 E(32554): 1.7e-45 Smith-Waterman score: 1457; 68.2% identity (81.3% similar) in 321 aa overlap (122-436:73-383) 100 110 120 130 140 150 pF1KB7 AAFNSTRDFLFRNRGFGDAAAAASAQHSLFAASAGGFGGPHGHTDAAGHLLFPGLHEQAA ..:..: ::. : :.. .::::::. CCDS54 WEKAQSQKMRYKTSLVMRKRLRLYRNTLKESSSSSGHHGPQ-LTAASSPSVFPGLHEEPP 50 60 70 80 90 100 160 170 180 190 200 pF1KB7 GHASPNV-VNGQMRLGFSGDMYPRPEQYGQVTSPRSEHYAAPQ-LHGYGPMN--VNMAAH .:::. .:: .:::. :::: ::: . . ::. :: ::::: :: ::.:: CCDS54 -QASPSRPLNGLLRLGLPGDMYARPEPFPPGPAARSDALAAAAALHGYGGMNLTVNLAAP 110 120 130 140 150 160 210 220 230 240 250 260 pF1KB7 HGAGAFFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQS :: :::::::::::::::::::. . :.:. :.:::::::::::::::::::::::. CCDS54 HGPGAFFRYMRQPIKQELICKWLAADGTATPSL-CSKTFSTMHELVTHVTVEHVGGPEQA 170 180 190 200 210 270 280 290 300 310 320 pF1KB7 NHICFWEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT :::::::::::.:::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 NHICFWEECPRQGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHT 220 230 240 250 260 270 330 340 350 360 370 380 pF1KB7 GEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKM--CDKSYTHPSSLRKHMKVHE :::::.::::::.:::::::::::: ::::::::: ::. ::: :::::::::::::: CCDS54 GEKPFRCEFEGCERRFANSSDRKKHSHVHTSDKPYTCKVRGCDKCYTHPSSLRKHMKVH- 280 290 300 310 320 330 390 400 410 420 430 440 pF1KB7 SSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEW : .: : ::::.:.:: ..::::.: :... :.... .:: : CCDS54 ----GRSPPP--SSGYDSATPSALVSPSSDCGHKSQVASSAAVAARTADLSE 340 350 360 370 380 pF1KB7 YV >>CCDS9494.2 ZIC5 gene_id:85416|Hs108|chr13 (663 aa) initn: 1150 init1: 874 opt: 1028 Z-score: 660.1 bits: 131.9 E(32554): 1.9e-30 Smith-Waterman score: 1286; 52.9% identity (65.1% similar) in 418 aa overlap (106-447:224-625) 80 90 100 110 120 130 pF1KB7 ALGHHHHPGHVGSYSSAAFNSTRDFLFRNRGFGDAAAAASAQHS--LFAASAGGFGGPHG : :. : :: .: ...: ..:: : CCDS94 SRDFVLRRDLSATAPAAAMHGAPLGGEQRSGTGSPQHPAPPPHSAGMFISASGTYAGPDG 200 210 220 230 240 250 140 150 160 170 180 pF1KB7 HTDAAGHLLFPGLHEQ-AAGHASPNVVNGQMRLGFSGDMYPRP-EQYGQVT---SPRS-- ..: :::.::. .: . :. .:::::::... : ::.. .::: CCDS94 ---SGGPALFPALHDTPGAPGGHPHPLNGQMRLGLAAAAAAAAAELYGRAEPPFAPRSGD 260 270 280 290 300 310 190 200 pF1KB7 EHY------AAPQLHGYGP--MNVNMAA--------------HHG--------------- :: :: ::::: .:.:.:: ::. CCDS94 AHYGAVAAAAAAALHGYGAVNLNLNLAAAAAAAAAGPGPHLQHHAPPPAPPPPPAPAQHP 320 330 340 350 360 370 210 220 230 240 pF1KB7 ----------AGAFFRYMRQPIKQELICKWIEPEQLAN-PK-----------------KS ::::.::::::::::::::::.:..::. : : CCDS94 HQHHPHLPGAAGAFLRYMRQPIKQELICKWIDPDELAGLPPPPPPPPPPPPPPPAGGAKP 380 390 400 410 420 430 250 260 270 280 290 300 pF1KB7 CNKTFSTMHELVTHVTVEHVGGPEQSNHICFWEECPREGKPFKAKYKLVNHIRVHTGEKP :.:::.::::::.:::::::::::::.:.::::.::::::::::::::.::::::::::: CCDS94 CSKTFGTMHELVNHVTVEHVGGPEQSSHVCFWEDCPREGKPFKAKYKLINHIRVHTGEKP 440 450 460 470 480 490 310 320 330 340 350 360 pF1KB7 FPCPFPGCGKVFARSENLKIHKRTHTGEKPFKCEFEGCDRRFANSSDRKKHMHVHTSDKP :::::::::::::::::::::::::::::::::::.::::.:::::::::: :::::::: CCDS94 FPCPFPGCGKVFARSENLKIHKRTHTGEKPFKCEFDGCDRKFANSSDRKKHSHVHTSDKP 500 510 520 530 540 550 370 380 390 400 410 pF1KB7 YLCKM--CDKSYTHPSSLRKHMKVHESSSQGSQPSPAASSGYESSTPPTIVSPSTDNPTT : ::. ::::::::::::::::.: .: :::. :: : :. : . CCDS94 YYCKIRGCDKSYTHPSSLRKHMKIHCKS---PPPSPGPL-GYSSVGTPV------GAPLS 560 570 580 590 600 420 430 440 pF1KB7 SSLSPSSSAVHHTAGHSALSSNFNEWYV :.:. : :.. : .:.::::: CCDS94 PVLDPARS---HSSTLSPQVTNLNEWYVCQASGAPSHLHTPSSNGTTSETEDEEIYGNPE 610 620 630 640 650 >>CCDS10511.1 GLIS2 gene_id:84662|Hs108|chr16 (524 aa) initn: 548 init1: 298 opt: 624 Z-score: 409.8 bits: 85.3 E(32554): 1.7e-16 Smith-Waterman score: 629; 36.8% identity (59.5% similar) in 304 aa overlap (151-438:87-370) 130 140 150 160 170 pF1KB7 FAASAGGFGGPHGHTDAAGHLLFPGLHEQAAGHASPNVVNG--QMRLGFSGDMYPRPEQY .: ::: .. : : .::. : : CCDS10 SGFLLNSKFPEKVEGRFSAAPLVDLSLSPPSGLDSPNGSSSLSPERQG-NGDLPPVPSAS 60 70 80 90 100 110 180 190 200 210 220 230 pF1KB7 GQVTSPRSEHYAAPQ-LHGYGPMNVNMAAHHGAGAFFRYMRQ-------PIKQELICKWI .: ..:. .. . :.. . : : :..:. .. :. ..:.:.: CCDS10 D--FQPLRYLDGVPSSFQFFLPLGSGGALHLPASSFLTPPKDKCLSPDLPLPKQLVCRWA 120 130 140 150 160 170 240 250 260 270 280 290 pF1KB7 EPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQSNHICFWEECPREGKPFKAKYKLV . ::. : ...:: ::. :: ..... : :: : :.:. :.:.::.. CCDS10 K----------CNQLFELLQDLVDHVNDYHVKPEKDAGYCCHWEGCARHGRGFNARYKML 180 190 200 210 220 300 310 320 330 340 350 pF1KB7 NHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHTGEKPFKCEFEGCDRRFANSSDRK :::.::.::: :: :.: :.: ::::::.:.::::::. : .:::..:..::::: CCDS10 IHIRTHTNEKPHRCP--TCSKSFSRLENLKIHNRSHTGEKPYVCPYEGCNKRYSNSSDRF 230 240 250 260 270 280 360 370 380 390 400 pF1KB7 KHMHVHTSDKPYLCKM--CDKSYTHPSSLRKHMKVHESSSQGSQPSPAASSGYESSTPPT :: ..: :::: ::: : : :: :::::::.:.: : : . . :: CCDS10 KHTRTHYVDKPYYCKMPGCHKRYTDPSSLRKHIKAH-----GHFVSHEQQELLQLRPPPK 290 300 310 320 330 410 420 430 440 pF1KB7 IVSPSTDN-PTTSS---LSPSSSAVHHTAGHSALSSNFNEWYV :. :. : .:. . :. .:. : .: CCDS10 PPLPAPDGGPYVSGAQIIIPNPAALFGGPGLPGLPLPLAPGPLDLSALACGNGGGSGGGG 340 350 360 370 380 390 CCDS10 GMGPGLPGPVLPLNLAKNPLLPSPFGAGGLGLPVVSLLAGAAGGKAEGEKGRGSVPTRAL 400 410 420 430 440 450 >>CCDS6451.1 GLIS3 gene_id:169792|Hs108|chr9 (775 aa) initn: 729 init1: 497 opt: 607 Z-score: 397.2 bits: 83.5 E(32554): 8.4e-16 Smith-Waterman score: 631; 31.4% identity (55.3% similar) in 436 aa overlap (19-436:135-545) 10 20 30 40 pF1KB7 MLLDAGPQYPAIGVTTFGASRHHSAGDVAERDVGLGINPFADGMGA-- ..: ::: . . .:...:..::.: CCDS64 MSSNSVSNSLPSYLFGTESSHSPYPSPRHSSTRSHSARS---KKRALSLSPLSDGIGIDF 110 120 130 140 150 160 50 60 70 80 90 100 pF1KB7 ---FKLNPSSHELASAGQTAFTSQAPGYAAAAALGHHHHPGHVGS---YSSAAFNSTRDF .. .:.: :. : .:. . . : : :: . .: . CCDS64 NTIIRTSPTSLVAYINGSRA----SPANLSPQPEVYGHFLGVRGSCIPQPRPVPGSQKGV 170 180 190 200 210 110 120 130 140 150 pF1KB7 LFRNRGFGDAAAA---ASAQHSLFAASAGGFG-GPHGHTDAAGHLLFPGLHEQAAGHASP : :.. : . : .. . ::. : .: .. : : :: :.:: . CCDS64 LVAPGGLALPAYGEDGALEHERMQQLEHGGLQPGLVNHM-VVQHGL-PGPDSQSAGLFKT 220 230 240 250 260 270 160 170 180 190 200 210 pF1KB7 NVVNGQMRLGFSGDMYPRPE--QYGQVTSPRSEHYAAPQLHG--YGPMNVNMAAHHGAGA . . . : . :. : : .: ..: .:: :: ..: ... CCDS64 ERL--EEFPGSTVDLPPAPPLPPLPPPPGPPPPYHAHAHLHHPELGPHAQQLALPQATLD 280 290 300 310 320 330 220 230 240 250 260 270 pF1KB7 FFRYMRQPIKQELICKWIEPEQLANPKKSCNKTFSTMHELVTHVTVEHVGGPEQSNHICF : . : . :.::. :. .. ..::: :. :. . . :: CCDS64 DDGEM-DGIGGKHCCRWID----------CSALYDQQEELVRHIEKVHIDQRKGEDFTCF 340 350 360 370 380 280 290 300 310 320 330 pF1KB7 WEECPREGKPFKAKYKLVNHIRVHTGEKPFPCPFPGCGKVFARSENLKIHKRTHTGEKPF : :::. :::.:.:::. :.:::.:::: : : :: :.:.: :::::: :.::::::. CCDS64 WAGCPRRYKPFNARYKLLIHMRVHSGEKPNKCTFEGCEKAFSRLENLKIHLRSHTGEKPY 390 400 410 420 430 440 340 350 360 370 380 390 pF1KB7 KCEFEGCDRRFANSSDRKKHMHVHTSDKPYLCKM--CDKSYTHPSSLRKHMKVHESSSQG :. ::.. :.::::: ::...: . ::: :.. : : :: :::::::.:.: :. : CCDS64 LCQHPGCQKAFSNSSDRAKHQRTHLDTKPYACQIPGCTKRYTDPSSLRKHVKAHSSKEQQ 450 460 470 480 490 500 400 410 420 430 440 pF1KB7 SQPSPAASSGYESSTPPTIVSPSTDNPTTSSLSPSSSAVHHTAGHSALSSNFNEWYV .. . .:. . . .. .. .:.: :: ..:.. :.:.: CCDS64 ARKKLRSSTELHPDLLTDCLTVQSLQPAT---SPRDAAAEGTVGRSPGPGPDLYSAPIFS 510 520 530 540 550 CCDS64 SNYSSRSGTAAGAVPPPHPVSHPSPGHNVQGSPHNPSSQLPPLTAVDAGAERFAPSAPSP 560 570 580 590 600 610 447 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 22:10:53 2016 done: Fri Nov 4 22:10:54 2016 Total Scan time: 3.340 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]