Gene Mlg_1020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1020
Symbol
ID	4270050
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1160528
End bp	1161634
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	67%
IMG OID	638125772
Product	histone deacetylase superfamily protein
Protein accession	YP_741863
Protein GI	114320180
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.283226
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAATTAG CGGTTAGTAT GCGGGTAGGG CTGGTCGGGC GCCGGCCGGC GATGACACCA 
CGGGCCGTTG ATGGGGGATC CGACGTGAAG GCATTTTTCC ACCCGAGCCA GGACAAGCAC 
ATCCCCAGGA GCTACCTCTC CCGCGGTCAG ATGCGGGCGC CGCTGGAACT CCCCGAGCGC 
ACCGGGCATA TCCTGGAGGG GCTGCGGACG CTGGATATCT CGGTGGAGAC ACCCTCTGAT 
CACGGGATGC AGGCCATTGC CCGGGTCCAC GACATGGGCT ACCTGCGGTT CCTGGAGTCG 
GCGCATCGGC GCTGGAAGGC CATCCCCGAT GACTGGGGTG ATGAGGTGAT GTCCAATGTC 
TTCGTGCGCT CGCCCAACCC CATGAAGGGC ATCCTGGCCG AGGCCGCCCG CTACCTGGCC 
GACGGCAGTT GCCCCATTGG CGAACACACC TTCGAGGCCG CCTACTGGTC GGCCCAGACC 
GCGTTATCGG CCAGCGACGA GCTGCTGCGG GGGGCGAAGC GCGCCTATGC GGTCTGCCGC 
CCGCCGGGAC ACCACGCCCG CCGCGACGCC GCGGGTGGCT TCTGCTATCT GAACAATGCC 
GCCATCGCCG CCGAGGCCCT CAAGGCCCAG TACCCCCGGA TCGCCATCCT CGACCCGGAC 
ATGCACCATG GCCAGGGCAT CCAGGAGATC TTCTACGACC GGGACGATGT GCTCTATATC 
TCCATCCACG GCGACCCCAC CAACTTCTAC CCGGTGGTGA GCGGCCACGA GGAGGAGCGC 
GGGGCCGGGG CCGGCGAGGG CTATAATATC AACCTGCCCA TGCCCCACGG CTCACCGGAG 
GCCACCTACT TCCAGCGCTT GGAGGAGGCG GCGCACGCCA TCGAGCTCTA CGCCCCCGAC 
GCGCTCATCG TCACCCTGGG CTTCGATATC TATAAGGATG ACCCGCAGAA CAAGGCGGCG 
GTGAGCTCAC CCGGCTTCAA CCGCATGGGT CGCACCCTGG CCGAGCTCGC TCTGCCGACG 
CTGATCATCC AGGAGGGGGG CTATCACATG GCGACGCTGG CACAGAACAC CCGCGAGTTC 
TTCACCGGCT TGGGCGACCC GCGCTGA

Protein sequence

MELAVSMRVG LVGRRPAMTP RAVDGGSDVK AFFHPSQDKH IPRSYLSRGQ MRAPLELPER 
TGHILEGLRT LDISVETPSD HGMQAIARVH DMGYLRFLES AHRRWKAIPD DWGDEVMSNV 
FVRSPNPMKG ILAEAARYLA DGSCPIGEHT FEAAYWSAQT ALSASDELLR GAKRAYAVCR 
PPGHHARRDA AGGFCYLNNA AIAAEALKAQ YPRIAILDPD MHHGQGIQEI FYDRDDVLYI 
SIHGDPTNFY PVVSGHEEER GAGAGEGYNI NLPMPHGSPE ATYFQRLEEA AHAIELYAPD 
ALIVTLGFDI YKDDPQNKAA VSSPGFNRMG RTLAELALPT LIIQEGGYHM ATLAQNTREF 
FTGLGDPR