Gene Mlg_0688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0688
Symbol
ID	4268847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	763202
End bp	764389
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	67%
IMG OID	638125437
Product	beta-ketothiolase
Protein accession	YP_741532
Protein GI	114319849
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.494591
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.737365
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGACA GAGAAGTGGT TGTCCTTAGT GCGGCACGTT CCGCCATCGG TACCTTTGGC 
GGCACCTTGG CCGGGTTCGA GCCCGCTGAC CTGGGTGGCC TGATCATCAA AGAGGCGGTG 
GCGCGCTCCG GTGTCGACCC CAATCAGATC AACTACACCA CCGTGGGCAA CTGCATCCCC 
ACCGAGAGCC GCTCGCCCTA TGTGGCCCGG GTGGCGGCGG TGCAGGGTGG GCTGCCGCAC 
AACTCCACGG CGGTCACCGT CAACCGGCTG TGCGGCTCCG GCATGCAGGC CATCGTCTCC 
ACCGCCCAGT CCATCCTGCT GGGCGATGCC GACTTCGGTG TCGGTGCCGG CACCGAGGTG 
ATGTCCAAGG GCGGTTACCT CACCCCCTCG GCCCGTTTCG GCGCCCGCAT GGGGGATGCC 
AAGATGGTCG ACATGATGGT GGCCACCCTG ACCGACCCCT TCGGCGTCGG CCACATGGGC 
ATCACCGCCG AGAACCTGGC CGAGAAGTGG AACATCTCCC GCGAGGAGCA GGACCAGTTC 
GCCGCGGAGT CCCAGCGCCG TGCCCAGGCG GCCATCGAAG GCGGCTACTT TAAGGACCAG 
ATCGTGCCGG TGACCATCAA GAGCCGGAAG GGCGAGAAGG TCTTTGACAC CGACGAGCAC 
CCGCGCTTTG GTGTCACCGT TGAGGATCTG GCCAAGATGC GCCCGGCCTT CAAGAAGGAG 
GGCGGCACCG TGACCGCCGG CAACGCCTCC GGTATCAACG ATGCCGCTGC CGCCCTGGTG 
CTGGCCGACC GTGCCGCGGC CGAGAAGGCC GGTCACAAGC CCGTGGCGCG GATGGTGGCC 
TACGGTATTG CCGGGGTGCC CAACGACATC ATGGGGGAGG GGCCGATCCC GTCGTCCAAG 
GTGGCGCTGG ACAAGGCCGG ACTGAGTATC GAGGACATGG ACGTGGTGGA GTCCAACGAG 
GCCTTCGCGG CCCAGGCGCT GACGGTCATG AAGGGCCTGG GGCTGGACCC GGCCAAGACC 
AACGTCAACG GCGGCGCCAT CGCCCTGGGC CACCCGGTGG GGGCCACCGG GTCCATCCTG 
GCGGTCAAGG CAATCCACGA GCTGCACCGC ATCCAGGGCA AGTACGCCCT GGTCACCATG 
TGCATCGGTG GCGGTCAGGG CATCACGGCC ATCTTCGAGC GCATGTGA

Protein sequence

MSDREVVVLS AARSAIGTFG GTLAGFEPAD LGGLIIKEAV ARSGVDPNQI NYTTVGNCIP 
TESRSPYVAR VAAVQGGLPH NSTAVTVNRL CGSGMQAIVS TAQSILLGDA DFGVGAGTEV 
MSKGGYLTPS ARFGARMGDA KMVDMMVATL TDPFGVGHMG ITAENLAEKW NISREEQDQF 
AAESQRRAQA AIEGGYFKDQ IVPVTIKSRK GEKVFDTDEH PRFGVTVEDL AKMRPAFKKE 
GGTVTAGNAS GINDAAAALV LADRAAAEKA GHKPVARMVA YGIAGVPNDI MGEGPIPSSK 
VALDKAGLSI EDMDVVESNE AFAAQALTVM KGLGLDPAKT NVNGGAIALG HPVGATGSIL 
AVKAIHELHR IQGKYALVTM CIGGGQGITA IFERM