Gene Mthe_0788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_0788
Symbol
ID	4461975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	+
Start bp	839074
End bp	840222
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	57%
IMG OID	639699799
Product	3-isopropylmalate dehydratase
Protein accession	YP_843217
Protein GI	116754099
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR01343] homoaconitate hydratase family protein [TIGR02086] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCACG ACGGCACAAG CGTCCTTGCC ATAAAGGCAT TCAGGGAGAT GGGGTCAGAG 
AAGGTCTGGG ATAAAAGCAG GATAGTAATA CCGTTCGATC ACATCGTGCC CGCAAACAAT 
GAGACCGCTG CGACGCTTCA GGCGGAGGTG AGAAGATGGG CGAGGGCTCA GGGGATTGAG 
AACTTCTACG ACTGCGGTCA TGGCATATGC CACCAGGTCT TCTGCGAGAT GGGTTTCGCT 
CTTCCTGGGG CGCTTGTCGT GGGCGCCGAC TCTCATTCCT GTACTTATGG TGCACTCGGC 
GCATTCGGAA CAGGTGTGGG CGCCACGGAC ATGGCTGAGA TCTATTCCCG CGGGAGGCTA 
TGGTTCAGAG TGCCGGAGAC GATATGCATG CGCCTTGAGG GCACTCTGGG TGATATGGTA 
TCAGCAAAGG ATCTCGCCCT CTTCGTGGTG AAGGAGATGG GCGCGGATGG CGCCAACTAC 
ATGTCCGTGG AGTTCGTCGG CGGGGCTGTG GAGAGGCTGA GCATATCAGG CAGGATGACT 
CTGTGCAACA TGGGTGTTGA GATGGGAGCA AAGGCTGCGA TCGTCCCGCC GGATGAGAGC 
GTCGACGCAT ACCTCGCTAG AAGAGCCAGA CGTCCATACA CGCACATCCA CTCAGACCCG 
GGATCATACT ACAGAGAGAT CGAGTACGAT GTGAGCGATA TTCCTCCAAT GATTGCGGCT 
CCATACCGCG TTGACAATGT TCATCCAGTC AGGGATCTGG CAGGCATCGA GGTGGACCAG 
GTATTCATCG GCACATGTAC CAACGGAAGG CTGGAGGATC TGGAGATGGC AGCCCGGATC 
GTGAAGGGCA AAAGGGTTAA GATCAGAACG CTTGTGATCC CCGCCTCCAG AGAGATATAT 
CTTGGTGCTC TGAGATCTGG GGTAATTGAG ACCCTTGTCG AGGCCGGCGC GATGATCGGC 
CCGCCGGGAT GCGGTCCATG CCTTGGCGCA CACATGGGAG TTCTGGGCGA CGGAGAGGTC 
TGTTTGTCCA CATCAAACAG AAACTTCCCG GGAAGGATGG GCAGAAACGG AAAGGTCTAC 
CTGGCATCGC CTGCAACTGC CGCAGCCACG GCGATCACAG GAAAGATCAC AGATCCAAGG 
GACGTATGA

Protein sequence

MSHDGTSVLA IKAFREMGSE KVWDKSRIVI PFDHIVPANN ETAATLQAEV RRWARAQGIE 
NFYDCGHGIC HQVFCEMGFA LPGALVVGAD SHSCTYGALG AFGTGVGATD MAEIYSRGRL 
WFRVPETICM RLEGTLGDMV SAKDLALFVV KEMGADGANY MSVEFVGGAV ERLSISGRMT 
LCNMGVEMGA KAAIVPPDES VDAYLARRAR RPYTHIHSDP GSYYREIEYD VSDIPPMIAA 
PYRVDNVHPV RDLAGIEVDQ VFIGTCTNGR LEDLEMAARI VKGKRVKIRT LVIPASREIY 
LGALRSGVIE TLVEAGAMIG PPGCGPCLGA HMGVLGDGEV CLSTSNRNFP GRMGRNGKVY 
LASPATAAAT AITGKITDPR DV