Gene Tmz1t_3071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_3071
Symbol
ID	7874541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	3324764
End bp	3326170
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	70%
IMG OID	643699994
Product	isopropylmalate isomerase large subunit
Protein accession	YP_002890046
Protein GI	237653732
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR00170] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCTC AAACGCTGTA TGAAAAGCTC TGGTCCAGCC ACGTGGTCCA CGAGGAGGCC 
GACGGCACGG CGCTGATCTA CATCGATCGC CACCTGGTGC ACGAAGTGAC CAGCCCGCAG 
GCCTTCGAAG GCCTCAAGCT CGCCGGGCGC AAGCCCTGGC GCGTCGGCTC CATCGTCGCC 
ACCGCCGACC ACAACACGCC CACCGACCAC TGGGACCTGG GCATCCAGGA CCCGGTGTCG 
CGCCAGCAGG TCGAGACGCT GGACGCCAAC ATCCGCGAGG TCGGCTCGCT CGCCTATTTC 
CCGTTCAAGG ACGCGCGCCA GGGCATCGTG CACGTGATCG GGCCGGAGAA CGGCGCCACG 
CTGCCGGGCA TGACCGTCGT CTGCGGCGAC TCCCACACCT CCACGCACGG CGCCTTCGGC 
TGCCTTGCGC ACGGCATCGG CACCTCCGAG GTCGAGCACG TGCTCGCCAC CCAATGCCTG 
CTGCAGAAGA AGTCCAGGAC CCTGCTGATC CACGTCGACG GCCAGCTCGG CCGCGGCGTC 
ACCGCCAAGG ACGTGGTGCT CGCCATCATC GGCAGGATCG GCACCGCCGG CGGCACCGGC 
TACGCGATGG AGTTCGGCGG CAGCGCCATC CGCGCGCTGT CGATGGAAGG CCGCATGACG 
ATCTGCAACA TGGCGATCGA GGCGGGCGCG CGCGCCGGGC TGGTCGGCGT GGACGAGACC 
ACCATCGAAT ACCTGAAGGA TCGCCCCTTC TCGCCCAAGG GCGCGCAGTG GGAGCAGGCG 
GTCGACTACT GGCGCAGCCT GCACAGCGAC GAGGGCGCCG AGTTCGACAA GATCATCGAA 
CTCAAGGCCG AAGACATCCT GCCGCAGGTC ACCTGGGGCA CCTCGCCCGA GATGGTCACC 
ACGGTCGACG GCCGTGTGCC CGATCCCGCC GCCGTCACCG ACCCGGTGCG CCGCGAGGGC 
ATCGAGCGCG CGCTCAAGTA TATGGGCCTC GAGGCCAACA CCCCGATCAC CGACATCCCG 
GTCGACCAGG TCTTCATCGG CTCGTGCACC AACTCGCGCA TCGAGGATTT GCGTGAGGCT 
GCCGCGGTGG CCAAGGGCCG CAGCAAGGCC GCCAGCGTCA AGCGCGTGCT GGTGGTGCCG 
GGCTCCGGCC TGGTCAAGCG CCAGGCCGAG GCGGAGGGCC TGCACGAGAT CTTCCTCGCC 
GCCGGCTTCG AGTGGCGCGA GCCGGGCTGT TCGATGTGCC TGGCGATGAA CGCCGACCGC 
CTCGAGCCTG GCGAGCGCTG CGCCTCGACC TCGAACCGCA ACTTCGAGGG CCGCCAGGGT 
GCGGGGGGGC GCACCCACCT GGTCAGCCCG GCGATGGCCG CGGCCGCCGC GGTCACCGGC 
CGCTTCACCG ACGTGCGCGC GCTCTGA

Protein sequence

MKAQTLYEKL WSSHVVHEEA DGTALIYIDR HLVHEVTSPQ AFEGLKLAGR KPWRVGSIVA 
TADHNTPTDH WDLGIQDPVS RQQVETLDAN IREVGSLAYF PFKDARQGIV HVIGPENGAT 
LPGMTVVCGD SHTSTHGAFG CLAHGIGTSE VEHVLATQCL LQKKSRTLLI HVDGQLGRGV 
TAKDVVLAII GRIGTAGGTG YAMEFGGSAI RALSMEGRMT ICNMAIEAGA RAGLVGVDET 
TIEYLKDRPF SPKGAQWEQA VDYWRSLHSD EGAEFDKIIE LKAEDILPQV TWGTSPEMVT 
TVDGRVPDPA AVTDPVRREG IERALKYMGL EANTPITDIP VDQVFIGSCT NSRIEDLREA 
AAVAKGRSKA ASVKRVLVVP GSGLVKRQAE AEGLHEIFLA AGFEWREPGC SMCLAMNADR 
LEPGERCAST SNRNFEGRQG AGGRTHLVSP AMAAAAAVTG RFTDVRAL