Gene Tmz1t_1508 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_1508
Symbol
ID	7083590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	1684809
End bp	1686014
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	70%
IMG OID	643698525
Product	beta-ketoadipyl CoA thiolase
Protein accession	YP_002355162
Protein GI	217969928
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02430] beta-ketoadipyl CoA thiolase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0554104
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCAAG CATTCATCTG CGACGCCATC CGCACCCCCA TCGGCCGCTA CGGCGGCTCC 
CTGGCCTCCG TGCGTGCCGA CGACCTCGGC GCCGTGCCGC TCAAGGCCCT GATGACCCGC 
AACCCCCAGG TCGACTGGAC CGCGGTCGAA GACATCATCT ACGGCTGCGC CAACCAGGCC 
GGCGAGGACA ACCGCAACGT CGCGCGCATG TCCGGCCTGC TCGCCGGGCT GCCGATCGAG 
GTGCCCGGCA CCACGGTCAA CCGCCTGTGC GGCTCGGGCA TGGACGCCAT CGGCCTGGCC 
GCGCGCTCGA TCAAGTCGGG CGAGACCGAG CTGATGATCG CCGGCGGCGT CGAGAGCATG 
TCGCGCGCGC CCTTCGTGAT GGGCAAGGCC GAGTCGGCCT TCTCGCGCAG CGCCGCGATC 
TACGACACCA CCATCGGCTG GCGCTTCATC AACCCGCTGA TGAAGAAGCT GTACGAGACG 
CACTCGATGC CGCAGACCGC GGACAACGTC GCCGCCGACT TCGACATCTC GCGCGCCGAC 
CAGGACGCCT TCGCGCTGCG CTCGCAGCAG CGCTGGGCCG CCGCCCACGC CGCCGGTCGC 
TTCAAGGACG AGCTGGTGCC GGTGGTGATC CCGCGCAAGA AGGGCGACCC GATCGTCTTC 
GACACCGACG AGCATCCGCG CCCCGAAACC ACGCTGGAGA TGCTGGCCAA GCTCAAGGGC 
GTCAATGGCC CCGAGCTCAG CGTCACCGCC GGCAACGCCT CGGGCGTCAA TGACGGCGCC 
TGCGCGCTGC TGCTGGCCTC CGACGCCGCC GCCGCGAAGC ATGGCCTGAC CCCGCGCGCC 
CGCGTCGTCG CCATGGCCAC CGCCGGCGTG GCGCCGCGCA TCATGGGCTT CGGCCCCGCA 
CCCGCGGTGC GCAAGGTGCT CGCCAAGGCG GGCCTCACGC TCGATCAGAT GGATGTGATC 
GAACTCAACG AGGCTTTCGC GGCACAAGGC CTCGCCGTGC TGCGCGACCT CGGCCTCGCC 
GACGACGAAG AACGCGTGAA CCCCAATGGC GGCGCCATCG CCCTGGGCCA CCCGCTGGGC 
ATGAGCGGCG CCCGCCTGGT CACCACGGCG GCCTACGAGC TGCAGCGCCG CAATGGCCGC 
TACGCGCTGT GCACGATGTG CATCGGCGTC GGCCAGGGCA TCGCGATGAT CATCGAGCGC 
GTCTGA

Protein sequence

MTQAFICDAI RTPIGRYGGS LASVRADDLG AVPLKALMTR NPQVDWTAVE DIIYGCANQA 
GEDNRNVARM SGLLAGLPIE VPGTTVNRLC GSGMDAIGLA ARSIKSGETE LMIAGGVESM 
SRAPFVMGKA ESAFSRSAAI YDTTIGWRFI NPLMKKLYET HSMPQTADNV AADFDISRAD 
QDAFALRSQQ RWAAAHAAGR FKDELVPVVI PRKKGDPIVF DTDEHPRPET TLEMLAKLKG 
VNGPELSVTA GNASGVNDGA CALLLASDAA AAKHGLTPRA RVVAMATAGV APRIMGFGPA 
PAVRKVLAKA GLTLDQMDVI ELNEAFAAQG LAVLRDLGLA DDEERVNPNG GAIALGHPLG 
MSGARLVTTA AYELQRRNGR YALCTMCIGV GQGIAMIIER V