Gene Tmz1t_0840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_0840
Symbol	aroB
ID	7084697
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	928734
End bp	929816
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	72%
IMG OID	643697864
Product	3-dehydroquinate synthase
Protein accession	YP_002354505
Protein GI	217969271
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGACCC TGAACGTGGC GCTCGGCGAG CGCGCCTATC CCATTCACAT CGGCCGCGGC 
CTGCTCGGAC GCACCGACCT GATCCTCCCC CACCTCAAGA CGCGGCGCGT CGCGATCGTC 
ACCAACGCGG TGGTGGGGCC GCTCTACCTC GAGCGTCTGC GCGCCGGGCT GGAAGGGGCG 
GGGGTGCGCA CCGCAGCGGT GGTGCTGCCC GACGGCGAGG CGCACAAGGA CTGGGAGACG 
CTCAACCGCA TCTTCGACAT GCTGCTCGCG GAGCGCTGCG AGCGCTCGAC CACCCTGGTC 
GCGCTCGGCG GCGGGGTGGT GGGCGACATG GGCGGCTTCG CCGCGGCCTG CTACCAGCGC 
GGCATGCCCT TCATCCAGGT GCCGACTACG CTGCTCTCGC AGGTCGACTC CTCGGTGGGC 
GGCAAGACCG CGATCAACCA CCCGCTCGGC AAGAACATGA TCGGCGCCTT CTACCAGCCC 
AGTATGGTGC TGGCCGACAT CGACACCCTC GACACCCTGC CCGACCGCGA GCTCTCCGCC 
GGCCTGGCCG AGGTCATCAA GTACGGGCTG ATCCGCGACC CCGAGTTCCT CGCCTGGCTG 
GAGGTCAACC TCGACCGCCT GGTGGCGCGC GACACCGACG CGCTGGCGTG GGCGATCGAG 
CGCTCCTGCC GCAACAAGGC CGAGGTGGTG GCGGCCGACG AGACCGAGCA GGGCGAGCGC 
GCGCTGCTCA ACCTCGGCCA CACCTTCGGT CATGCCATCG AGACCGGCCT CGGCTACGGC 
GAGTGGCTGC ACGGCGAGGC CGTTGCCGCC GGCACGATGA TGGCCGCCGA GCTGTCGTGC 
CGCCTGGGCT GGATCGACGC CGCCGCGGTG GCGCGCATCG AGGCGCTGTT CGAGCGCGCT 
CGCCTGCCGG TGTGGGGGCC GCGGCTCGGT GTCGAGCGCT ACGTCGAGCT GATGTCGCAC 
GACAAGAAGG TCGAGGCCGG CAAGCTGCGC CTGGTACTGC TGCGCGAGAT GGGGCGCGCG 
GTGATGCACG GCGAGGCGCC GGCCTCCGAG ATCGCCGCGG CGATCGAGGC GCGCTGCCGC 
TGA

Protein sequence

MQTLNVALGE RAYPIHIGRG LLGRTDLILP HLKTRRVAIV TNAVVGPLYL ERLRAGLEGA 
GVRTAAVVLP DGEAHKDWET LNRIFDMLLA ERCERSTTLV ALGGGVVGDM GGFAAACYQR 
GMPFIQVPTT LLSQVDSSVG GKTAINHPLG KNMIGAFYQP SMVLADIDTL DTLPDRELSA 
GLAEVIKYGL IRDPEFLAWL EVNLDRLVAR DTDALAWAIE RSCRNKAEVV AADETEQGER 
ALLNLGHTFG HAIETGLGYG EWLHGEAVAA GTMMAAELSC RLGWIDAAAV ARIEALFERA 
RLPVWGPRLG VERYVELMSH DKKVEAGKLR LVLLREMGRA VMHGEAPASE IAAAIEARCR