Gene Amir_5253 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_5253
Symbol	aroB
ID	8329455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	6250219
End bp	6251325
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	74%
IMG OID	644945692
Product	3-dehydroquinate synthase
Protein accession	YP_003102920
Protein GI	256379260
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.528317
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCGAGC CGGTGCGCAT CCGCGTGGCC GCGGAGCGGC CGTACGAGGT CATCGTCGGG 
CGTGGGTTGC TCGGGGACCT GGTCGAACTG CTGCGCGGCA CCTCGAAGGC GGCGATCGTG 
CACACCGCCG TGCTCGCCGA GACGGCGGAC GCGGTGCTCG AGGAGTTGCG CGGGGCCGGG 
GTCGACGCGC ACCGGGTCGA GGTGCCCGAC GCCGAGGACG GCAAGGACCT GCGGGTCGCC 
GGGTACTGCT GGGACGTGTT CGGGCAGATC GGGCTCGGGC GGCAGGACGT CGTCGTCGGG 
CTCGGCGGCG GGGCGGTCAC CGATCTCGCC GGGTTCGTCG CGTCCACCTG GATGCGCGGG 
GTGCGGCTGA TCAACGTGCC GACCACGCTC CTCGGCATGG TCGACGCCGC CGTGGGCGGC 
AAGACCGGCA TCAACACCGA CGCGGGCAAG AACCTCGTCG GCACCTTCTA CGAGCCGACC 
GCCGTCCTGG CCGACCTCAC CACCCTGGAG ACCCTGCCGC GCAACGAGCT CGTCGCGGGC 
ATGGCCGAGG TGGTCAAGGG CGGCTTCATC GCCGACCCGG CGATCCTCGA CCTCATCGAG 
GCCGACCCGG CCGCCGCGCT CGACCCGTCC GGCGACGTGC TCGCCGAGCT GGTCCGCCGC 
AAGATCCAGG TCAAGGCCGA CGTGGTGTCC AGCGACCTGC GCGAGTCGAA CCTGCGCGAG 
ATCCTCAACT ACGGCCACAC CCTCGGCCAC GCCCTGGAGC GCCGCGAGCG CTACCGCTGG 
CGCCACGGCG CGGCCATCAG CGTCGGCCTG GTCTTCGCCG CCGAGCTCGC CCGCCTGGCG 
GGCAGGCTGG ACGACGCCAC CGCCGACCGC CACCGCAGCG TCCTCACCTC GCTCGGCCTC 
CCCGTGGCCT ACGACCCGGA CGCCCTGCCG CAGCTGCTGG AGGGGATGCG CTCGGACAAG 
AAGAACCGCT CGGGCGTGCT CCGCTTCGTC GTGCTCGACG GCCTGGCCAA GCCGGGCAGG 
CTCGAAGGCC CCGACCCGTC GCTGATCGCC GCCGCCTACT CGGCCGTCGC GGCCGAGCCG 
AGGACCGGCG GGAGCATCCT GCTGTGA

Protein sequence

MGEPVRIRVA AERPYEVIVG RGLLGDLVEL LRGTSKAAIV HTAVLAETAD AVLEELRGAG 
VDAHRVEVPD AEDGKDLRVA GYCWDVFGQI GLGRQDVVVG LGGGAVTDLA GFVASTWMRG 
VRLINVPTTL LGMVDAAVGG KTGINTDAGK NLVGTFYEPT AVLADLTTLE TLPRNELVAG 
MAEVVKGGFI ADPAILDLIE ADPAAALDPS GDVLAELVRR KIQVKADVVS SDLRESNLRE 
ILNYGHTLGH ALERRERYRW RHGAAISVGL VFAAELARLA GRLDDATADR HRSVLTSLGL 
PVAYDPDALP QLLEGMRSDK KNRSGVLRFV VLDGLAKPGR LEGPDPSLIA AAYSAVAAEP 
RTGGSILL