Gene Arth_2272 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2272
Symbol	aroB
ID	4445315
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2557460
End bp	2558551
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	66%
IMG OID	639690081
Product	3-dehydroquinate synthase
Protein accession	YP_831752
Protein GI	116670819
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.474615
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGTAGCG AATCAACCGT CATCAAAGTC ACCGGCAAGT CTGCCGCTGA CAACTACGAC 
GTCGTTGTGG GCCGCGGCCT GCTTGGACGC CTTCCCGAGC TGCTGGGCGA GCGTGTCAAA 
CGGGTTCTGG TCATCCACCC GCGGGCCCTC CGGCTCACCG GTGACACCGT CCGCGATGAG 
CTGGCCTCGG CCGGGTTCAC TGCGCTGACC GCAGAAATCC CGGACGCCGA AGAAGGCAAG 
CACATCCAGG TAGCCGCGTT CTGCTGGCAG GTCCTGGGAC AAAACGACTT CACCCGCTCC 
GACGCCGTGG TGGCAGTAGG CGGCGGCGCC GTCACGGACC TCGCCGGCTT CGTGGCGGCC 
ACCTGGCTCC GCGGCGTTAA GGTCATCCAC ATGCCCACCA GCCTTCTCGG CATGGTGGAT 
GCATCCGTCG GTGGCAAGAC CGGCATCAAC ACCGCCGAAG GCAAGAACCT GGTGGGTGCG 
TTCCACCCGC CGGCCGCCGT CCTCGCGGAC CTCGATACGC TCAGCACCCT GCCGAAGAAC 
GAGCTCATTT CGGGCATGGC CGAGGTCATC AAGTGCGGGT TCATCGCCGA CCCCGCCATC 
CTGGACCTCG TGGAAAAGGA TCCGTCCGCA GTCACCGATC CGCAGTCAGC GTTCCTCCGC 
GAGCTGATCG AGCGCGCCAT CGCCGTGAAG GCCGACGTCG TGTCCGAAGA CCTCAAGGAA 
ACCGGCCGGC GCGAGATCCT CAACTACGGG CACACCCTAG GCCACGCGAT CGAGCTAGTG 
GAACGCTACT CCTGGCGCCA CGGCGCCGCT GTTTCGGTGG GGATGATGTT CGCCGCTGAA 
CTCGCCCGCA GCGTGGGTCG CCTCAGCGAC GCCGACGCCG ACCGTCACCG CACCATCCTG 
GAAACGCTCG GACTGCCGAT CACCTACCGC CGGGACCGGT GGCAGGGGCT GCTGGACGGC 
ATGCGCCGGG ACAAGAAGTC CCGTGGAGAC CTGCTTCGTT TCGTGGTCCT GGACGGCATC 
GCCCGCCCGG GAATCCTTGA CGTTCCGGAC ACGTCCCTGC TGTTTGCCGC CTACCAGGAG 
ATTGCCTCTT GA

Protein sequence

MSSESTVIKV TGKSAADNYD VVVGRGLLGR LPELLGERVK RVLVIHPRAL RLTGDTVRDE 
LASAGFTALT AEIPDAEEGK HIQVAAFCWQ VLGQNDFTRS DAVVAVGGGA VTDLAGFVAA 
TWLRGVKVIH MPTSLLGMVD ASVGGKTGIN TAEGKNLVGA FHPPAAVLAD LDTLSTLPKN 
ELISGMAEVI KCGFIADPAI LDLVEKDPSA VTDPQSAFLR ELIERAIAVK ADVVSEDLKE 
TGRREILNYG HTLGHAIELV ERYSWRHGAA VSVGMMFAAE LARSVGRLSD ADADRHRTIL 
ETLGLPITYR RDRWQGLLDG MRRDKKSRGD LLRFVVLDGI ARPGILDVPD TSLLFAAYQE 
IAS