Gene Mmcs_2354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_2354
Symbol	aroB
ID	4111187
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	2499719
End bp	2500801
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	70%
IMG OID	638031479
Product	3-dehydroquinate synthase
Protein accession	YP_639518
Protein GI	108799321
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGAGC CGGTCACCGT CGACGTACTG GTCGACCCGC CCTACCCGGT GATCATCGGC 
ACCGGACTGC TCGGCGAACT CGGCCGGCTG CTCGAGGGTA GGCACAAGGT GGCCATCCTG 
CATCAGCCGA CGCTCTCGGT GACCGCCGAA GCGGTGCGAA GCCACTTGGC CGACAAGGGA 
ATCGATGCCC ACCGCATCGA GATCCCGGAC GCCGAAGCCG GTAAGGACCT GCCGGTGGTG 
GGGTTCATCT GGGAGGTGCT CGGCCGGATC GGGGTGGGGC GCAAGGACGC GATCGTCAGC 
CTCGGCGGGG GAGCGGCCAC CGACGTCGCC GGATTCGCCG CGGCGACCTG GTTGCGCGGT 
GTCGACATCG TGCACGTCCC GACCACGCTG CTCGGGATGG TCGACGCGGC GGTCGGCGGT 
AAGACCGGCA TCAACACCGA CGCGGGTAAG AACCTCGTCG GCGCCTTCCA TCAGCCCGCC 
GCCGTGCTGA TCGACCTCGC GACCCTGGAG ACGTTGCCGC GCAACGAGAT CGTCGCCGGT 
ATGGCCGAGG TCGTCAAAGC CGGGTTCATC GCCGATCCGC ACATCCTCGA CCTCATCGAG 
GCCGATCCGG AAGCCGCCCT CGACCCGTCC AAAGATGTTC TGCCGGAACT GATTCGACGT 
GCGGTCGCGG TCAAGGCGGA GGTGGTCGCG GCCGACGAGA AGGAATCCGC GCTGCGCGAG 
ATCCTCAACT ACGGGCACAC GCTGGCCCAC GCGATCGAAC GCCGCGAGCG CTACCAGTGG 
CGCCACGGCG CGGCGGTGTC GGTCGGCCTG GTGTTCGCCG CCGAACTCGG CCGCCTGGCG 
GGCCGACTCG ACGACCAGAC GGCCGACCGG CACCGGTCGG TGCTGGAAGC GCTGGGGCTG 
CCGGTGAGCT ATGACCCCGA CGCGCTGCCG AAACTCCTGG AGTACATGGC GGGCGACAAG 
AAGACCCGCT CGGGTGTGCT GCGGTTCGTG GTGCTCGACG GGCTGGCCAA ACCCGGCCGG 
CTCGAAGGCC CCGACCCGTC GCTGCTCGCC GCGGCCTACT CGGTGGTGGG AGGGACCCGA 
TGA

Protein sequence

MSEPVTVDVL VDPPYPVIIG TGLLGELGRL LEGRHKVAIL HQPTLSVTAE AVRSHLADKG 
IDAHRIEIPD AEAGKDLPVV GFIWEVLGRI GVGRKDAIVS LGGGAATDVA GFAAATWLRG 
VDIVHVPTTL LGMVDAAVGG KTGINTDAGK NLVGAFHQPA AVLIDLATLE TLPRNEIVAG 
MAEVVKAGFI ADPHILDLIE ADPEAALDPS KDVLPELIRR AVAVKAEVVA ADEKESALRE 
ILNYGHTLAH AIERRERYQW RHGAAVSVGL VFAAELGRLA GRLDDQTADR HRSVLEALGL 
PVSYDPDALP KLLEYMAGDK KTRSGVLRFV VLDGLAKPGR LEGPDPSLLA AAYSVVGGTR