Gene Mkms_2401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_2401
Symbol	aroB
ID	4613224
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	2518703
End bp	2519785
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	70%
IMG OID	639792070
Product	3-dehydroquinate synthase
Protein accession	YP_938389
Protein GI	119868437
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0377427
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGAGC CGGTCACCGT CGACGTACTG GTCGACCCGC CCTACCCGGT GATCATCGGC 
ACCGGACTGC TCGGCGAACT CGGCCGGCTG CTCGAGGGTA GGCACAAGGT GGCCATCCTG 
CATCAGCCGA CGCTCTCGGT GACCGCCGAA GCGGTGCGAA GCCACTTGGC CGACAAGGGA 
ATCGATGCCC ACCGCATCGA GATCCCGGAC GCCGAAGCCG GTAAGGACCT GCCGGTGGTG 
GGGTTCATCT GGGAGGTGCT CGGCCGGATC GGGGTGGGGC GCAAGGACGC GATCGTCAGC 
CTCGGCGGGG GAGCGGCCAC CGACGTCGCC GGATTCGCCG CGGCGACCTG GTTGCGCGGT 
GTCGACATCG TGCACGTCCC GACCACGCTG CTCGGGATGG TCGACGCGGC GGTCGGCGGT 
AAGACCGGCA TCAACACCGA CGCGGGTAAG AACCTCGTCG GCGCCTTCCA TCAGCCCGCC 
GCCGTGCTGA TCGACCTCGC GACCCTGGAG ACGTTGCCGC GCAACGAGAT CGTCGCCGGT 
ATGGCCGAGG TCGTCAAAGC CGGGTTCATC GCCGATCCGC ACATCCTCGA CCTCATCGAG 
GCCGATCCGG AAGCCGCCCT CGACCCGTCC AAAGATGTTC TGCCGGAACT GATTCGACGT 
GCGGTCGCGG TCAAGGCGGA GGTGGTCGCG GCCGACGAGA AGGAATCCGC GCTGCGCGAG 
ATCCTCAACT ACGGGCACAC GCTGGCCCAC GCGATCGAAC GCCGCGAGCG CTACCAGTGG 
CGCCACGGCG CGGCGGTGTC GGTCGGCCTG GTGTTCGCCG CCGAACTCGG CCGCCTGGCG 
GGCCGACTCG ACGACCAGAC GGCCGACCGG CACCGGTCGG TGCTGGAAGC GCTGGGGCTG 
CCGGTGAGCT ATGACCCCGA CGCGCTGCCG AAACTCCTGG AGTACATGGC GGGCGACAAG 
AAGACCCGCT CGGGTGTGCT GCGGTTCGTG GTGCTCGACG GGCTGGCCAA ACCCGGCCGG 
CTCGAAGGCC CCGACCCGTC GCTGCTCGCC GCGGCCTACT CGGTGGTGGG AGGGACCCGA 
TGA

Protein sequence

MSEPVTVDVL VDPPYPVIIG TGLLGELGRL LEGRHKVAIL HQPTLSVTAE AVRSHLADKG 
IDAHRIEIPD AEAGKDLPVV GFIWEVLGRI GVGRKDAIVS LGGGAATDVA GFAAATWLRG 
VDIVHVPTTL LGMVDAAVGG KTGINTDAGK NLVGAFHQPA AVLIDLATLE TLPRNEIVAG 
MAEVVKAGFI ADPHILDLIE ADPEAALDPS KDVLPELIRR AVAVKAEVVA ADEKESALRE 
ILNYGHTLAH AIERRERYQW RHGAAVSVGL VFAAELGRLA GRLDDQTADR HRSVLEALGL 
PVSYDPDALP KLLEYMAGDK KTRSGVLRFV VLDGLAKPGR LEGPDPSLLA AAYSVVGGTR