Gene Mkms_3335 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3335
Symbol
ID	4611261
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	3498266
End bp	3499663
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	69%
IMG OID	639793008
Product	3-deoxy-D-arabinoheptulosonate-7-phosphate synthase
Protein accession	YP_939319
Protein GI	119869367
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3200] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01358] 3-deoxy-7-phosphoheptulonate synthase, class II

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.6171
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.158305
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACTGGA CCGTCGACAT CCCCATCGAC CAGCTCCCCG ACCTGCCGCC CCTGCCGGAC 
GAGCTGCGTC ACCGCCTGGA TTCCGCGCTG GCCAAACCGG CGGTCCAGCA GCCCAGCTGG 
GACGCCGACG CCGCCAAGGC CATGCGCACG GTCCTCGAGA GCGTTCCGCC GGTCACGGTG 
CCCTCGGAGA TCGAGAAGCT CAAGGGTCTG CTCGCCGACG TCGCGCGCGG TGAGGCGTTC 
CTGCTGCAGG GCGGGGACTG CGCCGAGACG TTCGTCGACA ACACCGAACC GCACATCCGC 
GCCAACATCC GCACCCTGCT GCAGATGGCC GTCGTCCTCA CCTACGGCGC GAGCATGCCG 
GTGGTCAAGG TGGCGCGCAT CGCCGGGCAG TACGCCAAAC CGCGCTCGTC GGACATCGAC 
GCGCTGGGGC TGAAGTCCTA CCGCGGCGAC ATGATCAACG GGTTCGCCCC GGACGCGGCG 
GCCCGCCAGC ACGATCCGTC GCGTCTCGTG CGCGCCTACG CCAACGCCAG CGCCGCGATG 
AACCTGGTGC GCGCGCTCAC CTCGTCGGGG ATGGCGGCGC TGCAGGGTGT GCACGACTGG 
AACCGCGAAT TCGTGCGCAC GTCGCCGGCC GGCGCCCGTT ACGAGGCGCT CGCCGGGGAG 
ATCGACCGGG CGCTGACGTT CATGAGCGCC TGCGGCGTCG ACGACCGCAA CCTGCAGACC 
GCCGAGATCT TCGCCAGCCA CGAGGCGCTG GTGCTCGACT ACGAACGAGC GATGCTGCGG 
CTCTCGACGG AGTTCCCGGC CGACGATCCG GAGCCGCGGC TCTACGACCT GTCGGCGCAC 
TACGTGTGGA TCGGTGAGCG CACCCGCCAG CTCGACGGCG CGCACATCGC GTTCGTGGAA 
ACGATTGCCA ACCCGATCGG CATCAAGCTC GGGCCGACCA CCACACCGGA ACTGGCCGTC 
GAGTACGTCG AGCGGCTCGA TCCGCACAAC CAGCCGGGCC GGCTGACGCT GGTGACCCGG 
ATGGGGAACA GCAAGGTGCG CGACCTGCTG CCGCCGATCA TCGAGAAGGT GCAGGCCAGC 
GGGCATCAGG TCATCTGGCA GTGCGATCCG ATGCACGGCA ACACCCACGA GTCCTCGACC 
GGTTACAAGA CCCGCCACTT CGACCGCATC GTCGACGAGG TGCAGGGCTT CTTCGAGGTG 
CACCGCGCGC TGGGCACCCA TCCGGGCGGC ATCCACGTCG AGATCACCGG TGAGAACGTC 
ACCGAATGCC TCGGCGGCGC GCAGGACATC TCCGACACCG ACCTGGCCGG GCGTTACGAG 
ACCGCATGCG ATCCGCGGAT GAACACCCAG CAGAGCCTCG AGTTGGCGTT CCTGGTCGCG 
GAGATGCTGC GGGACTAG

Protein sequence

MNWTVDIPID QLPDLPPLPD ELRHRLDSAL AKPAVQQPSW DADAAKAMRT VLESVPPVTV 
PSEIEKLKGL LADVARGEAF LLQGGDCAET FVDNTEPHIR ANIRTLLQMA VVLTYGASMP 
VVKVARIAGQ YAKPRSSDID ALGLKSYRGD MINGFAPDAA ARQHDPSRLV RAYANASAAM 
NLVRALTSSG MAALQGVHDW NREFVRTSPA GARYEALAGE IDRALTFMSA CGVDDRNLQT 
AEIFASHEAL VLDYERAMLR LSTEFPADDP EPRLYDLSAH YVWIGERTRQ LDGAHIAFVE 
TIANPIGIKL GPTTTPELAV EYVERLDPHN QPGRLTLVTR MGNSKVRDLL PPIIEKVQAS 
GHQVIWQCDP MHGNTHESST GYKTRHFDRI VDEVQGFFEV HRALGTHPGG IHVEITGENV 
TECLGGAQDI SDTDLAGRYE TACDPRMNTQ QSLELAFLVA EMLRD