Gene Mkms_2090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_2090
Symbol	ispG
ID	4613644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	2212103
End bp	2213284
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	68%
IMG OID	639791755
Product	4-hydroxy-3-methylbut-2-en-1-yl diphosphate synthase
Protein accession	YP_938078
Protein GI	119868126
COG category	[I] Lipid transport and metabolism
COG ID	[COG0821] Enzyme involved in the deoxyxylulose pathway of isoprenoid biosynthesis
TIGRFAM ID	[TIGR00612] 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.378407
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.448978
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTCCG GCCCCGCCAT CGGGCTTGGT ATGCCGCCCG CACCCCCGCC GGTGCTGGCA 
CCGCGGCGCA AGACCCGTCA GCTGATGGTG CGCGACGTCG GCGTGGGCAG CGATCATCCG 
ATCTCGGTCC AGTCCATGTG CACCACCAAG ACCCACGACA TCAACTCGAC CCTGCAGCAG 
ATCGCCGAAC TCACCGCGTC GGGCTGCGAC ATCGTCCGGG TGGCGTGCCC GCGGCAGGAG 
GACGCCGACG CGCTGCCGAT CATCGCCAAG AAGTCGAAGA TCCCGGTGAT CGCCGACATC 
CACTTCCAGC CGAAGTACAT CTTCGCCGCG ATCGACGCCG GATGTGCGGC GGTGCGCGTC 
AACCCCGGCA ACATCAAGGA GTTCGACGGT CGGGTCAAGG AGGTGGCCAA GGCCGCCGGT 
GACGCCGGCA TCCCGATCCG CATCGGCGTC AACGCCGGAT CGCTGGACAA GCGATTCCTG 
CAGAAGTACG GCAAGGCCAC GCCCGAGGCG CTCGTCGAGT CGGCGCTGTG GGAGGCCTCG 
CTGTTCGAGG AGCACGGCTT CGGCGACATC AAGATCAGCG TCAAGCACAA CGACCCCGTC 
GTGATGGTCG CGGCCTACGA GTTGCTGGCC GCCCGCAGCG ACTACCCGCT TCACCTCGGT 
GTCACCGAGG CCGGCCCGGC GTTCCAGGGG ACGATCAAGT CCGCGGTCGC CTTCGGCGCG 
TTGCTCTCCA AGGGCATCGG CGACACCATC CGGGTCTCGC TGTCCGCGCC GCCGGCCGAG 
GAGGTCAAGG TCGGCAACCA GATCCTCGAA TCGCTCAACC TGCGCCCGCG CGGTCTGGAG 
ATCGTGTCCT GCCCGTCGTG CGGACGCGCC CAGGTCGACG TGTACACCCT CGCCAACGAG 
GTCACCGCCG GCCTCGAGGG CATGGACGTC CCGTTGCGCG TCGCCGTCAT GGGCTGTGTC 
GTCAACGGTC CCGGCGAAGC CCGCGAAGCC GATCTCGGGG TGGCCTCCGG CAACGGCAAG 
GGTCAGATCT TCGTCAAGGG TGAGGTCATC AAGACCGTGC CCGAGGCGCA GATCGTCGAG 
ACGCTGATCG AGGAGGCCAT GCGCATCGCG GAGGAGATCG GCGCCGCCGG TGACAGCCCC 
GAGGGAAGTC CCAGCGGTTC GCCGGTTGTG ACCGTAAGCT GA

Protein sequence

MTSGPAIGLG MPPAPPPVLA PRRKTRQLMV RDVGVGSDHP ISVQSMCTTK THDINSTLQQ 
IAELTASGCD IVRVACPRQE DADALPIIAK KSKIPVIADI HFQPKYIFAA IDAGCAAVRV 
NPGNIKEFDG RVKEVAKAAG DAGIPIRIGV NAGSLDKRFL QKYGKATPEA LVESALWEAS 
LFEEHGFGDI KISVKHNDPV VMVAAYELLA ARSDYPLHLG VTEAGPAFQG TIKSAVAFGA 
LLSKGIGDTI RVSLSAPPAE EVKVGNQILE SLNLRPRGLE IVSCPSCGRA QVDVYTLANE 
VTAGLEGMDV PLRVAVMGCV VNGPGEAREA DLGVASGNGK GQIFVKGEVI KTVPEAQIVE 
TLIEEAMRIA EEIGAAGDSP EGSPSGSPVV TVS