Gene Mkms_1224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_1224
Symbol	metX
ID	4614420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	1309131
End bp	1310252
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	72%
IMG OID	639790899
Product	homoserine O-acetyltransferase
Protein accession	YP_937226
Protein GI	119867274
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAGAGCC CCGCCGTGCC CGCCCTCGAC CTGCCCGCCG AGGGTGAGAC CGGCGTGGTC 
GACATCGGCC CGCTGACCCT GGAGAGCGGC GCGGTCATCG ACGACGTGTC GATCGCCGTC 
CAGCGCTGGG GTGAGCTCTC CCCCAACCGC GACAACGTCG TGATGGTGCT GCATGCGCTC 
ACCGGTGACT CGCACGTCAC CGGACCGGCC GGCCCCGACC ATCCCACCCC GGGCTGGTGG 
GACGGCGTCG CCGGGCCGGG AGCCCCGATC GACACCGACC GCTGGTGCGC GGTGTCGACG 
AACGTCCTCG GCGGCTGCCG TGGGTCGACC GGCCCGTCGT CGATCGCTCC CGACGGCCGG 
CCGTACGGTT CGCGGTTCCC CGCGGTGACG ATCCGCGACC AGGTCACCGC GGACCTCGCC 
GCGCTCGAGG CGCTGGGCAT CACCGAGGTC GCCGCGGTGG TGGGCGGATC CATGGGCGGC 
GCGCGTGCGC TGGAGTGGAT CGTCGGCCAT CCGGCCACCG TGCGTTCGGC GCTGATCCTC 
GCCGTCGGCG CCCGCGCCAC CGCCGACCAG ATCGGCACGC AGAGCACCCA GGTCGCCGCG 
ATCAAGGCCG ATCCCGACTG GTGCGGCGGC GACTACCACG ACACCGGTCG CGTGCCGTCC 
ACCGGTCTGG CGATCGCCCG CCGCTTCGCC CACCTGACCT ACCGCGGTGA AGTCGAACTC 
GACGACCGGT TCGGCAACCA CGCCCAGGGT GACGAGAGCC CGACCGACGG CGGCCGGTAC 
GCGGTGCAGA GTTATCTGGA GTACCAGGGC GCCAAGCTGG TCGAGCGGTT CGACGCAGGC 
ACCTACGTCA CGCTGACCGA CGCGTTGTCG AGCCACGACG TGGGTCGCGG CCGCGGAGGC 
GTGCGCGCTG CGCTGCAGGG TTGCCGGGTG CCCACGATCG TCGGCGGCGT CACCTCCGAC 
CGGCTCTACC CCCTGCGGCT GCAGCAGGAG TTGGCCGAAC TGCTGCCCGG CTGTACCGGT 
CTGGACGTGG TCGATTCGGT CTACGGCCAC GACGGGTTCC TGGTCGAGAC GGAGGCCGTC 
GGCAAGCTCA TCCGGCGCAC ACTGGAGTTG GCGGAGCGGT GA

Protein sequence

MKSPAVPALD LPAEGETGVV DIGPLTLESG AVIDDVSIAV QRWGELSPNR DNVVMVLHAL 
TGDSHVTGPA GPDHPTPGWW DGVAGPGAPI DTDRWCAVST NVLGGCRGST GPSSIAPDGR 
PYGSRFPAVT IRDQVTADLA ALEALGITEV AAVVGGSMGG ARALEWIVGH PATVRSALIL 
AVGARATADQ IGTQSTQVAA IKADPDWCGG DYHDTGRVPS TGLAIARRFA HLTYRGEVEL 
DDRFGNHAQG DESPTDGGRY AVQSYLEYQG AKLVERFDAG TYVTLTDALS SHDVGRGRGG 
VRAALQGCRV PTIVGGVTSD RLYPLRLQQE LAELLPGCTG LDVVDSVYGH DGFLVETEAV 
GKLIRRTLEL AER