Gene Mkms_3970 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3970
Symbol
ID	4611909
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	4182948
End bp	4184285
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	69%
IMG OID	639793653
Product	homoserine dehydrogenase
Protein accession	YP_939952
Protein GI	119870000
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.781726
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAGTG ACAAATCGGT AGGCGACACA CCGGTGGGCG TAGCCGTCCT GGGCCTCGGC 
AATGTGGGCA GTGAAGTGGT CCACATCATC GAGCAGAGCG CGACCGACCT GGCGGCGCGT 
GTCGGCGCCC CGCTCGTACT GCGCGGGGTT GGGGTGCGCC GGGTGGCCGG CGACCGCGGG 
GTGCCGGTCG ACATGCTCAC CGACAACATC GAAGAACTGG TCTCGCGCGA GGACGTCGAC 
ATCGTCGTCG AGGTGATGGG TCCAGTCGAA CCGGCCCGCA AGGCGATCCT CTCCGCGCTC 
GAACAGGGCA AGTCGGTGGT GACCGCGAAC AAGGCGCTGA TGGCCCAGTC GACCGGTGAG 
CTGGCGCAGG CCGCCGAGGC CGCCCGGGTC GACCTGTACT TCGAGGCCGC GGTGGCCGGT 
GCCATCCCGG TGATCCGCCC GCTGACCCAG TCGCTGGCCG GCGACACGGT GCTGCGGGTG 
GCCGGGATCG TCAACGGCAC AACGAATTAC ATCCTGTCGG CGATGAACGA CACCGGCGCC 
GACTACGACA GTGCGCTGGC CGATGCCAGT GCGCTCGGCT ACGCGGAGGC GGATCCGACC 
GCCGACGTGG AGGGTTTCGA CGCCGCGGCC AAGGCCGCGA TCCTGGCGTC CATCGCGTTC 
CACACGCGGG TGACGGCCGA CGACGTCTAC CGCGAAGGCA TCACCAAGGT CACCGCCGAG 
GACTTCGAAT CCGCCCGCTC GCTCGGGTGC ACCATCAAGT TGCTCGCCAT CTGTGAGCGG 
CTGACCACCG ACGACGGCCA ACAGCGCGTC TCGGCCCGGG TCTACCCGGC GCTGGTTCCG 
CTCGACCACC CGCTGGCATC GGTCAACGGC GCGTTCAACG CCGTGGTGGT CGAGGCCGAG 
GCGGCCGGCC GCTTGATGTT CTACGGCCAG GGCGCCGGTG GCGCGCCGAC CGCATCGGCG 
GTCATGGGCG ATCTCGTGAT GGCCGCGCGC AACCGCGTCC AGGGCGGGCG CGGACCGCGG 
GAGTCGAAGT ACGCCAAGCT GCCGGTGTCG CCGATCGGGT TCATCCCCAC GCGGTACTAC 
GTCAACATGA ACGTCGCCGA CCGTCCTGGC GTGTTGTCCA CGGTCGCAGC CGAATTCGCC 
AGGCATGAGG TCAGCATCGC CGAGGTGCGC CAGGAGGGTG TGGTCGACGA GGGCGGACAG 
CCCTGCGGTG CGCGCATCGT CGTCGTCACC CACCGTGCGA CCGATGCGGC GTTGTCCGAA 
ACCGTCTCGG CCCTGGCCGA ACTCGACGTC GTGCAGAGCG TCAACAGCGT GCTGCGCATG 
GAAGGAACAA GCGAATGA

Protein sequence

MNSDKSVGDT PVGVAVLGLG NVGSEVVHII EQSATDLAAR VGAPLVLRGV GVRRVAGDRG 
VPVDMLTDNI EELVSREDVD IVVEVMGPVE PARKAILSAL EQGKSVVTAN KALMAQSTGE 
LAQAAEAARV DLYFEAAVAG AIPVIRPLTQ SLAGDTVLRV AGIVNGTTNY ILSAMNDTGA 
DYDSALADAS ALGYAEADPT ADVEGFDAAA KAAILASIAF HTRVTADDVY REGITKVTAE 
DFESARSLGC TIKLLAICER LTTDDGQQRV SARVYPALVP LDHPLASVNG AFNAVVVEAE 
AAGRLMFYGQ GAGGAPTASA VMGDLVMAAR NRVQGGRGPR ESKYAKLPVS PIGFIPTRYY 
VNMNVADRPG VLSTVAAEFA RHEVSIAEVR QEGVVDEGGQ PCGARIVVVT HRATDAALSE 
TVSALAELDV VQSVNSVLRM EGTSE