Gene Mnod_4039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_4039
Symbol
ID	7307491
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	+
Start bp	4110618
End bp	4111517
Gene Length	900 bp
Protein Length	299 aa
Translation table	11
GC content	69%
IMG OID	643601693
Product	dihydrodipicolinate synthetase
Protein accession	YP_002499223
Protein GI	220923921
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0329] Dihydrodipicolinate synthase/N-acetylneuraminate lyase
TIGRFAM ID	[TIGR00674] dihydrodipicolinate synthase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCCGTG CAGACTGGGG TGGCATCTTC CCCGTTCTCG TCACCCCCTT CGGAGCCGAT 
GGCTCCATCA ACGAGATCCG GTACAAGGCG CTCATCGACG ACGCGATCGC CAATGGCGCG 
CAGGGCGTGG TGGCCGCCGG CAGCACCGGC GAGTTCTATG CCCTCACCAA AGCCGAACGC 
GCGCGCCTGT TCAAGCTGGC CGTTGACCAC GCGGCGCGCC GCGTGCCCGT GCTGGCCGGT 
GTCGCCGACC TCCGGGTAGA GGATGTCCTG GAAGCGTGCC AGTCCGCGGT CGCGGCGGGC 
TGCGCGGGCG GCCTGATCCT GCCGCCGATC TACGCCATGC CGAGCCCGCG TGAGGTCGTG 
GCCTTCTTCG CGCACATCTC GCGCAACACC CCGCTGCCGC TGATGCTCTA CAACAGCCCG 
CGCCGGGCGA AAATCGAGCT CACCCCGGCG CTGGTGGAGC AGCTCTCCGC GCTGCGGACC 
GTGGTTGCCA TCAAGGACAG CTCCGGCGAC ATCACCCAGG TGAGCGAGCT CGTGCAGCGC 
GTGGGTGACA ACCTCCGCGT CTTCGTCGGC TACGAGACCA TGATCGTTCC CGCCCGGGCC 
GTGGGCGCCC ATGGGGTCAT CGCCATGGCG CACCAGATCG CCGGCCCCTT GATCCGCGCC 
TACTGGGACA AGGCGCTCAG CGGGGACAAG GCCCTGGAGG ACCTCGGTCG CGATGTCTGC 
GCCTTGTATC GCTGCTTCCA GTCCGGGTCC TATTACGCGG CCATCAAGGA GACCATGAGC 
CAGCTTGGGC GCGACGCCGG CGGCCCGCGC CTGCCGCTGC TGCCGCTGGC AGACGAACAA 
AAGGCCGCCA TCGCCAAGAT CATTGCCGAT GCCGGCCTCG CCCGGTGGGC CAAGGCCTAA

Protein sequence

MARADWGGIF PVLVTPFGAD GSINEIRYKA LIDDAIANGA QGVVAAGSTG EFYALTKAER 
ARLFKLAVDH AARRVPVLAG VADLRVEDVL EACQSAVAAG CAGGLILPPI YAMPSPREVV 
AFFAHISRNT PLPLMLYNSP RRAKIELTPA LVEQLSALRT VVAIKDSSGD ITQVSELVQR 
VGDNLRVFVG YETMIVPARA VGAHGVIAMA HQIAGPLIRA YWDKALSGDK ALEDLGRDVC 
ALYRCFQSGS YYAAIKETMS QLGRDAGGPR LPLLPLADEQ KAAIAKIIAD AGLARWAKA