Gene TM1040_3386 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3386
Symbol
ID	4075285
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	+
Start bp	402659
End bp	403693
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	62%
IMG OID	638004894
Product	malate/L-lactate dehydrogenase
Protein accession	YP_611620
Protein GI	99078362
COG category	[C] Energy production and conversion
COG ID	[COG2055] Malate/L-lactate dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.188787
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGACA GACAAGAAAG AACAGAGATG ACCGCCACCG AAACACTCAC GCTCTCGGAA 
ATCGAAAGCC TTGCCTTTGA TGCACTGGTT GCAGCGGGCA CCTCACCCGC AAACGCCCGC 
CCTCTGGCAG TTGCAACCGC GATGACCGAA GCCGATGGGG TCGCCTCGCA CGGGCTGGCC 
TATATCCCGA TCTATGCCCA GCATGTTGAA TGCGGCAAAG TCGACGGACA GGCCAACCCC 
AAGGTCGCAC ACCCTCGACC CGCAGTGATC ACCGTGGACG CAGCCACCGG ATTTGCACAT 
CGTGCGATCG ACCTCGGCTT TGAGCAGTTG ATCCCTCTGG CCAAGGAAAT GGGTGTCGCG 
GTGCTGGCCG TGAACAACTC CTACAACTGT GGTGTTCTGG GGGTTCACAC GCAAAGGCTG 
GCGCAGGCTG GGCTGATGGG GTTTGGCTTT ACCAATGCCC CTGCCTCGAT TGCGCCCTCG 
GGTGGCGCAA AGCCTGTGGT GGGCACCAAT CCATTTTCAA TCTCGGCGCC GGGTTCAGAT 
GGCACTGCGG CTCTGCTCAT TGATCAATCC GCCAGCACGA TTGCAAAGAG CGAAGTGATG 
AAACACGCCC GTGAAGGCAA GCCGGTCCCA CAAGGCTGGG TGCTGGACGC CGATGGCCAG 
CCCACCATCG ATCCCGATGC AGGCCTCAAA GGGTCAATGG TGCCGTCCGG CGGATACAAA 
GGCGTGGGCA TTGCCCTGAC CGTCGAGCTT CTGGCAGCGG CCATGACCGG CGCAACCCTG 
GGCGCGGTGG CGAGCCCGTT TTCCGGCACA GCGGGCGGTC CGCCCAAAAC CGGCCAGTTC 
TTTATCGCCA TAGACCCGGA CGCTACATCC GGGGGGCTCT TTCAGGAAAA GCTCGCGGAT 
TTGATTTCGG CATTTCGTGA TCAAGATGGC GCACGTCTGC CAGGAGATGG TCGCCAATCC 
GCCCGTCTCC GGGCCGCCAC CGAGGGCGTG AGGGTGAACG CCGCCCTACT GGAGCGCGTG 
CGCGCCCTCA TCTAA

Protein sequence

MSDRQERTEM TATETLTLSE IESLAFDALV AAGTSPANAR PLAVATAMTE ADGVASHGLA 
YIPIYAQHVE CGKVDGQANP KVAHPRPAVI TVDAATGFAH RAIDLGFEQL IPLAKEMGVA 
VLAVNNSYNC GVLGVHTQRL AQAGLMGFGF TNAPASIAPS GGAKPVVGTN PFSISAPGSD 
GTAALLIDQS ASTIAKSEVM KHAREGKPVP QGWVLDADGQ PTIDPDAGLK GSMVPSGGYK 
GVGIALTVEL LAAAMTGATL GAVASPFSGT AGGPPKTGQF FIAIDPDATS GGLFQEKLAD 
LISAFRDQDG ARLPGDGRQS ARLRAATEGV RVNAALLERV RALI