Gene TM1040_3167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3167
Symbol
ID	4075337
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	+
Start bp	147745
End bp	148710
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	64%
IMG OID	638004670
Product	mandelate racemase/muconate lactonizing-like protein
Protein accession	YP_611403
Protein GI	99078145
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATCA CCGTCACCCC CGATGTGTTC AAACTGGCGC AAGTGTTCAC CATCTCGCGC 
GGGTCGCGCA CCGAGGCCAA GGTGCTGACG GTTCGGATTG AGGATGGAGA TCATGTGGGC 
TGGGGCGAAT GTGTGCCCTA TGCGCGCTAT GACGAGACAC TCGAGTCGGT GACGGCTCAG 
ATCGAAGCGC TGCCCGCTAC GTTCACCCGC GCGGAACTGC AGTCGCTGCT GCCCGCTGGG 
GCGGCGCGCA ACGCGGTGGA TTGTGCCCTG TGGGATCTGG AGGCCAAAAA GGCCGGCAAG 
CCGGTCTGGG AATTGGCCGG TCTGGACCAG CCGGGACCCG AGATCACCGC CTATACGCTG 
TCGCTGGCCT CTCCGGAGGA GATGCAGAAA CAGGCCGCAG AGAACGCCCA TCGTCCGCTG 
TTGAAGATCA AGCTCGGCAC GCCAGAGGAT ATGCCCCGCC TTGAGGCGGT GCGCGCAGGC 
GCGCCCGATG CGCGGATCAT CATTGACGCC AACGAGGGCT GGTCGGCCGA GGTCTACGCC 
GAGCTTGCGC CGCATCTGCT GCGCCTTGGG GTGGAGCTGG TGGAGCAACC CCTGCCCGCA 
GGCGAGGATG AGGCCCTGAT CGGGATGGAA CGTCCGGTGC CGGTCTGCGC CGATGAGAGC 
GCGCATGACT GCGCCAGCCT GCCAAAACTC AAGGGCAAAT ATGATGTTGT GAACATCAAA 
CTGGATAAGA CCGGCGGCCT GACAGAAGCG TTGAAATTGC GCGATGCAGC GCTGGCCGAG 
GGCTATCAGG TGATGGTCGG CTGCATGGTC GGATCGTCGC TGGCCATGGC CCCCGCGACA 
CTGGTGGCGC AGGGTGCGTT GGTGACAGAT CTTGACGGGC CGCTCCTTCT GGCCGAAGAC 
CGTCCCGAAC CGCTGACTTT TGACGCCGAG GGGGTCCACC CCCCACGGCC CGCGCTCTGG 
GGCTAA

Protein sequence

MKITVTPDVF KLAQVFTISR GSRTEAKVLT VRIEDGDHVG WGECVPYARY DETLESVTAQ 
IEALPATFTR AELQSLLPAG AARNAVDCAL WDLEAKKAGK PVWELAGLDQ PGPEITAYTL 
SLASPEEMQK QAAENAHRPL LKIKLGTPED MPRLEAVRAG APDARIIIDA NEGWSAEVYA 
ELAPHLLRLG VELVEQPLPA GEDEALIGME RPVPVCADES AHDCASLPKL KGKYDVVNIK 
LDKTGGLTEA LKLRDAALAE GYQVMVGCMV GSSLAMAPAT LVAQGALVTD LDGPLLLAED 
RPEPLTFDAE GVHPPRPALW G