Gene TM1040_0031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0031
Symbol
ID	4076298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	31401
End bp	32708
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	62%
IMG OID	638005318
Product	methylamine utilization protein MauG, putative
Protein accession	YP_612026
Protein GI	99079872
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0868971
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.24254
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTGGT TTATATTGCT GACACTCATG GGCGCCTCAG CCACGCAGGC GCAGAGCCGC 
CCAGACCTTG GCCCGCGCCC AGCGTTTCCC GCCCCGGACA TGGCTGCGGT CGAGCTGGGG 
CAGCTGCTAT TTTACGATCC TATCCTGTCT GGCAATCGCA ATATCGCCTG TTCCACCTGT 
CATCACCCAC GCCTTGGAAC AGGAGATGGG CTATCGCTGG GGTTGGGCGA GGGGGGCATC 
GGCCTTGGCC CGGACCGAAA ACCAGATCCA GCCAACCTGC CCGAGCAACG CATTCCCCGT 
AATGCGCCGG GGCTCTGGAA TCTTGGTGCG CCCGAATTCA CGGTGATGTT TCATGACGGT 
CGGCTCGAGG ACCACCCCGA TCATCCCGGT GGCATCCGCA CCCCCTTGGG AGAAGATATG 
GTTGCGGGGT TTGATGACGC GCTCGCCGCG CAGGCCATGT TTCCGGTGCT CTCCGCAGAC 
GAGATGGCCG GGCATTATTC AGAAAACGAA GTGGCGCAGG CGGTGCGGCT GGGCCAGCTT 
TCAACACCGG GCGGGGCCTG GGACAGAATC GCGGCGCGGG TGGAGGCGAT TCCGGCCTAT 
CGCGTCGCAT TTGACGAGGT CTTGGGCGAG GGCACGCCCA TTACCTTTGC CGACATTGGC 
AATGTTCTTG CCGATTTCAT TCGCTTTGAA TGGCGCGCGG ATATGAGCCC ATTTGACGCA 
TACATGCTGG GGCAGGGGGA TCTGCCCAAA GCGGCCAAAC GCGGGATGGA GCTGTTTTAT 
GGCGCGGCGG ACTGTAGCCA GTGCCATACT GGGTGGTTCC AGACGGACCA CGGTTTTCAC 
GCCTTGGCCG TGCCTCAGAT CGGGCCGGGC AAGGCTGCGC GCTTTGAAAC TCATAGTCGG 
GACGAGGGCC GTATCCGCGT GACGGGCCGA GCGGAGGATG CTTTTGCCTT CCGCACGCCG 
TCTTTGCGCA ATGTGGGTCA AACTGCGCCC TATGGGCATT CAGGGGCCTT TGCGACCCTC 
GAGGACATCG TGTGGCATCA TCTGTCGCCA GAGCAATCCT TGAGCAGCTA TTCCAAATCG 
CAAGCCGTAC TACCCCAACT GGAAGGCGCC CAGGACTGGA CGATCCAGGA CAACGCGGCA 
GAGCGCGCCG CGTTGATAGC CGCTGTGGAT CTCGACCCGG TCTCGCTTAC GGCCGCGGAA 
GTGGCTGACA TTGTTGCCTT CTTGCACGCG CTCACCGATG AAGAGGCCGC AAAGGGGCGT 
CTTGGCGTTC CCGCAGAAGT CCCAAGTGGC TTGCCCGTAG ATCAGTGA

Protein sequence

MRWFILLTLM GASATQAQSR PDLGPRPAFP APDMAAVELG QLLFYDPILS GNRNIACSTC 
HHPRLGTGDG LSLGLGEGGI GLGPDRKPDP ANLPEQRIPR NAPGLWNLGA PEFTVMFHDG 
RLEDHPDHPG GIRTPLGEDM VAGFDDALAA QAMFPVLSAD EMAGHYSENE VAQAVRLGQL 
STPGGAWDRI AARVEAIPAY RVAFDEVLGE GTPITFADIG NVLADFIRFE WRADMSPFDA 
YMLGQGDLPK AAKRGMELFY GAADCSQCHT GWFQTDHGFH ALAVPQIGPG KAARFETHSR 
DEGRIRVTGR AEDAFAFRTP SLRNVGQTAP YGHSGAFATL EDIVWHHLSP EQSLSSYSKS 
QAVLPQLEGA QDWTIQDNAA ERAALIAAVD LDPVSLTAAE VADIVAFLHA LTDEEAAKGR 
LGVPAEVPSG LPVDQ