Gene TM1040_1444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1444
Symbol	dmdA
ID	4078074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1542571
End bp	1543728
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	60%
IMG OID	638006755
Product	putative dimethyl sulfoniopropionate demethylase
Protein accession	YP_613439
Protein GI	99081285
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0404] Glycine cleavage system T protein (aminomethyltransferase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.8924
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.101905
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCGCT CGCCCTCAAC TCATGGTATG AAAGGGTTTG CCATGACCGT TCTGAAACCT 
GCCATTTCCC TCTCTCGGCG CCTGCGTCGA ACCCCTTTTT CGGAGGGCGT CGAAGCCGCT 
GGAGTCAAAG GCTACACCGT CTACAATCAC ATGCTGCTGC CCACGGTGTT TGAGAGTGTC 
GAAGCCGACT ACCACCACCT CAAGCGTCAT GTGCAAGTCT GGGACGTCGC CTGCGAACGC 
CAGGTGGAAC TGCGCGGCCC CGACGCCGGA CGCCTGATGC AGATGCTGAC CCCGCGCGAT 
CTGCGTGGCA TGATGCCCGG TCAATGTTAC TATGTCCCCA TCGTCGATGA GACCGGCGGG 
ATGCTCAATG ATCCCGTAGC CGTAAAGCTC GCAGAGGATC GTTGGTGGAT CTCCATTGCG 
GACAGTGATC TGTTGTACTG GGTCAAGGGG ATCGCAAACG GCTGGCGCCT TGATGTGCTG 
GTGGATGAAC CGGATGTTTC GCCGCTTGCG GTGCAGGGCC CCAAGGCAGA GGACTTGATG 
GCGCGTGTCT TCGGCGAGAC TGTGCGCGCG ATCCGGTTTT TCCGCTTTGG CGTCTACCAG 
TTCGAAGGAC GCGATCTGGT GGTGGCAAGG TCGGGCTACT CAAAGCAGGG TGGGTTCGAG 
ATCTACGTCG AAGGCGGCGA TCTTGGCATG CCGCTCTGGA ACCGTCTGTT TGAGGCTGGC 
GCAGATCTCG AGGTGCGTGC GGGCTGTCCC AACCTCATTG AGCGGATCGA GAGCGGTCTT 
CTGAGCTACG GCAATGATAT GACCGACGAC AACACACCGC ACGAATGCGG CCTTGGGCGG 
TTCTGTAACA CCCACACGGC CATTGGGTGT ATCGGGCGTG ATGCGCTGCT GCGGGTGGCC 
AAGGAAGGCC CGGTGCAGCA GATCCGCCCG ATCGAGATTT CCGGCGAAGC GGTGCCGCCC 
TGTGATCAAT TCTGGCCGCT CGTTGCAAAT GGGCGTCGTG TCGGTCGGGT CTCCTCGGCC 
ACCTGGTCGC CGGATCATGC CACGAATGTT GCGATCGGCA TGGTCAAGAT GACGCATTGG 
GATGCGGGGA CGCAGCTAGA GGTGGAGACA CCGGATGGAA TGCGTACTGC TCTGGTGCGC 
GAAAATTTCT GGAATTAA

Protein sequence

MRRSPSTHGM KGFAMTVLKP AISLSRRLRR TPFSEGVEAA GVKGYTVYNH MLLPTVFESV 
EADYHHLKRH VQVWDVACER QVELRGPDAG RLMQMLTPRD LRGMMPGQCY YVPIVDETGG 
MLNDPVAVKL AEDRWWISIA DSDLLYWVKG IANGWRLDVL VDEPDVSPLA VQGPKAEDLM 
ARVFGETVRA IRFFRFGVYQ FEGRDLVVAR SGYSKQGGFE IYVEGGDLGM PLWNRLFEAG 
ADLEVRAGCP NLIERIESGL LSYGNDMTDD NTPHECGLGR FCNTHTAIGC IGRDALLRVA 
KEGPVQQIRP IEISGEAVPP CDQFWPLVAN GRRVGRVSSA TWSPDHATNV AIGMVKMTHW 
DAGTQLEVET PDGMRTALVR ENFWN