Gene Tmz1t_2371 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_2371
Symbol
ID	7094293
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011667
Strand	+
Start bp	33755
End bp	35014
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	60%
IMG OID	643701059
Product	DNA-cytosine methyltransferase
Protein accession	YP_002364200
Protein GI	217980150
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase
TIGRFAM ID	[TIGR00675] DNA-methyltransferase (dcm)

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	0.0692329
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.000000223127
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCTAACC CGATCGACCT ACTGAAAGAG GCTCGCCTTC GGTTTTCGCA GCGCGAGATT 
GCCGATTATG TGGGCAAGGA CATCAAAACC GTTCGCCGCT GGGAGAAAGG TGAAACGCCA 
TGTCCGGCAA TCCTCGAGCC CGCGCTAAGG GAGATGCTTC GCACGCCGCG CCTCCAAGAG 
CTCGCGGAGC CGGACTTCAC CTTCATTGAT CTGTTTGCAG GGGTCGGGGG TATAAGGATG 
GGCTTTGAGG CTCATGGTGG GCGCTGTGTC TTCACGAGCG AGTGGGACAG TTATGCTCAG 
AAAACCTATG CCGAAAACTT CCCTGCCGAG CACCCCCTGA ACGGCGATAT CACAAAGATT 
GAAGCTGCAG ACATCCCTGA CCACGATGTG TTGCTGGCCG GGTTCCCCTG TCAGCCGTTT 
TCCATCGCAG GCGTCTCAAA GAAGAATGCG CTAGGGCGCG CGCACGGTTT CGCCTGCGAC 
ACTCAAGGCA CGCTGTTCTT TGATGTGTGC AGGATCATCG AGGAGAAGCG CCCGCGTGCC 
TTCCTGCTGG AGAACGTCAA GAACCTGATG TCCCACGACA AGGGCCGGAC ATGGGATGTC 
ATCAAGAGCT CGCTCATCGA ACTGGGTTAC AACATTTCTC CGCGTGTGGT TGATGGCGCC 
CACTTCGTGC CCCAGCACCG TGAACGCATC CTCATCGTGG GCTTCCGGAA TGAGGACGGT 
ATCCGCTTCG ATTGGGATGC AGTGGGCCTG CCGCAGAAGG GAGTCCATGT GATGCGTGAC 
ATCCTGCACC GTACCGACGG TACCGAACCA GTCCTCCCGT GGGATGGTGA CCGGTTCTTC 
GATCATGCCG GTCGTAGGGT TCAGGACAAG TACACACTGA CCCCCAAGCT CTGGCGCTAC 
CTGCAGGACT ATGCAGACAA GCACCGTGCA AAGGGCAACG GCTTCGGCTT CGGTCTGGTG 
CACCCTGGCA GCGTGGCTCG AACCCTGTCC GCGCGGTACT ACAAGGATGG CTCGGAGATC 
CTTGTCTATC AGGGCGAGGG TATCAACCCG CGCAGGCTCA CGCCGCGGGA GTGCGCGCGC 
CTGATGGGCT TTCCGGACAG TTTCCGGATC CCGGTCTCCG ATACGCGGGC TTACAAGCAG 
TTCGGTAACA GCGTTGTAAT GCCTGTCATG CGTGAGGTGG CCCGGGCCAT GGTTCCGCAC 
ATTCTGGCTA GGCGAGAAGA CCGACACGAT GTGCCCGAAG CGCTCGCCTG TGCAGCGTGA

Protein sequence

MSNPIDLLKE ARLRFSQREI ADYVGKDIKT VRRWEKGETP CPAILEPALR EMLRTPRLQE 
LAEPDFTFID LFAGVGGIRM GFEAHGGRCV FTSEWDSYAQ KTYAENFPAE HPLNGDITKI 
EAADIPDHDV LLAGFPCQPF SIAGVSKKNA LGRAHGFACD TQGTLFFDVC RIIEEKRPRA 
FLLENVKNLM SHDKGRTWDV IKSSLIELGY NISPRVVDGA HFVPQHRERI LIVGFRNEDG 
IRFDWDAVGL PQKGVHVMRD ILHRTDGTEP VLPWDGDRFF DHAGRRVQDK YTLTPKLWRY 
LQDYADKHRA KGNGFGFGLV HPGSVARTLS ARYYKDGSEI LVYQGEGINP RRLTPRECAR 
LMGFPDSFRI PVSDTRAYKQ FGNSVVMPVM REVARAMVPH ILARREDRHD VPEALACAA