Gene Tmz1t_3631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_3631
Symbol
ID	7873136
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	3988319
End bp	3989410
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	66%
IMG OID	643700572
Product	GTP-dependent nucleic acid-binding protein EngD
Protein accession	YP_002890601
Protein GI	237654287
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0012] Predicted GTPase, probable translation factor
TIGRFAM ID	[TIGR00092] GTP-binding protein YchF

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCTGA AATGCGGAAT CGTCGGCCTG CCCAACGTCG GCAAGTCGAC CCTCTTCAAC 
GCGCTGACCA AGGCCGGCAT CCAGGCCGAG AACTACCCCT TCTGCACCAT CGAGCCCAAC 
GTCGGCATCG TCGAGGTGCC GGATCCGCGC CTGGCCGCGC TGTCCGAGAT CGTCAAGCCG 
CAGAAGATCC AGCCCGCCAT CGTCGAGTTC GTCGACATCG CCGGCCTGGT TGCCGGCGCC 
TCCAAGGGAG AAGGCCTGGG CAACCAGTTC CTCGCCAACA TCCGCGAGAC CGACGCCATC 
GTGCACGTCG TGCGCTGCTT CGCGGACGAC AACGTGATCC ACGTCTCCGG CAGTGTCGAC 
CCGATCCGCG ACATCGAGGT CATCGACACC GAGCTCGCCC TCGCCGACAT GGCCACCGTG 
GAGAAGGCGC TCAACCGCTA CAAGCGCCCT GCCGCCTCGG GTGACAAGGA GGCCAAGATC 
CTCGTCGCCG TGCTCGAGAA GTGCTTCGCC CAGCTCGACC AGGGCAAGGC CGTGCGCGCG 
CTCGACCTGT CGAAGGAAGA ATGGGCCAGC CTCAAGCCCT TCTGCCTGAT CACCGCCAAG 
CCGGTGCTCT ACGCCGCCAA CGTCGCCGAG GACGGCTTCG AAAACAACCC GCACCTCGAC 
GCCGTGCGCG CCCACGCCGC CGCCGAGGGC GCCGAAGTGG TCGCGCTGTG CGCCGCGATC 
GAGGCCGAGA TCGCCGACCT CGAGGACGCC GACAAGAAGG AATTCCTCGA GACCATGGGC 
CTGGAAGAAC CCGGCCTCGA CCGCCTGATC CGCGCCGGCT ACAAGCTGCT CGGCCTGCAG 
ACCTACTTCA CCGCCGGCGT CAAGGAAGTG CGCGCGTGGA CCATCCACGT CGGCGACACC 
GCCCCGCAGG CCGCCGGCGT CATCCACACC GACTTCGAGC GCGGCTTCAT CCGCGCCCAG 
ACCATCGCCT ACGACGACTT CATCCAGTAC AAGGGTGAGG CCGGCGCCAA GGAAGCGGGC 
AAGATGCGCG CGGAAGGCAA GGAATACGTG GTCAAGGACG GCGACGTGCT GAACTTCCTG 
TTCAACGTCT GA

Protein sequence

MSLKCGIVGL PNVGKSTLFN ALTKAGIQAE NYPFCTIEPN VGIVEVPDPR LAALSEIVKP 
QKIQPAIVEF VDIAGLVAGA SKGEGLGNQF LANIRETDAI VHVVRCFADD NVIHVSGSVD 
PIRDIEVIDT ELALADMATV EKALNRYKRP AASGDKEAKI LVAVLEKCFA QLDQGKAVRA 
LDLSKEEWAS LKPFCLITAK PVLYAANVAE DGFENNPHLD AVRAHAAAEG AEVVALCAAI 
EAEIADLEDA DKKEFLETMG LEEPGLDRLI RAGYKLLGLQ TYFTAGVKEV RAWTIHVGDT 
APQAAGVIHT DFERGFIRAQ TIAYDDFIQY KGEAGAKEAG KMRAEGKEYV VKDGDVLNFL 
FNV