Gene Tmz1t_3044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_3044
Symbol
ID	7874514
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	3297919
End bp	3299043
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	68%
IMG OID	643699967
Product	chaperone protein DnaJ
Protein accession	YP_002890019
Protein GI	237653705
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID	[TIGR02349] chaperone protein DnaJ

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.952099
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCAAAC GCGATTACTA CGAAGTCCTG GGCGTCAACC GCGACGCCGG CGACGACGAG 
ATCAAGAAGG CCTACCGCAA GCTGGCCATG AAGTTTCATC CGGACCGCAA TCCGGACAAC 
AAGGAAGCCG AGGAGAAGTT CAAGGAGGCC AAGGAGGCCT ACGAGATGCT CTCCGACCCG 
CAGAAGAAGG CTGCCTACGA CCGCTACGGC CACGCCGGCG TCGATCCGTC GATGGGCGCG 
GGCCCCGGCG CGCAGGGCTT CGACGGCTTC GCCGACGCCT TCGGCGACAT CTTCGGCGAC 
CTCTTCGGGG GCGGCGGACG CGGCGGGCGC TCAAACGTCT ATCGCGGCGC CGACCTGCGC 
TACAACCTCG AGATCACCCT GGAAGAGGCC GCGCGCGGCG CCGAGAAGAC GATCCGCATC 
CCCACCGTCG AGGAGTGCGG CACCTGCCAC GGCAGCGGCG CCAAGCCCGG CACCCATCCC 
AAACCCTGCC CGACCTGCCA GGGCCACGGC CAGGTGCGCG TGCAGCAAGG CTTCTTCTCG 
ATCCAGCAGA CCTGCCCGAA GTGCCACGGC AGCGGCAAGA TCATCCCCGA CCCGTGCCGC 
GACTGCGGCG GCGCCGGCCG CACCAAGAAG CAGAAGACGC TCGAGGTGAA GATCCCCGCC 
GGCATCGACG ACGGCATGCG CCTGCGCCAC GCCGGCCACG GCGAGCCCGG CCTCAACGGC 
GGCCCGCCGG GCGACCTCTA CGTCGAGATC CACATCCGCA AGCACGCGGT GTTCGAGCGC 
GACCACGACG ACCTGCACTG CGAGATGCCG ATCAGCATCA CCACCGCGGC GCTCGGCGGC 
GAGATCGAGA TCCCGACGCT GGAAGGCATG GCGCGGCTGA AGATCCCCGC GGAGACGCAG 
AGCGGCAAGG TCTTCCGGCT GCGCGGCAAG GGCATCAAGA ACGTGCGCAG CCACGTGCAC 
GGCGACCTGA TGTGCCACGT GGTGGTCGAG ACCCCGGTGA ACCTGACCGA GCGTCAGAAG 
GAGTTGCTGC GCGAGTTCGA GGAGAGCGCC AGCGGCAACG CCACCCGCCA CAACCCCAAG 
GCGCAGGGGT GGATGGACAA GGTGCGGGAC TTCTTCGGCG GCTGA

Protein sequence

MSKRDYYEVL GVNRDAGDDE IKKAYRKLAM KFHPDRNPDN KEAEEKFKEA KEAYEMLSDP 
QKKAAYDRYG HAGVDPSMGA GPGAQGFDGF ADAFGDIFGD LFGGGGRGGR SNVYRGADLR 
YNLEITLEEA ARGAEKTIRI PTVEECGTCH GSGAKPGTHP KPCPTCQGHG QVRVQQGFFS 
IQQTCPKCHG SGKIIPDPCR DCGGAGRTKK QKTLEVKIPA GIDDGMRLRH AGHGEPGLNG 
GPPGDLYVEI HIRKHAVFER DHDDLHCEMP ISITTAALGG EIEIPTLEGM ARLKIPAETQ 
SGKVFRLRGK GIKNVRSHVH GDLMCHVVVE TPVNLTERQK ELLREFEESA SGNATRHNPK 
AQGWMDKVRD FFGG