Gene Tmz1t_1192 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_1192
Symbol
ID	7083852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	1321627
End bp	1322667
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	74%
IMG OID	643698208
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_002354847
Protein GI	217969613
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.978581
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTGC TCGGCATCGA AACCTCCTGC GACGAGACCG GCGTGGCGAT CTACGACACC 
GACACCGGCC TGCGCGCGCA CTGCCTGCAC TCGCAGATCG ACCTGCACGC GGCCTACGGC 
GGGGTGGTGC CCGAGCTCGC CTCGCGCGAT CACATCCGCC GCCTGCCGCT GCTGCTGCGC 
CAGACCCTGG CCGCGGCCGG CCTCGCCGCC GCGGACATCG ACGCCGTGGC CTACACCAGC 
GGTCCCGGGC TCGCGGGCGC GCTGCTGGTG GGGGCGAGCG TGGCGGAGTC GTTCGCGATG 
GCGCGCGGGA TCCCGGCGCT GCCGGTGCAT CACCTCGAGG GCCACCTGCT GTCGCCGCTG 
CTGTCGGCCG ATCCTCCGGC CTTCCCCTTC GTGGCCTTGC TGGTTTCGGG CGGCCACACC 
CAGCTGATGC GGGTGCGCGG GGTGGGCGAC TACGCGCTGC TCGGCGAGTC GGTGGACGAC 
GCCGCCGGCG AGGCCTTCGA CAAGACCGCC AAGCTGCTCG GCCTGGGCTA TCCCGGCGGG 
CCGCAGCTCG CCGGGCTGGC CGAATCCGGC GTGCCCGGCC GCTTCCGCCT GCCGCGGCCG 
ATGCTGCACT CGGGGGACCT CGACTTCAGC TTCAGCGGTC TCAAGACCGC GGTGCTCAAC 
GTGGTGTCGG CGCCCGACTG GGACCCGGCG CGCATGGCCG ACCTCGCTGC CGAGTTTCAG 
CAGGCCGTGG TCGATGTGCT GTGCGCGAAG GCGCTCGCGG CGCTGAAGAA GGTGGGGCTG 
AAGACCCTCG TAGTGGCCGG CGGGGTGGGT GCCAACCGCT GCCTGCGCGC CACCCTGGAC 
GCCGCGCTCG CGCGCCGCGG CGGGCGCGTG CATTACCCCG AGCCGGCGCT GTGCACCGAC 
AACGGCGCCA TGATCGCCTT CGCCGGCGCC TTGCGCCTGG CGGCCGGCGA GTCCGTGCCG 
GAAGTCTGCG CCGTCCGCAT CCGCCCGCGC TGGCCCATGG TCGAACTGCG CCCGCCGGTG 
CAGGCGCCCG CCATCCTGTA G

Protein sequence

MKVLGIETSC DETGVAIYDT DTGLRAHCLH SQIDLHAAYG GVVPELASRD HIRRLPLLLR 
QTLAAAGLAA ADIDAVAYTS GPGLAGALLV GASVAESFAM ARGIPALPVH HLEGHLLSPL 
LSADPPAFPF VALLVSGGHT QLMRVRGVGD YALLGESVDD AAGEAFDKTA KLLGLGYPGG 
PQLAGLAESG VPGRFRLPRP MLHSGDLDFS FSGLKTAVLN VVSAPDWDPA RMADLAAEFQ 
QAVVDVLCAK ALAALKKVGL KTLVVAGGVG ANRCLRATLD AALARRGGRV HYPEPALCTD 
NGAMIAFAGA LRLAAGESVP EVCAVRIRPR WPMVELRPPV QAPAIL