Gene Tmz1t_3574 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_3574
Symbol
ID	7873079
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	3917078
End bp	3918220
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	72%
IMG OID	643700514
Product	Peptidoglycan-binding domain 1 protein
Protein accession	YP_002890544
Protein GI	237654230
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACGCA TCATTCCCTG CACGGATTGC GCCGAGAAGA CGCTCGACGT CGAGCAGCTC 
GGCTTCCGGG TCACCAGCTG CGATCCCCAT CCCGAGCGGC CCGGGTTCTG CGTGCTGCGC 
TTCGAGGATC GCAGCGCCAC GCCGGCGGCC GGGGCAAGCC TCGCAGCCCC CGCCGCAGCG 
GCGCGCGCGG GGAGGGGGGC GGTCGCCGGT GGCGTCACCG CCACCCAGGC GGCGGTCGCC 
AAGGCGATCG TCAACCTGTT CGAGACCGGG GAGGTGCTGG GCCAGTACGG GAAGGTGACG 
CTGATCCCGG GCGATACCGG CCACCTGACC TTCGGCCGAT CGCAGACCAC GCTCGGCTCT 
GGCAACCTCG CCAAGCTGCT GCAGCAATAC TGCGCCAACC CCGGGGCACG CTTCGCCGGC 
CGGCTGGCGT CCTACCTGCC GCGCTTCCTG GCCATCGACG AGAGCCTCGA CGACGATCCC 
CGCCTGCACA ACGTGCTGCG TGCGACCGCC GACGATCCGG TGATGCGCGA TACGCAGGAT 
GCGTTTTTCG ATCGGACCTA CTGGGAGCCT GCGCTGCGCG CGGCCGCAAG CTTGGGCGTG 
CACACCCCGC TCGGCGTGGC GGTGGTGTAC GACAGCGCCG TGCACGGCTC CTGGCTGGCG 
ATGCGCGACC GCACCACGCG CGCGGTCGGC GAGCCCGCGG CGGTGGGCGA GCAGGCCTGG 
ATCGACGCCT ATGTGCGCAC GCGACGAGCC TGGCTGGAGG GCCACGCGCG CGCCGACCTG 
CGCCAGACGG TGTATCGCAT GGAAGCGTTC GGACGCCTCA TCGACCAGGG CTTCTGGGGG 
CTCGAGATGC CGCTCGTGGT GCGCGGCAGG GAGATCTCGA GCGTGACGCT CGCCGCCTTG 
CCGCCCGGCT GCTACGACGG GCCGCAGCCG GGTTCGCGCC CCTTGACGCT GGCGACCCCG 
CTGGCGCGCG GGCTGGATGT CCGCCTGCTG CAGCTCGGCC TGTCCGACCG CGGCGTGGAC 
ATCCTCGCCG ATGGCATCTT CGGGCGGACC AGCTTCAACC TGCTCAAGGC CTGGCAGGCG 
CAGCACGGGC TGGCGGCCAC CGGCATCGCG GACCCCGCCC TGATCGGCGA GTTGACGGCC 
TGA

Protein sequence

MERIIPCTDC AEKTLDVEQL GFRVTSCDPH PERPGFCVLR FEDRSATPAA GASLAAPAAA 
ARAGRGAVAG GVTATQAAVA KAIVNLFETG EVLGQYGKVT LIPGDTGHLT FGRSQTTLGS 
GNLAKLLQQY CANPGARFAG RLASYLPRFL AIDESLDDDP RLHNVLRATA DDPVMRDTQD 
AFFDRTYWEP ALRAAASLGV HTPLGVAVVY DSAVHGSWLA MRDRTTRAVG EPAAVGEQAW 
IDAYVRTRRA WLEGHARADL RQTVYRMEAF GRLIDQGFWG LEMPLVVRGR EISSVTLAAL 
PPGCYDGPQP GSRPLTLATP LARGLDVRLL QLGLSDRGVD ILADGIFGRT SFNLLKAWQA 
QHGLAATGIA DPALIGELTA