Gene Tmz1t_4086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_4086
Symbol
ID	7873313
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	4489059
End bp	4490366
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	70%
IMG OID	643701017
Product	sun protein
Protein accession	YP_002891040
Protein GI	237654726
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00563] ribosomal RNA small subunit methyltransferase RsmB

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGTGGTG CCCCACGCCG TGCTCCGGAA CAGCCCATCG ACAGCCTCGG CTACGCGCTC 
GCACGGGCAA CCGAACTGGT CGCTGGCGTG ATCGACGGCG CCAACCTGAC CGATGTCTTC 
GAGCGCATGC AGGCCGGGCA TCCGGAGTGG CCGGAAGGCA CGCGCGGGGC CGTGCGCGAC 
CTCGCCTGGT CGACCTTGCG CGAGTTCGGG CGCGGTGATG CGATCCTTTC CCGCCTGCTG 
CATAGTCCTC CTCCGGTGGA GATTCGGGCG CTTCTGCTGG TTGCCCTGCA GCGCCTGACG 
CAGCGCCCCG AGCAAGCCCA CACGGTGGTC GATCAGGCTG TGGGCGCCAC GGCCGTGGCG 
ATGCCCGGCC TGCGCAACCT GGTCAACGGT GTGCTGCGCA ATGCGCTGCG TCGGCAGCCG 
GAGTGGCAAG GCTGGATCGA GGCCGAGCCC GAGGCGCGTC ATGCCTTTCC GGCCTGGTGG 
GTGGAGCGTG TGCGCAGCGC GCATCCTCAG GCCTGGCAGG ATCTGCTCGC GGCCGGCAAT 
ACGCGTCCCC CCATGGCCTT GCGGGTCAAT CCGCGCCGTG CCACGTTGGC CGAGGTCGAG 
GCGGAGCTTG CCGCAGCCGG GCTGGAGTTC CGGCGACTCG ACAACGACGC GCTGGTGCTC 
GCGCGTCCGC TGGCGGTCGC ACGCCTGCCC GGGTACGCCG AAGGGCGCTT GTCGGTGCAG 
GACGCGGGGG CACAGTGGGC GGCGCAACTG CTCGATGTTC GAGCCGGCGA GCGTGTGCTC 
GACGCCTGCG CAGCCCCCGG CGGCAAGACT GCACACATCC TCGAGAGGGC CGATGCGGAC 
CTGCTCGCGC TGGAGCTTGA TCCGCTGCGG GCGGGTCGGG TGGCGCGCAA CCTCGACCGC 
CTCGGCCTGC GCGCGGAGCT GAAGGTCGCC GACTGCCGCC GCCTGGCAGC GTGGTGGGAT 
GGTCGTCCCT TCGACCGCAT CCTGGCCGAT GTGCCGTGCT CGGCATCCGG CGTGGTGCGC 
CGACATCCGG ACATCAAGTG GTTGCGCCGG GACAGCGATA TCGCCAACTT TGCCGCACAG 
CAGGCGGAAA TCCTGGAGGC ACTTTGGCGC ACGCTCGCCC CGGGTGGCAC AATGCTCTAC 
GTCACCTGCT CGGTGTTCGA CGAGGAAAAC GCCGGCCAGG TCGCCCGCTT CTGCGTCCGC 
CATGCCGACG CGGAGCGACT CCCGATTCGC GGATCTTCCG ACCTGCAGCT GCTGCCTTGT 
GCCGACCATG ACGGCTTCTA TTACGCGCTC CTCCGCAAGC GGCCCTGA

Protein sequence

MRGAPRRAPE QPIDSLGYAL ARATELVAGV IDGANLTDVF ERMQAGHPEW PEGTRGAVRD 
LAWSTLREFG RGDAILSRLL HSPPPVEIRA LLLVALQRLT QRPEQAHTVV DQAVGATAVA 
MPGLRNLVNG VLRNALRRQP EWQGWIEAEP EARHAFPAWW VERVRSAHPQ AWQDLLAAGN 
TRPPMALRVN PRRATLAEVE AELAAAGLEF RRLDNDALVL ARPLAVARLP GYAEGRLSVQ 
DAGAQWAAQL LDVRAGERVL DACAAPGGKT AHILERADAD LLALELDPLR AGRVARNLDR 
LGLRAELKVA DCRRLAAWWD GRPFDRILAD VPCSASGVVR RHPDIKWLRR DSDIANFAAQ 
QAEILEALWR TLAPGGTMLY VTCSVFDEEN AGQVARFCVR HADAERLPIR GSSDLQLLPC 
ADHDGFYYAL LRKRP