Gene Tmz1t_1445 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_1445
Symbol
ID	7083528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	1610743
End bp	1611783
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	68%
IMG OID	643698463
Product	TIM-barrel protein, nifR3 family
Protein accession	YP_002355100
Protein GI	217969866
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGTTTG CCGGCTTCAC CCTGCGCAAC AACCTCTTCG TCGCCCCCAT GGCCGGCGTG 
ACGGACCGCC CCTTCCGCCA GCTCTGCAAA AAGCTGGGCG CAGGCGTCGC CGTATCCGAG 
ATGGTCACCT CCAATTCGCT GCTCTACGGC AGCGAGAAGA CCCGCCGCCG CGCCGACCAT 
ACCGGCGAGG TCGATCCGAT CTCGGTGCAG ATCGCCGGCG CCGATCCGGC GATGATGGCC 
GAAGCCGCGA AGTTCAACGC CGACAACGGC GCGCAGATCA TCGACATCAA CATGGGCTGC 
CCGGCCAAGA AGGTGTGCAA CGTGATGGCC GGCTCGGCGC TGATGCAGGA CGAGCCGCTG 
GTCGCGCGCA TCCTCGAGGC CGTAGTCAAG GCGGTGCCCG ATACCCCAGT CACGCTCAAG 
TTCCGCACCG GCTGGAACCG CGCCAACAAG AACGCGCCGA CGATCGCGCG CATCGCCGAG 
GAGTCCGGCA TCCGCGCCAT CGCCATCCAC GGCCGTACCC GGGCCGACCA GTACATGGGC 
GAGGCGGAGT ACGACACCAT CGCCCACGTC AAGACCCTCG TGAACATCCC GGTGATCGCC 
AACGGCGACA TCGGCAGCCC GCAGAAAGCC AAGCACGTGC TCGACTACAC CGGCGCCGAC 
GGCGTCATGA TCGGGCGCGC GGCGCAGGGC CGGCCGTGGA TCTTCCGCGA GATCGAGCAT 
TTCCTCGCCA CCGGCGAGCT CCTGCCGCCG CCGCTGGTGA GCGAGATCCA CCAGGTGTGC 
CGCGAGCACC TCGCCGACCT CTACGCCTTC TACGGCGACG ACCGCGGCGT CAAGATCGCG 
CGCAAGCACA TCTCCTGGTA CACCAAGGGC CTGGTGGGCT CGGCGGCCTT CCGCCGCGCG 
ATGAACCAGA TCCCCGACAT TCCCGCCCAG CTCGCCGCGG TGGACGACTT CTTCGGCCAG 
CTCGCCGAGG CCGGCGCCCG CCTGAGCTAC GAGCACGAGC GCGCGCCGCA CGCCGAATAT 
CCGCAGGAAC TCGCAGCATG A

Protein sequence

MQFAGFTLRN NLFVAPMAGV TDRPFRQLCK KLGAGVAVSE MVTSNSLLYG SEKTRRRADH 
TGEVDPISVQ IAGADPAMMA EAAKFNADNG AQIIDINMGC PAKKVCNVMA GSALMQDEPL 
VARILEAVVK AVPDTPVTLK FRTGWNRANK NAPTIARIAE ESGIRAIAIH GRTRADQYMG 
EAEYDTIAHV KTLVNIPVIA NGDIGSPQKA KHVLDYTGAD GVMIGRAAQG RPWIFREIEH 
FLATGELLPP PLVSEIHQVC REHLADLYAF YGDDRGVKIA RKHISWYTKG LVGSAAFRRA 
MNQIPDIPAQ LAAVDDFFGQ LAEAGARLSY EHERAPHAEY PQELAA