Gene Tmz1t_0203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_0203
Symbol
ID	7084324
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	238135
End bp	239259
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	72%
IMG OID	643697245
Product	transcriptional regulator of molybdate metabolism, LysR family
Protein accession	YP_002353894
Protein GI	217968660
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1910] Periplasmic molybdate-binding protein/domain
TIGRFAM ID	[TIGR00637] ModE molybdate transport repressor domain

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.433996
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCAGGA TCAGGCTGAA CTACGTACTC GGCGCGGACA CGGGGTCGGC GCCGCTCCAC 
AATCCCCTGC TCGACCTCCT GCAGGCGGTG CGCGAGCAGG GCTCGATCTC CGCCGCCGCG 
CGTGTGCTGG ACCTCTCCTA CCGCCACGTT TGGGGCGAGC TCAAGCGCTG GGAGCTCGAG 
CTCGGCCAGC CGCTGATCCT GTGGGAGAAG GGCCAGGCCG CGCGCCTGTC CGAGTTCGGC 
GCCAAGCTGC TGCTCGCCGA GCGCCAGGTG CAGGCTCGCC TGTTGCCGCA GATCGAGGCG 
CTGCGCGCCG ACCTCGAGCG CGCCTTCGCG ATCGCCTTCG ACGATTCGGT GCATGTGCTG 
TCCTTCCACG CCAGCCACGA CGAGGCGCTC GCCGCGCTCG GCGAGGAGGC GCGGACCCGC 
GGCCTGCACC TGGACATCCG CTTCACCGGC AGCGTCGATG CGATCCGCGC ATTGAACGAG 
GGCCGCTGCA CCATGGCCGG CTTCCACGTG CGCCTGCCGG CGGTGCCGGG CTCGCGGGGG 
TCGTCGTCAC ACTCGCAGCG CACCTACAAG CCGCTGCTGC GCCCCGGCCT GCACAAGCTG 
ATCGGCTTCG CCCGCCGCAG CCAGGGCCTG ATCGTGGCAC GCGGCAATCC GCGCGGCCTG 
CACGGCCTCG CCGACCTCGC GCGCCCCGGC GTGCGCTTCG TCAATCGCGC GCGCGGCACC 
GGCACGCGGG TGATTTTCGA CGAGCTGCTC GGCGAGCTCG GCCTCGCGCC CGCCGCGATC 
GAGGGCTACG CCAATGACGA ACCCTCGCAC GCCGCGGTCG CGCAGGCGGT GGCGAGCGGT 
CAGGCCGACG CCGGCTTCGG CATCGAGGCG AGCGCGCGCG GCCGCGGACT GGACTTCGTG 
CCGCTGGTCG AAGAGGCCTA CTTCCTCGCC TGCCTCAAGT CCACCCTGGA GCACGACGCC 
ACCCGCGCCC TGCTCGCGCT GCTGCGCACC GCCGCATGGC AGCAGCGCCT GGCCGACCTG 
CCCGGCTACG CGCCGATGCA GAGCGGCGAG GTGCTGTCGA TGAGCCGGGT GCTGCCGTGG 
TGGCGCTTCG GGGGGCGTGG AAACGCTCGC GAAGGAAAGC AATAA

Protein sequence

MRRIRLNYVL GADTGSAPLH NPLLDLLQAV REQGSISAAA RVLDLSYRHV WGELKRWELE 
LGQPLILWEK GQAARLSEFG AKLLLAERQV QARLLPQIEA LRADLERAFA IAFDDSVHVL 
SFHASHDEAL AALGEEARTR GLHLDIRFTG SVDAIRALNE GRCTMAGFHV RLPAVPGSRG 
SSSHSQRTYK PLLRPGLHKL IGFARRSQGL IVARGNPRGL HGLADLARPG VRFVNRARGT 
GTRVIFDELL GELGLAPAAI EGYANDEPSH AAVAQAVASG QADAGFGIEA SARGRGLDFV 
PLVEEAYFLA CLKSTLEHDA TRALLALLRT AAWQQRLADL PGYAPMQSGE VLSMSRVLPW 
WRFGGRGNAR EGKQ