Gene Tmz1t_0762 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_0762
Symbol
ID	7084153
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	846613
End bp	848043
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	67%
IMG OID	643697787
Product	Radical SAM domain protein
Protein accession	YP_002354429
Protein GI	217969195
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.502838
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTGCCG TCTTGAATCT GGTGCAGGAC AACCTGCACG AGCTGCGCAT CGATGAGACG 
CGCATGCTGT TCCACATCCC GAGCAGTTCG CTGTTCGCGC TCGACCCGCT GAGCGCGGCG 
CTGATCGATC GCATCCGCCG TCAGAGCCTC ACCGTCGAGG CCCTGATCGA CGGCCTGCGC 
ACCGAGTTCG ACGCCGACGA GGTGGCCGAG GCGATCCGCG AGCTGGTCGC GCTCGAGCTC 
ATCGACGACG GCCGCCCCGC CGGCGCCGGC ACGCTCGCGC ACACCTTCGA GCGCTTCCCG 
CTCACCACGG TGGTGCTCAA CGTCAACACC GGCTGCAACC TGAGCTGTAC CTACTGCTAC 
AAGGAAGACC TCGACAAGCC CTCGGCGGGC CGCAAGATGG CCTTCGGGAC CGCGCGCGAC 
GCGATCGAGA TGATGTTGCG CGAGTCGCCG GACGAGCCGC GCTACAACGT CGTCTTCTTC 
GGCGGCGAGC CGCTCAGCAA CCTGCCGCTG ATCAAGGACG TGGTCGCGTA CTGCGAGGCG 
CGCTTCGCCG AGCTCGGCAA GCAGGTCGAT TTCGTCATGA CGACGAACGC GACCCTGCTC 
GCCGACGACA CCATCGACTG GCTCGATGCC CACCGCTTCG GGCTGTCGAT CAGCATCGAC 
GGTCCGAAGG CGATCCACGA CCGCAACCGG CTCACCGTCG GCGGCCAGGG CACCTACGAG 
ACCGTGCGGC GCAAGGCCGA GCGCCTGCTG GCGCGCTACC ACGCGCGGCC GGTGGGGGCA 
CGGGTCACGC TCACCCACGG CACCACCGAG GTCGAGCGCA TCTGGGACCA CCTGTTCAAC 
GAGCTGGGCT TTGCCGAAGT GGGCTTCGCG CCGGTGACCT CGGGCGACAT CAGCACCTTC 
AACCTCACGG GCGCGGAGCT GGTCGAGGTC TTCGCCGGGC TGAAGCGGCT CGGTGCGCGC 
TATCTGGAGG CGGCGCTGGA GGGACGCAAC ATCGGTTTCT CCAACATGCA CCAGCTGATC 
ACCGACCTGC ACGAAGGCCA CAAGAAGGCG CTGCCCTGTG GCGCCGGGTT GAAGATGCTC 
GCGGTCGACC ACAAGGGTGA ACTGAACCTG TGCCATCGCT TCACCGGCTC CACGCTGCCG 
ACCTTCGGCG ACGTGAAGAA CGGTATCCAG CGCGCGCAGC TCGGCGATTT CCTGTCCCAG 
CGCCTGGATC GCACGGATAC CGGCTGCGCG AGCTGCCGCA TCCGCAACCT GTGCTCGGGC 
GGCTGCTACC ACGAGAGCTA CGCGCGCTAC GGCGATCCCG CACATCCCAC CTACCACTAC 
TGCGATCTGA TGCGCGACTG GGTGGACTTC GGCATCGAGG TCTACAGCCG CATCATGGCC 
GGGAACCCGG CCTTCATCGA ACAGCATATT TCCCCGAGGA GGGCGTCATG A

Protein sequence

MGAVLNLVQD NLHELRIDET RMLFHIPSSS LFALDPLSAA LIDRIRRQSL TVEALIDGLR 
TEFDADEVAE AIRELVALEL IDDGRPAGAG TLAHTFERFP LTTVVLNVNT GCNLSCTYCY 
KEDLDKPSAG RKMAFGTARD AIEMMLRESP DEPRYNVVFF GGEPLSNLPL IKDVVAYCEA 
RFAELGKQVD FVMTTNATLL ADDTIDWLDA HRFGLSISID GPKAIHDRNR LTVGGQGTYE 
TVRRKAERLL ARYHARPVGA RVTLTHGTTE VERIWDHLFN ELGFAEVGFA PVTSGDISTF 
NLTGAELVEV FAGLKRLGAR YLEAALEGRN IGFSNMHQLI TDLHEGHKKA LPCGAGLKML 
AVDHKGELNL CHRFTGSTLP TFGDVKNGIQ RAQLGDFLSQ RLDRTDTGCA SCRIRNLCSG 
GCYHESYARY GDPAHPTYHY CDLMRDWVDF GIEVYSRIMA GNPAFIEQHI SPRRAS