Gene Tmz1t_2800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_2800
Symbol
ID	7873209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	3030688
End bp	3032061
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	48%
IMG OID	643699722
Product	Ankyrin
Protein accession	YP_002889777
Protein GI	237653463
COG category	[R] General function prediction only
COG ID	[COG0666] FOG: Ankyrin repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACATTC TGCTGCTGGG TTTCATCGGC TGGACTTTGT TGTGCTGCGC ATTGATCGCT 
AGAAAGGCAG GCTATTCAGG ATGGTGGTCT ATTTTAATGG TCATTCCAAT AATAAGCTTG 
GTTTTGATGT GGCGTTTCCC GTTCTTGAAA TGGCCAGCGC TCAGGCGACA ACCGCAGCCT 
GAATCCGTAC GTGAATCGTC CGCAAGAATG GCCAAGGGAG CTTCACAGCA CGATGGGGTG 
ACGTACGTCG TACCTGCGAT TGGGGTTCAG TTCGAGGCAG CATCTCAAAA GAATGATGAG 
GCTGTGCTTG ATGCCCTTTT AGAAGTTGAT CTCGTGCCTG CTGAGGTGAG TCTTGACAGG 
ATTTACGAAG AAGTGGCTGA GGAACTAGAG AGGGAAAGGG TCGATAAAGG GCTGTGGACT 
AGGCTGTACG CGGAATTTGA TGGCGATGAA AGAAAAGTAA AGGTTGGGTA CATCAAGGCC 
CGTGCAGAAA AGCTGCTTCG TGAAAAAGGC GAAGAGATTC GGATTGCCCG CTTGCGTCAT 
GAGGAGAAGC TAAGGGCTAT AAGCCAACTG AAAATGAAAC GAGATTATAT TCGTGAGAAT 
ATTGATCGTG CTTCGTCAGA CGGTCGCGCA GATGCTGGCC TCGAGGGTCT TTCATCAACA 
CACACTGCAA CGTTGTTTCT AAATTCAGTT AGGTTCAGTC GCATTGACGA GGCAAGGTCT 
TGGCTTGATG AAAACCCAGC GTTAGTCGAC GTTAAAGATA GCGGGGGTAT GACTGCGCTT 
CACATAGCCG CACGAGAAGG TTATGCGGAT ATGATTAAAT TTCTGATCCA GAGAGGAGCT 
TCTCTGACGG CTAGAAATTT GGAAGGGAAG GTTCCGTTAG ATCTGTCTGC CGGGTTCGGT 
GCTCAATGGA TAAATGAAGT GCTTGGATCA ACGCAAGTCC GCCAAAAAAG AGACAAAGAA 
AATTCGGAAA ACAGTTCAGT GAGAAAGGGG GTTGATATAG CCCTTATGAA TGTCAGGGCC 
TCTAGAAAGC TTCTTACTGA AGACGATATG ATCCGTGCGC TCCGAGAGAA AGGTTCAAGC 
TTGGCAAAAA ATTTCTGGAG TGACGTAAAA GATGGGAATC ATGTATTCAT CAGCCGGGAA 
CTAGATAGAA ATCCGTGGCT CGCAGCAGTT GCCTTCGATT ATGGCGAAAC GGCACTGCAC 
AAAGCGGTAG GCCGTAAAGA TCTCTGGTTA ATTGAACATC TTCTAATTGC AGGTGCTATG 
CCGGATAAGG CTGCGGATTA CGGGAAGTCG GCGCTTGACT TAGCGAGGGC GTCTGGGGAT 
GGCGACATTG TCACGCTTCT AGAGTGCTGT TCTGAATTTG ATGCTAAGTC ATGA

Protein sequence

MDILLLGFIG WTLLCCALIA RKAGYSGWWS ILMVIPIISL VLMWRFPFLK WPALRRQPQP 
ESVRESSARM AKGASQHDGV TYVVPAIGVQ FEAASQKNDE AVLDALLEVD LVPAEVSLDR 
IYEEVAEELE RERVDKGLWT RLYAEFDGDE RKVKVGYIKA RAEKLLREKG EEIRIARLRH 
EEKLRAISQL KMKRDYIREN IDRASSDGRA DAGLEGLSST HTATLFLNSV RFSRIDEARS 
WLDENPALVD VKDSGGMTAL HIAAREGYAD MIKFLIQRGA SLTARNLEGK VPLDLSAGFG 
AQWINEVLGS TQVRQKRDKE NSENSSVRKG VDIALMNVRA SRKLLTEDDM IRALREKGSS 
LAKNFWSDVK DGNHVFISRE LDRNPWLAAV AFDYGETALH KAVGRKDLWL IEHLLIAGAM 
PDKAADYGKS ALDLARASGD GDIVTLLECC SEFDAKS