Gene Tmz1t_0866 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_0866
Symbol
ID	7084724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	958825
End bp	959844
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	68%
IMG OID	643697889
Product	PhoH family protein
Protein accession	YP_002354529
Protein GI	217969295
COG category	[T] Signal transduction mechanisms
COG ID	[COG1702] Phosphate starvation-inducible protein PhoH, predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGAAAA TCCTGGAAGT CTTCTTCGAG CCGGTGGATA ACGCCCGGCT GGCCAAGCTG 
TGCGGCGTAC TCGACGAGAA CCTGCGCCAG ATCGAGAACG CCTTCGACAT CACCGTGAGC 
CGGCGTGCCG AACACTTCAC GCTGCAGGGC CACCCCGCGC AGGTGCTGCG CGGCGAGATG 
GCGCTCAAGC ATTTTTACGC GCTCGCCGAC AAGGATCTGT CGCGCGACGA GGTCCAGCTC 
GGCCTCATCG AGATCGCCAA CAAGGGCGAG GCGGCGCAGC CCGCGCCGGT GCTGATGACG 
CGCCGTACGG AGCTCCACGG CCGCACGCCG CGCCAGGTCG ACTACCTGCG CAACATCCAG 
GACTTCGACA TCACCTTCGG CATCGGCCCG GCCGGCACGG GCAAGACCTA TCTCGCGGTG 
GCGAGCGCGG TCGACGCCTT CGAGCGCGAC CTCGTCGAGC GCATCATCCT CACCCGCCCG 
GCGGTCGAGG CCGGCGAGCG CCTGGGCTTC CTGCCCGGCG ACCTGGCGCA GAAGGTCGAC 
CCCTACCTGC GCCCGCTCTA CGACGCGCTC TACGACCTGA TGGGCTTCGA CCGCGTCGGC 
AAGCTCTTCG AGCGCGGCAG CATCGAGATC GCGCCGCTCG CCTTCATGCG CGGGCGCACG 
CTCAATAATG CCTTCATCAT CCTCGACGAG GCGCAGAACA CGACCCCCGA GCAGATGAAG 
ATGTTCCTCA CCCGCATCGG CTTCGGCGCC AAGGCGGTGG TCACCGGCGA CCTCACCCAG 
ATCGACCTGG CACGCGGCCA GCGCAGCGGT CTCAAGGAGG CGCGCGCGGT GCTGGCGGGG 
GTGCGCGGCA TCGCGTTCAC CGAATTCAGC AAGGAAGACG TGGTGCGTCA TCCGCTTGTC 
GCGCGCATCG TCGAAGCTTA CGACCTCGAG GCTGCGCGCC TCGAGCGCGA GAAGGCCGCG 
GCCCGCGCCG CGCGCCAGCA GCCGCACCCG CAGGAGCAGG AAGCCGAAGA TGGCGAATAA

Protein sequence

MAKILEVFFE PVDNARLAKL CGVLDENLRQ IENAFDITVS RRAEHFTLQG HPAQVLRGEM 
ALKHFYALAD KDLSRDEVQL GLIEIANKGE AAQPAPVLMT RRTELHGRTP RQVDYLRNIQ 
DFDITFGIGP AGTGKTYLAV ASAVDAFERD LVERIILTRP AVEAGERLGF LPGDLAQKVD 
PYLRPLYDAL YDLMGFDRVG KLFERGSIEI APLAFMRGRT LNNAFIILDE AQNTTPEQMK 
MFLTRIGFGA KAVVTGDLTQ IDLARGQRSG LKEARAVLAG VRGIAFTEFS KEDVVRHPLV 
ARIVEAYDLE AARLEREKAA ARAARQQPHP QEQEAEDGE