Gene Tmz1t_1955 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_1955
Symbol
ID	7084423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	2198529
End bp	2199653
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	72%
IMG OID	643698980
Product	PAS/PAC sensor signal transduction histidine kinase
Protein accession	YP_002355602
Protein GI	217970368
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.630058
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGTCGC CCCGGCTCGA AGCCTTGCGC AGCGCGCTCG AGAAGGCGGA GTTCCGCCTC 
GCCGCCACCC AGGACCTCGC CCGTGTCGGC GACTGGGAGC TCGACCGCCA CACCGGGCGG 
ATGTACTGGT CGCGCGAACT CTTCCGCCTC TTCGAGCGCC CGGAAGCGCT CGGCGTGCCC 
GACCTCAACG AGGCGCTCGG CTACTTCAGC CTGGAGTCGA CGAATCGCAC CCGCGACCTG 
TTCTGGGAGG CGATCGACAG CGGCCGACGC TGCGCCCTGG AGCAGGAGGT CCTGCTGCCC 
TCGGGCGAGG AGCGTCGCCA TTTCACCGTG ATCGTGCCGG TCGCCGACGA GACCGGGCGC 
GTGTTCCGCC TGTACGGTAC GGTGCAGGAC ATCACCGAAC GCCGGCGCCT GGAGGCCGAG 
CGCCTGGAGC ATCTGGAACG CCTCGAAGAG CTCTCCCGCC ACCTGGTCGA GATCGAGGAG 
CGCGAGCGCC GCGAACTCGC CAGCGCGCTG CACGACCGCG CCAGCCCCAA CCTAGCCGCG 
CTGCAGATCC TGTTCTCCAG CCTGGCCGAC GCCCTCCCCG AATCCGCCCG CGATGAGCTC 
GCCCCGCTGC TGGAGGACGC CTCGGCCCTG CTCGCCGACA CCACCGCCGG CATCCGCGAG 
ATCTGCACCA ACCTGCGCCC GGCCACGCTC GACTACGCCG GCCTGGTACC CGCACTGCGC 
GAATACGTCG CCCAGTTCCG CGCCCGCACC GGGCTGGACG TGCGCGTCGA CGCTGCGTCC 
GGCAGCCCCC CGTGCGCCCT CTCCCGCGCG ACGCAGACGC TCTGCTTCCG CCTAGTGCAG 
GAGGCGCTCA CCAACTGCGC CAAGCACGCT CGCGCCGGCA GCGTGCGCAT CGGGCTCGGC 
GGCTGCGCCG GCGGGGTCCT GCTGCAGATC GGCGACGACG GCGTCGGCTT CGACCTCTCC 
CGTCTCGGCG AAGCGGGCAG CACCCCGGGG CTGGGCCTGA TCACGATGCG CGAGCGCGTC 
GAGCTCGCCG GCGGGGACTT CCGACTGTAT ACCCGCCCCG GCGACGGCAC CGTCATCGAG 
GTACGGCTGC CCGCCGAGCT CCACCCCGCG GAAACGAACC GATGA

Protein sequence

MRSPRLEALR SALEKAEFRL AATQDLARVG DWELDRHTGR MYWSRELFRL FERPEALGVP 
DLNEALGYFS LESTNRTRDL FWEAIDSGRR CALEQEVLLP SGEERRHFTV IVPVADETGR 
VFRLYGTVQD ITERRRLEAE RLEHLERLEE LSRHLVEIEE RERRELASAL HDRASPNLAA 
LQILFSSLAD ALPESARDEL APLLEDASAL LADTTAGIRE ICTNLRPATL DYAGLVPALR 
EYVAQFRART GLDVRVDAAS GSPPCALSRA TQTLCFRLVQ EALTNCAKHA RAGSVRIGLG 
GCAGGVLLQI GDDGVGFDLS RLGEAGSTPG LGLITMRERV ELAGGDFRLY TRPGDGTVIE 
VRLPAELHPA ETNR