Gene Moth_0593 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0593
Symbol
ID	3830978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	617517
End bp	618518
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	55%
IMG OID	637828534
Product	PhoH-like protein
Protein accession	YP_429466
Protein GI	83589457
COG category	[T] Signal transduction mechanisms
COG ID	[COG1702] Phosphate starvation-inducible protein PhoH, predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.318782
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAAAC CATTGGCCGA TATTTATGAA GTAAAACTCA CCACCGGCAA TAACGGTGAG 
GCGGCCAACA TCTTTGGCCA CCAGGATGAA AACCTGAAAT TTATTGAGAG CCACACGCCG 
GCCCGGATTA TCGCCCGGGG TAACGAAATA ACCTTAAGCG GCGACCGGCG GGAAGTCCAG 
GTGCTGGAAA AGCTTTTCCG GCAACTAATA AAACTCGCCC GGGCGGGAAC AACCATCAAT 
ACAGCAACCA TCAACTACAC CTGGAACCTG GTCCGCAGGC AGGACGGCAG CCAGGATCAG 
CCGGACCTGG CCCAGGCTCT GGGTGAAGTG ATTTATGTTA CCCCCCGGGG TAAGCAGATC 
CGGCCCAAGA CCCTGGGACA ATTGCGTTAT ATTCAGGCCA TGCGCCGTTA TGATATCGTC 
TTTGGTATCG GCCCGGCCGG TACCGGTAAA ACCTACCTGG CAGTAGTTAT GGCCGTCAAT 
GCCCTGAGGG CGCGCAGCGT AGAAAGGATC ATCCTGGCCC GACCGGCAGT AGAAGCGGGA 
GAGAAGCTGG GCTTCCTCCC CGGCGACCTG CAGGAAAAGG TCAATCCCTA CCTGCGCCCC 
CTTTATGACG GCCTTTATGA CGTTTTAGGA CTGGAAACGG CACAAAAGTA TATGGAAAAA 
AATATTATAG AAGTAGCGCC CCTGGCCTAT ATGCGGGGAC GGACCCTGGA CGACGCCTTT 
ATCATCCTGG ATGAGGCCCA GAATACTACT TCCGAACAAA TGAAAATGTT CCTGACCAGG 
ATCGGCTTCG GCTCCAGGGC GGTAATCACC GGCGATATCA CCCAGGTGGA TCTGCCCCGG 
GAGACAACCT CCGGCCTGGT GGAAGTCCAG AGGATTTTAA AGGGCATTGA AGGCATTGCC 
ATCGAGTATT TAACGGAAGC CGATGTGGTT CGGCATCCCC TGGTCCAGGA GATCATCAAG 
GCCTACGAGA GGAGTGACCA GATGTGCCAT GGCAGCGGTT AG

Protein sequence

MIKPLADIYE VKLTTGNNGE AANIFGHQDE NLKFIESHTP ARIIARGNEI TLSGDRREVQ 
VLEKLFRQLI KLARAGTTIN TATINYTWNL VRRQDGSQDQ PDLAQALGEV IYVTPRGKQI 
RPKTLGQLRY IQAMRRYDIV FGIGPAGTGK TYLAVVMAVN ALRARSVERI ILARPAVEAG 
EKLGFLPGDL QEKVNPYLRP LYDGLYDVLG LETAQKYMEK NIIEVAPLAY MRGRTLDDAF 
IILDEAQNTT SEQMKMFLTR IGFGSRAVIT GDITQVDLPR ETTSGLVEVQ RILKGIEGIA 
IEYLTEADVV RHPLVQEIIK AYERSDQMCH GSG