Gene Cthe_1071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1071
Symbol
ID	4811369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1278892
End bp	1279893
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	41%
IMG OID	640106493
Product	PhoH-like protein
Protein accession	YP_001037496
Protein GI	125973586
COG category	[T] Signal transduction mechanisms
COG ID	[COG1702] Phosphate starvation-inducible protein PhoH, predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGAAAGTC TTGTGGAAGT TTCTTTGGAA TTTGACAGGA TTGAACATGC TATGAACCTT 
TTTGGGAACT TTGACGAAAA TATTAATATA ATTGAGGACG CTTTTAATGT AAAAATTATT 
TCAAGGGACA ACGAAATAAG AGTTGTGGGC TACAGTGACG CAGTATACAA GGCCCAGACG 
GTTCTTCAAA GGCTTATTGC CATGGCGGCG CAAGGTGATA TCATCTCAAA GCAGAATGTG 
AGTTATTTCG TTCAGTTGGC TGAAGAAAAC CAGTTGGATA AGATAAAAGG TTTCACTGCG 
GATTTTGTCT GCCTTACCGC AAGAGGCAGG CAGATAAAGG CGAAGACCCA TGGACAGAAG 
GTTTATGTGG ATGCAATAAA AGAAAATGAC ATAGTATTCG GCATAGGACC GGCAGGCACG 
GGAAAGACAT TTCTTGCCGT GGCCATGGCG GTTAATGCTT TCAGAAACAA GAAAGTAAAC 
AGGATAGTTC TTACAAGACC TGCGGTTGAA GCAGGTGAAA AACTGGGATT TTTGCCGGGC 
GATTTGCAAA ACAAGGTGGA TCCGTATTTA CGTCCTTTGT ATGATGCTCT TTATGAAATG 
ATGGGAGCCG AAACATATCA TAAATATCTG GAAAAAGGCA TGATAGAAGT TGCGCCCCTT 
GCATACATGA GAGGAAGAAC TTTGGACGAT TCATTCATTA TACTTGATGA AGCCCAAAAT 
ACCACTCCGG AGCAGATGAA AATGTTTCTT ACGCGAATAG GGTTTGGTTC AAAAGCCGTT 
ATTACCGGTG ATATTACCCA GATAGACCTT CCGGGGGAAA AAAAGTCAGG GCTTGTTGAG 
GTCATGAAAG TGTTAAAGGA CGTAAAGGGT ATTTCTTTTG TCCATTTGTC GGACATGGAC 
GTGGTAAGAC ATGAATTGGT TCAAAGAATT ATCCAGGCAT ATGAAAGATA TGATAGGGAA 
AAGAAGGAAA AGGGCAAAAA GGAAAGCAAG GAAACCAATT AA

Protein sequence

MESLVEVSLE FDRIEHAMNL FGNFDENINI IEDAFNVKII SRDNEIRVVG YSDAVYKAQT 
VLQRLIAMAA QGDIISKQNV SYFVQLAEEN QLDKIKGFTA DFVCLTARGR QIKAKTHGQK 
VYVDAIKEND IVFGIGPAGT GKTFLAVAMA VNAFRNKKVN RIVLTRPAVE AGEKLGFLPG 
DLQNKVDPYL RPLYDALYEM MGAETYHKYL EKGMIEVAPL AYMRGRTLDD SFIILDEAQN 
TTPEQMKMFL TRIGFGSKAV ITGDITQIDL PGEKKSGLVE VMKVLKDVKG ISFVHLSDMD 
VVRHELVQRI IQAYERYDRE KKEKGKKESK ETN