Gene Cthe_0129 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0129
Symbol
ID	4808687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	157782
End bp	159299
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	40%
IMG OID	640105540
Product	metal dependent phosphohydrolase
Protein accession	YP_001036563
Protein GI	125972653
COG category	[T] Signal transduction mechanisms
COG ID	[COG2206] HD-GYP domain [COG3706] Response regulator containing a CheY-like receiver domain and a GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAAC ATGTTTCATT GCTCAGGAAA AGATATGTTG ATTTGCGGGA TACATATCTT 
GGCAGTGAGC TGAAAAAAGT TGAGTTGCTT TTTTATATTT CGGTTTCGAT AGCATTGGGG 
CTTATACAAT ATAAGCTGCT AAATTATGAA AATACATACA ACATTCGAGC TTATATCAGC 
CATATACAAT CATGCATTGT GATTCTTATG GCCTTTCGAT TTGGCTATGT GGGACTGGCC 
ACGGCAGTGG TATTGGTTTT GGCTGAAACA ATATTCATAA TTGAAGAATA TTTGGTCAGT 
TTCGATAAAT ATCTTTTACT TGGGCTTACG CTGAAATTCT TTACAATATT TGTAACCAGT 
TTTATTGCAG TACTTACCAA CAGGCAGCAG ATTCAGAAGA AAAGGCTTGA ACGGATGGCA 
ATTACGGATG AATTGACCGG GGCATACAAT CAGAGATTTT TTCACATGGT GCTTGAAAGT 
GAGCTTGAGA AGGCAAAAAA TAATAACGGT TCTGTGAGCC TTATAATGAT TGACATAGAT 
AACTTTAAAA TGTACAACGA TATTTACGGA CGTGACTTTG GTGACAATAT ATTGAGGACA 
ACTGCAACAA TCCTTTCGGA AATTTTGGAC GAAGGCAGCT ATTTGTGCCG ATACGGCGGA 
GATGAATTTG CTGTTATTAC TACAAATACC CGGCTCGATA ATTTAGAGGA TATGGCAAAC 
AATCTTCGCC GGGAGTTTGA AAGACTTAAA CAAAAATATT ACAAACATAA ATTATACGAA 
AAGGTAACAC TGTCCATTGG TTTGTCGGAA TACCCCAACA TGTCGCGGGA CAAAAATGAA 
CTCATTTACC AGGCCGATAC AGCCTTGTAT CATGCAAAGA ACCTGGGAAA AGACAAGGTA 
CATCTCTATC AGGACGCGTT AATGCAAATA CGCAAAAATA TCAGTTCCGA CCACCAGCAG 
CTTATAGGAA TATTCAAGGG ATTGTTGAGT ACCATATCGG CAAAGGATAA ATATACTCAT 
GGACATTGCG AGCGGGTGGC GGCTTATGCG GTGCTGATTG CGGAGGCAAT GGGACTGAGT 
GCAAAAGAAA TCAGCACAAT TCAGTGTGCC GCTTTGTTGC ATGACATTGG AAAGATAGAA 
ATGCCCAGGC ACATATTAAA TAAAAAAGAA GAACTGACTG AAGAGGAAAT AAAATATTTA 
AGACAGCACC CTATATATAG TGAAAACATA CTTGAGCCTT TGGCGGACAT GGACAAGCTT 
ACCGATTATG TAAGGCACCA TCATGAAAGA TATGATGGCA AGGGTTATCC GGACGGCCTA 
AAAGGTAAGG AAATAAGCCT CGGTGCCAGA ATATTGTGTG TTGCAGACTC TTTTGATGCC 
ATGGTGTCCG ACCGCCCGTA CAGTAAAAGC ATGTCAAAGG AAGATGCTTT TAAAGAACTT 
GAGAAAAATG CGGGAACCCA GTTTGATCCG GAAATTGTAG AGATTTTCAT AAAAGCAATG 
AAATCGTATG CCGCATAA

Protein sequence

MNKHVSLLRK RYVDLRDTYL GSELKKVELL FYISVSIALG LIQYKLLNYE NTYNIRAYIS 
HIQSCIVILM AFRFGYVGLA TAVVLVLAET IFIIEEYLVS FDKYLLLGLT LKFFTIFVTS 
FIAVLTNRQQ IQKKRLERMA ITDELTGAYN QRFFHMVLES ELEKAKNNNG SVSLIMIDID 
NFKMYNDIYG RDFGDNILRT TATILSEILD EGSYLCRYGG DEFAVITTNT RLDNLEDMAN 
NLRREFERLK QKYYKHKLYE KVTLSIGLSE YPNMSRDKNE LIYQADTALY HAKNLGKDKV 
HLYQDALMQI RKNISSDHQQ LIGIFKGLLS TISAKDKYTH GHCERVAAYA VLIAEAMGLS 
AKEISTIQCA ALLHDIGKIE MPRHILNKKE ELTEEEIKYL RQHPIYSENI LEPLADMDKL 
TDYVRHHHER YDGKGYPDGL KGKEISLGAR ILCVADSFDA MVSDRPYSKS MSKEDAFKEL 
EKNAGTQFDP EIVEIFIKAM KSYAA