Gene Ccel_0944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0944
Symbol
ID	7309780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	1122427
End bp	1124046
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	35%
IMG OID	643607872
Product	two component transcriptional regulator, AraC family
Protein accession	YP_002505287
Protein GI	220928378
COG category	[T] Signal transduction mechanisms
COG ID	[COG4753] Response regulator containing CheY-like receiver domain and AraC-type DNA-binding domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATAAAG CTATTATTGT TGATGATGAA GATTTGGTAC GCCAAGGTTT AAAAAAACAC 
TTTGATTGGA GCGACCACAA TATTGAGATA GTTGCCGATC TTTCCGATGG CCAGAAGGCA 
TTTCAGTATG TGAAGGACAA TCACGTTGAT TTGGTCCTTA CTGATGTCCT CATGCCTTAT 
ATGGATGGAA TAACATTGGC AAAGAATTTA CGAGAGCTTT ATCCAGAGAT AAAGATAATA 
TTTATTAGTG GTCATGATGA TGTAAGCTAC CTAAAAAATG CACTTAAAGT CGAGGCTGTG 
GACTATATTC TTAAATCCAT CGATTTAGAC GAGCTTAAAG ATACTGTTAG CCGAGTGGTA 
AATACTATGA ATACTGAGAA TCAGAGTAAA AAAACCATGG CTGATATGGA AAATCTATTA 
AATCAGAGTT TTCCACTTTT ACAAGAGCGT TTTTTTATCA CAATGATCCG CGATGATTTC 
GAAAATCCTG ATATAATGAA AGAACGTATA GCATTTTTGA ATATCCCACT CAATGATGAA 
ATGTATTATT GTGTACTAGT AGTGCAAATA CAGCGTATTT ACAGCAAGTT TCATGTCTTA 
ACGGAACGTG AGAGACAAAT TCTTTCCCTT CAGATACAAA ACGAATGTAC AGAAGTTGGT 
AAACAGTATA GTGATACCAT TTGCTTTGAA AATAAACAAG GTGAATATGT TATGATATTG 
TCCTTATTAG AAGATGAATA TGAAGAAACT CTCCTTGAAG TTTCCGAAAA TCTTGACAAG 
CGTCTCAACG GTTATATGAA TTTGCCAGTA TCTATTGGTA TAAGTGACAG ATTTAAAGGG 
CTTGAAAATA TAAAAGCATC TTATGAGAAT GCATCAAATT CCATAAGTAA ACGGTATTTA 
CTTGATGACG AACTGACCAT TTCCGTTGAT AAATACGAAA TGGACGAAAG TCTCAAAGAA 
TATAAGGAAA GAGCTAAAAA GAGTCTGCAA GAATGTTTAA GCTCTGGAAA TACCGAACAG 
GTGTCTGAGG TACTCCGAGA GCTTTTCCAT ATAATAAGAG AAAAATTTCC AGATGATGAA 
GAGCAGAATC TGATGATTTT TTTACTACTA CTCCCAACAC GCATAGTAAC TGATATTAAA 
ATAAATAAAA AAAGTGATTA TTCCAACCAG CGAATGATTT TAGAGAAATT TCTGTGCTGT 
GCGGATTTTG AAGAACAATG CCTTCTGATT CAAAAGCTCT ATTTTGAGGT GGCAACCCTT 
ATGAGCAGCA TGAGCAAAAC ATATTCCCAT ACAATCATCA ATCAGGTGCG AAAGACTATT 
GAGGAACGCT TTAAGGAACA GATATCAATA AGTACATTAG CAAGGGATGT TTACTTAACA 
CCCACATATT TATGCGTTTT GTTTAAACAA GTTACCGGAA CTACAATAAA TGATTATTTA 
ACTCTGACTC GACTTGAGAA AGCAAAGAAG CTTTTATCAG ATCCGTACAT AAAACTGTAT 
GATGTATGTT ATGAGGTTGG CTATTTATCA CCAAGCTATT TTTCCCGTTT ATTTAAGAAA 
TACACAGGAA TCTCGCCTAG CGAATACAGG AATGTTGCAA TAGCATCTTC CGAGCAATAA

Protein sequence

MYKAIIVDDE DLVRQGLKKH FDWSDHNIEI VADLSDGQKA FQYVKDNHVD LVLTDVLMPY 
MDGITLAKNL RELYPEIKII FISGHDDVSY LKNALKVEAV DYILKSIDLD ELKDTVSRVV 
NTMNTENQSK KTMADMENLL NQSFPLLQER FFITMIRDDF ENPDIMKERI AFLNIPLNDE 
MYYCVLVVQI QRIYSKFHVL TERERQILSL QIQNECTEVG KQYSDTICFE NKQGEYVMIL 
SLLEDEYEET LLEVSENLDK RLNGYMNLPV SIGISDRFKG LENIKASYEN ASNSISKRYL 
LDDELTISVD KYEMDESLKE YKERAKKSLQ ECLSSGNTEQ VSEVLRELFH IIREKFPDDE 
EQNLMIFLLL LPTRIVTDIK INKKSDYSNQ RMILEKFLCC ADFEEQCLLI QKLYFEVATL 
MSSMSKTYSH TIINQVRKTI EERFKEQISI STLARDVYLT PTYLCVLFKQ VTGTTINDYL 
TLTRLEKAKK LLSDPYIKLY DVCYEVGYLS PSYFSRLFKK YTGISPSEYR NVAIASSEQ