Gene Ccel_0149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0149
Symbol
ID	7309059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	170830
End bp	172407
Gene Length	1578 bp
Protein Length	525 aa
Translation table	11
GC content	34%
IMG OID	643607078
Product	two component transcriptional regulator, AraC family
Protein accession	YP_002504517
Protein GI	220927608
COG category	[T] Signal transduction mechanisms
COG ID	[COG4753] Response regulator containing CheY-like receiver domain and AraC-type DNA-binding domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTAAAG TTTTACTTGT AGATGATGAG CCCATGGCAC TTGAAGCACT AAGAATTGTT 
GCAGATTGGG AAGAGCTTGG GTTTACCGTT TGCGGTGAAT GCAGTAATGG AGATGAGGCA 
TTAAATAAAA TTGAAGATAT AAAGCCCGAC TTAGTGGTAA CAGACTTAAA AATGCCCGGA 
ATGGACGGAC TGGAACTAAT AAGGAAGGTT ATGGAATGTG TAAATTCGGA TATTATATTT 
ATAATTGTAA GCGGCTATGA TGAATTCGAT TATGCAAAAG AGGCTATGCA GTATGGTGTC 
CGCTATTATG TTTTAAAACC CGTATTTAAG GACGAATTTT CAGAAGTACT TTTAGAAATA 
GGAAACAAAC TCAAAAAGAA ATATCAATTA GGTAAAATGA CTATTAATAA CATAAGTACG 
GATATAGGAA GTCTATTGGG AAAATACCTT ATTGGAAGCT TAGGTGAAGA TGAAATTAGG 
GCCAGAATGC CGGAAAAAAT AAGTAAAAGT AAGGCATACT GGTCTTATGT GTGTTTGGGT 
ACACCGCGGG TGTGGGAAAC AGTGAATTTC AAAAACGATG AGATCAGTGA GGACAGCCTC 
AGTACATTTA AAGAGATGGT GAATACAGTC CTTGAAGGTA TATATATTTA CCCGATATTA 
ACAAATACAG TTATTGAAGG TATTGTAATT TGTATTACAA GTGAAATTCA AACGAATAAG 
ATAATAGAAA CCCTAAAATC AAGTGTATCT ACACTCTTTG GGGAAGGATT CTATTTAGGA 
GTAGGAAATA CAGTAAATGA ACTCTCGGAA CTTTCTGAGT CCATGTCTCA GGCTCATAAG 
GCAATAGACT ATAGATTTTT TAGTGCCCCA GGCAGTATTA TCTACTATCA GAACATAAAG 
GATTTTTCAC TAAATTACAG CTTTAAAGGA ATTTACAAAA TTGAGGACAT GTATAAAGCC 
CTTGACAGCC TGGATGAAAT GAGAATAAAA AAAGCAATTG AAGTAGTTTT TTCGGATTTC 
CGCAGGGAAT ATACAGCTCC AGAAATAATC AAAATGTATG TGGTTAACAT TATATATAAA 
AGCATATCTA TAGTAACCAG CTTAAACGGT AGTACAGACC AAATACCGCT CCTGGACTCA 
ATTACCGCAA TTCTTGCAAA AAGTTTGATA ATAGATGAGA TGGAAAACAT GGCACATGAG 
TACTGTTTCA AATTCGTTAT CTATGCAAAG AGCTTAAAAG ATAAAGCTAA AAATTCAGAT 
ATGAAACTTG TTGATGAATA TATAAGGAAT AACTACACAA GAAACCTGAC AATCAGGGAA 
ATTTCCAAGA AACTTTATAT TCATCCCAAC TATCTCGGTC ATCAAATAAA TAAGTGGTTT 
GGATGCAGTT TCAATGAATA TCTTCATGGT CTCAGAATGG AAGAAGCAAA AAATCTGATA 
GAAAATACCA ATCTAAAAGT TCACGAAATA GCTGAAAGAG TCGGATACAG TTCGTATAGC 
AATTTTCTGG ATCAGTTTGT CAAAAGATTC TCCATAAAAC CCAGTGATTA TAAAATTATG 
CTAAATAACA AGAACTAA

Protein sequence

MFKVLLVDDE PMALEALRIV ADWEELGFTV CGECSNGDEA LNKIEDIKPD LVVTDLKMPG 
MDGLELIRKV MECVNSDIIF IIVSGYDEFD YAKEAMQYGV RYYVLKPVFK DEFSEVLLEI 
GNKLKKKYQL GKMTINNIST DIGSLLGKYL IGSLGEDEIR ARMPEKISKS KAYWSYVCLG 
TPRVWETVNF KNDEISEDSL STFKEMVNTV LEGIYIYPIL TNTVIEGIVI CITSEIQTNK 
IIETLKSSVS TLFGEGFYLG VGNTVNELSE LSESMSQAHK AIDYRFFSAP GSIIYYQNIK 
DFSLNYSFKG IYKIEDMYKA LDSLDEMRIK KAIEVVFSDF RREYTAPEII KMYVVNIIYK 
SISIVTSLNG STDQIPLLDS ITAILAKSLI IDEMENMAHE YCFKFVIYAK SLKDKAKNSD 
MKLVDEYIRN NYTRNLTIRE ISKKLYIHPN YLGHQINKWF GCSFNEYLHG LRMEEAKNLI 
ENTNLKVHEI AERVGYSSYS NFLDQFVKRF SIKPSDYKIM LNNKN