Gene Ccel_0302 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0302
Symbol
ID	7309194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	348359
End bp	350017
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	43%
IMG OID	643607232
Product	dihydroxy-acid dehydratase
Protein accession	YP_002504669
Protein GI	220927760
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAGTG ATATAGTAAA AAAAGGTATA GAAAAAGCAC CCCATAGATC ATTATTTAAG 
GCTATGGGTT ATACCGATGA AGAATTAGAA AGGCCTTTAA TCGGAGTGGC AAACTCAAAA 
AGTGAAATAA TACCCGGACA CATACATCTT GATAAATTAA CAGAAGCTGT AAAAGCCGGA 
ATCAGGATGG CAGGCGGTAC ACCGATAGAA TTCGGTGCAA TAGGTGTATG CGATGGGATA 
GCAATGGGGC ATACAGGGAT GAAATACTCT CTGGCAACTA GAGAACTAAT CGCCGATTCA 
TGTGAAGCAA TGAGCAAGGC CCACAGCTTT GATGGAATGG TTTTCATTCC CAACTGTGAC 
AAGATTGTAC CAGGCATGCT GATGGCTGCA GCAAGAATAA ATATTCCATC CATAGTTATC 
AGTGGCGGGC CAATGCTTTC CCTTAACAGG GATGGTAAAC AGCTTGATCT CAACAGTCTG 
TTTGAAGCGG TTGGTTCATA TAAAGCAGGA ACGATGACAA AGGAAGAAGT GGATGATATT 
GAAGACCACG CATGTCCTGG CTGCGGTTCA TGCTCGGGGA TGTTTACGGC AAATTCCATG 
AACTGCCTTA CAGAAGTCCT CGGTATGGGG CTTACAGGAA ACGGAACAAT ACCTGCCGTG 
TACGCAGAGC GTATAAGACT GGCAAAGTAT GCAGGAATGA AAATAATGGA GCTGGTTGAA 
AAAGACATTA AACCTTCAGA CATACTCACA AATGAAGCTT TTGAAAATGC ATTAACTGTG 
GATATGGCAC TTGGTTGTTC AACAAACTCA GTACTTCATC TTCCTGCTAT TGCAAATGAA 
TTAGGAATAG AGATAAACCT AGATATTATT AATGAAATCA GCTCAAGGAC TCCGAATCTG 
TGTAAGTTGG CTCCGGCCGG AAAATATCAT ATACAGGATT TATACAGTGC AGGCGGGGTT 
CAGGCCGTTA TGAGTGAGCT GGCAAAAAAA GATCTGCTTC ACCTTGATTT AGTTACGGCA 
ACAGGTAAAA CTATAAGAGA AAATATTCAG AATGCAAAAG TAAAGGACTA TGAAATAGTT 
AAAAGCATAG ATACACCATA CAGTGCTACC GGAGGGATAG CTGTATTAAG GGGTAATATT 
GCACCTGATG GAGCAGTAGT CAAAAAGTCG GCTGTAGCTG AAAAGATGCT GATTCACACG 
GGGCCTGCAA GAGTATTTGA CAGTGAGGAT GAAGCAATTA CGGCTATCTA TAGCGGGCAG 
ATAAATAAAG GTGATGTAGT AATTATACGT TACGAAGGCC CCAAGGGGGG GCCGGGTATG 
AGAGAGATGC TTAGCCCTAC ATCCGCTATT GCGGGTATGG GACTGGACAG CGATGTTGCA 
CTAATCACAG ACGGTAGGTT TTCAGGTGCA TCCAGAGGTG CATCAATTGG TCATGTATCA 
CCTGAGGCAA TGGAGGGCGG CCCAATAGCA CTGGTTCAGG AAGGTGATAT TGTAGATATC 
GACATACCTG CAGGACGCAT AAATATTCAG GTAACCAATG AAGAAATGGT AAAGCGTAAA 
GAGTCATGGA AAGCTCCAAA GCCCAAGATA ACCACAGGAT ATCTTGGCAG ATATGCCAGA 
CTGGTTACCT CTGCAAGTAC AGGAGCAGTC CTAAAGTAA

Protein sequence

MRSDIVKKGI EKAPHRSLFK AMGYTDEELE RPLIGVANSK SEIIPGHIHL DKLTEAVKAG 
IRMAGGTPIE FGAIGVCDGI AMGHTGMKYS LATRELIADS CEAMSKAHSF DGMVFIPNCD 
KIVPGMLMAA ARINIPSIVI SGGPMLSLNR DGKQLDLNSL FEAVGSYKAG TMTKEEVDDI 
EDHACPGCGS CSGMFTANSM NCLTEVLGMG LTGNGTIPAV YAERIRLAKY AGMKIMELVE 
KDIKPSDILT NEAFENALTV DMALGCSTNS VLHLPAIANE LGIEINLDII NEISSRTPNL 
CKLAPAGKYH IQDLYSAGGV QAVMSELAKK DLLHLDLVTA TGKTIRENIQ NAKVKDYEIV 
KSIDTPYSAT GGIAVLRGNI APDGAVVKKS AVAEKMLIHT GPARVFDSED EAITAIYSGQ 
INKGDVVIIR YEGPKGGPGM REMLSPTSAI AGMGLDSDVA LITDGRFSGA SRGASIGHVS 
PEAMEGGPIA LVQEGDIVDI DIPAGRINIQ VTNEEMVKRK ESWKAPKPKI TTGYLGRYAR 
LVTSASTGAV LK