Gene Ccel_1030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1030
Symbol
ID	7309852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	+
Start bp	1282193
End bp	1283233
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	37%
IMG OID	643607957
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_002505372
Protein GI	220928463
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0743662
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTATCTT ATGTTTACCA TACGGATAAA ACATTGGAGC TAAAAGATGT ACCTAAACCT 
ATGTTGAATG GAGAAGGCGC CTTAATTAAA ACTATAGCAT GTTCAATATG CGGAACTGAT 
GTCAGAACCC ATAGATTTGG AAGTACAAAA ATAGATGAGG GCAGGATTAT AGGACATGAA 
GTAGTTGGTG AAATAATCGA ATTGTCTGAG TCCGTAAAAG ATTTCGAAAT TGGTGAACAT 
GTGGCTGTTG CTCCTGCTAT TGGATGCGGT ATTTGCTACA GCTGTAAGAA TGGAAAGACC 
AATATGTGTG AGGATTTGAA AACTATAGGT TTTCAGTATG ATGGTGGGTT TGCTGACTAT 
ATGGTTATTC CCTTACAGGC ATTTAAAATG GGAAATGTAT ATAAGCTGCC CGAGGTTAAA 
GATGATTCAG TATTTACTTT AAGTGAACCG CTGGCTTGTG CTATAAATGC ACAATCGTAT 
TTGAATATTA AACAAGGGGA AGACGTAGTT ATATTTGGCT CAGGTATAAT CGGATGCATG 
CATGCGGAGT TAGCATTGTA TTCTGGTGCA AAAAATGTAA TTATTATTGA AACCTCATTT 
GAAAGGATTA AGCAAGCGAG TAAATTACTT AAAGATGTAA TATTTATTAA TTCGGCTGAA 
ACTGACATTT TTGCTGAAGT AAGCAGACTG ACAGATGGGA AAGGTGCAGA TGTGGCTATA 
ATAGCTTGTT CAGTCGGAAG TGCTCAGGCT GATGGTATGA AAATACTGGC TAAGTGCGGA 
AGAATATCTT TGTTTGGCGG GCTTTCAGGA AATTCTACCG GGTTTATCGA CAGCAATTTA 
ATTCATTACA GAGAAATAAG CGTTTTCGGT GTACACGCAT CAACTCCGGA ACAAAATAAA 
CAAGCAATGG AAATGATTCA TAGTGGAAAA ATAAATGTAG AGAAATATAT TACCGAAAGA 
TATCCGCTTA AAGACATAGA GAAAGCTTTT AAGGATATAG AAGATGGAAG AGTCATGAAG 
GCTGTAATAG TTAACAAATA G

Protein sequence

MLSYVYHTDK TLELKDVPKP MLNGEGALIK TIACSICGTD VRTHRFGSTK IDEGRIIGHE 
VVGEIIELSE SVKDFEIGEH VAVAPAIGCG ICYSCKNGKT NMCEDLKTIG FQYDGGFADY 
MVIPLQAFKM GNVYKLPEVK DDSVFTLSEP LACAINAQSY LNIKQGEDVV IFGSGIIGCM 
HAELALYSGA KNVIIIETSF ERIKQASKLL KDVIFINSAE TDIFAEVSRL TDGKGADVAI 
IACSVGSAQA DGMKILAKCG RISLFGGLSG NSTGFIDSNL IHYREISVFG VHASTPEQNK 
QAMEMIHSGK INVEKYITER YPLKDIEKAF KDIEDGRVMK AVIVNK