Gene Acel_2101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_2101
Symbol
ID	4484954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	2378554
End bp	2379615
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	69%
IMG OID	639730902
Product	alcohol dehydrogenase
Protein accession	YP_873859
Protein GI	117929308
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID	[TIGR02824] putative NAD(P)H quinone oxidoreductase, PIG3 family

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.692182
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATGCGA TCACGATTCG CGGTTTCGGC GGCCCGGACG TCCTCACCTG GACCGAAGTC 
CCCGACCCGG TTCCTGCGTC CGGCGAGGTT GTCATCGATG TTGTCGCCGC CGGGGTGAAT 
CGCGCCGATC TCCTGCAGCG CGAGGGCCAC TACCCCCCGC CGCCAGGCGC GCCCGACATA 
CCCGGCCTGG AATGCGCGGG TGTTATTTCC GCCGTCGGTC CCGGCGTCGA TGGTTGGCAG 
CCGGGCGACC GGGTCTGCGC TCTCCTTGGC GGTGGGGGGT ACGCCGAGCG GGTCGCCGTC 
CGTGCCGACC ACGTCCTCCC GATTCCCGCC GGCGTGACAC TGGTTGAGGC CGCCGCCTTT 
CCAGAGGCCG CCTGCACCGT GTGGTCGACA GTGTTCATGG CCGCCAGGGC CCGGGCCGGC 
GAAACACTCC TCATCCACGG AGGTGCAAGC GGAATCGGCA CCTTCGCGGT GCAACTTGCG 
ACTGCTTGGG GGCTCCGGGT GACGGCGACG GCAGGCACTG CGGAGAAGTG CGAGCGGGTC 
CACGCACTCG GCGCGGAGTT TGTCATCAAT TACCGCACGC AAGACTTCGT GGCGGAAATA 
TCGGCACGCA CCGGGGGACG GGGCGTGGAC GTCGTCCTCG ACATCGTCGG TGGCCCGTAC 
CTGGCCCGCA ACCTCGCGGT CCTGGCGCCG GACGGCCGGA TCGTCGTCAT CGCCCTGCAG 
GGCGGCCGGC GGGCCGAACT CGACCTCGCT GCGCTCATGA CCAAACGCGG CTCGATCTAC 
GCCGCTGGAC TGCGCGCCCG GCCGCCCGAG CAGAAGGCGG AGATCGTGAG CGAGGTGCGC 
ACGCATGTGT GGCCGCTCAT CGGATCCGGC CAAATCCGGC CGGTGATCGA GGCGCAGGTA 
CCGATGCACG AGGCGGCACG TGCGCACCGC ATCCTTGAGG CCGGTCGGCA CGTGGGCAAG 
GTCGTCTTGG TGCACCCCGC GCGGGTCATG ACCGAGACGT CGACACCGCC GGAAGAGACA 
GAGGCGGCAC CGTCGGGTAG GCAGTCGACA CCGCCGAAAT GA

Protein sequence

MHAITIRGFG GPDVLTWTEV PDPVPASGEV VIDVVAAGVN RADLLQREGH YPPPPGAPDI 
PGLECAGVIS AVGPGVDGWQ PGDRVCALLG GGGYAERVAV RADHVLPIPA GVTLVEAAAF 
PEAACTVWST VFMAARARAG ETLLIHGGAS GIGTFAVQLA TAWGLRVTAT AGTAEKCERV 
HALGAEFVIN YRTQDFVAEI SARTGGRGVD VVLDIVGGPY LARNLAVLAP DGRIVVIALQ 
GGRRAELDLA ALMTKRGSIY AAGLRARPPE QKAEIVSEVR THVWPLIGSG QIRPVIEAQV 
PMHEAARAHR ILEAGRHVGK VVLVHPARVM TETSTPPEET EAAPSGRQST PPK