Gene Acel_1850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1850
Symbol
ID	4486648
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	-
Start bp	2091700
End bp	2093061
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	66%
IMG OID	639730640
Product	betaine-aldehyde dehydrogenase
Protein accession	YP_873608
Protein GI	117929057
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.92194
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGATA TATCAGTAAT CGACCCGGCG ACCGAACAAG TTATTGACAC GGTGCCGGCG 
GCCGACGAAG AGGCGGTGGA TGCCGCTGTC GCCCGCGCCT CTCGTGCGTT TGCCGAGTGG 
CGTCGGGTGA CACCCGCCGA TCGCAGCCGG TTGCTGCGCC GGTTCGCGGA GGTCGTGGAC 
GGGCATCTGG AGGAACTTGC CCGCCTGGAG GTGCGCAACG CCGGTCATAC GATCCGCAAC 
GCGCTCGGCG AGGCCGCCAA TGTGCGCGAC GTCCTTGCCT ACTACGCCGG TGCACCGGAG 
CGGCTCCTCG GTGAGCAGAT TCCCGTCGCA GGCGGCGTTG ACGTTACTTT TCATGAGCCG 
CTCGGCGTGG TCGGAATCAT CGTTCCGTGG AACTTTCCGA TGCCGATCGC CGCATGGGGC 
TTTGCCCCTG CGCTGGCCGC CGGCAATACC GTCGTGCTCA AACCCGCCGA ACTGACGCCG 
CTGACCGCGC TGCGGCTCGG TGAACTCGCG CTCGAGGCGG GAATCCCCGA AGGCGTTTTC 
ACCGTCCTGC CGGGCAAGGG TTCGGTGGCC GGCGAACGGT TGGTCTGCCA CCCGCTGGTC 
AGGAAGATCT GCTTCACCGG TTCGACGGAG GTGGGCAAGC GCATCATGCG GCTGGCCGCG 
GACGGCGTGA AGCGCATCAC CTTGGAGCTT GGCGGAAAGA GCGCAAACAT TGTCTTTGCC 
GACGCGGATC TCGAGCGTGC GGCGGCGGCG GCGCCGTACG CGGTCTTTGA CAATGCCGGC 
CAGGATTGCT GCGCCCGCAG TCGGATTCTC GTCCAGCGCC GTGTGTACGA CGAATTCCTC 
GCCCTGTTCC AGAAAGCGGT GGCCGGCGTC GTGGTTGGGC CGCCCGGCGA CGAGCGGACC 
GAGATGGGAC CACTCATTTC CGCGCAGCAG CGCGACCGCG TCGCACGCTT CGTCGTCGAG 
GATCACGTGT TGTTCCGCGG CACGGCGCCT GCGGGAGCCG GATTCTGGTT TCCGCCGACG 
GTGGTGGCAC CCGCCGGTAC CGACGATCCC GTCTGGCGGG AAGAAGTTTT CGGGCCCGTC 
GTCGCCGTCC TGCCGTTCGA TGATGAGGAC GACGCGATCC GGATGGCGAA CGACACGGCG 
TACGGGTTAT CCGGCTCGAT CTGGACCCGC GACGTCGGCC GGGCCTTCCG CGTAGCGCGC 
GGCGTTGAGT CCGGAAATCT GTCGGTCAAT TCCAACACCT CGGTGCGGTA CAACACGCCG 
TTCGGTGGTT TCAAGCAATC GGGACTCGGG CGGGAGCTCG GGCCCCATGC GTTGGAGAGT 
TTCACGGAGA TCAAGAACGT TTTCATCGCA ACGGAGGAGT GA

Protein sequence

MTDISVIDPA TEQVIDTVPA ADEEAVDAAV ARASRAFAEW RRVTPADRSR LLRRFAEVVD 
GHLEELARLE VRNAGHTIRN ALGEAANVRD VLAYYAGAPE RLLGEQIPVA GGVDVTFHEP 
LGVVGIIVPW NFPMPIAAWG FAPALAAGNT VVLKPAELTP LTALRLGELA LEAGIPEGVF 
TVLPGKGSVA GERLVCHPLV RKICFTGSTE VGKRIMRLAA DGVKRITLEL GGKSANIVFA 
DADLERAAAA APYAVFDNAG QDCCARSRIL VQRRVYDEFL ALFQKAVAGV VVGPPGDERT 
EMGPLISAQQ RDRVARFVVE DHVLFRGTAP AGAGFWFPPT VVAPAGTDDP VWREEVFGPV 
VAVLPFDDED DAIRMANDTA YGLSGSIWTR DVGRAFRVAR GVESGNLSVN SNTSVRYNTP 
FGGFKQSGLG RELGPHALES FTEIKNVFIA TEE