Gene Acel_1100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1100
Symbol
ID	4485763
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	1217860
End bp	1219341
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	65%
IMG OID	639729875
Product	betaine-aldehyde dehydrogenase
Protein accession	YP_872858
Protein GI	117928307
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.486917
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCGTA CGACGTCCGT CAGCGGAATT GAGGTTTCCG TTGACCACTG GGTGGGCGGC 
GAACGCCTCG CGTCGGATGC GACGTTCCCT GACATTTCAC CGCTTGATCA GCAGGTTCTC 
GCCAATGTCG CCCGCGGCGG ACCGCGGGAA GTGAGCGCCG CGGTCGACGC CGCTTCGGCG 
GCGTTTCCGC AATGGGCGGC GACACCGCGC ACCGAGCGGG CCGCCCTCCT GCACGCCGTA 
GCGGAAGGCA TCGAGAAGCG TGTCGACGAT CTCGCACTCG TCGAAACGTT GGACAACGGG 
GGGTTGCTCC GGTCCCATCG TCGGAGTGTG ATTCCCCGCG CCGCGTATAA CTTTCATTTC 
TTTGCGGATT TTCTCTTGCA GCTCGGTCAT GAGGATTTCG AGACACGAGG ACATAGAAAC 
CACATTTCGT GGCAACCGGC AGGAGTCACG GCGGTCATCA CGCCGTGGAA TGCACCGTTG 
ATGCTCGCCA CCTGGCGGGT CGCACCCGCC CTAGCCGCCG GCAATACCGT CGTGCTCAAG 
CCCCCGGAGT GGGCGCCGTT GACGGCATCA CTCCTCGCCG ACATTACCGC TGAAGCCGGG 
CTGCCGCCAG GCGTCTTTAA CGTCGTGCAG GGTATTGGGG AGGAGGCCGG TGCCGCACTG 
GTGCGCGATC CCCGGGTACG CCGTATCGCC TTCACCGGCT CGGTTGCGAC CGCGCGCGCC 
ATCGGTCACG CGGCAGCGGA GAACGTCATC CCCGTCTCCT TCGAGCTGGG AGGCAAGAAT 
CCGTTCATTG TCTTTCCCGA CGCCGACCTG GACCTCGCTG TACGACACGC GGTGGATCAG 
TACGACAACG CCGGCCAGGT CTGTCTCGCC GGCACGCGAT TGTACGTCGC CGACGCCGTC 
TACGACGAAT TCCTTGAGCG GTTTCTCCAG GCGGCTGCGG CGTGGCGGGT AGGGGACCCG 
CGCAGCGAAG ACGTCGACAT GGGCCCGCAG ATTCATCCCG ACCATCTTGC GCGCATTGAC 
GGATACGTCC GCCGCGCGAA AGCCGCCGGG GCGACGGTCC TACTCGGCGG CGGCCCGCAT 
CCGGAGCTGG GCGGTCTGTA CTACCAACCC ACCTTATTGA CGAATGTTGC CGATGACAGT 
GAGATCAACC GCGAAGAAGT CTTCGGTCCT GTCATTGTCC TGCATCGATT TACGGACGAA 
GACGAAGTCA TCCGGCGTGC GAACGACAAT ATCTATGGGC TCGCGGCGAT GGTCTTTACC 
GGCGACCGGT CACGGGCGGA GCGCGTCGCG GACCGGCTGG TCGCCGGCAC CGTCTGGGTG 
AACTGCTTCT ACGTCCGCGA CTTGCGGGCG CCGTTCGGCG GCGCGCGGTT GTCCGGTATC 
GGCCGGGAAG GCGGCACCTG GTCGTTCGAC TTCTACGCGG AGGTCAAGAA CACGGTGACC 
GCCCCGAGCG GCTGGTTGAT AAAGGAGGCG AATGGTGGGT GA

Protein sequence

MPRTTSVSGI EVSVDHWVGG ERLASDATFP DISPLDQQVL ANVARGGPRE VSAAVDAASA 
AFPQWAATPR TERAALLHAV AEGIEKRVDD LALVETLDNG GLLRSHRRSV IPRAAYNFHF 
FADFLLQLGH EDFETRGHRN HISWQPAGVT AVITPWNAPL MLATWRVAPA LAAGNTVVLK 
PPEWAPLTAS LLADITAEAG LPPGVFNVVQ GIGEEAGAAL VRDPRVRRIA FTGSVATARA 
IGHAAAENVI PVSFELGGKN PFIVFPDADL DLAVRHAVDQ YDNAGQVCLA GTRLYVADAV 
YDEFLERFLQ AAAAWRVGDP RSEDVDMGPQ IHPDHLARID GYVRRAKAAG ATVLLGGGPH 
PELGGLYYQP TLLTNVADDS EINREEVFGP VIVLHRFTDE DEVIRRANDN IYGLAAMVFT 
GDRSRAERVA DRLVAGTVWV NCFYVRDLRA PFGGARLSGI GREGGTWSFD FYAEVKNTVT 
APSGWLIKEA NGG