Gene Acel_0890 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_0890
Symbol
ID	4485722
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	981548
End bp	982621
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	64%
IMG OID	639729665
Product	protein of unknown function DUF1100, hydrolase family protein
Protein accession	YP_872649
Protein GI	117928098
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.712139
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGGATG AGCGCGTAAG AATCGCGATT GAGAATTGGG GCCCCCGCTT CACGACGAAC 
GGGGTGACGT ACAGCGACTT CCACGAGGTG CTCAGTCGCA TCACCACGTG GGAGGAGTGG 
TGCTCGGCGT GGTGCACCGC CGCGGAGCCG TACGTGGAAC TGGGCAGAGC GGCGCTTGAC 
GAGGGGCGTA CGTTGTCCGC AGGAGATCAC TTCTCGCAAG CAGCCGTGTA TTATCACTTT 
GCGAAGTTTC TCTTCGTCGA TGACATGGAA CAAATGCGCG CTGCGCACCA GAAGGCCGTG 
GAGTGTCTCA CCACCGCCCT GCCCTATCTC GATCCGCCGG GTCGGCGCAT CACCGTTCCG 
TTTGAAGGCG CGCGGATGGT CGGCATCCTG CGCCTGCCGC GCGGCGAGCC GCCTTTCCCC 
GCGGTCATGC TCATTCCGGG GCTTGACTCA ACCAAGGAGG AGTTCCGTTC CACCGAGCAA 
CTCTTCCTGC AGCGTGGATT GGCGACATTC TCTGTCGACG GACCCGGCCA AGGCGAGGCC 
GAGTACGACT TACCGATCCG GCCGGACTGG GAGGTTCCAG GCGCGGCGTT GCTCGATGCC 
CTGGCTTCTC AACCTGAGAT TGATCCAGCC CGGCTGGGGA TCTGGGGCGT TAGTCTCGGA 
GGTTATTACG CTCCGCGGCT GGCTAGCGGT GATCAACGTG TCAAGGCGTG TATCGCCCTT 
GCCGGACCCT GGAACTTTGG TGCGTGTTGG GACGGACTCA ACGAGTTGAC CCGGGCGGCG 
TTCCGGGTCC GATCGCGGAG TCGTTCCGAC GAGGAGGCAC GCGCAAAAGC CGCCCAACTG 
ACGCTCGACG GCCGCGCGGA AAGGATTCGC TGCCCCTTAC TCGTCGTTGC CGGAAAGCGG 
GATCGACTGA TTCCTTGGCA GGATGCGGTC AGACTCGCCG AGGCGGCAGG GTCGCAGGCG 
GAATTGCTCC TGCTGGAGAA CGGAAATCAC GGCGGCATGA ACGTTGCTGC GCAGCATCGG 
CAGCGATCGG CGGATTGGAT GGCCCGCATT CTCGGCGGGC GAGTGGCCGG ATGA

Protein sequence

MVDERVRIAI ENWGPRFTTN GVTYSDFHEV LSRITTWEEW CSAWCTAAEP YVELGRAALD 
EGRTLSAGDH FSQAAVYYHF AKFLFVDDME QMRAAHQKAV ECLTTALPYL DPPGRRITVP 
FEGARMVGIL RLPRGEPPFP AVMLIPGLDS TKEEFRSTEQ LFLQRGLATF SVDGPGQGEA 
EYDLPIRPDW EVPGAALLDA LASQPEIDPA RLGIWGVSLG GYYAPRLASG DQRVKACIAL 
AGPWNFGACW DGLNELTRAA FRVRSRSRSD EEARAKAAQL TLDGRAERIR CPLLVVAGKR 
DRLIPWQDAV RLAEAAGSQA ELLLLENGNH GGMNVAAQHR QRSADWMARI LGGRVAG