Gene Acel_0470 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_0470
Symbol
ID	4484791
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	-
Start bp	504502
End bp	505737
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	71%
IMG OID	639729237
Product	hypothetical protein
Protein accession	YP_872230
Protein GI	117927679
COG category	[S] Function unknown
COG ID	[COG5282] Uncharacterized conserved protein
TIGRFAM ID	[TIGR03624] putative hydrolase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.634716
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.62944
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCAAT TCCCGTTCGG CTTCGGTAAA CCGGACGACG ACCAGCCGGG GTTCGATTTC 
GGTTCCCCCG CCGACCTGAG TGCCGCCCTG CACCGATTCG CCGATCTGCT CTCTTGGTCC 
GGCGGGACGG TCAATTGGGA TCTCGCGCGG GATGTCGCCC GGCAATCTAT CGCCGCCGAC 
GACGTCTCGG TCACCGAAGC CGACCAGCGT GACGTCGCCG AGAGCCTGCG GCTCGCCGAC 
CTGTGGCTGG AGCCGCACAC CGAACTGCCC GGGGCGATAC GCGCCGCGCG GGCCTGGAGC 
CGCGCCGAAT GGATCGAAGC AACCCTGCCG ACGTGGCGGG AACTCGTCGA ACCCGTCGCA 
GCCCGGGTCG TTGAGGCGTT CGGCAGCGAG CTGAGCGCGG GGCTCGCCGG AGAGGCGGCC 
GGTCCCGACG CGGAGCTCCC GGCTCAGCTT CAACAGCTCA CCGGGCCGCT CGCGGCAATG 
ATGCGTCAGG TCGGCGGGGT GATGTACGGC GGTCAGGTCG GCCAGGCGCT CGGCGCCCTG 
GCCCGCGACG TCGTCAGTTC CACGGACGTC GGTCTCCCTC TCGCCGGAGC CGGACAGGCC 
GCCCTCCTCC CCGCCGGGGT CGCCGCGTTC GCCGCCGGTC TGGACGTCCC ACTCACCGAA 
GTGCGGATTT TCCTCGCCCT ACGGGAGGCC GCGTATCACC GGCTGTACGC CGGCACGCCA 
TGGCTGCGGT CCCGGTTGAT CGGTGTCCTC GAGGAGTACG CCCGCGGGAT CACGATTGAC 
ACCGAACGGA TCCGCCAGGC GATGGAGTCC ATCGATCCGA CGCATCCGGA GACCCTGCAG 
GATGCCCTGA TCGGCGGCCT TTTCGAGCCG CAGCGCACCC CCGCGCAGCA GGCGACCCTC 
GACCGATTGG AAACGCTGCT TGCGCTGATC GAAGGCTGGG TGGACGAAGT CACCGACCAG 
GCGGCCCGCG AGCATCTGCC AGCGGCGGCT GGTCTCATCG AAATGGTGCG CCGGCGGCGG 
GCGACCGGCG GCCCCGCGGA GCAGACTTTT GCCGCCCTGG TCGGCCTGGA ACTTCGGCCG 
CGCCGGCTCA GGGACGCCGC AGCGCTCTGG GCTGCGGTGC GTCACGCCCG TTCAGTCGCC 
GGCCGGGACG CGCTGTGGCG CCATCCCGAC CTGTTGCCCA CCGCCGAGGA TCTCGCCGAT 
CCGCTCGGGT TCGTCGAAGG GCTGGACGAG CAGTGA

Protein sequence

MAQFPFGFGK PDDDQPGFDF GSPADLSAAL HRFADLLSWS GGTVNWDLAR DVARQSIAAD 
DVSVTEADQR DVAESLRLAD LWLEPHTELP GAIRAARAWS RAEWIEATLP TWRELVEPVA 
ARVVEAFGSE LSAGLAGEAA GPDAELPAQL QQLTGPLAAM MRQVGGVMYG GQVGQALGAL 
ARDVVSSTDV GLPLAGAGQA ALLPAGVAAF AAGLDVPLTE VRIFLALREA AYHRLYAGTP 
WLRSRLIGVL EEYARGITID TERIRQAMES IDPTHPETLQ DALIGGLFEP QRTPAQQATL 
DRLETLLALI EGWVDEVTDQ AAREHLPAAA GLIEMVRRRR ATGGPAEQTF AALVGLELRP 
RRLRDAAALW AAVRHARSVA GRDALWRHPD LLPTAEDLAD PLGFVEGLDE Q