Gene Acel_0259 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_0259
Symbol
ID	4486330
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	277523
End bp	278677
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	64%
IMG OID	639729022
Product	hypothetical protein
Protein accession	YP_872019
Protein GI	117927468
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR00423] radical SAM domain protein, CofH subfamily

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.341096
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATCCCG GGCTCCAGCG TGAGATCGAA GCCAAGGTTC TGGCAGGGGA GCGCCTGAGC 
TTCGCGGACG GCGTCGCCCT CTACGAGTGC GACGACTTGG CCTGGCTCGG TGAGCTCGCC 
CACGCCGTGC GGACCAGGCT CAATGGGGAT TACGTCTACT TCAATGTGAA CCGGCACCTG 
AACCTGACCA ACGTCTGCGC GGCGTCCTGC GCATACTGCA GTTTTCAACG CAAGCCGGGC 
GAGCCGGACG CGTACACGAT GCGGGTCGAG CAGGCGGTCG AGCTCGCCCG GCAGATGGAA 
CCGGAAGGCA TCACCGAGCT GCACATCGTC AACGGTTTGC ATCCCACCCT GCCCTGGCGC 
TATTACCCCC GCATGCTGCG GGAACTGAAG AAGGCGCTGC CGAACGTGGC GCTGAAAGCG 
TTCACCGCGA CGGAAATTCA TTGGTTCGAG AAGATTTCCG GACTCCCGGC CGATGAGATT 
CTCGACGAGC TCATCGACGC CGGACTGGAA TCACTGACCG GCGGCGGCGC GGAAATCTTT 
GATTGGGAAA TCCGGCGGCG CATCGTCGAC CATGACACCC ACTGGGAGGA CTGGTCACGG 
ATTCACCGCC TCGCGCACGC CAAGGGACTC CGGACGCCGT GCACGATGCT CTACGGTCAC 
ATCGAAGAAC CGCGGCACCG GGTCGACCAC GTCCTGCGGC TGCGTGAGCT GCAGGACGAG 
ACCGGCGGTT TCGTCGTCTT CATCCCGCTG CGTTTCCAGC ACGACCCCAA CGGCGATCCG 
CGGAATCGGC TCGCCACTCA GCCGATGGCG ACCGGGGCCG AGGCGCTGAA GACCTTCGCG 
GTCTCCCGTC TGCTCTTCGA CAATGTGCCG CACGTCAAGG CGTTCTGGGT GATGCACGGT 
TTGACGACGG CTCAGCTGGC GTTGTCGTAC GGCGCGGATG ATCTCGACGG TTCGGTGGTG 
GAGTACAAAA TCACCCATGA CGCGGACCAC TACGGAACGC CGAATGTGCT GCACCGGGAA 
GACCTTCTCG AACTGATCCG GGACGCTGGT TTCGTCCCCG TGGAACGCGA CACCCGCTAC 
AACGTCCTCC GCGTCTATCC CGGTCCGGAT CCGCACCGCC GCGACGTGCC GCAACCGATG 
CCGACCGCCG TATGA

Protein sequence

MDPGLQREIE AKVLAGERLS FADGVALYEC DDLAWLGELA HAVRTRLNGD YVYFNVNRHL 
NLTNVCAASC AYCSFQRKPG EPDAYTMRVE QAVELARQME PEGITELHIV NGLHPTLPWR 
YYPRMLRELK KALPNVALKA FTATEIHWFE KISGLPADEI LDELIDAGLE SLTGGGAEIF 
DWEIRRRIVD HDTHWEDWSR IHRLAHAKGL RTPCTMLYGH IEEPRHRVDH VLRLRELQDE 
TGGFVVFIPL RFQHDPNGDP RNRLATQPMA TGAEALKTFA VSRLLFDNVP HVKAFWVMHG 
LTTAQLALSY GADDLDGSVV EYKITHDADH YGTPNVLHRE DLLELIRDAG FVPVERDTRY 
NVLRVYPGPD PHRRDVPQPM PTAV