Gene Acel_0447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_0447
Symbol
ID	4485197
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	-
Start bp	480191
End bp	481336
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	70%
IMG OID	639729214
Product	glycosyl transferase, group 1
Protein accession	YP_872207
Protein GI	117927656
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.429575
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGGT TGCGCGTCGC GGTGAACTTG CTCTGGTGCG TGCCCGGCGT GGTCGGCGGC 
ACCGAACGGT ATGCGGTCGA CCTGCTCAAC GCCCTCCGCG GCCGCGACGA CCTGGCGCTC 
ACGCTTTTTG CCACGCCAGA ATTCACCGGC CGCTACCCGG AATTCGCCCG CCATTGCATC 
ACCGCGCCGC TGCCCGCCGG CCGACACGTC GTCCGCCGGG TCGCGGTCGA GCACAGCTGG 
CTCGCTCTCC GCCTCCGGTC GGGGGATTTC GACGTCGTCC ACCATCTCGG CGGGCTGGTG 
CCGACCGCGC CCGTCCCGGC GGTCGTGACC ATTCACGATT TGCAATACCT GGTGTATCCG 
CGGAATTTCT CAATTCTCAA ACGCGCGTAT TTGCGGGCCG CGCAAGGCCG GGCGGTGCGC 
CGGGCCCGGG TAGTCTGCAC GGTGAGCGAG TTCACCGGCC GGCACGTCAG GGCCGCATTT 
CCGGCCGCGG GCCGGGTCGT CGTCATTCCG CCGCTGCTCC TTCCCCCACC AGAACCGACG 
GACGCCGACC GGGAGGCCGT CGATGCGTTG CTCCGCAACG TCGGGACGTT CATCCTCTAT 
CCGGCCGCGT TCTACCCGCA CAAGAATCAC CGCGTGCTCA TCGAGGCTTT CGCGCGGTTC 
GCTCACCGCC GCGCGGTGCA GCTCGTTTTC ACCGGCGCCG CCGGGGCTGG GGCGTGGGGG 
TCGGCGCGGT CGACGGAATC GGAAATCCGT GCGCTGGCGG CTCGGCATCG CCTCAACGAC 
CAGGTGAAAT TCTTCGGCCA CCTGCCCCGG CCGCACCTTG TCGAACTGTA CCGGCGGGCG 
GCTGTGCTTG CTTTTCCGTC CCGTTTCGAG GGTTTCGGCT TGCCAGTCCT GGAGGCGATG 
GCGCACGGCG TCCCGGTGGC CGCCGCCCGG GCCGCGGCGT TGCCGGAGCT GGTCGGTGAC 
GCCGGGCTGC TCGTCGATCC GGACGATATC CTCGGCTGGG CGGACGCTCT GGAGCGACTG 
CTAGACGACG ACGCCGAACG GTGCCGCTGC GCCGACGCGG GCCGACGCCG GGCGGCCGAG 
TTCGCCGCGC CGCGCAGCGT CGACCGGCAG GTGGCGGTGT ACCGGGAGGT GGCCGAGCGG 
AGATGA

Protein sequence

MTRLRVAVNL LWCVPGVVGG TERYAVDLLN ALRGRDDLAL TLFATPEFTG RYPEFARHCI 
TAPLPAGRHV VRRVAVEHSW LALRLRSGDF DVVHHLGGLV PTAPVPAVVT IHDLQYLVYP 
RNFSILKRAY LRAAQGRAVR RARVVCTVSE FTGRHVRAAF PAAGRVVVIP PLLLPPPEPT 
DADREAVDAL LRNVGTFILY PAAFYPHKNH RVLIEAFARF AHRRAVQLVF TGAAGAGAWG 
SARSTESEIR ALAARHRLND QVKFFGHLPR PHLVELYRRA AVLAFPSRFE GFGLPVLEAM 
AHGVPVAAAR AAALPELVGD AGLLVDPDDI LGWADALERL LDDDAERCRC ADAGRRRAAE 
FAAPRSVDRQ VAVYREVAER R