Gene Acel_0972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_0972
Symbol
ID	4485388
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	1070442
End bp	1071581
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	73%
IMG OID	639729747
Product	glycosyl transferase, group 1
Protein accession	YP_872731
Protein GI	117928180
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.775545
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.23686
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGACGGT TGCTCGTCAT CTCCAACGAC TTTCCGCCCC GGCCGGGTGG CATTCAGGCC 
TTCGTCCACG CCATCGTCAC CCGGTTGGCC GCGCGCGGCT GCCAGGTCAC GGTGTACGCG 
CCGGCTTGGC CGGGGGCGGC GGAGTTCGAT GCCGCCCAGC CATACCCGGT GGTTCGTCAT 
CCGACGTCGC TCATGCTCCC GACGCCGGAC GTTGCCCGCC GGGCCCGCTC CCTCCTGGCA 
GCCACTCAGG CCGACACGGT CTGGTTCGGC GCCGCCGCGC CGCTTGGCTT CCTGGCACCG 
CTCCTCCGAC GCTCCGGAGC ACGCCGGATC GTCGCAAGCA CCCACGGGCA TGAGCTCGCC 
TGGCTCCGCT TCCCCGGCGC GCGGCAGCTC TTCGTGCACC TCGCCCGCCG CCTCGACGTC 
CTCACCTACC TTGGGGCGTA CACGCACCGA CGGCTGGCTC GAGCCATCGG CCCGGGTGCG 
CGGCTTGCCC GGCTCAGCCC GGGTGTCGAT CCGGCCGTCT TCCATCCCGG CGTCGACGGC 
AGCGCTGTCC GCCGCCGCCA CCGGCTCGGA GACGACCCCG TCGTCGTCTG CGTCTCCCGG 
CTGGTGCCGC GCAAGGGCCA GGACATGTTG ATCCGCGCGC TCACACCCCT TCGGCGGCGG 
ATTCCCGGCG CGCGTCTCCT CCTTGTCGGC GACGGGCCGT ACCGGTCTCG GTTGCAGCAG 
CTCGCCGCCC GCTACGCCGT GTCGGACGCG GTGGTGTTCG CCGGGGCGGT GTCCTGGTCG 
GAACTGCCGG CCTACTACGC CGCCGGGAAC GTCTTCGCCA TGCCGTGTCG TGATCGCTGG 
TTCCACTTGG ACGTCGAAGG ATTCGGCATC GTCTACCTGG AAGCAGCCGC GACCGGGCTT 
CCCGTCGTCG CCGGAACGTC GGGCGGAGCA CCCGAAGCGG TTCCGCCGGG CGGCGGTGTC 
GTGGTCGACG GCCGTGATCC GGCCGCCTTG GTGGACGTCC TCGCCGAGCT TCTCTCCGAC 
CCCAAGCGCG CGGCCGAAAT GGGTGAGGCC GCCCGGGCCT GGGTCGTCGC GCACGCGACC 
TGGGACGCCG CGGCGGCGCG GCTCGCGCAG CTGCTCGACG GCGAGCCGGT CGAGTCGTGA

Protein sequence

MGRLLVISND FPPRPGGIQA FVHAIVTRLA ARGCQVTVYA PAWPGAAEFD AAQPYPVVRH 
PTSLMLPTPD VARRARSLLA ATQADTVWFG AAAPLGFLAP LLRRSGARRI VASTHGHELA 
WLRFPGARQL FVHLARRLDV LTYLGAYTHR RLARAIGPGA RLARLSPGVD PAVFHPGVDG 
SAVRRRHRLG DDPVVVCVSR LVPRKGQDML IRALTPLRRR IPGARLLLVG DGPYRSRLQQ 
LAARYAVSDA VVFAGAVSWS ELPAYYAAGN VFAMPCRDRW FHLDVEGFGI VYLEAAATGL 
PVVAGTSGGA PEAVPPGGGV VVDGRDPAAL VDVLAELLSD PKRAAEMGEA ARAWVVAHAT 
WDAAAARLAQ LLDGEPVES