Gene Acel_0035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_0035
Symbol
ID	4484528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	-
Start bp	39359
End bp	40534
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	69%
IMG OID	639728795
Product	putative aminotransferase
Protein accession	YP_871797
Protein GI	117927246
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCACCC GGGAGATATC CGACTCCGCA CCGCGACCCG GCGCTCGACC TTTCCCACGC 
GCCGACCTGC GAGGCATCCC GACGTACAAG CCCGGCCGGC GGCCGGCCAC CGGCCGGCGC 
GCGTACAAGC TCTCCTCGAA CGAATCCCCC TACCCGCCGC TGCCCAGCGT GCTCGACGCG 
ATCGCCCAGG CGAGCGACAC CATCCACCGG TACCCGGACC TGCTCAGCTC GGATCTGGTC 
GCCGCGATCG CGCACCGGTT CGGCGTCCCG GAAAGCCACG TCGTTGTCGG ATGCGGTTCG 
GTGGGGCTCG CCACGCAGAT CGTGCAGGCG TTCGCTGGAC CCGGCGACGA AGTGGCCTAC 
GCCTGGCGTT CCTTCGAGGC CTACCCGATC ATCGTGCAGG TTGCCGGTGC GGTGAGCATC 
CAGATACCTC TGCGCCCCGA CGGCGTACAC GATCTCCCTC GCCTGGCCGC CTCAATCACG 
CCGAAGACCC GCGTCGTCTT CATCTGCAAC CCCAACAACC CCACCGGAAC CGTCGTCGGC 
GCCGACGCCC TGCTTCGGTT CCTCGACGCC GTACCCGCCG GTTGCCTGGT CGTCCTCGAC 
GAGGCGTACC GCGAATTCGT CACCAACCCC GACAGTCCGG ACGGCATCAC CCTCTACCGT 
GACCGTCCGA ACGTCGTCGT ACTCCGCACG TTCTCCAAGG CGTACGGGCT GGCCGGCCTG 
CGTGTCGGAT ATGCGATTGC CCAGCCTGAG ATCGTCGACT CCATCCGGAT CACCGACGTC 
CCGTTCTCCA CCAATGCCCT TGGGCAGGCA GCTGCGCTCG CCTCGCTCCA ACCGGCCGCG 
GAAGCCGAGC TCATGGCCCG GGTACAGGCC ACAGTCTCCG AGCGGGAGCG GATCGTCGCC 
GCATTACGGG CCGCCGGTTG GGACATTCCC CAGCCGGAAG GAAACTTCGT CTGGCTTCCC 
ACCGGCGACC GAACCGAGAG CTTCGCGGCC GCATGCGAAG CCGCGGGAGT GATCGTACGG 
CCCTTCGCCG GTGAGGGAGT ACGCGTCACC ATCGGCGAAC CCGAGGCCAA CAACCTCTTC 
CTGGACGTCG CCCGCGCCCA CGGTCCCGCG CCCACCGCGC CAACGGCCCA TGGGGCTGCT 
CAGCCCAGCC CGTCAGGCCC AGATGAACCA GCCTGA

Protein sequence

MTTREISDSA PRPGARPFPR ADLRGIPTYK PGRRPATGRR AYKLSSNESP YPPLPSVLDA 
IAQASDTIHR YPDLLSSDLV AAIAHRFGVP ESHVVVGCGS VGLATQIVQA FAGPGDEVAY 
AWRSFEAYPI IVQVAGAVSI QIPLRPDGVH DLPRLAASIT PKTRVVFICN PNNPTGTVVG 
ADALLRFLDA VPAGCLVVLD EAYREFVTNP DSPDGITLYR DRPNVVVLRT FSKAYGLAGL 
RVGYAIAQPE IVDSIRITDV PFSTNALGQA AALASLQPAA EAELMARVQA TVSERERIVA 
ALRAAGWDIP QPEGNFVWLP TGDRTESFAA ACEAAGVIVR PFAGEGVRVT IGEPEANNLF 
LDVARAHGPA PTAPTAHGAA QPSPSGPDEP A