Gene Amir_1091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_1091
Symbol
ID	8325265
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	1212320
End bp	1213867
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	75%
IMG OID	644941637
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_003098893
Protein GI	256375233
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3525] N-acetyl-beta-hexosaminidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGGGCGG CCAGCACCGC GCCCCCGCCG AGCCGAGCGC GGGGGCGCCG AACCGCCGCG 
GAGAGCCCCT TGCACACGAT CGTGCCAGCG CCCGTCCTGG TTGAGCCGCG CCCCGGCGCC 
GCGTTCACCC TCGCCCCCGA CGCCGAGGTC CGCGTCCCGC CCGGCTCACC CGGCGCGCGC 
GACGTCGGCG AGCTGCTGGC GGAGCTGCTG CGCCCGGCGA CCGGCTACCC GCTCCCGGTG 
GTGGAGGGCG CGACCGGACC GGGCGTCGTG CTGCTGCTGG AGGGCGCCGC CGCCGAGGTC 
GGCGACGAGG GCTACGAGCT CGACACCGCC GGGGACACCG CCGTGCTCAG GGCGAACACC 
CCGGCGGGCC TGTGGTCCGG GGTGCAGACG CTGCGGCAGC TGCTGCCCGC CGCCGTCGAG 
AGCCCGGAGC GGCAGGACGG CCCGTTCACC GCGCCCGCCG TGCACGTGCT CGACCACCCG 
CGCTTCCCGC ACCGGGGCGT GATGCTGGAC GTGGCCAGGC ACTTCTTCGG CGTCGACGAC 
GTCAAGCGCT ACCTGGACCT GGCCGTCGCG CACAAGGTCA ACACCCTGCA CCTGCACCTG 
AGCGACGACC AGGGCTGGCG CCTGGAGGTC GAGAGCTGGC CGAACCTCAC CGCGCACGGG 
TCGACCAGCT CGGTCGGCGG CGGCCCCGGC GGCTTCTACA CCCAGGACGA GTACCGCGAG 
ATCGTCGCGT ACGCCGCCCG CAGGCACGTC GTGGTCGTGC CGGAGATCGA CCTGCCCGGC 
CACACCGCCG CCGCGCTGTC CTCCTACCCG GAGCTGAACC CCGACGGCGT CGCGCCCAAG 
CTCTACACCG GCATCGAGGT CGGCTTCTCC ACCCTCGACA TCGCCTCCGA GACCACCTAC 
CGGTTCGTGG CCGACGTGCT GCGCGAGGTC GCCGCGCTGA CCCCCGGCCC GTACCTGCAC 
ATCGGCGGCG ACGAGGCGTT CGCGACCGAG GCCGGGGACT ACCGGGCCTT CATGGCGCGG 
GTGCTGCCCA TGGTCGAGGA GCACGGCAAG CGCGCCATGG GCTGGTCCGA GTTCACCCGC 
GCCGACCTGC CCGCGACGGC GGTCGCGCAG TACTGGGACA CCGGGCGGCC CGCGGGTCCC 
GAGCTGGCCG AGGCGGCGGC GCGCGGGGTG CGGTTCGTGC TGTCCCCGGC GAACCGGGTC 
TACCTGGACA TGAAGTACGC CGAGCAGACC GAGCTGGGCC TGAAGTGGGC CGGGACCGTG 
GAGGTCGACG CCACCTACGG CTGGGACCCG GCGACCCTGC TGGACGGGGT GCCGGAGTCG 
GCGGTGCTGG GCGTGGAGGC CCCGCTGTGG ACCGAGACGC TCACGACGAT GAGCGAGCTG 
GAGCTCATGG CCTTCCCGCG CCTGGCCGCG GTGGCCGAGG TGGGCTGGAC CGCCGCGACC 
GGCCGGGACT GGGCGGACTT CCGGTCCCGG CTGGCCGCGC AGGGCCCGAG GTGGGAGGCG 
AAGGGCGTGG CCTTCCACCC CTCACCCACC GTCCCGTGGC AGGGCTGA

Protein sequence

MGAASTAPPP SRARGRRTAA ESPLHTIVPA PVLVEPRPGA AFTLAPDAEV RVPPGSPGAR 
DVGELLAELL RPATGYPLPV VEGATGPGVV LLLEGAAAEV GDEGYELDTA GDTAVLRANT 
PAGLWSGVQT LRQLLPAAVE SPERQDGPFT APAVHVLDHP RFPHRGVMLD VARHFFGVDD 
VKRYLDLAVA HKVNTLHLHL SDDQGWRLEV ESWPNLTAHG STSSVGGGPG GFYTQDEYRE 
IVAYAARRHV VVVPEIDLPG HTAAALSSYP ELNPDGVAPK LYTGIEVGFS TLDIASETTY 
RFVADVLREV AALTPGPYLH IGGDEAFATE AGDYRAFMAR VLPMVEEHGK RAMGWSEFTR 
ADLPATAVAQ YWDTGRPAGP ELAEAAARGV RFVLSPANRV YLDMKYAEQT ELGLKWAGTV 
EVDATYGWDP ATLLDGVPES AVLGVEAPLW TETLTTMSEL ELMAFPRLAA VAEVGWTAAT 
GRDWADFRSR LAAQGPRWEA KGVAFHPSPT VPWQG