Gene Amir_0449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_0449
Symbol
ID	8324608
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	485657
End bp	487000
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	76%
IMG OID	644940993
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_003098262
Protein GI	256374602
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3525] N-acetyl-beta-hexosaminidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACGCTGC TGCCCGAGCC GGTGTCGGTG GTCTGGGGCG GGGGGACCGT GCCGTGGTCG 
ACGCCGGTCG TGCGGCGCGC GCCAGGACCG GCCGAGGGCT ACCGGATCTC CATCTCCGCG 
GGCGGCGTCC ACGTCGACGC GTCCGACGAC GCGGGCGAGT TCTACGCCCA CCAGACCCTG 
CGCCAGCTGC GCGGACCCGA CGCGTTCCGG GCCGCGCCGA TCCGGCCGGA CGGGCCCGTG 
CCGGTGTGCG AGATCGTCGA CCACCCGGAG CACCGGTGGC GCGGCTGCAT GATCGACGTG 
GCGCGGCACT TCCTGCCCAA GCACGACCTG CTGCGGTACG TGGACCTGCT GGCCGCGCAC 
AAGCTCAACG TGCTGCACCT GCACCTGACC GACGACCAGG GCTGGCGGGT CGAGTCCGAG 
CGCTTCCCGA GGCTGCACGA GGTCGGCGGC TGGCGGCCGG ACTCGCGGTG GGGCGACCGG 
CGCGGCGGGC TGAGCACCGG GAGGCCGCAC GGCGGGTGCT ACACGCGGGA CGACCTGCGC 
GAGGTCGTGG CGTACGCGGC GGCGCGGCAC GTGACCGTGG TGCCGGAGAT CGACGTGCCG 
GGGCACTCGC AGGCGGCCAT CGCGGCGTAC CCGGAGCTGG GCGTCGACGG CGGCGGGGTG 
TGGACCGACT GGGGGGTGAA CCCGCGCGTC CTCAACGGGT CGCAGTCCAC AGTGGACTTC 
TACCGCGCGG TGTTCGACGA GCTGCTGGAG GTGTTCCCCG GCGAGGTGGT CGGCTTCGGC 
GGCGACGAGG CGCCGGGTGG CGACGGGCGG TTCGTGCGCC TGATCGCGGA GCACCTCGTG 
GCGCGCGGGC GCAGGCCCTA CGGCTGGGAC GAGGTGCTGG ACGTCGAGGG GCTGCCGGAG 
GAGACGGTCA TCGCGGCGTG GCGCTCGGAG GAGGCCGTGG AGCGGGCGCT GGAGCGCGGG 
CTGGACGTGG TCGCCTGCCC GGAGCGGCAC GCGTACCTGG ACTACCGGCA GTCCGAGGAC 
GCGGACGAGC CGATCCCGGT GGGCACGGTC CTCACCACCG AGGACGTGCG CGCGTACCGG 
CCGGTGGCCG GGGTGCTCGG CGCGCAGGCG AACATCTGGA CCGAGCACCT GGACAGCCCG 
AGGCGCCTGG ACTACGCCGC GTTCCCGAGG CTCTCGGCGT TCGCGGAGGT GGTGTGGAAC 
CCGGCCCCGG TGGACGGGGC CGGGTTCGCG GCGAGGCTGG GCGCGCACCT GCCCAGGCTC 
GCCGCGCTCG GCGTCGAGTA CCGGCCGCCG GGCGGACCGC TGCCGTGGCA GCGCCTGCCA 
GGGGTGCCCG GTCACCCGCG CTGA

Protein sequence

MTLLPEPVSV VWGGGTVPWS TPVVRRAPGP AEGYRISISA GGVHVDASDD AGEFYAHQTL 
RQLRGPDAFR AAPIRPDGPV PVCEIVDHPE HRWRGCMIDV ARHFLPKHDL LRYVDLLAAH 
KLNVLHLHLT DDQGWRVESE RFPRLHEVGG WRPDSRWGDR RGGLSTGRPH GGCYTRDDLR 
EVVAYAAARH VTVVPEIDVP GHSQAAIAAY PELGVDGGGV WTDWGVNPRV LNGSQSTVDF 
YRAVFDELLE VFPGEVVGFG GDEAPGGDGR FVRLIAEHLV ARGRRPYGWD EVLDVEGLPE 
ETVIAAWRSE EAVERALERG LDVVACPERH AYLDYRQSED ADEPIPVGTV LTTEDVRAYR 
PVAGVLGAQA NIWTEHLDSP RRLDYAAFPR LSAFAEVVWN PAPVDGAGFA ARLGAHLPRL 
AALGVEYRPP GGPLPWQRLP GVPGHPR