Gene Saro_1091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1091
Symbol
ID	3916387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1134430
End bp	1135497
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	68%
IMG OID	640443826
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_496370
Protein GI	87199113
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGGCGCTC CGGGCCTTGC AAATGGCCAT GGCATCCGCG AATCCACCAC CATGCTTCCG 
GCGATCTTCG GGCTTTCGGG CCTGACCCTG ACTGAAGACG AACGCGCCTT CTTCCGCGAT 
GCGGACCCGG CGGGATATAT CCTGTTCGGT CGGAATGTGG AAAGCCCGGC GCAGCTTCGC 
GCCCTGACGG ACGAGCTGCG CGCGCTGCAT GGCCGTGACC GCACTTTCAT CTGCATCGAT 
CAGGAAGGCG GGCGCGTCGC GCGGATGAAG CCGCCGGTCT GGCAACCCTA TCCTCCCGGC 
GAGCGGTTCG ACCGGCTCTA CGACATCGCC CCTGCCAGCG CGATCGAGGC TGCGCGCGCC 
AATGCCGAAG CGCTGGGCCT CGATCTGGCG GAAGCGGGGA TCAGCGTCGA TTGCCTGCCG 
CTGCTCGACG TCCGCCAGCC GGGCGCGCAC GACGTCATCG GGGACCGTGC GCTCGGTTCG 
GAACCGATGC GCGTTGCGGC GCTCGGAAGG GCAACGCTCG ATGGGCTGGC GCGCGCGGGA 
ATTGCGGGCG TGGTCAAGCA CATGCCGGGC CATGGCCGCG CGCTGGTCGA TAGCCACAAG 
GAACTGCCCA CGGTCTCTGC CAGCGCCGAG GAGCTGGAAA TGGACCTCGC TCCGTTCCGC 
GCCCTGCGCG ATGCCACCAT CGGCATGACC GCGCACCTGC GGTTCCTCGC ATGGGATGAC 
TGGAACCCGG CGACGCACTC GCCCTTCGTC ATCGAGGAGA TCATCCGCAA GGCGATCGGC 
TTCGACGGGC TGCTCCTGAC CGACGATCTC GATATGCAGG CGCTTGGCGG CACCGTGCCC 
GAACGCGCGG CGCGCGCGCA GGCTGCGGGC TGCGACATCG CCTTGAATTG CTGGGCGAAG 
ATGGATGACA TGGTCGGCAT CGCGAACAGC CTCGCGCCCA TGTCTGACAA AGTGATGCAG 
CGGCTGGAAC GCGCGCTCGC GCCCACCGCG GCCTTCGACG CTCCAGCCGA CATGACCGCT 
CAGGCCGCGC TTTTCGACAA GCGCGACCGG TTGCTGGAAC TGGCCTGA

Protein sequence

MGAPGLANGH GIRESTTMLP AIFGLSGLTL TEDERAFFRD ADPAGYILFG RNVESPAQLR 
ALTDELRALH GRDRTFICID QEGGRVARMK PPVWQPYPPG ERFDRLYDIA PASAIEAARA 
NAEALGLDLA EAGISVDCLP LLDVRQPGAH DVIGDRALGS EPMRVAALGR ATLDGLARAG 
IAGVVKHMPG HGRALVDSHK ELPTVSASAE ELEMDLAPFR ALRDATIGMT AHLRFLAWDD 
WNPATHSPFV IEEIIRKAIG FDGLLLTDDL DMQALGGTVP ERAARAQAAG CDIALNCWAK 
MDDMVGIANS LAPMSDKVMQ RLERALAPTA AFDAPADMTA QAALFDKRDR LLELA