Gene Snas_5877 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5877
Symbol
ID	8887093
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	6237333
End bp	6238973
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	71%
IMG OID
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_003514598
Protein GI	291303320
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACGAAT CGTTGATCCC CCAGCCGACC TCGGTCGAAG CCCACCCCGG CGGTCCGTTC 
ACTCTCGACG GTGACACCCG CATCGTCGCC ACCGAAGCCG CCGCCGAGGC GGGCTGGCTG 
CTGCACGACT ACCTGCGGGC CGGAACCGGC CTGACCGTCC CGGTCACCGA CCGGGCCGAC 
GGCGGCGCCA TCACCCTCGA ACTGTCCGGC GACCGTCCCG CTGACGGCAC CACCGCCGCC 
GAGGCCTACC GGCTCGACGT CGACGCGGAC GGGGTCCGGC TGTCCGCCGC CCACCCCGCC 
GGACTGTCAC GGGCGGTGCA GACGCTGCGG CAGCTGCTGC CCGCCGAGAC GCTGCGCAGC 
GCGCCGGTGG GCACCACCCC GGTGACCCTG GCCGCGGTGT CGATTCAGGA CGAACCGCGG 
TTCGCCTGGC GCGGCGTGAT GCTGGACGTG GCGCGGCACT TCCAGCCCAA GGAGTTCGTG 
CTGCGCATGA TCGACCTGGC GGCGCTGCAC CGGCTCAACG TCGTCCAGCT GCACCTGACC 
GACGACCAGG GCTGGCGGCT GGAGGTCCCC GGCCGTCCCA AGCTCACCGA GATCGGTTCC 
TGGCGCCCCG AGACCGTGAT CGGGCACGCC CTCGACGACA CCAAGGGCTA CGACGGCACC 
CCGCACGGCG GCTACTACAC CGCCGCCGAC CTGCGCGAGA TCGTCGCCTA CGCCGCCCGC 
CGCCACATCA CCGTGGTGCC CGAGATCGAC CTGCCCGGCC ACGTGCGCTC GGTGCTGGCC 
GGTTATCCCG AACTGGGCAA CACCGGCGAG CCCACCACCG TGGCCACCAC CTTCGGCATC 
TTCTCCGAGG TCCTGGCGCC CACCGAGGCG GCGCTCGACT TCGCCCGCGA GGTCTTCGAC 
ACCGTCGTCG ACATCTTCCC GTCTCCGTAC ATCCACATCG GCGGCGACGA ATGCCCCCGC 
ACCGAATGGC GCGACAGCCC GGCGGCGCGG GACAAGGCGA AGGAACTGGG ACTGAGCAGC 
GTCGACCTGT TGCAGTCCTG GTTCACGAAG AACTTCGCCG AGCACCTGGC CGGACACGGC 
CGCCAGATCA TCGGCTGGGA CGAGATCCTG GACGGTGGCG CGCCCGACGA CGCGGTCATC 
GCGGTGTGGC GGGACTTCTC GATCGCCGCG AAGGCGGCGG CCAAGGGCCA CAAGGTGATC 
GTGGCCCCGG TACAGGCGAC CTATCTGGAC TACTACGAGT CCACCGACGC CGAGGAGCCG 
CTGCGGATCT TCAAGAACAT CTCCGTCGAC ACGATCGCGG AGTTCGAGCC GGTTCCCGAG 
GGCACCTCCG ACGAGCTCAT CTTCGGCGTC CAGGCTCAAC TGTGGAGCGA GTACCTGCCG 
GTGCCCTCGG CGGTGGAGTA CGCCGCCTTC CCGCGGCTGT CGGCCATCGC CGACGTCGCG 
TGGTCGACAC CCGAGGCGCG CACCGCCTCG CCGGTGACCG GACGGCTGGA GGAGCACCTC 
AAGCGCCTGG ACGCGCTGGG CGTCAACTAC CGGCCGCCGT CGGGCCCGAG GCCGTGGCAG 
AAGGGTGGCA CGGGAGCGCG GGCACGCTGG GACCTGGACG ACACCTCGAG GGACGAGACC 
CCGGACCTGC CGGAGTTCTA G

Protein sequence

MYESLIPQPT SVEAHPGGPF TLDGDTRIVA TEAAAEAGWL LHDYLRAGTG LTVPVTDRAD 
GGAITLELSG DRPADGTTAA EAYRLDVDAD GVRLSAAHPA GLSRAVQTLR QLLPAETLRS 
APVGTTPVTL AAVSIQDEPR FAWRGVMLDV ARHFQPKEFV LRMIDLAALH RLNVVQLHLT 
DDQGWRLEVP GRPKLTEIGS WRPETVIGHA LDDTKGYDGT PHGGYYTAAD LREIVAYAAR 
RHITVVPEID LPGHVRSVLA GYPELGNTGE PTTVATTFGI FSEVLAPTEA ALDFAREVFD 
TVVDIFPSPY IHIGGDECPR TEWRDSPAAR DKAKELGLSS VDLLQSWFTK NFAEHLAGHG 
RQIIGWDEIL DGGAPDDAVI AVWRDFSIAA KAAAKGHKVI VAPVQATYLD YYESTDAEEP 
LRIFKNISVD TIAEFEPVPE GTSDELIFGV QAQLWSEYLP VPSAVEYAAF PRLSAIADVA 
WSTPEARTAS PVTGRLEEHL KRLDALGVNY RPPSGPRPWQ KGGTGARARW DLDDTSRDET 
PDLPEF