Gene Smed_1160 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1160
Symbol
ID	5322006
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1237755
End bp	1238789
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	61%
IMG OID	640790101
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_001326846
Protein GI	150396379
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0839942
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.394325
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGTATG CTTTTCGCAT GAGCGAATCA AAAGCATTCA TTTCCGGCTG CAAGGGCCTT 
ACGCTGACGC AGGAAGAGCG CGACTTCTTC GCCGGCGAGC GCCCATGGGG CTTCATTCTC 
TTCGGACGGA ATATCGGCGA GGAAGAGCAG ATCTGCGACC TGGTGGCGAG CCTGCGCGAC 
AGCATAGGTA ACCCGGGAGC ACCGGTGTTG ATCGATCAGG AGGGCGGCCG TGTTCAGCGC 
ATACGCCCGC CGCTCGTCGC GCAATATCCC AATGGCGCGG CGATCGGCGA AATCTATCGC 
CGGGATCGTG AACTCGGTGT GCGTGCCGCG TGGCTCATGG GACGCCTGCA TGCGTTCGAC 
CTGATGCGCT TCGGCATCAC GGTCGATTGC CTGCCGGTAC TCGACGTACC GGTTCCCGGG 
AGCCACGACG TGATCGGCAA CCGCGCCTAT GGGCATGATC CGGCGACGGT CACTGAGATC 
GGCCGCGCCA TGAGCGAAGG GTTGAAGGCT GGGGGCATGC TGCCGGTCAT GAAGCATATG 
CCCGGTCACG GCCGAACCTT CGTCGATTCG CATCACAGCC TGCCGGTCGT CAGCGCCGGC 
CTCGATGAAT TGAAGAGTAG CGATTTTCTT CCCTTTGCGG CGATGAAGGA TGAAGCGATG 
GCCATGTCCG CGCACATGGT CTTCACTGCA ATCGACCCGG ACAACCCCGC AACGACCTCC 
ACAAAGGTCG TTCGCGAGAT CATTCGAGGC CATATTGGCT TCGACGGCCT GTTGATGTCC 
GACGACGTTT CCATGAATGC CCTTGCCGGG GACATGGCCG CACGCGCCCG CGGAATAATC 
GCCGCCGGTC TTGATCTCGT ATTGCATTGT CATGGCATTA TGGAGGAAAT GAAAGCTGTG 
GCAGATGTCG TTCCGGTCAT CTCCGGGGAG AGGCTCCGCC GGGCTAAGGC TGCCGAGGCA 
GCCTTCCGGG AACCGGACAG TTCGGTCGAA GCTGCACTGC GCACAGAGTT TAACGCAATG 
TTCGCGCTCG CCTAG

Protein sequence

MQYAFRMSES KAFISGCKGL TLTQEERDFF AGERPWGFIL FGRNIGEEEQ ICDLVASLRD 
SIGNPGAPVL IDQEGGRVQR IRPPLVAQYP NGAAIGEIYR RDRELGVRAA WLMGRLHAFD 
LMRFGITVDC LPVLDVPVPG SHDVIGNRAY GHDPATVTEI GRAMSEGLKA GGMLPVMKHM 
PGHGRTFVDS HHSLPVVSAG LDELKSSDFL PFAAMKDEAM AMSAHMVFTA IDPDNPATTS 
TKVVREIIRG HIGFDGLLMS DDVSMNALAG DMAARARGII AAGLDLVLHC HGIMEEMKAV 
ADVVPVISGE RLRRAKAAEA AFREPDSSVE AALRTEFNAM FALA