Gene Rleg2_5779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5779
Symbol
ID	6977168
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011366
Strand	+
Start bp	189732
End bp	190754
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	65%
IMG OID	643393234
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_002278052
Protein GI	209546162
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.028314
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0213376
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCCTCGA CCCCGCTCGC CCTTTTCGTC GGCCTTCCCA ATCCGGTCCT TTCGGATGAA 
GAATTCGCCC TGTTTCGCGA AACCAATCCG CTCGGCCTCT TTGTCGGCCG GCGCAATCAG 
CGCGAACCGG AGCAGACGAA GCGCCTGATC GAACGCTTTC GCGAGGCCGT CGGCCGCGAC 
GATGCGCCTG TTTTTACCGA CCAGGAAGGC GGCCGCGTGC AGCATCTCGA TGCCGGCCCC 
TGGCCGCTCT TCCGCAGCTT CGGCCAGTTC GCCGAACTGG CGCGCCGGGA TTTCGCACTC 
GGCAAAAAAG CATTGCGCCT TTCCTCCCAG GCCATGGGGG CGATGATGAC GGAACTCGGC 
CTTTCCAGCG GCTGCTCGCC CGTTCTCGAC CTCGTCTTCG AGACGACGAG TGCGGTCATC 
GGCGCCCGCT CTTTCGGCCC CGATCCTGAT GTCATCGCCG CCCTCGGCCC CGAGGTGATC 
GACGGCCTGC TCGAGGCCGG CAATATGCCT GTGATGAAGC ACATTCCCGG CCATGGCCGC 
GCGACGCTGG ATTCCCACAA AGAGCGTCCC GTAGTCGATG CCAGCCGCGT GACGCTCGCT 
GCGACCGATT TCAAGCCCTT CGTGGCGCTG AAGGATACGC CCTGGGCCAT GGTCGCCCAT 
GTCGTCTACT CCGCCTACGA CAAGGAGCGG CCCGCCTCCG TCTCGCCGGT CATGCACGAC 
GTCATCCGCA ACGAGATGGG CTATGAAGGC GTGCTGATTT CCGACTGCAT CTTCATGGAA 
TCGCTCTCCG GCACCCTGCC GGAACGCGTC AGACAGGTGC TCGACGCCGG CTTCGACATC 
GCCCTCCACA GCCATGGCGA CGTCAGGGAA AGCGAGGCCG CCGCCAAGGC CGCCCGACCG 
CTGACGGACG CCGCTCTCAA GCGGATCGCC GCCGGCACGG CCCGCCTCGG CAATCTCAAG 
GTCGACGTCC GCGCCGCCCA CCGCCAAGTC GAAGACATGT TTGCAAGCGC GCTGGTCTCC 
TGA

Protein sequence

MSSTPLALFV GLPNPVLSDE EFALFRETNP LGLFVGRRNQ REPEQTKRLI ERFREAVGRD 
DAPVFTDQEG GRVQHLDAGP WPLFRSFGQF AELARRDFAL GKKALRLSSQ AMGAMMTELG 
LSSGCSPVLD LVFETTSAVI GARSFGPDPD VIAALGPEVI DGLLEAGNMP VMKHIPGHGR 
ATLDSHKERP VVDASRVTLA ATDFKPFVAL KDTPWAMVAH VVYSAYDKER PASVSPVMHD 
VIRNEMGYEG VLISDCIFME SLSGTLPERV RQVLDAGFDI ALHSHGDVRE SEAAAKAARP 
LTDAALKRIA AGTARLGNLK VDVRAAHRQV EDMFASALVS