Gene Rleg2_0637 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_0637
Symbol
ID	6979353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	663179
End bp	663868
Gene Length	690 bp
Protein Length	229 aa
Translation table	11
GC content	63%
IMG OID	643395349
Product	HAD-superfamily hydrolase, subfamily IA, variant 3
Protein accession	YP_002280160
Protein GI	209548243
COG category	[R] General function prediction only
COG ID	[COG0637] Predicted phosphatase/phosphohexomutase
TIGRFAM ID	[TIGR01493] Haloacid dehalogenase superfamily, subfamily IA, variant 2 with 3rd motif like haloacid dehalogenase [TIGR01509] haloacid dehalogenase superfamily, subfamily IA, variant 3 with third motif having DD or ED [TIGR01549] haloacid dehalogenase superfamily, subfamily IA, variant 1 with third motif having Dx(3-4)D or Dx(3-4)E

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.872179
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.213307
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGGCT TCGATCTCAT TATCTTCGAT TGCGACGGCG TGCTCGTCGA TTCCGAAATC 
ATCGCCGCAG AAGTCGAATC CGCGCTTCTG ACGGAGGCGG GATATCCGAT CGGCGTCGAG 
GAAATGGGCG AACGTTTCGC CGGCATGACA TGGCGCAACA TCCTGCTGCA GATCGAGCGC 
GAAGCGAGCA TTCCGTTTTC GGCCTCGCTG CTTGAGAAGT CCGAGCAACT GCTCGACACC 
AGGCTGGCAA ATGACGTCAA GGCCATTCCG GGCGTCGAAT TCGCCGTCTC AAGGCTCTCG 
ATGAAGCGCT GCATCTGCTC GAATTCGAGC AGCAAGCGGC TCGACATGAT GCTCGGCAAG 
GTGGGGCTGA AGCCGCTGTT TGCCCCCAAT ATCTTTTCCG CCAAGGATCT CGGCCCCGAC 
CGGGCCAAGC CGAAGCCCGA CATCTTCCTG CACGGCGCAA GCCAGATGGG TGTCTCGCCC 
GACAAGGTGG TCGTCGTCGA GGATTCCGTG CACGGCGTGC ATGCGGCGCG CGCCGCCGGC 
ATGCGCGTCA TCGGCTTCAC CGGCGCCTCG CACAGCTATC CCGCCCATGC CGACAAGCTG 
ACCGATGCCG GCGCCGAAAC GGCGATCTCC CGCATGAACG ACCTGCCTGG TGTCGTCGCC 
GCGCTTGCGG CCTGGGAAGG CGTTCTCTAG

Protein sequence

MNGFDLIIFD CDGVLVDSEI IAAEVESALL TEAGYPIGVE EMGERFAGMT WRNILLQIER 
EASIPFSASL LEKSEQLLDT RLANDVKAIP GVEFAVSRLS MKRCICSNSS SKRLDMMLGK 
VGLKPLFAPN IFSAKDLGPD RAKPKPDIFL HGASQMGVSP DKVVVVEDSV HGVHAARAAG 
MRVIGFTGAS HSYPAHADKL TDAGAETAIS RMNDLPGVVA ALAAWEGVL