Gene Rleg_4133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4133
Symbol
ID	8014928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	4215702
End bp	4216724
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	60%
IMG OID	644826703
Product	Aldose 1-epimerase
Protein accession	YP_002977913
Protein GI	241206817
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2017] Galactose mutarotase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.270907
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGATA AGTTGGAGCG GGACGTTTTC GGGCAGACGC AGGCGGGCGA GACCGTCTAT 
CGCGTCGTGA TCAAGGGCGG TGGGCTGACG GCCAAGATCA TCAGCTGGGG CGCGGTCATC 
CAGGATCTGC GTCTCGAGGG ACATGATGCG CCGCTGCAGC TCGGCTTTGA CGATTTCGAC 
AGCTACCCCC TCTATTCATC CTATTTCGGC GCGACACCCG GCCGCTGCGC CAACCGCGTC 
GGCGGCGGCA GGTTTACGCT TGACGACAAG GACTATCAGC TCGAACTGAA TGAAAACGGC 
GTGACGCATC TGCATGGCGG CAGCGACAAT ATCGCAAAAC GCAATTGGAC GATTGTCGAG 
CATGACGTCG ACCGCGTAGT ACTGAAGATC GTCGATCCCG ATGGCCGCGC CGGCTATCCC 
GGCAATTGCA CCATCCAGGC GACTTTCTGG GTGCATGGCA ACGGTGAACT GTCGATCACC 
TATGAATCGA CCTGCGACCA GCCGACGCTC GCCAATGTCT GCCAGCACGC CTATTTCAAT 
CTCGACGGCC GGGAAGATGC GCTTGGCCAC GATATCATGA TTGCCGCCGA TCGCTATCTG 
CCGACCGATG AGAAGCAGGT GCCGACCGGC GAGATCTGTT CCGTCGAGGG CACGGAATTC 
GATTTCCGCG AGATGGCGCC GATGAAGCGT TTCGTCGGCA GCGAACAAGC CTTTTACGAC 
CATAATTTCT GCCTGTCGGG CGAGCGTACC GCCAAGCGGA GCGTCGCGCT TGCCCGCAGC 
CTTTATTCCG GTGTGTCGCT GGAAGTGCGC AGCACCGAGC CAGGCGTGCA GTTCTATGCC 
GGCTTCAAGC TCGATACCGC GGCCCCCGGC ATCGGCGGGC GCAAATACGG CCCATTCGCC 
GGCTTCTGCC TGGAGACGCA GGTCTGGCCG GATGCCATCA ATCACCAAGG TTTTCCGAAT 
GCGGTTCTGC GCCCCGGCGA AGTGCTGCGT CAGGAGACGG ATTATATCTT CACCAAGAAC 
TGA

Protein sequence

MSDKLERDVF GQTQAGETVY RVVIKGGGLT AKIISWGAVI QDLRLEGHDA PLQLGFDDFD 
SYPLYSSYFG ATPGRCANRV GGGRFTLDDK DYQLELNENG VTHLHGGSDN IAKRNWTIVE 
HDVDRVVLKI VDPDGRAGYP GNCTIQATFW VHGNGELSIT YESTCDQPTL ANVCQHAYFN 
LDGREDALGH DIMIAADRYL PTDEKQVPTG EICSVEGTEF DFREMAPMKR FVGSEQAFYD 
HNFCLSGERT AKRSVALARS LYSGVSLEVR STEPGVQFYA GFKLDTAAPG IGGRKYGPFA 
GFCLETQVWP DAINHQGFPN AVLRPGEVLR QETDYIFTKN