Gene Rleg_5378 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5378
Symbol
ID	8007336
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	+
Start bp	788638
End bp	789768
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	62%
IMG OID	644822282
Product	Xylose isomerase domain protein TIM barrel
Protein accession	YP_002973542
Protein GI	241113707
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1082] Sugar phosphate isomerases/epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTGG GAATCGACAG CATAAAGCTG CCTGAGGCGA AGAAGCGGGG GCCGCTGGCA 
AGCCTTGATC ACGTCAAGGA ACTTGGGCTC GCAGGCATCT TCTTCAGTAC GGCGCTGGAC 
ATGAGCCCCG ACCTCGACAG CGGCCTGCTG CGCGACATCA GGGCGAAGGC CGACGACCTT 
GGCCTCTATC TCGAAAGCGG CATCGGCAAG ATCAATCCCT ATTGCAGCGC CGAGGAACCG 
GTACTCCGGG CCGCCGGCGG CGGCGATATC ATTGCCGGTT TCACGCGCAT GATCGAGGCA 
AGTGCCGCGA TCGGCTGCCA TGAGCTTTGG GTTGCACCGG GCAATTTCAA GGGCGAATAT 
CGCGGCCGGC TGGCCAATGA CCGCTTCCGC ACCGACGTGA CCTGGGAAGA GCAGTTGCTC 
GGAATTGAAA ACGTCCTCCG CAAGCTGGCG CCCGTCGCAC GTGCCAATGG CGCGCACATG 
AACATCGAAA CCCATGACGA GATCACGTCC TTCGAGATCC TGCGATTGAT CGAGAAGGTC 
GGCGCCGATT GCGTCGGCGT CGTCTTCGAC ACGGCAAACG GACTGCAGCG GGGCGAGCAT 
CCGGTCTTCG CCGCCAAGCG CCTGGCTCCT CATATCCGAC AGACCCATAT CAAGGATGCC 
TATGTCGGCC GCGCTCCGGG TGGTCTCGAT TTCCAGACCA GACCCGTTGG CGGCGGCATT 
GTCGATTTCG CCGCGATCCT TCCCATTCTC AGCGACGCCA GCGCCGCGCT GAACCTGTCG 
CTGGAGGTTG CCCAGTCTGT CGCCGACAAG CCTCGCAAGG CCAATCCACG CCAGTGCATC 
GAGATCGACG ATCCGGTCTG GCGAGCTGGC CACCCGGACC TGACGGCGGA TGAGCTTGCG 
GCCTACATGG CGATGGTGGA TGCCTATGAA AAGCGGGTCG CCTCCGGAGC GGTTCTCGAC 
TGGGAAGCCT ACGAGAGCAG CCGCTACGGC TACCCGACCT ATGAGGTGCA ATCCTACGGT 
TTCGACGAGG CGATTGGTTT CATCAAGCAG TCGGCCCGCC ACATCGAGGC TATTTGCGCC 
GAAAAGGGTA TTACCTTGTC CCCGCCGGCA AAAGAACAAA AGGCAGCCTA G

Protein sequence

MKLGIDSIKL PEAKKRGPLA SLDHVKELGL AGIFFSTALD MSPDLDSGLL RDIRAKADDL 
GLYLESGIGK INPYCSAEEP VLRAAGGGDI IAGFTRMIEA SAAIGCHELW VAPGNFKGEY 
RGRLANDRFR TDVTWEEQLL GIENVLRKLA PVARANGAHM NIETHDEITS FEILRLIEKV 
GADCVGVVFD TANGLQRGEH PVFAAKRLAP HIRQTHIKDA YVGRAPGGLD FQTRPVGGGI 
VDFAAILPIL SDASAALNLS LEVAQSVADK PRKANPRQCI EIDDPVWRAG HPDLTADELA 
AYMAMVDAYE KRVASGAVLD WEAYESSRYG YPTYEVQSYG FDEAIGFIKQ SARHIEAICA 
EKGITLSPPA KEQKAA