Gene Rleg_3000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_3000
Symbol
ID	8013917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	2997103
End bp	2998245
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	64%
IMG OID	644825570
Product	glucose sorbosone dehydrogenase
Protein accession	YP_002976798
Protein GI	241205702
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0518762
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.592053
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAGAA TATCCGCCTT CCATTTCGCC TCAGCGCTGG TCCTGTTCGG CGCCATGTCC 
GCGGATGCGG CCGACATCGT CAACACGCAG GATCTCGCGG TCCGTGTCGA CAAGCTCGCC 
GACGGCCTCC AACATCCCTG GGCGGTCGAA GTGTTGCCCG ACGGGGCCTA TCTCGTCACC 
GAGCGGCCGG GCCGCATGCG CATCGTCCGC GACGGCAAGG TTTCCGAGCC GATCGGCGGC 
GTACCCAAGG TCAGCGCTCG TGGTCAGGGC GGCCTGATGG ACGTGGCGCT CGCGCCGGAC 
TTTGCGAAAT CTCGCAAGCT CTATTTCACC GCCGCCATCG CCAACAGCCA GGGCTCCGGC 
ACCGAAGCCT TCAGCGCCGC GCTTTCCACT GACGAGAAGA CACTCGACGC CGTGAGGCCT 
ATCTTCAGCA TGCGGCGCTT CACGTCGGGC AATATCCAGT ACGGCTCGCG CATCGCGATT 
GCCTCAGACG GTACGCTGTT CATCAGCGTC GGTGATCGCG GCAACCGCGA CCGCTCGCAA 
GACTGGCAGG ACGATGCCGG CTCGATCATC CACATCAACG CCGATGGCAG CATTCCTGCC 
GACAATCCAT TCAAGGAAGG CGGCAAGGCG CTGCCGGAAA TCTGGTCGAA AGGTCACCGC 
AACCCGCAGG GCATCACCTT CGACGCCAAA GATGGCAAGC TCTATACCGT CGAACACGGT 
GCGCGCGGCG GCGACGAGAT CAACCAGCCC GAGGCCGGCA AGAATTACGG CTGGCCGATC 
ATCACCTATG GCCGCGACTA TTCGGGTGCC GAGATCGGTG AAGGCACCGC CAAGGACGGG 
CTGGAACAGC CGCTCCATTA CTGGGATCCT TCGATCGCAC CAGGCGCCCT CGTCGTCTAT 
CGTGGCGCCA TGTTCCCGGA ATGGGACGGC AATTTCCTCG TCGCGGCGCT GAAGTTCCAA 
CTGCTCTCGC GCATGCAGCG CGACGACGGC GGCGCCTTCG TCACCGAAGA GCGCCTGTTC 
GAGGGCGAAT ACGGCCGCAT CCGCGACGTC GTCGTCGCCC CCGACGGCGC CCTGCTGATG 
GTGACGGATG AGGACAACGG CGCGCTGCTC AGGATATCCC GAGCGCAAGC CCGCAACGGC 
TGA

Protein sequence

MKRISAFHFA SALVLFGAMS ADAADIVNTQ DLAVRVDKLA DGLQHPWAVE VLPDGAYLVT 
ERPGRMRIVR DGKVSEPIGG VPKVSARGQG GLMDVALAPD FAKSRKLYFT AAIANSQGSG 
TEAFSAALST DEKTLDAVRP IFSMRRFTSG NIQYGSRIAI ASDGTLFISV GDRGNRDRSQ 
DWQDDAGSII HINADGSIPA DNPFKEGGKA LPEIWSKGHR NPQGITFDAK DGKLYTVEHG 
ARGGDEINQP EAGKNYGWPI ITYGRDYSGA EIGEGTAKDG LEQPLHYWDP SIAPGALVVY 
RGAMFPEWDG NFLVAALKFQ LLSRMQRDDG GAFVTEERLF EGEYGRIRDV VVAPDGALLM 
VTDEDNGALL RISRAQARNG