Gene Rleg_4939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4939
Symbol
ID	8007389
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	-
Start bp	316886
End bp	318145
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	57%
IMG OID	644821856
Product	ROK family protein
Protein accession	YP_002973116
Protein GI	241113281
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGTTTG AGAGCCAGCC GTCCTATTCG TTGGGCCAGC GCACCCCTGC CACCAGAGAA 
GTCGCCGCCG GCGAGAACAG CGGCAACGTT ACGCTTGTCT CCCAATCGGC ACTCGGCGCC 
ATAAATCGCG GTCGCGTACT TCAAGCTTTG TATGATAACG GACCCAAAAG CCGGGCGGAT 
CTCGCTCGAC TTGCGGGCGT CAACCGGACC ACGATCACCG GTATTGTGCA GCCGATGATC 
GAAGACCAGC TTCTTATCGA GGGAGATGCG TCGCCTTCCG ACGTCAAAGG CGGCAAGCCG 
GCTCGTCCCC TTTATTTTAA CCCCGATGCA CCGATGCTTG GCGCAGTCCT CCTTCTGCCC 
GGCACGATAC AATCATGCCT CGTGGCTCTA ACTGGCGAGA TCAAGGCCGT TACGAAAGCT 
GAGTTTGATC CGCATGGCGA CACAGAAGCA TTCATCGCTG TCATGACGAA GACGCTTACT 
GCCACACTGT CTCAGGCCCA GCGGGCACCG TTTGGCATTG GCGTGGCTTC TGCTGGAATG 
ATCGACAGTG ACAAAGGAAC AATTCTTACC GTCAACCTTG CTCCCGTTCT AACGGGACTA 
CCTCTTGTAG CGATACTACA AGAACGCTTC TCTCTTCCCG TTGTTATCGA TCATCACCCT 
CGTGCCTTGC TTGTTGGGGA CAGATGGTTC GGGCCCGGCC GCGGCCAACA AAATTTTGCC 
GCGGTCTATA CCGGCGAGGT GCTTGGCGGC GCCTTCTTCA TCGACGGCAA GGTTTATCGT 
GGACTCGCCG GATCCGGCGG TGAGCTCGGG CACAGCGTGG TTCAGATCGA CGGTGCCCTT 
TGCAATTGTG GAAAGCACGG TTGCTGGGAG ACGGTAGCTG CCCTTCCGTG GCTACGAAAA 
GAAGCCGTCC GAATGGGCTT ACCACATCCC CGAAGCGTCA CCTGTGCCAG ACTTGTCAAG 
GAAACAGACG AAGGCTCGAA TGCGGCAGAG GAACTTCTCG ACCGTTATAC ACGCAACGTG 
GCGTTCGGCA TCGTCAACCT GCAGCAAACA CTGTCCCTCA ACTCCTACGT CCTTCACGGA 
GACGTCGCCG GAGGCGGAAT GAAGGCTGCG GAGCTGATCA GACGGCATGT CAAGCAGCTA 
GTGGTAAAGA GACCTGGTCA GGAGATATCA ATCACAGTGA ATGGTATCGG CGAAGGCCAT 
ACGGCTCTAC GTGGCGCCGC GGGTCTGGTT TTATCCAGCC ACCTAAAGCT AGTCATTTGA

Protein sequence

MKFESQPSYS LGQRTPATRE VAAGENSGNV TLVSQSALGA INRGRVLQAL YDNGPKSRAD 
LARLAGVNRT TITGIVQPMI EDQLLIEGDA SPSDVKGGKP ARPLYFNPDA PMLGAVLLLP 
GTIQSCLVAL TGEIKAVTKA EFDPHGDTEA FIAVMTKTLT ATLSQAQRAP FGIGVASAGM 
IDSDKGTILT VNLAPVLTGL PLVAILQERF SLPVVIDHHP RALLVGDRWF GPGRGQQNFA 
AVYTGEVLGG AFFIDGKVYR GLAGSGGELG HSVVQIDGAL CNCGKHGCWE TVAALPWLRK 
EAVRMGLPHP RSVTCARLVK ETDEGSNAAE ELLDRYTRNV AFGIVNLQQT LSLNSYVLHG 
DVAGGGMKAA ELIRRHVKQL VVKRPGQEIS ITVNGIGEGH TALRGAAGLV LSSHLKLVI