Gene Rleg2_5636 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5636
Symbol
ID	6977027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011366
Strand	+
Start bp	24298
End bp	25257
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	66%
IMG OID	643393093
Product	transcriptional regulator, AraC family
Protein accession	YP_002277911
Protein GI	209546021
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTCGC CCGATAGTAA AAATGTCCAG GAAATCGGCT TCATCCTGAT CCCGGGATTC 
GCGCTGATGT CCTATGCCTC GGCGACCGAG CCGCTCAGGG CGGCAAACCT TCTGGCCGGA 
CGAGAAATCT ATCGGCTGTC GATCTTTTCG CCGGACGGAG GGCCGGCGCG CTCCTCTTCA 
GGCGTCAGCG TGCCCGCCGA ACCCCTTCCG GCCAGAGGTT CCGGCCTCGG CACGGCCTTC 
GTCTGCGCCG GCGGCTTGCC GCGCGACTGG CGTTATCCCG GCGTGCTTGC CTGCCTCAGG 
CAACTGTCGC GCGAGGGTGT GAGGATCGGC GGCATTTCGG GCGGCCCCTA TCTGATGGCT 
GCCGCCGGAC TGCTGGCCGG CCGCGATTTT ACCATCCACT GGGAACATGC GGCCGCCCTG 
CTCGAGGCCT TTCCGGAGCT TACGCCGCGC CAGGCGCGCT TCATGATCGA CGGCAACCGG 
ATCACCTGCG GCGGCGGCAT CGCCCCGCTC GATATGATGC ATGTGCTGAT CGCCGAGCGC 
ATGGGACCGG ATTTTGCCCG CCGCGTCAGC GACTGGTATC TTCACACCGA GGTCAATGAG 
CCCGCCGCCC CCCAGCGCGC CTCGCTCGCC GAGCGCTATG GCGTCCACCA TCCAGGGCTG 
CTCAGCGTTC TCGAACGGAT GGAGGAGACG ATCGAAATGC CGCTCGACCG CGCCGCCATG 
GCGCGCATCG CCGGCGTCAC CGTCCGCCAT CTCGACCGGC TCTTTTCCGC CCATCTTAAG 
ACCAGCTTCC TCGATCAGTA CCACAGGATC AGGCTGCAGC ACGCCCATCG CCTGCTGAAG 
CAGAGCCCGC TTTCCGTCTC GGAGATCGCC GTTGCCACCG GCTTTTCCAG TCTTAGCCAC 
TTTTCCCGGA TGTTCCGCGC CGTCTACGGC ATCGCTCCGC GTGAGGCGCG CCGGGAATAG

Protein sequence

MSSPDSKNVQ EIGFILIPGF ALMSYASATE PLRAANLLAG REIYRLSIFS PDGGPARSSS 
GVSVPAEPLP ARGSGLGTAF VCAGGLPRDW RYPGVLACLR QLSREGVRIG GISGGPYLMA 
AAGLLAGRDF TIHWEHAAAL LEAFPELTPR QARFMIDGNR ITCGGGIAPL DMMHVLIAER 
MGPDFARRVS DWYLHTEVNE PAAPQRASLA ERYGVHHPGL LSVLERMEET IEMPLDRAAM 
ARIAGVTVRH LDRLFSAHLK TSFLDQYHRI RLQHAHRLLK QSPLSVSEIA VATGFSSLSH 
FSRMFRAVYG IAPREARRE