Gene Rleg2_5286 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5286
Symbol
ID	6978380
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	+
Start bp	908844
End bp	909857
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	62%
IMG OID	643394390
Product	transcriptional regulator, AraC family
Protein accession	YP_002279208
Protein GI	209547290
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.371656
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.135191
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACCGG AGCAGCATCG ACAGGGAGAC GGCGTCACGA AATCCGGTGC CCGGCTGAAG 
GTGGGGTTCG TGCTGTCGCG GTCGTTTACG CTGTCGGCCT TCGCACTCTT CGTCGACACG 
CTGCGGCTTG CCAGTGACGA GCAGGATCGG TCCGGAAGGG TGCTTGCCGA CTGGCAGGTC 
ATCGGCAGCA CGCGGCATCT GATCACCTCA AGCTGCGGCG TCCAGGTTGC TCCGACCTCC 
GATTTCGTCG ATCCGCTGAA ATTCGACTAT ATCGTCGTCG TCGGCGGGCT TCTGACCGTG 
GAAAACCCTG TCGACCAGCA GACCATCAAT TTTCTCAGGC AGGCGGATGC CAAGAAGGTG 
CCGCTGATCG GCGTCTGCAC CGGGTCGTTC ATTCTTGCGG CCGCGGACCT GATGAAGCGG 
CACGAGTCCT GCGTGAGCTG GCTGCATTAC AAGGAATTTC GCGAGCGGTT TCCCGACCTC 
GGCGTTCGGT CCGACCGGCT TTTCAATCTC GACCGCCAGC GCGGATCCTG CGCCGGCGGC 
AGCAGTTCGG CCGACATGGC GGCGCTGCTG GTCAGGAAAT ATATCAGCCG GGATGCCGAG 
CGAAATGCGC TTGAGGTGCT TCAGATCGAG AAGGCCCGGG CGCCGGCGGA CATCCAGCCC 
CGCCGCCCGC TGTATGACGA CTATGACGAC GCCCGCGTCA AGGCGGCGAT GATTACGATG 
GAACAGTTCG TCGACGGCAG CATATCGATC CAGAAGCTTG CCGGCATGGT TGGGCTGTCA 
CGGCGGCAGC TGGAGAGAAT TTTCATCGAC AAGACGGGAA TGTCTCCCGC CAAGGCCTAT 
AATCGGGTCC GCATGGAGCG GGCAAAATCG ATCCTGGTCC AGTCGAAGGC GCCGCTTATC 
GAGATCGCGC TCGATGTCGG TTTCGAAAAC GCCTCGCAGT TCACGCGAAC GTTCAAGCGG 
ACCTTCGGGC AGACCCCGTC GCAGCATCGC GCGGCAGCTT TAAGAGCACA CTGA

Protein sequence

MRPEQHRQGD GVTKSGARLK VGFVLSRSFT LSAFALFVDT LRLASDEQDR SGRVLADWQV 
IGSTRHLITS SCGVQVAPTS DFVDPLKFDY IVVVGGLLTV ENPVDQQTIN FLRQADAKKV 
PLIGVCTGSF ILAAADLMKR HESCVSWLHY KEFRERFPDL GVRSDRLFNL DRQRGSCAGG 
SSSADMAALL VRKYISRDAE RNALEVLQIE KARAPADIQP RRPLYDDYDD ARVKAAMITM 
EQFVDGSISI QKLAGMVGLS RRQLERIFID KTGMSPAKAY NRVRMERAKS ILVQSKAPLI 
EIALDVGFEN ASQFTRTFKR TFGQTPSQHR AAALRAH