Gene Rleg2_4381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4381
Symbol
ID	6977475
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	-
Start bp	10400
End bp	11425
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	67%
IMG OID	643393561
Product	transcriptional regulator, AraC family
Protein accession	YP_002278379
Protein GI	209546461
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.165128
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGAGA TCGAACGACG CATGATCGCG CCGGGTTTCG TCGAGGAGGC GCTCGACAGC 
CTGCGGCGGC TAGGCAAGCC GACGGAACCG ATCCTTGCCC GCCTCGGCCT GCCGCCCGTC 
ATCGATCAGC CGGTTTCGGC CGATACCTAT GGCGCGCTCT GGCTCGCAAT CGCCGCCGAG 
CTCGACGACG AATTCTTCGG CATGGGCGCG CGGCCGATGC GCAGCGGCAG CTTCACGCTG 
CTCTGCCATT GCGTGCTGCA CGCGCCGACC CTCGGTCATG CGCTGCGCCG GGCGCTGCGC 
TTCCTCGATA TCGTGCTCGA CGATCCCCGC GGGCGGCTCG TCGTCCGCGA CGGTCTTGCC 
GAGGTCGAAC TCAGGGATGC CGGCGGTCCG CGTTCGGCCT TCGCCTACCG CACCTACTGG 
ATCATCCTGC ACGGCATCAC CTGCTGGCTG GTCGGCCGGC GCATCCCGAT CCGCCTCGTC 
GATTTCCGCT GCGCCGAGCC CGGGCAAGGC GCCGACTATC GGCTCTTCTT CGGCGCACCG 
GTGCGCTTCT CGCAACCCAT CAGCCGGCTC GGCTTCGACA GCGCCTTGCT CGACCTGCCG 
GTGGCGCGCA GTGAACAGGC GCTCAAACAA TTCCTGCGCG GCGCGCCCGC CAATATTCTG 
GTGCGCTACC GTTACGATGC CGGCATCGCT GCGGCCGTCC GCCGGCGCTT GAGCCAGGCC 
ACACCCAATG CCTGGACAAA CTTCGCCGCC CTTGCCGCCG ATATGCGCAT GCCACCCTCG 
ACACTCCGCC ACCGCCTGCA TGACGAGGGG CAAAGCTATG CCGCGATCAA GGACGATATC 
CGCCGGGATC TCGCCATCGA CCTGCTGCTG AACACATCAA AGACCATCGG TGAGATCGCC 
GTGCAGCTCG GCTATTCCGA ACCCAGCGCC TTCTTCCGGG CCTTCCGGAA ATGGATGGGC 
AAGAGTCCGG AGTCGTTCCG GCGGGAGGAA GCGGAAAACC AGACCTATGT CAGTCGAACC 
GCTTGA

Protein sequence

MAEIERRMIA PGFVEEALDS LRRLGKPTEP ILARLGLPPV IDQPVSADTY GALWLAIAAE 
LDDEFFGMGA RPMRSGSFTL LCHCVLHAPT LGHALRRALR FLDIVLDDPR GRLVVRDGLA 
EVELRDAGGP RSAFAYRTYW IILHGITCWL VGRRIPIRLV DFRCAEPGQG ADYRLFFGAP 
VRFSQPISRL GFDSALLDLP VARSEQALKQ FLRGAPANIL VRYRYDAGIA AAVRRRLSQA 
TPNAWTNFAA LAADMRMPPS TLRHRLHDEG QSYAAIKDDI RRDLAIDLLL NTSKTIGEIA 
VQLGYSEPSA FFRAFRKWMG KSPESFRREE AENQTYVSRT A