Gene Rleg2_6140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_6140
Symbol
ID	6983213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011370
Strand	+
Start bp	76009
End bp	77409
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	56%
IMG OID	643399159
Product	transcriptional regulator, XRE family
Protein accession	YP_002283915
Protein GI	209551999
COG category	[R] General function prediction only
COG ID	[COG3800] Predicted transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.29056
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.20843
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTATCG GGAAACTATT TATCGGCAAA AAAGTGCGGG AGTTGAGACT CCTCCACAAA 
GCAAATCAAT CGCAGTTTGC AGAGCGTCTT GGGATTTCGA CGAGCTACCT GAACCAAATC 
GAGAGCAATC AGCGGCCTGT GTCTGCCGCG GTCCTTCTCG CCCTTGTCGA CAAGTTCCAA 
CTGGACATGT CGGATCTTGC CACCGGGGAA ATCGACCGGC TGCTTTCCGC TTTCTCCGAA 
GCACTTACTG ATCCGTTGTT CGAAGGCTAT GCCCCGAGCT TTCAGGAGCT GAAGCTTGTC 
GTTCAAAACG CTCCCGGCGT CGCCCATGCT CTCATCAAAG CCCATCAAGC CTATCGCCGG 
GTCAGCGAGC AACTGGCTAG CATCGATCGG GAATTGACCA GAGGAATGCC AGAAACCACG 
CCCTACGAAG AGGTGCGCGA CTTCTTTCAT TTCGTTGACA ATTATGTGCA CGACCTGGAT 
GTCGCTGCTG AACGTCTTGC GAGCGAGTTG CGGCAGGCAG ATGACCGGCA GGGGGGATTG 
AAGCGGCGCC TGGAAACCGG GCATGGTGTG CGGATCAGCT ACGATCTGGA GGGGGACGCA 
CTGCGCACGT TCCACGCTGC AAATATGATG CTCCACCTGA ACAAGTATTC ACCGCTCCAT 
ACACAGCAGT TCCAGATGGC GATTCAACTT GCCCAGCTCG AAGCGGCGAA CGCAATCGAT 
GAGATCGTTG GGAGCGCCGG ATTTCGGTCG GCTGAGGCGG CGGAGGTGTG CAAGATAGGC 
CTGCAGAATT ATTACGCAGG CGCGCTCCTC ATGCCCTATC GCGAATTCCT GGAGGCGGCG 
AGGCTTCACA GGCATGATGT GCATCTGCTT TCGTTAAGAT TCAACACGTC GCTGGAGCAG 
GTCTGCCATC GCCTGTCCAC CCTGCAACGC CCCGGACAGA AAGGAATTCC GATCTTTTTT 
GCCAAAATCG ACAGGGCCGG CAACATTACC AAGCGCCACA GCGCGACGAA GCTGCAGTTT 
GCCCGGTTTG GTGCCGCCTG TCCTTTGTGG AATGCTCATC AGGCCTTCGA GTCCCAGGGG 
CGGATCATCA GACAGCTTGC GGAAACGCCG GATGGCGGAC GTTTCCTCTC GATAGCCTTG 
CAGGTGAACA AGCGATCAGG AGGGTATACA TCCCATGATA CGACATATGC CTTGGCCCTT 
GGCTGCGAGA TAGGAGATGC CAGCGCCTTT ATATACGCGG ACGATCTCGT TGGACTCTCT 
CAGCCGCGAT ACGATCAGAT AGGTGTGTCC TGCAGGATCT GCGAGCGCGT CAAATGTCCC 
AGTCGAGCCG CGCCGCCCGT CAAAAGGAAG ATCGGCATCG ATCATCATCA ACGCATGGCA 
TTGCCCTACG ACATCAACTG A

Protein sequence

MAIGKLFIGK KVRELRLLHK ANQSQFAERL GISTSYLNQI ESNQRPVSAA VLLALVDKFQ 
LDMSDLATGE IDRLLSAFSE ALTDPLFEGY APSFQELKLV VQNAPGVAHA LIKAHQAYRR 
VSEQLASIDR ELTRGMPETT PYEEVRDFFH FVDNYVHDLD VAAERLASEL RQADDRQGGL 
KRRLETGHGV RISYDLEGDA LRTFHAANMM LHLNKYSPLH TQQFQMAIQL AQLEAANAID 
EIVGSAGFRS AEAAEVCKIG LQNYYAGALL MPYREFLEAA RLHRHDVHLL SLRFNTSLEQ 
VCHRLSTLQR PGQKGIPIFF AKIDRAGNIT KRHSATKLQF ARFGAACPLW NAHQAFESQG 
RIIRQLAETP DGGRFLSIAL QVNKRSGGYT SHDTTYALAL GCEIGDASAF IYADDLVGLS 
QPRYDQIGVS CRICERVKCP SRAAPPVKRK IGIDHHQRMA LPYDIN