Gene Rleg2_4142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4142
Symbol
ID	6982914
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	4323143
End bp	4324348
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	63%
IMG OID	643398872
Product	integrase family protein
Protein accession	YP_002283630
Protein GI	209551713
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAACAAAT TGACCGCGAA GCAGGTCACA AGCATCAAGA AGCCGGGCCG TCATAGCGAC 
GGCGGAAGCC TCTATCTTGT CGTCGACAAG TCCGGCGCCA AGCGGTGGGT GTTCCTGTAT 
CGCCGCGGCG ATCGCCAGCG CGAAATGGGC TTGGGCGGCG TCGATACTGT ATCGCTGGCG 
AGCGCGCGCG AGCTGGCCGC GGATGCCCGC CGGCTGCTGC AGGCCGGCAT TGATCCTATC 
GAGGCGAAAA ACGCCATCGT CGACGAGATC CCGACCTTCG GCGATTGCGC CGACGATTTC 
ATTGAAACTA TGGCCCCGCA ATTCCGGAAC GCGAAGCATA TCGCGCAATG GAAAATGACC 
TTGCAGGAAT ATGCAAAGCC TCTCCGGCCG AAGGCGGTTG ACCAGGTCAC GACTTCCGAC 
GTGCTGGAAG TCTTGAAACC GATCTGGCTA ACGAAGCCGG TCACGGCGTC GCGAGTACGT 
GGTCGCGTTG AGCGGGTTCT GGACGCGGCA AAGTCAAAAG GCTACCGGTC AGGTGAAAAC 
CCGGCGCGCT GGCGCGGCCA CCTGTCAAAC CTGCTGCCGA AGCGCAAGAA GCTGACGCGC 
GGCCATCACG CGGCGCTTCC TTACAAGGAC GTGCCTACGT TCACCGCCGC GCTGCGTGAA 
CGACCGGCCG TCGCGGCGAG GGCTATGGAA TTCACAATCC TGACCGTGGC GCGGTCCGGA 
GAAACGCGGG GCATGAAGTG GCGCGAAGTC GACCGCGTTG ACGAGGTCTG GACGGTGCCG 
CCCGAGCGGA TGAAAGCGTT CCGCGAACAT CGTGTTCCGC TTGCGCCGCG GGCGCTGGCG 
ATCCTCGATG AAATGGCGCT GTTCGGCACC GATCCGGACG CTTATGTCTT CCCTGGCCAG 
CAGAAGAACA GGAAGGGCCG ACCGCTGTCC GACATGGCAA TGGATATGGT GCTGCGGCGG 
ATGAAGGTAG ACGTCACAGT CCACGGCTTT CGATCCTCCT TCCGCGACTG GTGTGGCGAA 
GAGAGCACCT TCCCTCGAGA AATCGCCGAA GCGGCGCTCG CCCACGTGGT CGGCGACGAG 
ACGGAACGCG CCTACCGCCG CGGCGACGCG CTCGAGAAGC GCCGGCGGCT TATGACGGCT 
TGGGCGAACT ATTGCGAGCC CAAGACCGGC AACGTCATTT CGCTGAAGCG GCGCGCGGGG 
GCCTAG

Protein sequence

MNKLTAKQVT SIKKPGRHSD GGSLYLVVDK SGAKRWVFLY RRGDRQREMG LGGVDTVSLA 
SARELAADAR RLLQAGIDPI EAKNAIVDEI PTFGDCADDF IETMAPQFRN AKHIAQWKMT 
LQEYAKPLRP KAVDQVTTSD VLEVLKPIWL TKPVTASRVR GRVERVLDAA KSKGYRSGEN 
PARWRGHLSN LLPKRKKLTR GHHAALPYKD VPTFTAALRE RPAVAARAME FTILTVARSG 
ETRGMKWREV DRVDEVWTVP PERMKAFREH RVPLAPRALA ILDEMALFGT DPDAYVFPGQ 
QKNRKGRPLS DMAMDMVLRR MKVDVTVHGF RSSFRDWCGE ESTFPREIAE AALAHVVGDE 
TERAYRRGDA LEKRRRLMTA WANYCEPKTG NVISLKRRAG A