Gene Rleg_4101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4101
Symbol
ID	8015889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	4174848
End bp	4176290
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	64%
IMG OID	644826671
Product	Microcystin LR degradation protein MlrC-like protein
Protein accession	YP_002977881
Protein GI	241206785
COG category	[S] Function unknown
COG ID	[COG5476] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCG CCGTCGGTGG CATTCATATC GAATGCAGCA CATACAACCC CGTCCTGAAC 
GAGGAGAAGG ATTTCCGCGT GCTGCGCGGC GCGGCGCTGC TGGAAGCGCC GTATTTCGCC 
TTCCTCAGGG ATTACGCTGC CGAATTTCTG CCGACGATCC ATGCCCGCGC CATCGCCGGC 
GGCCCGGTTT CGCGTGCCAC CTACGAGGCC TTCAAGGGTG AATTCCTCGA GCGGCTGAAG 
CCGATGCTGC CGCTTGACGG TCTCTATCTC GCCATGCACG GCGCCATGTA TGTCGAGGGC 
ATGGAGGATG CGGAAGGCGA CTGGATCAGC GCGGCCCGTG CGCTGGTCGG CAAGGATTGC 
ACGGTCTCGG CAAGCTACGA TCTGCACGGC AACGTCACGC AACGCATCAT CGATGCGCTC 
GATATCTATT CCACCTACCG CACTGCGCCG CATATTGATG TCGAAGAGAC GATGCGCCGC 
TCCGTTTCCA TGCTGGTAAA GAGCCTGAAA ACCGGCGAGA GGCCGGTCGT GCTCTGGGTG 
CCGATCCCGG TCGTGCTGCC CGGCGAGCGC ACCAGCACCG TCGATGAGCC GGCAAAGAGC 
CTCTATGACA TGCTGCCCGG GATCGATGCG ATCGACGGCG TCTGGGATGC ATCGCTGATG 
GTCGGCTATG TCTGGGCCGA CGAACCGCGC GCCACCGCCG CCGCGATCAT GACCGGCACC 
GACCGCACCG TGCTGGAGCG CGAGGCCAAA CGCCTCGCGA GGGCTTATTG GGATGCGCGC 
GAAGACTTTG TCTTCGGCTG CAAGACCGGC ACGCTCGAGG AATGTGTCGA AAGGGCGATC 
GCAAGCCCGA CCGCTCCTGT GGTGCTTGCC GAATCCGGCG ACAACCCGAC CGGCGGCGGC 
GTTGGGGACC GGGCTGATGT GCTGGCAGAG CTGATTGCCA GGGGCGCCAC CGGCGTCGTC 
TTTGCCGGCA TCGCCGACAA GGCGGCGACC GAGGCCTGTT ATGCCGCTGG CATCGGTGCG 
GAACTGGAGC TCAGTGTCGG CGCCTCGCTC GACACCCAGG GTAGCAAGCC CGTTCACGGC 
CGCTTCACGG TCAAGTTCCT GCATGAGACA TCAGATCCCA CAGACCGCCA GGCGGTAGTT 
TCGGTCAGTG GTATCGATCT CGTGCTCTCC GCCAAGCGTC GGCCCTATCA CAACATCGTC 
GACTTCACCC GGCTCGGCCT CGACCCACAC AAGGCCAGCA TCATCGTCGT CAAATCGGGC 
TATCTCTCGC CGGAACTGGC GCCGATCGCC AATCCGAACC TGATGGCGCT ATCAACAGGG 
GTCGTCGATC AGTTCGTCGA GCGCCTGCCG CGGCTGCGCA AGCAGCGTCC GACCTATCCT 
TTCGACAAGG ATTTTGCCTT CGAGCCGCAG GTTTTTCTCT CCGCACGCTC GACGCTGGCC 
TGA

Protein sequence

MRIAVGGIHI ECSTYNPVLN EEKDFRVLRG AALLEAPYFA FLRDYAAEFL PTIHARAIAG 
GPVSRATYEA FKGEFLERLK PMLPLDGLYL AMHGAMYVEG MEDAEGDWIS AARALVGKDC 
TVSASYDLHG NVTQRIIDAL DIYSTYRTAP HIDVEETMRR SVSMLVKSLK TGERPVVLWV 
PIPVVLPGER TSTVDEPAKS LYDMLPGIDA IDGVWDASLM VGYVWADEPR ATAAAIMTGT 
DRTVLEREAK RLARAYWDAR EDFVFGCKTG TLEECVERAI ASPTAPVVLA ESGDNPTGGG 
VGDRADVLAE LIARGATGVV FAGIADKAAT EACYAAGIGA ELELSVGASL DTQGSKPVHG 
RFTVKFLHET SDPTDRQAVV SVSGIDLVLS AKRRPYHNIV DFTRLGLDPH KASIIVVKSG 
YLSPELAPIA NPNLMALSTG VVDQFVERLP RLRKQRPTYP FDKDFAFEPQ VFLSARSTLA