Gene Rleg_6386 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6386
Symbol
ID	8017000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012854
Strand	+
Start bp	97654
End bp	99006
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	63%
IMG OID	644828181
Product	monooxygenase protein
Protein accession	YP_002979381
Protein GI	241554168
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0181294
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.0362961
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACGGA AAATCAGGCT TGGGGCATTT CTTCCCGGTG GCGGACAGCA TGTTGCGTCA 
TGGCGGCATC CCGACCAGCC GGCAGACGGC GCGACCAGTT TCGAGTTTCA CAAACGTCTT 
GCCTTGACGG CTGAGCGTGG CCTCTTCGAT GCATATTTCC TCGCCGACGG GCTGGCTGTC 
GGTTTTGGCG GTGCGCGTGA AGGCGGCAAC GCCCGCGTGG CCGGCTTCGA ACCCGTGACA 
TTGTTCTCGG CCCTTGCGCC TTTCACCACC CATCTCGGCT TTATCGCCAC GTCCTCGACC 
ACTTACGAAG AGCCTTACAC GACCGCCCGC AAATTCGCCT CGCTGGACCT GATCTCGGAG 
GGCCGTGCCG GCTGGAATGT TGTCACCACG ACGGGCGACC TGACGGCGCA GAACTTCAAC 
CGCGATACCC AGCTTCCGCA TGCAGACCGA TATCGCCGCG CCGCCGAACA CGTCGATGTT 
GTCCGCAAAC TCTGGGAAAG CTTCGAGGAC GACGCCTTCA TCCGGGACAA GCAATCCGGC 
GTCTTCTTCG ATCCGGCGAA GCTGCACGAC ACCGATCACC GCGGCGAACA CTTCAGCGTG 
CGCGGTCCGC TCAACATCTC GCGATCGCCG CAGGGGCATC CCGTCATCGT CCAGGCCGGG 
CAATCCGAAG ATGGACGCGG GCTCGCCGCA GCAACGGCCG AAGTCATATT CACCGCCCAT 
CAGCATATCG AAACCGCCCA GGAGTTCTAT CGGGATATCA AGGCGCGCGC CCGCGCTCTC 
GGCCGAAACC CCGATCATAT CCTCGTCATG CCCGGCGTAT CCGCTTTCGT CGGTAGGACC 
GAGGCGGAGG CGCGCGAGAA ATACGACCGC CTGACGTCGC TCATCGTCGA AGAGGACGGG 
ATCGGCCTCC TCAATGGCCT GACCGGCGGC ACGCTCGACC TGCACGGCTA TGACCTCGAC 
GGCCCTCTAC CGCCGGCGCC GCCGACGGAA GGCATGAAGA GCCGCCAGGC CCTCATCCGC 
CAGATCGCCG ACGAAAACAA CTTCACCATC CGCCAGCTCT ATCAGTGGAT CGCGTCTGCC 
CGCGGTCACT ACACCATCGT CGGAACACCC GAACAGATCG CCGATACGCT GCAGAAGTGG 
TTCGAGAACG AAGCTGCCGA CGGCTTCAAC ATTCTGCCGC CCTGGCTGCC GACGGCGCTC 
GACGATTTCG TCGATCTGGT CATTCCGGAA CTGCAGCGCC GCGGCCTGTT CCGCACGGCC 
TATGAGGGCA AGACGCTTCG AGAAAACCTC GGCCTGCCTT TCCCGACCAA TCGGTGGGCT 
GCAGAACAAG CAGATCTCCA GGCAGCAGAG TGA

Protein sequence

MTRKIRLGAF LPGGGQHVAS WRHPDQPADG ATSFEFHKRL ALTAERGLFD AYFLADGLAV 
GFGGAREGGN ARVAGFEPVT LFSALAPFTT HLGFIATSST TYEEPYTTAR KFASLDLISE 
GRAGWNVVTT TGDLTAQNFN RDTQLPHADR YRRAAEHVDV VRKLWESFED DAFIRDKQSG 
VFFDPAKLHD TDHRGEHFSV RGPLNISRSP QGHPVIVQAG QSEDGRGLAA ATAEVIFTAH 
QHIETAQEFY RDIKARARAL GRNPDHILVM PGVSAFVGRT EAEAREKYDR LTSLIVEEDG 
IGLLNGLTGG TLDLHGYDLD GPLPPAPPTE GMKSRQALIR QIADENNFTI RQLYQWIASA 
RGHYTIVGTP EQIADTLQKW FENEAADGFN ILPPWLPTAL DDFVDLVIPE LQRRGLFRTA 
YEGKTLRENL GLPFPTNRWA AEQADLQAAE