Gene Rleg_4047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4047
Symbol
ID	8014852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	4125433
End bp	4126662
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	61%
IMG OID	644826616
Product	radical SAM enzyme, Cfr family
Protein accession	YP_002977827
Protein GI	241206731
COG category	[R] General function prediction only
COG ID	[COG0820] Predicted Fe-S-cluster redox enzyme
TIGRFAM ID	[TIGR00048] radical SAM enzyme, Cfr family

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGTCA TGGATGCGAT TGATGTCATC ACGTCTCAGG CGCCTCGTGC CGCTTCCGGC 
GTCGAGAAGC CGTCCCTGAT CGGGCTGTCA CGCGAGGAGA TGGGGGCGGC ACTCCGGGAA 
AAGGGTGTGG CCGAGAAGCA GATCAAGATG CGCGTCTCGC AGCTCTGGAA CTGGATCTAT 
GTGCGCGGGG TCTCTGACTT CGACCATATG ACGAATGTCG CCAAGGACAT GCGGGAGATG 
CTGAAGCAGC ATTTCACCAT CGAACGTCCC GAGATCGTCG AGGAGCAGGT CTCCAACGAC 
GGCACGCGCA AATGGCTGCT GCGCTTTCCC GCCCGCGGCG CCGGGCGTCC AGTCGAGATC 
GAGGCCGTCT ACATTCCGGA AGAGGGCCGC GGCACGCTCT GCCTTTCCAG CCAGGTCGGC 
TGCACGCTCA CCTGTTCCTT CTGTCATACC GGGACACAGC GTCTGGTGCG CAACCTGACG 
GCGGAGGAAA TTCTTTCGCA GCTGCTGCTT GCCCGCGACC GGCTTGGGGA TTTCCCGGAC 
CGTGAAGCGC CGCAGGGCAC GATCATGCCT GCCGAGGGCC GCAAGGTCAG CAACATCGTC 
ATGATGGGCA TGGGTGAGCC GCTTTATAAC TTCGATGCCG TCAAACAGGC ATTGCTGATC 
GCCACGGATG GTGACGGCCT GTCGCTGTCC AGGCGCCGCG TGACGCTTTC TACTTCTGGC 
GTTGTGCCGG AGATCTTCCG CACCGGCGAG GAAATCGGCG TCATGCTGGC GATTTCGCTG 
CATGCGGTGC GCGACGATCT GCGCGACCTT CTGGTGCCGA TCAACAAGAA GTATCCGCTG 
AAGGAGCTGA TCGAAGCCTG CCGGACCTAT CCTGGCCTTT CGAACGCACG GCGCATCACC 
TTCGAGTATG TGATGCTGAA GGATGTCAAC GACAGCCTGG AAGACGCCAA GGGGCTGATC 
AAGCTCCTGA AAGGCGTGCC GGCGAAGATC AACCTCATTC CGTTCAATCC GTGGCCCGGC 
ACCAATTACC AGTGTTCGGA CTGGGAGCAG ATCGAGAAGT TCGCCGATTT CATCAATTCG 
GCAGGCTATG CCTCGCCGAT CCGCACACCC CGCGGTCGCG ACATTCTTGC CGCCTGCGGC 
CAGCTGAAAT CGGAGTCGGA ACGCATGCGC AAGACCGATC GTTTGGCCTT CGAGGCGATG 
ATGATCGCCA ATCACGGCGC CGACGACTGA

Protein sequence

MSVMDAIDVI TSQAPRAASG VEKPSLIGLS REEMGAALRE KGVAEKQIKM RVSQLWNWIY 
VRGVSDFDHM TNVAKDMREM LKQHFTIERP EIVEEQVSND GTRKWLLRFP ARGAGRPVEI 
EAVYIPEEGR GTLCLSSQVG CTLTCSFCHT GTQRLVRNLT AEEILSQLLL ARDRLGDFPD 
REAPQGTIMP AEGRKVSNIV MMGMGEPLYN FDAVKQALLI ATDGDGLSLS RRRVTLSTSG 
VVPEIFRTGE EIGVMLAISL HAVRDDLRDL LVPINKKYPL KELIEACRTY PGLSNARRIT 
FEYVMLKDVN DSLEDAKGLI KLLKGVPAKI NLIPFNPWPG TNYQCSDWEQ IEKFADFINS 
AGYASPIRTP RGRDILAACG QLKSESERMR KTDRLAFEAM MIANHGADD