Gene Rleg_5228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5228
Symbol
ID	8007396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	+
Start bp	639186
End bp	640223
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	58%
IMG OID	644822136
Product	oxidoreductase domain protein
Protein accession	YP_002973396
Protein GI	241113561
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.596346
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.783327
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTTGA TCATTCTCGG AACCGGAGGA TGGGCAAACA CCCATGCCAT GAATTTTTCC 
GAAATCGCCG ACGTGAAAAT TGTTGCTGCT GTTGATACGG ACGAGGTCCG GCTACGGGCC 
TTCGCGCTAA GGCATGGTAT CCCACTTACC TTCACGTCGC TTGATGACGC TCTTGCCTGG 
GGAGAGTTTG ACGCCGTGAC CAATGTCACG CCGGATCGCG CGCATTATTC CACGACAATG 
AAGATACTCG GCGCCGGCAA GCATGTCCTC TGCGAGAAGC CGCTGGCGGT TAACTACCGC 
GAAGCCAAAG AGATGGCCGA CGCTGCCGCT GCGTCCGGCA AGGTCACGAT GGTAAACCTT 
ACCTATCGTA ATGTAGCGCC GCTGCAAGCA GCGCGTAAGA TGGTGTTGGA CGGACGCCTC 
GGCGCGATCC GCCACTTCGA AGCATCCTAT CTCCAGAGCT GGCTGGTCTC AAAGGCGTGG 
GGCGACTGGA CCAAGGAATC GCAATGGCTT TGGCGGCTGT CGACAAAGCA CGGCTCCAAT 
GGCGTGCTGG GCGATGTCGG TATCCATATT CTCGACTTCG CGGTTTTTGC CGCCGGAAGT 
GACGTCAAGG CGGCTGCATC GCATCTTAAG GTGTTCGACA AGAGCCCCGG AAATCGGATC 
GGCGAGTATG ATCTCGACGC CAACGACAGT TTCCTGATGA TGGCTGAACT CGAAAACGGT 
GCCGCTGGCG TCATCCACGC AACGCGCTGG GCAACCGGCC ATCTGAACGA ATTGCGCCTG 
CGCCTGCATG GAGACAAGGG CGCGCTGGAG GTGGTGCATA CGCCTGAAGG TTCGACGCTC 
AGGGCCTGTG AAGGTCCCGA TGCCGACAAG GCAATCTGGC GTAAGATCGA CGTCGAACCG 
GTTATCACTA ATTTCCAGCG CTTTGCAAAC GCCGTGCAAA AGGGGCAGCT GGATGAGCCT 
GGTTTTGGCC ACGCAGCCAA GCTGCAATTC GTTCTTGACC ACGCAGTGAA GACGGCCGGC 
GCTCTGATCG AACTTTAA

Protein sequence

MRLIILGTGG WANTHAMNFS EIADVKIVAA VDTDEVRLRA FALRHGIPLT FTSLDDALAW 
GEFDAVTNVT PDRAHYSTTM KILGAGKHVL CEKPLAVNYR EAKEMADAAA ASGKVTMVNL 
TYRNVAPLQA ARKMVLDGRL GAIRHFEASY LQSWLVSKAW GDWTKESQWL WRLSTKHGSN 
GVLGDVGIHI LDFAVFAAGS DVKAAASHLK VFDKSPGNRI GEYDLDANDS FLMMAELENG 
AAGVIHATRW ATGHLNELRL RLHGDKGALE VVHTPEGSTL RACEGPDADK AIWRKIDVEP 
VITNFQRFAN AVQKGQLDEP GFGHAAKLQF VLDHAVKTAG ALIEL