Gene Rleg_1053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1053
Symbol
ID	8012182
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	1028698
End bp	1029657
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	64%
IMG OID	644823636
Product	oxidoreductase
Protein accession	YP_002974887
Protein GI	241203791
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.176111
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGACA AACAAGTCCC CATCCGCTCC GGATTTGGAG CCCACACGAC GGCCGGCGAG 
GTTTTGGCCG GTCTCGATCT TTCCGGCAAG CGCGCCATCG TCACCGGCGG CCATTCCGGC 
CTCGGGCTCG AGACCACGCG CGCTCTGGCG GGCGCCGGCG CGAAGGTGAC CATCGGCGCA 
AGGAGCATCG AGGCGGCGCG TAGCGCGGTC GCCGGTATCG ATGGCGTAGA GATTGATCGG 
CTCGACCTTT CCGACCTCGA AAGCGTTCGC GCCTTTGCCG AGCGGTTCGT CGCATCTGGC 
CGCAGCATCG ACATTTTGAT CAACAGCGCC GGCATCATGG CCTGCCCGGA AACGCGTGTC 
GGCGACGGAT GGGAGGCACA GTTCGCGACC AATCATCTCG GCCATTTCGC CTTGGTCAAC 
CGCCTCTGGC CGGCGATCTC GCGCGGCACT CGCATCGTTT CGGTTTCCTC CGGTGGCCAT 
GGCAACTCGG CCATACGATG GGAGGATGTG CATTTCGAGA CCGGTTACGA CAAATGGCAG 
GCCTACGGCC AGTCGAAGAC CGCCAACGCA CTTTTCGCCG TGCATCTGGA CAGGCTCGGG 
CGCGACACCG GCATCCGCGC CTTCTCGCTG CACCCGGGCA AGATTTTTAC CCCCTTGCAG 
CGCCATCTCG CAAAGGAGGA AATGGTCAGT GCCGGCTGGA TCGATGCAGA CGGCAATCCG 
ATTGATCCGA CGTTCAAGAC ACCAGCCCAG GGGGCAGCGA CGCAGGTTTG GGCGGCGACC 
TCGCCACAAC TCGAAGGTAT GGGAGGCCTC TATTGCGAGG ACTGCGATAT CGCCATCCGC 
GCAACGGTTG GAGAACCCGG CGGCGTCAGC GACCATGCAG CCGATCCCGA GGAGGCGGCA 
CGCCTGTGGA TCTTGTCGGC AAGGCTGACC GGCATTGACG CTTTCGCGGC GTACGCCTGA

Protein sequence

MSDKQVPIRS GFGAHTTAGE VLAGLDLSGK RAIVTGGHSG LGLETTRALA GAGAKVTIGA 
RSIEAARSAV AGIDGVEIDR LDLSDLESVR AFAERFVASG RSIDILINSA GIMACPETRV 
GDGWEAQFAT NHLGHFALVN RLWPAISRGT RIVSVSSGGH GNSAIRWEDV HFETGYDKWQ 
AYGQSKTANA LFAVHLDRLG RDTGIRAFSL HPGKIFTPLQ RHLAKEEMVS AGWIDADGNP 
IDPTFKTPAQ GAATQVWAAT SPQLEGMGGL YCEDCDIAIR ATVGEPGGVS DHAADPEEAA 
RLWILSARLT GIDAFAAYA