Gene Rleg_4991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4991
Symbol
ID	8007582
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	+
Start bp	374808
End bp	376004
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	64%
IMG OID	644821906
Product	hypothetical protein
Protein accession	YP_002973166
Protein GI	241113331
COG category	[S] Function unknown
COG ID	[COG5441] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.148886
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCAGA TCTACGTGGT CGGCACGGCC GACACGAAGG GCGAGGAGCT TGCCTATCTT 
GCCGCTTGCA TCGAAGCGGC GGGCGGCGGT GTTGTCCGCG TTGACGTCGG CATAGGCGAG 
CCTGCGACCG CCGTCGATGT GAAGGCCGAC GCAGTGGCGG CGTGCCATCC GGACGGGGCT 
GGAGCCGTTC TTGCCAGCGG GGACCGCGGA AGTGCGGTCG CGGCGATGGG CATTGCTTTC 
GCGCGCTTCC TTGTGGAGCG CCAGGACATC GCCGGCGTCA TCGGTATAGG TGGAGGCGGA 
GGCACTTCGA TCATTACCGC AGGCATGCGC CAATTGCCGC TCGGTCTGCC AAAGATCATG 
GTATCGACGC TCGCATCCGG CGATGTGGCT CCCTTTGTCG ATGTTTCAGA CATCGTGATG 
ATGCCTTCGG TCACGGACAT GGCGGGCCTG AACCGGCTGA GCCGCGTCAT CCTTCACAAC 
GCCGCTCAGG CGATCACCGC CATGACCCAC CGCCCGGCTG AGGTGACTGC ATCCAAGCCG 
GCCCTCGGGC TTACCATGTT CGGCGTTACC ACACCTGCCG TATCGGCCAT GGTCGAGCGC 
CTCCGAGCAG ATTATGATTG CCTGGTCTTC CACGCCACAG GCACGGGCGG GCGGGCGATG 
GAGAAGCTTG CCGACAGCGA GCTCATCTCT GGCGTGCTCG ACATCACGAC GACCGAGGTC 
TGCGACCTGC TTTTCGGCGG CGTCCTGCCG GCCACCTCGG ACCGTTTCGG CGCCATTGCT 
CGCAAAGGCT TGCCCTATAT CGGTTCGGTT GGTGCGCTCG ACATGGTGAA CTTCTGGGCG 
CCGGAGACCG TTCCGGAGCG TTATTCCGGT CGGCTGTTTT ACCAGCACAA CCCGAACGTC 
ACCTTGATGC GCACGACGCT GGCCGAATGC GCGCAGATTG GTCGCTGGAT CGGCGACAAG 
CTCAATCTCT GCCACGGCCC CCTACGCTTC CTCATTCCCG AAAAGGGTGT TTCGGCCCTC 
GACATCGAAG GCGGTGCGTT CTTCGATCCG CAAGCCGACG CCGCGCTTTT CGCCGCGCTC 
GAGGCGACGG TGAAGCCGAC GGCGTCGCGA CGTATTATTC GCCTGCCGCT CCATATCAAC 
GACCCAGATT TCGCCGAGGC CGCCGTCGCG GCCTATCGTG ACATCGCCAA CCCCTGA

Protein sequence

MKQIYVVGTA DTKGEELAYL AACIEAAGGG VVRVDVGIGE PATAVDVKAD AVAACHPDGA 
GAVLASGDRG SAVAAMGIAF ARFLVERQDI AGVIGIGGGG GTSIITAGMR QLPLGLPKIM 
VSTLASGDVA PFVDVSDIVM MPSVTDMAGL NRLSRVILHN AAQAITAMTH RPAEVTASKP 
ALGLTMFGVT TPAVSAMVER LRADYDCLVF HATGTGGRAM EKLADSELIS GVLDITTTEV 
CDLLFGGVLP ATSDRFGAIA RKGLPYIGSV GALDMVNFWA PETVPERYSG RLFYQHNPNV 
TLMRTTLAEC AQIGRWIGDK LNLCHGPLRF LIPEKGVSAL DIEGGAFFDP QADAALFAAL 
EATVKPTASR RIIRLPLHIN DPDFAEAAVA AYRDIANP