Gene Rleg_5583 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5583
Symbol
ID	8016474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012853
Strand	+
Start bp	165648
End bp	166736
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	64%
IMG OID	644827749
Product	hypothetical protein
Protein accession	YP_002978949
Protein GI	241518321
COG category	[S] Function unknown
COG ID	[COG4641] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.0202038
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATCG CCTTTTACGG ATCGAGCCTG GTTTCCGCCT ACTGGAACGG CGCCGCCACC 
TACTATCGCG GCCTGCTGCG CGCTTTGGCG CGGAAGGGCT ACGACATCAC CTTCTACGAG 
CCAGATGTTT ACGACCGGCA GAAAAACCGC GACATCGATC CCCCGGAATG GTGCAAGGTC 
GTCGTCTATC AAGGCACCAT CGACGCGCTG AGGCAGGTGA CGGCGGCCGC GGCCGAGGCC 
GATATCGTCG TCAAAGCCAG CGGCGTCGGC TTCGAGGACG ATCTCCTGCT GCAGGAAGTC 
CTTCGCCATG CCAGGCAAGG GGCTTTGAAG ATCTTCTGGG ACGTGGATGC GCCGGCAACG 
CTTTCCGAGC TGCGGCAGAC CCCCGAGCAC CCGCTTCGCA AGTCCTTGAG CCGGATCGAC 
CTCATCCTCA CCTATGGTGG CGGCGACCCC GTGATCGACG CCTATCGCGG CCTCGGGGCA 
GCCGACTGCG TGCCGATCTA CAACGCGCTC GATCCTCAAA CCCATCATCC GGTGCAGGAG 
GAGGCGCGGT TCACCGCGGA TCTTGCCTTT CTCGGCAACC GTCTGCCCGA CCGTGAAGCG 
CGGGTCGAGC AGTTTTTTCT CGAACCCGCG GCCCGCCTGC CGCGGCAAAG CTTTCTGCTC 
GGCGGGTCCG GCTGGAGCGA CAAAGCCTTG TCGTCGAACA TCGTTCACAT CGGGCATGTC 
CTGACCCGCG ACCACAACGC GTTCAACGCG ACGCCGAAGG CGGTGCTCAA TATTTCCCGT 
ACCAGCATGG CCGAAAACGG TTTTTCGCCG GCAACCCGCG TTTTCGAAGC CGCAGGCGCC 
GGCGCCTGCC TGATCACCGA CTACTGGCAA GGCATTGACC TGTTTCTGAA GCCCGGCGAA 
GAAATCCTGG TGGCGCGCGA CGGCCAGGAT GTCGCCGATC TTTTGACCGG CCTGACATGG 
CAGCAGGCCA GGGCGATCGG ACAGCGGGCG CTAAGACGTG TGCTTGCCGA GCATACCTAT 
AGCAATCGCG CCGAGACCGC CGATGCCATC TTCCGCGCTC ATGCCGCGCG AGCGGAGGCG 
GCCGAATGA

Protein sequence

MKIAFYGSSL VSAYWNGAAT YYRGLLRALA RKGYDITFYE PDVYDRQKNR DIDPPEWCKV 
VVYQGTIDAL RQVTAAAAEA DIVVKASGVG FEDDLLLQEV LRHARQGALK IFWDVDAPAT 
LSELRQTPEH PLRKSLSRID LILTYGGGDP VIDAYRGLGA ADCVPIYNAL DPQTHHPVQE 
EARFTADLAF LGNRLPDREA RVEQFFLEPA ARLPRQSFLL GGSGWSDKAL SSNIVHIGHV 
LTRDHNAFNA TPKAVLNISR TSMAENGFSP ATRVFEAAGA GACLITDYWQ GIDLFLKPGE 
EILVARDGQD VADLLTGLTW QQARAIGQRA LRRVLAEHTY SNRAETADAI FRAHAARAEA 
AE