Gene Rleg2_2984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_2984
Symbol
ID	6981729
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	3047014
End bp	3048225
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	57%
IMG OID	643397694
Product	polysaccharide export protein
Protein accession	YP_002282477
Protein GI	209550560
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.182191
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTTGTT CTCGTATCGG TAGTACACGC GTCGCCATTG TTGTAGCGCT AACCACTATA 
TTGGCAAGCT GCACATCGTT GCCAAGATCC GGTCCCGATC ACAAAGATGT TGATCGAGAT 
GCCGCAGTGA AAGTGACAAC GAAGGAGCGT CGCGTCGGCA TCGACTACGC CCTGATCGAT 
CTCAGCAAGA ACGTTCTGCC CTATTTTACC TCTCCCCAGC CGACGTCCTT CAAGGGGTTT 
GGCGGCGGTC GTGGTGGAGC GCCTGAAATT CCGCTTGGTT ATGGCGACGT CGTCCAGGTT 
GCCATCTTCG AAGCTCAGTC CGGCGGTCTC TTCATTCCGT CCGATGCCGG CAGCCGACCC 
GGCAATTACA TTTCCCTGCC AGAGCAGACC ATCGATAGAA ACGGGACGAT TACGATTCCG 
TATGCGGGTC GGGTTCCGGC TGCCGGTCGC TTGAAGGAGA CCGTCGAGCA GGACGTCGAG 
GATCGCCTGG CGAGCCGCGC GATCGAGCCG CAGGTGGTTA TTACCACAAC GTCGAGCCGC 
TCCAGTCAGG TTGCCGTGCT CGGTGATGTC AATAATCCCC AGCGCGTCGA GATCAGCCCG 
GCCGGCGAGC GTGTTCTCGA TGTCATTTCA GCCGCGGGCG GTTTGACGAC AAATAATATC 
GAAACGAATG TGACGTTGCA GCGTCGCGGC AAGACGGCGA CCGTCGCCTA CAATACGCTG 
TTGAAGAACC CGGCGGAAAA TATCTATGTT GCGCCTGACG ATACAATCTC GATTGATCAT 
GAGCGCCGCA CCTATCTTGC GCTCGGCGCC GCAGGCGTCA GCGGCCGCTT CGATTTCGAA 
GAGTCTAACC TGACACTTGG AGAGGCAATC GCTAAAGCGG GCGGCCTGCG CGACGACCGC 
GCCGATCCTG CTCAGGTCCT GCTCTATCGC CTTGTTCCGA AGAAAACGGT TGAGGCGATG 
CACGTCGACA CGACGAGATT TGCAGGTGAT GCGGTTCCGG TGATCGTCCG CGCGAATATG 
CGCGATCCGG CAACCTTGTT CGCCGTTCAG CAATTCAAGA TGGAAGACAA GGACATTATC 
TATATTTCCA ATTCGGACTC GGTTGAATTG GTCAAGTTCC TTGACATCGT AAACTCGGTA 
TCGTCCACTG TTTCCGGTGT GACGGACGAC GCGCGTGATA CTCGCAACGC GGTCCAAGAT 
CTCGGAAATT GA

Protein sequence

MGCSRIGSTR VAIVVALTTI LASCTSLPRS GPDHKDVDRD AAVKVTTKER RVGIDYALID 
LSKNVLPYFT SPQPTSFKGF GGGRGGAPEI PLGYGDVVQV AIFEAQSGGL FIPSDAGSRP 
GNYISLPEQT IDRNGTITIP YAGRVPAAGR LKETVEQDVE DRLASRAIEP QVVITTTSSR 
SSQVAVLGDV NNPQRVEISP AGERVLDVIS AAGGLTTNNI ETNVTLQRRG KTATVAYNTL 
LKNPAENIYV APDDTISIDH ERRTYLALGA AGVSGRFDFE ESNLTLGEAI AKAGGLRDDR 
ADPAQVLLYR LVPKKTVEAM HVDTTRFAGD AVPVIVRANM RDPATLFAVQ QFKMEDKDII 
YISNSDSVEL VKFLDIVNSV SSTVSGVTDD ARDTRNAVQD LGN