Gene Rleg2_3332 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3332
Symbol
ID	6982086
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	3429116
End bp	3430207
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	61%
IMG OID	643398050
Product	hypothetical protein
Protein accession	YP_002282825
Protein GI	209550908
COG category	[S] Function unknown
COG ID	[COG2899] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.643264
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.318214
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCAGC CCGCGACCCA CCACTCCTCG CTCAGCTATT TCCGCTGGGC CTTTATCGTC 
ACTGCCCTCG GCCTCGTTCT CGGCGCCGTG CTCGGCTGGC AGACGACAGG CACGATCGGC 
GGCATGGCGA CCGTCTTCTT TATCTGCACC GTGCTTGCGG TGCTGGAAAT CTCGCTCTCC 
TTCGACAATG CCATCGTCAA CGCCAACAAG TTGAAGGAGA TGACGCCGGT CTGGCAGAAG 
CGCTTCCTCA CCTGGGGCAT CATCATCGCC GTCTTCGGCA TGCGCATCGT CTTTCCGCTG 
GCGATCGTTG CGATCGCGGC ACGGATCGGC CCCTGGGATG CGCTTGTGCT TGCCGCCCGT 
GAGCCGGAAG AATATGCCCG CATCATGACT GACGCGCATC TGCCGATCGC AGCCTTCGGC 
GGCACCTTCC TGATGATGGT CGGCCTCAGC TATTTCTTCG ACCATGAAAA GAAAATCCAT 
TGGTTTCGAG GCCTGGAAAA GGTGATGGCG CGCTCAGCCA CCATCAGGGG CATCGAGATC 
GCTTTCGTGC TGGCACTGAT GCTGGTTTTC TCCTGGCTGA TCGGCGGCGA GCAGGCGAGC 
GTCTTCGTCC ATTGCGCCAT CTACGGGCTG CTCACCTTCC TCGCGGTCGA GGTGGTTGGT 
GAACTGCTCG ATGCCTCGCA ACAGACGATG AGCGCTGCCG CCAAGGGCGG CCTCGGCGCC 
TTCATCTATC TCGAGGTGCT GGATGCCAGC TTCTCCTTCG ACGGCGTCAT CGGCGCCTTT 
GCGCTGACGC AGAACCTCTT CGTCATTGCG ATCGGCCTCG GTATCGGCGC CATGTATGTG 
CGCTCGATGA CGATCATGCT GGTGGAGAAA GGGACGCTTG CCGAATATCG CTATCTCGAG 
CACGGCGCCT TCTACGCCAT CCTGATCCTC TCGGTGATCA TGTATGCGCA AACCCTGGTG 
CACATCCCCG AAGTCATCAC CGGGCTCGGC GGCGCGACGC TGATCGGTCT GTCGCTCTGG 
TCTTCCATTC GCCACAACAG GCGCGAGCGG TTGGAAGATC ACGCCAACCG GCAGGAAGAA 
CTTCACGCCT GA

Protein sequence

MNQPATHHSS LSYFRWAFIV TALGLVLGAV LGWQTTGTIG GMATVFFICT VLAVLEISLS 
FDNAIVNANK LKEMTPVWQK RFLTWGIIIA VFGMRIVFPL AIVAIAARIG PWDALVLAAR 
EPEEYARIMT DAHLPIAAFG GTFLMMVGLS YFFDHEKKIH WFRGLEKVMA RSATIRGIEI 
AFVLALMLVF SWLIGGEQAS VFVHCAIYGL LTFLAVEVVG ELLDASQQTM SAAAKGGLGA 
FIYLEVLDAS FSFDGVIGAF ALTQNLFVIA IGLGIGAMYV RSMTIMLVEK GTLAEYRYLE 
HGAFYAILIL SVIMYAQTLV HIPEVITGLG GATLIGLSLW SSIRHNRRER LEDHANRQEE 
LHA