Gene Rleg2_3701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3701
Symbol
ID	6982463
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	3828671
End bp	3829957
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	66%
IMG OID	643398423
Product	hypothetical protein
Protein accession	YP_002283190
Protein GI	209551273
COG category	[S] Function unknown
COG ID	[COG4223] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTATCGG GAAACCCGCC ACGCCATTCG AAGAGCGCCG ACGAGCCGGT CACGATCGAC 
CTCGAAGGAC AGGATTTCGC CTCTGCAGCC GATACCGAAA AGCCGGTTGA GAAGGATGTC 
GGCGACGCCG ACAACAGCAC CGCCGATGCC GGCGTGACGC CCGAAACCGA GGCTGCGCCG 
CAGTTCGAAC AGGCACGAAC CGAGCAGGAA CAAGCCGAAC ACGAACCAGC CGAACAAGAG 
GACCAGCCTG CAACGGATGC GCCGGAGGAG GAGCCGGCAG CCCCGGAGCC TGCCTTCGCG 
CCGCCTCCCG AACAGCCGCG GCGCGCCGCC ACCTCCGGTC TGATCGCGGC CGGCATCTTT 
GGCGGCCTGG TGGCGCTGCT TGGCGCCGGC GCCATTCAAT ATGCCGGCTA TCTCCCGGGT 
TCCTCCGCGC CGCAGGCGAC ATCGCCTGAC ATCGCCGATC TTTCCGGCGA GATCGATGGC 
TTGAAACAGA CCGTTGCCAA TCTTGCCGCC AATCCAGCGA GTACAGATGA CGGCGCGCTT 
GAAAAGCGCA TCGCCGCGCT GGAAACGACT GCCAAGGCGC CCGCAGCCGC CGCCCCGGCC 
GATTCGGCAA ATGTCGAGGC ACTCAACCAG AAGATTGCCG AGCTGACCGG CCAGGTCGAC 
CAACTGCGTG CCACCCTGGC CCAGTCTTCC GAGCAACAGA CGACGAGCGG CGCCGATATC 
GCCAAACGTC TCGACGAGGC CGAAAAGAAG CTGAACGAGC CGCGCGAGGA TGTCGCCGTC 
GCCCGGGCGA TCGCGGCGGC CGCCCTCAAG GCGGCGATCG ATCGCGGCGG GCCGTTCCTG 
GCCGAACTCG ATACTTTCGC CGGCGTCGCC CCCGACGATC CCGCAGTCGC CGACCTTCGA 
GCCTTTGCCG AAACCGGCAT TCCCTCGCGC GCCGAACTCA TGCGTCAGGT TCCCGATGTC 
GCCACGGCGA TCGTCGAAGC CGTCAACCAG CCGGATCCAA ACGAGAGCTG GTCGGACCGG 
TTGATGTCGA GCGCCAAGTC GCTGGTATCG GTCCGTCCCG TCGGCAATAT CGAGGGCGAC 
AGCGTAGAAG CCATCGCCGC CCGCATGGAG GACAAGGTGA AGAGCGGCGA TTTGCCGGGC 
GCTTCCGCCG AATGGAACAA CCTGCCGGCT CCCGGCAAGC AGGCGTCCGC CGCCTTCAAG 
CAATCGCTCG AAGCGCGTAT CCGCGTCGAG GAACTGGTCG GCGGGGCGCT GTCGAAAGCG 
GTTTCCGGCA CCGGCAAGGA GGGATGA

Protein sequence

MVSGNPPRHS KSADEPVTID LEGQDFASAA DTEKPVEKDV GDADNSTADA GVTPETEAAP 
QFEQARTEQE QAEHEPAEQE DQPATDAPEE EPAAPEPAFA PPPEQPRRAA TSGLIAAGIF 
GGLVALLGAG AIQYAGYLPG SSAPQATSPD IADLSGEIDG LKQTVANLAA NPASTDDGAL 
EKRIAALETT AKAPAAAAPA DSANVEALNQ KIAELTGQVD QLRATLAQSS EQQTTSGADI 
AKRLDEAEKK LNEPREDVAV ARAIAAAALK AAIDRGGPFL AELDTFAGVA PDDPAVADLR 
AFAETGIPSR AELMRQVPDV ATAIVEAVNQ PDPNESWSDR LMSSAKSLVS VRPVGNIEGD 
SVEAIAARME DKVKSGDLPG ASAEWNNLPA PGKQASAAFK QSLEARIRVE ELVGGALSKA 
VSGTGKEG