Gene Rleg_5080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5080
Symbol
ID	8007673
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	+
Start bp	466887
End bp	467993
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	63%
IMG OID	644821995
Product	ABC transporter related
Protein accession	YP_002973255
Protein GI	241113420
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.199927
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGAAC TGAAACTTTC CAACGTCAAC AAATCGTATG GCTCGGTCAA AGTCCTGCAT 
GACGTCGAAC TCGATATCAC GGACGGCGAG TTCGTCGTCT TCGTCGGGCC GTCGGGATGT 
GGCAAGTCGA CTCTGCTGCG TGTCATTGCC GGCCTCGAAG AGGTGACGGA GGGCGCAATC 
GCGATCGGGG GCCGCGATGT CAGCGCGCTC TCGCCGGCCG AGCGCAAGAT CGCAATGGTC 
TTCCAGTCCT ACGCGCTCTA TCCGCATATG AGCGTTCGCA AAAACCTCGC TTTCGGCCTG 
GAGAACCTGA AGTTCAAGCG TGCCGAGATC GAGGCGCGGA TTGCCGAGGC CGCCAGGATG 
CTGGCGATCG AGCCCTACCT GGACCGACGC CCGAAGCAGC TTTCGGGCGG CCAGCGCCAG 
CGCGTGGCGA TCGGCCGGGC TATCGTGCGC GAACCGGACA TTTTTCTCTT CGACGAGCCG 
CTGTCGAATC TCGACGCGGC GCTGCGCGTT CAGACCCGCG CCGAGATCAC CAAGCTCCAC 
CGCGAGATCA AGACGACGAT GATTTATGTC ACGCATGACC AGGTCGAGGC GATGACGATG 
GCCGACAAGA TCGTCGTGCT GCGCGCCGGG CGGGTCGAGC AGGTCGGCGC GCCGCTGGAC 
CTGTTCGACA GCCCACGCAA TCTCTTCGTC GCCGGCTTCC TCGGCTCGCC GCGCATGAAC 
ATCATCAAGG GCAAGGTCGC TGGCATCGAG GAAGGCGGCG TCGTCATCGA TGTCGGCAAT 
GGTGGCAAGG TCGTCAGCGA TGTCGATCCC GCCGGAGTTG CGGTCGGACA GGCTGTTCTC 
GCCGGCATCC GGCCCGCGCA TTTTTCACGC TCCAGCGAGC AGGGCCTGCC GTTCATCGTC 
CAGTATCACG AGGGCCTCGG TACGGAGACC TATGTCTATG GCAATCTTGC AGGCCATGAC 
GAGCAGATCA TCATTCACGA GGCCGGCCAT TTCGCGCCGG CGCCTGGTGA TCGCATCCTG 
ATCGATGCCG CCCCGGGGCG GGTTCATCTG TTCGATCCCG AAAGCGGCCT GGCTTTTGCC 
CGGCGGCCCG GACAGGGGAG GCGCTGA

Protein sequence

MAELKLSNVN KSYGSVKVLH DVELDITDGE FVVFVGPSGC GKSTLLRVIA GLEEVTEGAI 
AIGGRDVSAL SPAERKIAMV FQSYALYPHM SVRKNLAFGL ENLKFKRAEI EARIAEAARM 
LAIEPYLDRR PKQLSGGQRQ RVAIGRAIVR EPDIFLFDEP LSNLDAALRV QTRAEITKLH 
REIKTTMIYV THDQVEAMTM ADKIVVLRAG RVEQVGAPLD LFDSPRNLFV AGFLGSPRMN 
IIKGKVAGIE EGGVVIDVGN GGKVVSDVDP AGVAVGQAVL AGIRPAHFSR SSEQGLPFIV 
QYHEGLGTET YVYGNLAGHD EQIIIHEAGH FAPAPGDRIL IDAAPGRVHL FDPESGLAFA 
RRPGQGRR