Gene Rleg_1888 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1888
Symbol
ID	8012938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	1875234
End bp	1876313
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	63%
IMG OID	644824477
Product	ABC transporter related
Protein accession	YP_002975709
Protein GI	241204613
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.2512
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGGC TCGAGCTCAG GAACATCGTC AAGAATTTCG GCGCCGTCGA GGTCATTCGC 
GATGTCTCGC TTCATGTCAA TGACGGCGAG TTCGTCGCTT TCGTCGGCCC TTCCGGTTGC 
GGGAAATCGA CGCTCTTGCG CCTGATTGCC GGCCTCGATA AGCCGACTGA CGGCAGCATC 
GCCATCGACG GCAAGGATGT TACCGCTATC AGCGCTGCCG ATCGCGGCCT GGCCATGGTC 
TTCCAGTCCT ATGCGCTCTA TCCGCATATG AGTGTCAGGG AGAACCTCGC CTTTGGTCTC 
GAGAACACCA AGGTGGCGAA AGCCGAGATC GAAGCGCGCA TTACCGACGC CGCGCGCATG 
CTGGAGATCG AGCCTTTCCT GCAACGCCGT CCGGGCCAAC TCTCCGGCGG CCAGCGCCAG 
CGCGTCGCCA TCGGCCGCGC CATCGTGCGG CGGCCGGATG CCTTTCTGCT CGACGAGCCG 
CTATCCAATC TCGACGCCGA ACTCAGGGTC AGCATGCGGG CCGAACTGGC GGCCCTTCAC 
GCCCGCCTGA AGGCGACGAT GATCTACGTC ACCCACGATC AGGTCGAGGC AATGACACTG 
GCCGACCGCA TCGTCGTGCT GAGAGGCGGC AGGATCGAGC AGGTGGGAAC ACCGCTGGAA 
CTCTACAACA AGCCGGCCAA CCGCTTCGTC GCCGGCTTCA TCGGCGCGCC GCACATGAAT 
TTCCTCGAAG GTGCGATTGT CGGTCACGAG GGCGGTTTCG CTGAAGTCGA AACCGTCGGC 
GGCCATCGCC TTTCCGTCAT TGCCAAGGAG GCCCCCCCGG CGGGCGAAAG GGTCAGCATC 
GGCATTCGGC CGCAGCATAT CACCCTCGCC GAAGCGGGCT CAGCGGGCAG ACTGGATACA 
AGCGTTACCC TTGTCGAGGA ATTGGGCTCG GAGACTGTCG TCCACGCCGA CGCAGGCGGG 
AAGAAGCTGA TTGCGGTTTT TGCCGGCCAG CAGCGGATGA AATCGGGTGA CAGCCTGCCG 
CTGCATCTCG ACCCCGATGT GCTGCACCTC TTCGGCGAGG ACGGCAGGCG CTTGTCCTAA

Protein sequence

MSGLELRNIV KNFGAVEVIR DVSLHVNDGE FVAFVGPSGC GKSTLLRLIA GLDKPTDGSI 
AIDGKDVTAI SAADRGLAMV FQSYALYPHM SVRENLAFGL ENTKVAKAEI EARITDAARM 
LEIEPFLQRR PGQLSGGQRQ RVAIGRAIVR RPDAFLLDEP LSNLDAELRV SMRAELAALH 
ARLKATMIYV THDQVEAMTL ADRIVVLRGG RIEQVGTPLE LYNKPANRFV AGFIGAPHMN 
FLEGAIVGHE GGFAEVETVG GHRLSVIAKE APPAGERVSI GIRPQHITLA EAGSAGRLDT 
SVTLVEELGS ETVVHADAGG KKLIAVFAGQ QRMKSGDSLP LHLDPDVLHL FGEDGRRLS