Gene Rleg_5050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5050
Symbol
ID	8007643
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	-
Start bp	433253
End bp	434362
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	61%
IMG OID	644821965
Product	ABC transporter related
Protein accession	YP_002973225
Protein GI	241113390
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.251909
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAGCA TTTCGCTTAA AGAGCTGAAC AAGAGCTACG GTGCGCTCAC CGTCGTCCAC 
GACATCGACC TCGAGATCGC AGACAAGGAA TTCATCATTC TGGTCGGCCC GTCGGGCTGC 
GGCAAATCGA CGACGCTGCG GATGATCGCC GGCCTCGAGG AAATATCGGG AGGAGAGCTC 
AAGATCGGCG GCGACGTCAT GAACGACGTC CCGTCCAAAG ATCGGGATAT CGCCATGGTG 
TTCCAGAACT ATGCGCTCTA TCCGCATATG ACCGTCTACA AGAACATGGC TTTCGGCCTG 
CAGCTCAGGA AGGTGTCGCG CGACTTCATC GACGCGCAGG TGCAGGACGC CGCCAGGATC 
CTCGACATCT CTCATCTCCT CAACCGCAAG CCGAAGGCGC TTTCGGGCGG GCAGCGCCAG 
CGCGTCGCGC TCGGCCGCGC CATGGTGCGC AATCCGGCGG TCTTCCTTCT CGACGAGCCG 
CTTTCCAATC TCGACGCCAA GCTGCGCGGC ACCATGCGCT CCGAAATCAC CAAGCTGCAC 
AAGCGCCTCA ACGCCACCTT CATCTACGTC ACCCATGACC AGGTCGAGGC CATGACCATG 
GCGGATCGGA TCGTCGTCAT GAAGGACGGG CACATCCAGC AGGTGGATAC GCCGCAGAAC 
CTCTATGACC GCCCCGTCAA CATGTTCGTT GCCGGCTTCA TCGGCGCACC GCAGATGAAC 
ATGCTGCCCT CGACCATTCT GCGCCGGGGC GACGGCTACG TCGCCGTCTT CGACGGCCGG 
GAACTGCCGC TGCCTGCCCA TTTCGACAAA AGCAGGATCG CCCCCTACGA GGGTCGCGAA 
CTGGTGCTTG GCATCCGTCC GGAGAATTTC CACGAGCTGC CGCCGGCCGA CATCGCGCCC 
GAGAACCTGG CGCCTCTCAA GGCGATCGTC GAACTTGCCG AACCGATGGG ATCGGAAGTG 
CACCTGAACA TGGTAGCAGG CGGTCGCAAT CTGATCGCCC GCGTCTCGCC GCGTTACCGG 
CCTGATATCG GCGAAGAGGC GACGCTGGTC GCCGATATGA CCAATGCGCA GTTGTTCGAC 
AATGAAACGG AACGCTCGAT TCTATACTGA

Protein sequence

MASISLKELN KSYGALTVVH DIDLEIADKE FIILVGPSGC GKSTTLRMIA GLEEISGGEL 
KIGGDVMNDV PSKDRDIAMV FQNYALYPHM TVYKNMAFGL QLRKVSRDFI DAQVQDAARI 
LDISHLLNRK PKALSGGQRQ RVALGRAMVR NPAVFLLDEP LSNLDAKLRG TMRSEITKLH 
KRLNATFIYV THDQVEAMTM ADRIVVMKDG HIQQVDTPQN LYDRPVNMFV AGFIGAPQMN 
MLPSTILRRG DGYVAVFDGR ELPLPAHFDK SRIAPYEGRE LVLGIRPENF HELPPADIAP 
ENLAPLKAIV ELAEPMGSEV HLNMVAGGRN LIARVSPRYR PDIGEEATLV ADMTNAQLFD 
NETERSILY