Gene Rleg_4747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4747
Symbol
ID	8006968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	-
Start bp	115236
End bp	116306
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	60%
IMG OID	644821677
Product	ABC transporter related
Protein accession	YP_002972937
Protein GI	241113102
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.155462
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGGCT TGAGCATCAG AAACGTCAAG AAATCCTTCG GCACGGTCGA CATCATTCAT 
GGTGTCGACG TCGAGATCGC CGACGGTGAA TTTACCATTC TCGTCGGCCC CTCCGGCTGC 
GGCAAGTCGA CATTGCTGCG CATGATTGCC GGGCTCGAGG ATATCACCGC CGGCCAGATC 
AGCATCGATG GTCGGGTCGT GAACAATCTG CAGCCGAAGG ATCGCGATAT CGCGATGGTC 
TTCCAGAACT ATGCATTGTA CCCGCAGATG ACGGTCTCCC AGAACATGGG ATTTGCGCTC 
GAGCTCGCCG GGGTCAAGCG GCCGGAAATC GAACAGAAGG TCGGTGAGGC TGCAGCAATT 
CTCGGATTGC AGCCGCTTCT CGATCGAAAG CCGGCGCAGC TGTCGGGCGG ACAGCGGCAG 
CGCGTCGCCA TGGGCCGCGC CATTGTTCGA GATCCGAAAG TCTTTCTCTT CGACGAGCCG 
CTCTCCAATC TGGATGCGAA ACTGCGGGTG AAGATGAGGG CGGAGATCAA GGCTCTGCAC 
CAGCGCCTGA AGACGACGAT CGTTTACGTC ACCCATGACC AGATCGAGGC CATGACCATG 
GCTGACAAGA TCGTCGTGCT CCACGGCGGT CGGGTCGAAC AGATCGGCAG CCCGCTCGAA 
CTCTACGACC GACCGCGCAA TATCTTTGTC GCCGGCTTCC TCGGTTCCCC CGCGATGAAT 
TTTCTCGAGG GAACTCTTGA GGGCGCAGGC AACCCGGTAT TGTCGCTGCC GGGTGGGTCA 
CGCGTAACGC TTTCGCGGGC TCCAGCCAAT GCCGCCAACA GACCGCTGAC GCTGGGCATT 
CGCCCCGAAG ACATCACCTT CGGTGGCGAA AACGGTGTGG ATGCCGTGGT CAAGGTGGTC 
GAACCCACGG GATCGGAAAC CCATGTCGCC GTGGAGCTCG AAGGCAGGGA ACTGACATGG 
GTCGTTCGCG AACGTGTCGA GCTGGTGCCG GAACAGCCGG TGAAGCTTTC TTTCGAAACG 
GCCAAGGTTC ACTTCTTCGA CCGGCAGACG CAGCAGCGCC TGAACGCCTG A

Protein sequence

MSGLSIRNVK KSFGTVDIIH GVDVEIADGE FTILVGPSGC GKSTLLRMIA GLEDITAGQI 
SIDGRVVNNL QPKDRDIAMV FQNYALYPQM TVSQNMGFAL ELAGVKRPEI EQKVGEAAAI 
LGLQPLLDRK PAQLSGGQRQ RVAMGRAIVR DPKVFLFDEP LSNLDAKLRV KMRAEIKALH 
QRLKTTIVYV THDQIEAMTM ADKIVVLHGG RVEQIGSPLE LYDRPRNIFV AGFLGSPAMN 
FLEGTLEGAG NPVLSLPGGS RVTLSRAPAN AANRPLTLGI RPEDITFGGE NGVDAVVKVV 
EPTGSETHVA VELEGRELTW VVRERVELVP EQPVKLSFET AKVHFFDRQT QQRLNA