Gene Rleg_4721 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4721
Symbol
ID	8007196
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	+
Start bp	91167
End bp	92228
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	60%
IMG OID	644821654
Product	ABC transporter related
Protein accession	YP_002972914
Protein GI	241113079
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCATG TTTCGGTCAA CAATGCGCGC AAGGATTACG GCGCGTTCAA AGCCATAAAA 
GGCGTCTCGG TCGATATCGG CGACGGCGAG TTCGTCGTTC TGGTCGGTCC CTCCGGCTGT 
GGCAAATCCA CGCTTCTGAG AATGATCGCG GGCCTCGAGG GTATCACCTC GGGGCAGATC 
CAGATCGGCA AGCATATCGT CAACGAGCTT GCCCCCAAGG ATCGGGACAT CGCGATGGTG 
TTCCAGAATT ATGCGCTCTA TCCGCACATG ACCGTTGCCA AGAACATGGG GTTTTCGTTG 
CGGCTGAAAC GAATGCCGCG CACGGAGATC GATCAGCGGG TCGGCAACGC CGCGAAGATC 
CTCGGTCTCG AAAGTCTATT GGAGAGATAC CCCAAGCAAC TGTCGGGCGG CCAGAGACAG 
CGTGTGGCGA TGGGGCGGGC AATCGTGCGC GACCCGGCCG TCTTCCTCTT CGATGAACCC 
CTGTCGAACC TCGACGCCAA GCTCAGGGTG CAGATGCGCT CGGAGATCAA GGAATTGCAT 
CAACGGCTGC AGACGACCAC CATCTATGTC ACCCACGACC AGATCGAAGC CATGACCATG 
GCCGACAAGA TCGTCGTCAT GAAGGACGGG CTGATCGAGC AGTCGGGTTC TCCGTTGGAA 
TTGTACGATC GTCCGAACAA CCTTTTCGTC GCCGGCTTCA TCGGCTCCCC GGCGATGAAT 
TTCATCAGCG GCAACATGAC GGAAGATGGG TTTCGAACCG CCGACGGCCT ACTCCTGCCG 
AGTGAGCGCC GTCCGGCAGA TGCCGCGATC TACGGCATTC GCCCCGAACA TATCCGGTTG 
GACCCAGGCG GCATCGAGGT AACGACGGTG GTCGTCGAGC CCACGGGTTC GGAAACGCTC 
GTCATCGTCC GGCTGGGGAC GCAGACGCTG ACCTGTGTCT TCAGGGAACG GATCAGGGCC 
GCCCCCGGCG AGGTGCTGAG GATTGCACCA ATCCATGATG CGGTTCACCT GTTTGCCGGA 
AACGAGCAGC GGATCACATC AGGCGAAGCC CCGTTGAACT GA

Protein sequence

MAHVSVNNAR KDYGAFKAIK GVSVDIGDGE FVVLVGPSGC GKSTLLRMIA GLEGITSGQI 
QIGKHIVNEL APKDRDIAMV FQNYALYPHM TVAKNMGFSL RLKRMPRTEI DQRVGNAAKI 
LGLESLLERY PKQLSGGQRQ RVAMGRAIVR DPAVFLFDEP LSNLDAKLRV QMRSEIKELH 
QRLQTTTIYV THDQIEAMTM ADKIVVMKDG LIEQSGSPLE LYDRPNNLFV AGFIGSPAMN 
FISGNMTEDG FRTADGLLLP SERRPADAAI YGIRPEHIRL DPGGIEVTTV VVEPTGSETL 
VIVRLGTQTL TCVFRERIRA APGEVLRIAP IHDAVHLFAG NEQRITSGEA PLN