Gene Rleg_5981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5981
Symbol
ID	8016339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012852
Strand	-
Start bp	10270
End bp	11340
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	59%
IMG OID	644827293
Product	ABC transporter related
Protein accession	YP_002978493
Protein GI	241258609
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACGTA TCACCCTCGA TCATATTCGA CATGCCTATG GGCCGAACCC GAAGAGCGAG 
AAGGACTACG CTCTCAAGGA AGTGCACCAC GAGTGGAACG ATGGCGGTGC CTATGCGCTG 
CTCGGACCTT CAGGCTGCGG AAAGACCTCG CTGCTCAATA TCATTTCCGG CCTTATTCAG 
CCCTCCGAAG GACGAATTCT CTTCGACGGA CAGGATGTTA CGAACCTGCC GACGCAGCAG 
CGAAATATTG CGCAGGTATT CCAGTTTCCG GTCATCTACG ACACGATGAC CGTCTATGAC 
AATCTGGCCT TCCCCTTGCG CAACCGCGGA GTCGCGGAGC CTGATGTTGA TCGTCGTGTC 
CGCGAAATAT TGGAGATGAT TGATCTTGCA GATTGGGCCA AGCGTCGCGC GCGCGGTTTG 
ACGGCGGACC AAAAGCAGAA GATTTCGCTC GGCCGCGGCC TGGTGCGCTC GGATGTGAAC 
GCGATTCTCT TTGACGAGCC GCTCACTGTT ATCGATCCGC ATATGAAATG GGTGCTGCGA 
TCGCAGCTGA AGCGGCTGCA TAAGCAGTTC GGTTTTACAA TGGTCTATGT CACGCATGAC 
CAGACGGAGG CGCTGACCTT CGCCGACAAA GTCGTGGTGA TGTACGATGG CGAGATCGTG 
CAGATCGGCA CGCCGGCCGA GCTCTTCGAG CGTCCGAGTC ATACCTTCGT CGGCTACTTC 
ATCGGTTCTC CGGGCATGAA CTTCATGCCA GCCAAGGTGG AAGGCCGCAC GGTTCGGGTC 
GGCGAGCATG CGCTGACGCT CGACTATGCG CCAAAGATTT CGGCAGCGGC CAAGGTAGAG 
CTTGGAATCC GGCCCGAGTT TGTTCGGGTC GGCCGCGAGG GCATGCCTGT GACCGTCAGC 
AAGGTGGAAG ATATCGGCCG GCAGAAGATC GTCCGCGCGC AGTTTGCCGG CCAGCCGATC 
GCGATAGTCG TCCCTGAGGA CGAGGACATT CCGGCTGATC CGCGGGTGAC CTTCGAGCCA 
TCGGGTATCA GTATCTATGC CGACTCTTGG CGCGCCGGAC CGGAGGCTTG A

Protein sequence

MARITLDHIR HAYGPNPKSE KDYALKEVHH EWNDGGAYAL LGPSGCGKTS LLNIISGLIQ 
PSEGRILFDG QDVTNLPTQQ RNIAQVFQFP VIYDTMTVYD NLAFPLRNRG VAEPDVDRRV 
REILEMIDLA DWAKRRARGL TADQKQKISL GRGLVRSDVN AILFDEPLTV IDPHMKWVLR 
SQLKRLHKQF GFTMVYVTHD QTEALTFADK VVVMYDGEIV QIGTPAELFE RPSHTFVGYF 
IGSPGMNFMP AKVEGRTVRV GEHALTLDYA PKISAAAKVE LGIRPEFVRV GREGMPVTVS 
KVEDIGRQKI VRAQFAGQPI AIVVPEDEDI PADPRVTFEP SGISIYADSW RAGPEA