Gene Rleg2_5823 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5823
Symbol
ID	6977212
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011366
Strand	-
Start bp	233864
End bp	235069
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	62%
IMG OID	643393278
Product	putative branched-chain amino acid ABC transporter, substrate-binding protein
Protein accession	YP_002278096
Protein GI	209546206
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.281514
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.102648
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAGA ATCTCGTTGC ATCAGTTGCA TTTCTGCTTG CGAGCAGCAC AGCGGTGCTC 
GCGCAGAGCG CGACCGACGG CAAGGTCAAG ATCGGCATCC TGAACGACCA GTCGGGCGTT 
TATGCCGACT TTGGCGGCAA GTCTTCCGTC GAAGCCGCCA AGATGGCGGT CGAGGATTTC 
GGCGGCAAGG TACTTGGTGT GCCGGTCGAG ATCGTCGATG CCGACCACCA GAACAAGCCC 
GATATTGCCT CCAACATCGC CCGCCAGTGG TATGACACCG AGCAGGTAGA TGCGATCATG 
GAGTTGACGA CCTCGTCGGT GGCGCTCGCC GTGCAGGCGA TCGCCAAGGA AAAGAAAAAG 
ATCGACATCG TCACCGGTGC GGCGACGACG GATCTCACCG GCAAGGCCTG CTCGCCTTAC 
GGCTTCCATT GGGCCTACGA CACCCATGCG CTTGCCGTCG GCACCGGCGG TGCGCTGGTC 
AAGCAGGGCG GCGACAGCTG GTTCTTCCTG ACCGCCGACT ATGCTTTCGG CTATTCGCTG 
GAGCAGCAGA CCACCGACTA CGTCAAGGCG AGCGGCGGCA CAGTCGTCGG CGCCGTCCGC 
CATCCGCTAT CGACCCAGGA CTTCTCGTCC TTCCTGCTGC AGGCACAATC ATCCGGCGCC 
AAGGTGATCG GCCTCGCCAA TGCCGGCCTC GATACCTCGA ACGCCATCAA GCAGGCGGCC 
GAATTCGGCA TTACCCAGGG CGGCCAGCAT CTGGCGGCGC TGCTCTTCAC GCTCGCCGAA 
GTCCATGGTC TCGGCCTCGA GGCGGCGCAG GGGCTGACGC TGACCGAAGG CTTTTATTGG 
AACCGCGACG ACGACAGCCG CGCCTTCGCC AAGAAATTCT TCGCCCGCAC CGGCAAGATG 
CCCAACATGA TCCATACCGG CACCTATTCG GCGGTGATGC AATATCTGAA GGCGGTGCAG 
AAAGCCGGAA CCGACGAGAC GGAAGCCGTC GCCAAACAGC TGCATGAAAT GCCTGTCGAT 
GACGTCTTCG GCCGTGGCGG CACGGTCGGC GCCAACGGCC GCATGATCCA CGACATGTAC 
CTGCTGCAGG TCAAGAAGCC GGCCGACAGC AAGGAGCCGT GGGACTACTT CAACGTTCTC 
GCCACCATTC CCGGCAAGGA AGCCTATATC GACCCCGCCA AGAGCGGCTG CGATCTGGTG 
AAGTGA

Protein sequence

MRKNLVASVA FLLASSTAVL AQSATDGKVK IGILNDQSGV YADFGGKSSV EAAKMAVEDF 
GGKVLGVPVE IVDADHQNKP DIASNIARQW YDTEQVDAIM ELTTSSVALA VQAIAKEKKK 
IDIVTGAATT DLTGKACSPY GFHWAYDTHA LAVGTGGALV KQGGDSWFFL TADYAFGYSL 
EQQTTDYVKA SGGTVVGAVR HPLSTQDFSS FLLQAQSSGA KVIGLANAGL DTSNAIKQAA 
EFGITQGGQH LAALLFTLAE VHGLGLEAAQ GLTLTEGFYW NRDDDSRAFA KKFFARTGKM 
PNMIHTGTYS AVMQYLKAVQ KAGTDETEAV AKQLHEMPVD DVFGRGGTVG ANGRMIHDMY 
LLQVKKPADS KEPWDYFNVL ATIPGKEAYI DPAKSGCDLV K