Gene Rleg2_6321 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_6321
Symbol
ID	6983394
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011370
Strand	-
Start bp	271909
End bp	272979
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	57%
IMG OID	643399324
Product	extracellular solute-binding protein family 1
Protein accession	YP_002284080
Protein GI	209552164
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.374689
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAAT ACCTACTTGC CACCACTATG ATCGTGTCGA TCGCAACCGC AGCGCGGGCC 
GATGTCGTTG TGATGTCATG GGGTGGCGAC TACGGTGCCG GACAGATCGC TGCCTTCAAC 
AAGCCGTTTA CGGAGCAGAC CGGGATCAAA TCCAGCATGG TCGATTCCGA TAACCCGACA 
GCGCTGATCA AGTCCATGGT TGAAGCCAAA AACGTGACCG TCGACGTCGT TGAAGTCGAG 
TATCCCGATG CGATCCGCGG ATGCGACGAG GGCCTGCTCG AACCCGTCGA TCCCGCCATC 
CTCCCGGCAG GCTCAGACGG AACCGCTGCC AACGACGACT TCATGAAAGG CGCGGTCACC 
GAGTGCGGCG TAGCGACAGT CGTCTATTCA TGGGTCTTTG CCTACGACAA CAAAAAATTC 
ACTGACGGTC CGAAGACCGT AGCGGACTTC TTCGACACCA AAAAATTTCC GGGAAAACGC 
GCTCTTCGGA AACAGCCGAA ATTCGCACTT GAAATGGCGC TTATCGCCGA CGGAGTTTCC 
ACGGCGGATG TCTACAAGGT CCTCAATACC AAAGAAGGCG TTGACCGTGC CTTCGCAAAG 
CTCGGCACGG TGAAGGGCGA CTTGATCTGG TACCAGGCGA ATGCGGAGGC AGCACGCTTG 
CTGGCAGATG GAGAGGTAGT GATGTCTTCG GGCTCCGCAA ACCGCTTCTT CAACGCCGCA 
GTATCCGAAG GGAAGCCCTT CACCACAGTG TGGGACGGGC AAATCTACGA CTTTGCCATG 
TTCGTAATTC CCAAGGGAGC TCCGCATCTC GACGAAGCGA AGAAGTACTT GGCCTTCGCA 
ACTGACACGA AGCAGCTTGC CGCGATGGCC ACGGAACTTC CTTTCGGTCC AGCAAGAATG 
TCTGCGGTCC CGCTCGTGCA TTTCTTCAAA GACGGAAAGA CCGACATTCG CCCGCACATG 
CCCACTAACC CCGACAACCT GAAGAACGGT CTCGCCGTGT CTTCGGATTT CTGGGCCGAT 
CACGAAGCCG AATTGACGGA GCGCTTCAAC GCGTGGCTCG CCACGAATTG A

Protein sequence

MKKYLLATTM IVSIATAARA DVVVMSWGGD YGAGQIAAFN KPFTEQTGIK SSMVDSDNPT 
ALIKSMVEAK NVTVDVVEVE YPDAIRGCDE GLLEPVDPAI LPAGSDGTAA NDDFMKGAVT 
ECGVATVVYS WVFAYDNKKF TDGPKTVADF FDTKKFPGKR ALRKQPKFAL EMALIADGVS 
TADVYKVLNT KEGVDRAFAK LGTVKGDLIW YQANAEAARL LADGEVVMSS GSANRFFNAA 
VSEGKPFTTV WDGQIYDFAM FVIPKGAPHL DEAKKYLAFA TDTKQLAAMA TELPFGPARM 
SAVPLVHFFK DGKTDIRPHM PTNPDNLKNG LAVSSDFWAD HEAELTERFN AWLATN