Gene Smed_5241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5241
Symbol
ID	5319543
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	203666
End bp	204616
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	61%
IMG OID	640777018
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001313950
Protein GI	150377355
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.635479
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTGA CCGGGCTCAG AACCGCAGCG CTGGCTGCGG GCCTTGCCAC CTTGTTGACG 
TCAAGCGCAC TCGCGGCCGA CGTCAAGGCA ACGATGATCA TCTACCTCGA TCCGAGTGTG 
CAGTTCTTTA ATCCCGTGGT GAAGGGAGCG CAAGACGCCG CCGCCCAATT CGGCGTCGAC 
CTCGACGTGC AGTATGCCAA CAACGATCCG GTGCGCCAGA ATGACCTGAT CGAGAGCGCG 
ACGGTCAGCG GCGTTGACGG CATCGCCGTC GCGATCTCCA GTTCGGACGC ATTCGACGAG 
AGCATCTGCG CTGCAGTGAA GGCCGGCATC ATCGTCATCG GCTTCAACAA CGATGACCTC 
GACGGCGCCA AAGGGAACTG TCGCCAGGCC TATGTCGGCA TGGACGAGCT TGCCTCAGGC 
TATGAGCTCG GCAACCGCAT GATCAAGGAA TTTGGCCTCA AGTCCGGCGA CGTCGTCTTC 
AACCCGCGCG AAATTCCGGA AGCGAGCTTT GCAGTCGCCC GTGGTGGCGG CATCGAGAAG 
GCGATGACGG AAAACGGCAT CAAGGTGGAG ACGGTTCGTG CCGGCCTCGA CCCCGCCGAA 
GCGCAGAACA TCATCGCGCA ATTCCTCATC GCCAACCCGA ACGTGAAGGC GCTGTTCGGC 
ACCGGCTCGG TCACCTCCAC GGTGGGCGCG GGCGCCATCA AGGATGCCGG AGTAAACATT 
CCATTCGGCG GTTTCGACCT TGCGGTCGAG ATCGTAAACG CGGTGGATTC CGGCGCTATG 
TACGCGACCA TGGACCAGCA GCCCTATCTG CAGGGCTACT ACCCGATCGC CCAGATCGCG 
CTCGCCAAAA AATACGGACT GACACCGACC GACATCGACA CGGGTCAGGG CGCCTTCCTC 
GACAAGTCGC GCATCGGTTC GGTCAAGCCG CTGATCGGCA GCTATCGCTA A

Protein sequence

MKLTGLRTAA LAAGLATLLT SSALAADVKA TMIIYLDPSV QFFNPVVKGA QDAAAQFGVD 
LDVQYANNDP VRQNDLIESA TVSGVDGIAV AISSSDAFDE SICAAVKAGI IVIGFNNDDL 
DGAKGNCRQA YVGMDELASG YELGNRMIKE FGLKSGDVVF NPREIPEASF AVARGGGIEK 
AMTENGIKVE TVRAGLDPAE AQNIIAQFLI ANPNVKALFG TGSVTSTVGA GAIKDAGVNI 
PFGGFDLAVE IVNAVDSGAM YATMDQQPYL QGYYPIAQIA LAKKYGLTPT DIDTGQGAFL 
DKSRIGSVKP LIGSYR