Gene Smed_4919 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4919
Symbol
ID	5319131
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1429854
End bp	1430903
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	63%
IMG OID	640776703
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001313635
Protein GI	150377039
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.35548
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGGAA TTCGGCGCCT GGCGCAACAT CTCGATATTT CGATCGGAAC GGTTTCGCGT 
GCATTGAACG GCCGCCCCGA CGTTAACGAG GAGACGCGCA GGCGGGTCCT CGAAGCGGCC 
GAGAAGCTCG GCTATGTGCC GAACCAGTCG GGCCGCAGCC TGAGGCAGGG CACCACCAAC 
ATCATTGGCT TCATGATGCA GACCGGCACG GAGATCACCG GCCAAGGCGA CACCTTCTTC 
ATGAGTGTCT TCGACGGCGT GCAGGCGGTC TTCGCCAGGC ATAAGCTCGA CCTCGTCGCC 
CTGCTCTGCT CGTCCGAGGA GGATCAGAGC GATTACCTGC GCCGCGTCGT TGCGCGCGGT 
TTCGCCGACG GCCTGATCCT CTCGGCCACG CAGCGGCACG ATCCGCGTAT CGAGTATCTG 
GCCGAACGCA ACATCCCCTT CATTACCCTC GGCCGAAGCC TCACGGATGT CGGGCGGCCC 
TGGCTGGATC TCGATTTCGA GGGAATGGCT CAGATCGCGA TCGACCGTCT CGTCGCCCGT 
GGACATCGCC GTATCGCGGT CACCCGCCCC CATGACGACG CCAATCTCGG CTACATCTTC 
GTCGACCGCT GCCGCGAAGC GCTCGCCGCG CATGGCCTCA CTCTGGAGGA GGAGCTGATC 
TTCCGATCGA CGCCGAACGA AACCGGTGGC TATCAGATCG CACGCGAACT CCTGAAGCTC 
GAGGACCGGC CGACGGCTGC CTTGCTCGTC AACGAGACGA TCGCCATCGG ATTTTACCAG 
GGCCTTTCCG AAGCCGGCGT CAGGCCCGGC CGCGACATCG CGGTGATCGG GCGCTACAGC 
CCGCATGCGC ATTTTCTTTC GCCGCCGCTC ACCTGTTTCC GTCTGTCGCT GCGCGACCTC 
GGCATAGCGC TTGCGGAGAC GCTGCTTTCC ACTATGCCGA CTTTCCAGGA GCATTACCCG 
CAGGCGTTGA CAAATGCGGT CTGGCCGATG GAGCTCATCG AAGGCGAAAG CGACGGCTTT 
CGCGTCAATG GCGACGAAAG TCGCGGCTGA

Protein sequence

MKGIRRLAQH LDISIGTVSR ALNGRPDVNE ETRRRVLEAA EKLGYVPNQS GRSLRQGTTN 
IIGFMMQTGT EITGQGDTFF MSVFDGVQAV FARHKLDLVA LLCSSEEDQS DYLRRVVARG 
FADGLILSAT QRHDPRIEYL AERNIPFITL GRSLTDVGRP WLDLDFEGMA QIAIDRLVAR 
GHRRIAVTRP HDDANLGYIF VDRCREALAA HGLTLEEELI FRSTPNETGG YQIARELLKL 
EDRPTAALLV NETIAIGFYQ GLSEAGVRPG RDIAVIGRYS PHAHFLSPPL TCFRLSLRDL 
GIALAETLLS TMPTFQEHYP QALTNAVWPM ELIEGESDGF RVNGDESRG