Gene Smed_5008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5008
Symbol
ID	5318657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1525936
End bp	1526967
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	64%
IMG OID	640776790
Product	regulatory protein LacI
Protein accession	YP_001313722
Protein GI	150377126
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0284302
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAGAC GGCCGACGAT TGCGGATCTG GCCCGCGCAT CAGGCGTGAG CGTTGCAACG 
GTCGATCGCG TGCTGAACGG CCGTCATCCG GTGCGCGAGG AAACGGCGCG CCGCGTCTAC 
GATGCGGCGA AGGCGATCGG CTACCACGCG GTCGGCCTGC TTCGCCAACG GGTTTTCGAG 
GACCTGCCGC AATTTCGGCT CGGCTTTCTC CTGCAGAAGC CGGAGCAATC ATTCTACAAG 
GCGCTCGCAA AGGAGATCGA AAACGCGGCC CTTGCGGTGA CGCATGTGCG TGCCGTTCCG 
CAGGTGGATT TCGTCGCAAG CTCCACGCCG CAAGGGATCA TCGAAAAGTT GAAGGCCATG 
GCGGCGCGCA ATCAGGCGAT CGCCCTGGTG TCGCCGGATT ATCCGGCCGT GACCGCCGCG 
GTCGAGGACC TCAGGGATCG CGGCATTCCC GTCGTCGCAC TGCTTTCCGA CTTTGCCGCC 
GGCGTGCGCG AGGCCTATGT GGGCCTCAAC AATCAGAAGG TCGGCAGAAC GGCGGCATGG 
ATGATCGCCA AGGCGGCGAA GCGTCCGGGA AAGGTCGCCG CCTTCGTCGG CAGCCACCGC 
TTCCATGGAC ACGAGCTGCG CGAGATCGGC TTTCGTTCGT ATTTTCGCGA AAACGCACCC 
GAGTTCGAAG TCCTCGACAC GATGGTGAAC CTCGACACGC CCGAGATCAC CCATGAGGCA 
ACGCTCGATC TCCTGCAACG CCACCCCGAT GTCCTCGGTT TCTACGTCTG TGGCGGCGGC 
ATGGAGGGTG CCATTTCGGC GATCCGGGAG GAAAGGCTCG AGGGCAAGCT GCTCGTGGTC 
GTCAACGAGC TGACGCCGGA ATCGCGCGCG GCACTCGCCG ATGAAACATT GCTTATGGCG 
ATCTCGACGC CCGCCTCGGC ATTGGCCCGG GAATCGGTGA GCCTGATGAT CGGCGCGATC 
GACCGGGAGG CCGCGAGCGT GCCCGGCCAA ACCTTCCTGC CCTTCGACAT CTACACGCCC 
GAGAACATCT GA

Protein sequence

MTRRPTIADL ARASGVSVAT VDRVLNGRHP VREETARRVY DAAKAIGYHA VGLLRQRVFE 
DLPQFRLGFL LQKPEQSFYK ALAKEIENAA LAVTHVRAVP QVDFVASSTP QGIIEKLKAM 
AARNQAIALV SPDYPAVTAA VEDLRDRGIP VVALLSDFAA GVREAYVGLN NQKVGRTAAW 
MIAKAAKRPG KVAAFVGSHR FHGHELREIG FRSYFRENAP EFEVLDTMVN LDTPEITHEA 
TLDLLQRHPD VLGFYVCGGG MEGAISAIRE ERLEGKLLVV VNELTPESRA ALADETLLMA 
ISTPASALAR ESVSLMIGAI DREAASVPGQ TFLPFDIYTP ENI