Gene Smed_2039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2039
Symbol
ID	5322898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2091126
End bp	2092163
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	65%
IMG OID	640790976
Product	regulatory protein LacI
Protein accession	YP_001327707
Protein GI	150397240
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.865704
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.671678
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGGAA AATGCCACGT GGTGAAATCG CGGCCGAAAG TGGATGAAAT TGCCCGCATG 
GCCGGCGTGT CGAAGGCGAC CGTCGACCGG GTGCTCAACA ATCGGCCGGG GGTGCAGGAG 
CATACGCGCG CTCACGTGAT GGCCATCGCT GCAAGCCTCG CCGAAACGCC GGGAGAAGTC 
TCGAACCCCG GTAAAATCGG CCTGGACTTC ATCCTCGCGG GCGGCACGAA CCCCTTTATC 
GCGGATCTGG CGCTCCACCT GGAGCGGCAG GCCGCGGTGC GACCGGATGT AGACGTCATC 
ATCCATCGGC TGAACGGCAT CGAGCCCGAG GAAATTGCCG AGAAACTGAC AAGCCTTCGC 
CCCTCCTGCA AGGGCGTCGG CCTGATCGGG CTCGACAGCC CGGCGGTCCG GGAGGCGTTG 
CGGCAGCGGA TCGCGGCGGG CGTCCCGGTG CTCACCCTTG TCTCCGACAT CAGTCACGTC 
GGGCGGGTGA GCTATGTCGG CATTGACAAC CGGGCCGCGG GGCGGCTGGC CGGATACCTG 
ATCGGGCGCT TCGTGCCGGG CGCGAGGGGA AAGATCGCGC TGATTGCCGG TGCCCTTGCC 
TATCGCGGCC ATGAAGAACG CGAAATGGGT TTCCGGCACG TGCTCGACGA GCGGTTCCCT 
CTTCTGGAGA TCATCGCCGT TCGTGAGGTC AAGGAGAACC CCGAGCGCGC TTACAGCGAA 
GTGCGCACGC TGCTCGCCGA GGAGCCCGAA CTCGTCGCGA TCTACTGCAT CGGCGCCGGC 
CATGCAGGCA TTGCTCGCGC CTTGAAGGAG GCCGGGCGGG AGAAGTCCCT GATCTTCGTA 
GGGCACGACC TCACCGACGA TACCCGTCAG TATCTGCTGA GCGGCGTCAT GGACGCGGTG 
ATCGATCAGA ACGCCGGGGT CGAAGCGCGC GAAGCCATCG ACCGTCTCGT GCGCGCCACC 
CGCAACGAGA CCTCGATCTC TGCGGCGACG ATCCGCATTC AATCGGTTTT CAGCGAAAAC 
ATCCCAGCCG ACGCCTGA

Protein sequence

MTGKCHVVKS RPKVDEIARM AGVSKATVDR VLNNRPGVQE HTRAHVMAIA ASLAETPGEV 
SNPGKIGLDF ILAGGTNPFI ADLALHLERQ AAVRPDVDVI IHRLNGIEPE EIAEKLTSLR 
PSCKGVGLIG LDSPAVREAL RQRIAAGVPV LTLVSDISHV GRVSYVGIDN RAAGRLAGYL 
IGRFVPGARG KIALIAGALA YRGHEEREMG FRHVLDERFP LLEIIAVREV KENPERAYSE 
VRTLLAEEPE LVAIYCIGAG HAGIARALKE AGREKSLIFV GHDLTDDTRQ YLLSGVMDAV 
IDQNAGVEAR EAIDRLVRAT RNETSISAAT IRIQSVFSEN IPADA