Gene Smed_3846 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3846
Symbol
ID	5318721
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	303777
End bp	304808
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	62%
IMG OID	640775658
Product	LysR family transcriptional regulator
Protein accession	YP_001312591
Protein GI	150375995
COG category	[K] Transcription
COG ID	[COG0583] Transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGATAC GGGAGCTCGA GGCGTTTCTT GCAGTGATGT CGGCAGGCAG CATCACTGGC 
GCCGCCCGGC TGCTCGATCG TTCCCAGTCC CAGGTCACGC GCCTCATCCA GGATCTTGAG 
ACTTCCGTCG GATTCTCGCT CTTCGATCGC AACGGCCCGA AGATCGCTCC CAGCGAAAAA 
GGGATAGCAT TCCACGCGGA AGCCGAACGC TTCCTCAGCG GCATCGGCCA TTTGCGGGAG 
CGGGCAAGGA CGATCGCCGA AAAGGAGCCG CAGCCGATCG AGATCGTAGC GATCGCGGCT 
TTCGCGAGCG GCATCATCCC CATGGCGCTG GCGGCGTTGC CGGAAAGGCT CTTGCCGCGA 
AAGGTCCATC TGCGCAGCCT GCCGGCAGAG GCAGCGGTTC AATCTGTTCT GGCCCGCACG 
GCGGATTTCT GCGTCACGTC GCTGCCGGCC GACCAGCCAG GGCTGGAGGT ACACGGTGTA 
TTTCAGGCAC CTTGCGTCGC CGCGGTGGCG CCGGACGACC CCCTCACTGC CCGCGAGGTG 
ATTTCGATCG CCGACCTTGC CGGACGCAAT ATCATTACGA TGGCCAATCC GTTCCGGCTG 
CGAAGCCGCG TAGACAAGGC TCTGGAGGCG GCCAACATCC GCCCGGCCAG GATCATCGCG 
ACCAGCGTTT CGGTCAATGC GGTAAGGATT GCGTCGACGG GGCTCGGCGT TGCGATCGTC 
GAGCCCGCGA CGGCCTATGG CTTGAAGCTG ACCGACGTCA CGATCCGGCC GCTCGACGTC 
GACATCCCCT TCCTTTGGGC GATCCTTTCC GCCGCTGCAC GCCCGTTGTC CGACAGCTCG 
CGCGAACTGA TTCAGGCGAT CATCCGGGTC TCTTCAGCCT GTATACCGGG ATTTACAGCT 
CACGACCCGC GCCACGCCAA TCGCGCTGCT GAAATGATGT TGGGAGAAGA CCAGACAGAT 
CGAGACGCGC GCTGGCGCGA CTATCCGTTG CATAACAACA AAACGCAGAA CCAAAAGAGG 
AGAATGACAT GA

Protein sequence

MEIRELEAFL AVMSAGSITG AARLLDRSQS QVTRLIQDLE TSVGFSLFDR NGPKIAPSEK 
GIAFHAEAER FLSGIGHLRE RARTIAEKEP QPIEIVAIAA FASGIIPMAL AALPERLLPR 
KVHLRSLPAE AAVQSVLART ADFCVTSLPA DQPGLEVHGV FQAPCVAAVA PDDPLTAREV 
ISIADLAGRN IITMANPFRL RSRVDKALEA ANIRPARIIA TSVSVNAVRI ASTGLGVAIV 
EPATAYGLKL TDVTIRPLDV DIPFLWAILS AAARPLSDSS RELIQAIIRV SSACIPGFTA 
HDPRHANRAA EMMLGEDQTD RDARWRDYPL HNNKTQNQKR RMT