Gene Smed_3606 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3606
Symbol
ID	5318440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	34753
End bp	35757
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	61%
IMG OID	640775420
Product	DeoR family transcriptional regulator
Protein accession	YP_001312353
Protein GI	150375757
COG category	[K] Transcription
COG ID	[COG2390] Transcriptional regulator, contains sigma factor-related N-terminal domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAACG CCAAACCGAA ATCCACATCC GGCCCGCGCG AGGAAATCGT CATCGCCAGG 
CAGATGCACC AAGCCCTGGT GCTGCATTTC CTGGAAGGCT TGACGCAGGC GCAGATCGCC 
GATCAGCTCG GCATCTCACA TGCGACCGTC AATCGCCTGA TCAAGCGCGG CCGACAGCTC 
GGCCTCGTCG AGATAAAGAT CAAATCGCCT GTGGAGCCGT TGATCGACAT CGAGGAAAGA 
TTGCTTGCGC TTGGCGGCAT CAGCCGGGCG GTGGTCGTGC CGACAGCCTC CGACAATCCG 
CAGACCGCCT TGCAAGCGGT CGGCGAGGCC GCAGCAAGAC TGATGCTCGA GGAGATCGCC 
GATGGCGACA CGATCTGCAT CACCGGTGGC AAAGGCGTGA GCGCCGTCGT TGCCGGTCTC 
CACCCGCCGC GCCGGTACGA TATCGAGGTC ATTCCCGCGA CAGGCTGCGT TCAGGGCAAG 
CACTATACCG ACGTTAATCA CGTCTCAACC CTGATGGCGG ATCGGCTCGG CGGCCATTCT 
TTCCAGATCC ATGCGCCTCT TTTTGCCGAC AGCGAAGCGG AACGAAGAAT GCTGCTGGGC 
ATGCGCGCAG TCGCCGACGT CTTCAAGCAG GCGCGTGAAG CAAAGATTGC CGTGGTCGGC 
ATCGGCTCGA TCCTTTCGGA CGACTCCAGC TATTACGACC TGCATCCCTC CTCCAGTACC 
GACCGCGCGG CGATCGAACA GTCCGGTGCA TCCTGCGAGC TGCTCGCGCA TCTCCTCGAT 
GATCAAGGGC GCGTCTGCGG CTATGGCCTC AACCAGCGCC TCGTATCGCT GACGCTCTCG 
GAATTCGCTT CCATCCCCAT GAAGATTGGC GTCGCAAGCG GTCCGAGCAA GGCGGGGCCG 
ATCCTGAGCG TCATGCGCGG CAAACATCTG GACACACTCG TTACCGATCA GGCAACGGGC 
TCGCGCATAC TCGAACTGGC CAAGGAAGTC GGAGAACATT CATGA

Protein sequence

MPNAKPKSTS GPREEIVIAR QMHQALVLHF LEGLTQAQIA DQLGISHATV NRLIKRGRQL 
GLVEIKIKSP VEPLIDIEER LLALGGISRA VVVPTASDNP QTALQAVGEA AARLMLEEIA 
DGDTICITGG KGVSAVVAGL HPPRRYDIEV IPATGCVQGK HYTDVNHVST LMADRLGGHS 
FQIHAPLFAD SEAERRMLLG MRAVADVFKQ AREAKIAVVG IGSILSDDSS YYDLHPSSST 
DRAAIEQSGA SCELLAHLLD DQGRVCGYGL NQRLVSLTLS EFASIPMKIG VASGPSKAGP 
ILSVMRGKHL DTLVTDQATG SRILELAKEV GEHS