Gene Smed_3043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3043
Symbol
ID	5323921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	3192219
End bp	3193196
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	61%
IMG OID	640791992
Product	DeoR family transcriptional regulator
Protein accession	YP_001328704
Protein GI	150398237
COG category	[K] Transcription
COG ID	[COG2390] Transcriptional regulator, contains sigma factor-related N-terminal domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGAAG ATGATGACGC GCTGATGGTG CGGGCGGCCT GGTTTTACTA TGTCGGCGGC 
CTCAACCAGG AAATGACCGC CGCCCGGCTG GGCCTCACCC GTGCCAGGGT CAATAAAATG 
CTGGCCGAGG CGCGCGAGAG CGGGCTTGTC AGCATTTCGA TCGACCATCG GCGGGTCGGT 
GTCCTGCCGC TCGAGGACAG GCTGCGCACG CGCTTCGGGC TTGATTTCTG CATCTCCACA 
CCGGCCTTCG GGTTTCACGA TACGTCCAAG CAAGACAGCG AAGTGCGCAA GCAGATCGCC 
TTCCGAGCCG TGGGCGTGGC TGCCGCCAAT CACTTGAAAA CATTGCTTTC CGAGAACGAT 
TCCCTGACGG TCGGGACCGG TTGGGGCCGA ACGATCGAAC AGATGACCTT GCATCTGGCC 
GGCGTTCGGG CGCCGCATGC GCGCTTCATC TCGATCATGG GGTCGTTGAC GGCAAACAAT 
GCCTATAACC CGTTCGAAGT CGTGCACAGC CTCGCGAGAC GCACCGGCGG CGAAGGTTAT 
TTTCTTCCGG TGCCCTTCAT CGCCGACTCG GTAGATGACA AAAAGGTCCT CATCTCACAA 
CGTTCCGTGG TCAAGGCATT GGAAATCGCC CGCAGTGCTT CCGTCTGCTT CATCAGCGCG 
GGTGAATTGA CGGAGGAATC GCTTTTACGG CGCCAGGGCA TGATCAGCGG CACCGAACTC 
GAAAGCCTGC GGCAGGCCGG CGCCGTCGGC GACACCAACG GCATTTTCTT CGACAGCGAA 
GGGAGGCAGG TCGACCATGA GCTCAACGAA CGGACCATCG CACTGGGTTT CGAAGAGCTG 
AAGGCTCTGC CGGTGCTCCT GCTGATCGCC GGCCTGGAGA AAATCCAGGC GGCCCGGGCC 
CTGCTTCGCA GCGGCGTCGT CAACGGTCTG ATCATAGACG GCGATGCGGC CGAGGCGTTG 
GCAGCGTTGG GCGAATAG

Protein sequence

MSEDDDALMV RAAWFYYVGG LNQEMTAARL GLTRARVNKM LAEARESGLV SISIDHRRVG 
VLPLEDRLRT RFGLDFCIST PAFGFHDTSK QDSEVRKQIA FRAVGVAAAN HLKTLLSEND 
SLTVGTGWGR TIEQMTLHLA GVRAPHARFI SIMGSLTANN AYNPFEVVHS LARRTGGEGY 
FLPVPFIADS VDDKKVLISQ RSVVKALEIA RSASVCFISA GELTEESLLR RQGMISGTEL 
ESLRQAGAVG DTNGIFFDSE GRQVDHELNE RTIALGFEEL KALPVLLLIA GLEKIQAARA 
LLRSGVVNGL IIDGDAAEAL AALGE