Gene Smed_2599 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2599
Symbol
ID	5323467
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2695628
End bp	2696659
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	57%
IMG OID	640791542
Product	AraC family transcriptional regulator
Protein accession	YP_001328264
Protein GI	150397797
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGTCG TGAGTGACAA ACTTCAGGGT GATATGGACA AAACGAAGGA TATTCACGAA 
GTCGGCATCG TTGGCTACAA GGGGGCTCAG GCTGCCGCGG TGCTTGGAAT GACCGATCTT 
CTGACCGCCG CAGACGGCTT TGCACGTAAA ATGCATGCCA TTGATCACCC CCTACTTCGC 
GTGAGTCACT GGACACGCGA AGATGGGCGG GCTGCGCCTG AGCGGCTGTT CGATTCCGAC 
CCTGGCATAG GTGGCAGCAG GCCAACCGTC ATCGTCATCC CTCCAGGGCT TGGCGATCCG 
CTCCCCGAGC ACGAAGCGAA ATTCTACGCC GACTGGCTTC TTTCAGAACA TTCGAGAGGA 
GCAGCTTTGT GCTCGATCTG CAAAGGAGCC TTCCTGTTGG GAGAGACCGG GCTTCTTGCG 
GGCCGGACAG TGACCACTCA CTGGACCTAT GAGGAGCAGC TTGCCTCTCG ATTTCCCGAC 
ATCAAGGTGA ACACCGACCG TCTGATCATA GACGATGGCG ACATACTCAC GGCCGGCGGC 
GTGATGGCAT GGATCGATCT CAGTCTGATT CTGATCGAGC GTTTTCTCGG CCCGAACATC 
ATGGTGGAAA CAGCAGGAGC TTTCCTGGTT GATCCACCGG GACGCAAACA AAGTTACTAC 
AGGGGCTTCT CGCCACGTCT CAATCATGGT GACGATTCGA TCTTGAAGGT TCAGCACTGG 
CTTCAACTCA CCGGCGGGAA AGAGATGAGA CTTGCGGCCC TCGCGGAGCA GGCAGGCCTT 
GAACCGCGTA CCTTTATGCG GCGATTCCAG AAAGCAACCG GCCATACGGC AGGCGAATAT 
GTTCAACGTC TGCGTATCAA CCGGGCACGT GACCTGCTCC AGCTGACACG CGATCCCATC 
GATTCAATCG CCTGGGATGT TCACTACAGC GATCCCAGCG CCTTTCGACG AATCTTCACG 
CGGATCATCG GTCTGAGCCC AACTGAGTAT CGCCGAAGAT TTCGCGCAGG GCCGAACGGA 
AATGGGACTT GA

Protein sequence

MSVVSDKLQG DMDKTKDIHE VGIVGYKGAQ AAAVLGMTDL LTAADGFARK MHAIDHPLLR 
VSHWTREDGR AAPERLFDSD PGIGGSRPTV IVIPPGLGDP LPEHEAKFYA DWLLSEHSRG 
AALCSICKGA FLLGETGLLA GRTVTTHWTY EEQLASRFPD IKVNTDRLII DDGDILTAGG 
VMAWIDLSLI LIERFLGPNI MVETAGAFLV DPPGRKQSYY RGFSPRLNHG DDSILKVQHW 
LQLTGGKEMR LAALAEQAGL EPRTFMRRFQ KATGHTAGEY VQRLRINRAR DLLQLTRDPI 
DSIAWDVHYS DPSAFRRIFT RIIGLSPTEY RRRFRAGPNG NGT