Gene Smed_1503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1503
Symbol
ID	5322361
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1583967
End bp	1585385
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	64%
IMG OID	640790450
Product	GntR family transcriptional regulator
Protein accession	YP_001327182
Protein GI	150396715
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0921845
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACTT GGCTGCCAGA CATCGAACAG GGCCACGGCC CGCTTTACGC GCGCATCGCC 
GACCAGATTG AAGAGGCGAT AGGCAACGGC ACCCTGCCCG TCGGCACGAA GTTGCCGCCC 
CAACGCAATC TTGCATTCGA TGTCGGCGTG ACGATCGGCA CGATCGGACG CGCCTATGGG 
ATTGTCCGCG AGCGAGGCCT GGTCAGCGGC GAGGTCGGGC GCGGTACCTA CGTTCTCGAC 
CACCCGGAGA GCCGGCCGCC GGAACAGTCG GACCCGCTGA CGACGTCGCT GTCAGGGACG 
CGCCCGCTCA TCGCCCCTGC CGGAAAGCTC CGCTTCGACA GCACGGCCGC GCCCGACATA 
GGACAGGGTG ACATTCTGGC TAGATTGCTC AGCGAGATCA GCCGCGAGCA TCATCGGGAC 
ATTGCGAGCT ATGCCCGCAA TTTTCCAGAG CATTGGTTCG AGGCAGGGTC TCAATGGCTC 
GCACGGGAGA GCTTCCGCCC GGCGCCGGAA ACGGTGGTTC CGACGCTCGG CGCCCACGCC 
GCAGTCGTCG CGGTAATCTC CGCCGTCACC TCGCCTGGCG ATCGCATTGC CTTCGAGACT 
CTGACCTACT CCCAGATCAG CCGCAGCGCA GGCCTCATCG GCCGGCGGAT CGCACTGGTC 
GAGAGCGACG AGTTCGGAAT GCGGCCGGAA GACTTCGAGC GCGTCTGCGC ACAACAGCAC 
CCGAAACTCG CCTTTCTCAT GCCCGGCGCC CAGAATCCGA CCGTCGCCGT CATGCCCCTC 
GACCGGCGCC GGGCGATTGC CGATATAGCG CGCAAGTACG GCGTCTGGCT GATCGAGGAC 
AACCTCTACG GCTCGATGAT CGGAGACCCG CTTCCGCTGC TCGTGGAGCT TGCGCCCGAG 
CGGACTTTTC TTGTCGGCGG GCTCTCGAAG TCCGTTGCAG CCGGCGTACG CGGCGGCTGG 
GTCGCTTGCC CGCCGCATTT CAGTCAACGT ATTCGCGTGG CCCATAAGAT GGTGAGCGGC 
GGCCTGCCTT TCATTCTCGC AGAACTATGC GCCCGCCTGG TCCTCTCGGG ATCCGCATCC 
GTATTGCGTA ATCGCGGCGT GGAGGAAATC GGTGCGCGCG TAGCGTTGGC TCGCGAAATC 
TTTTCCGGGT TCGAGTTCAA CTCGCATTCC AAGATCCCGT TTTTCTGGCT GAAACTGCCC 
GAGCCGTGGC TTTCCGGAAC ATTCAAGCAG GCCGCTCTTC AGGAAGGCGT GCTCATCGAC 
GACGAGGACG AGTTCAAGGC CGGACGTTCC GACCGGGTTT TCCATCGCAT CCGCGTCGGC 
TTCTCCTCTC CCGTCGACCG ATCGGAGGTG AAGCGAGGCT TCGACGTTCT GCGGCGTCTG 
CTCGACAGTG GACGCGTCGG ATACGACAGT TTCGATTGA

Protein sequence

MTTWLPDIEQ GHGPLYARIA DQIEEAIGNG TLPVGTKLPP QRNLAFDVGV TIGTIGRAYG 
IVRERGLVSG EVGRGTYVLD HPESRPPEQS DPLTTSLSGT RPLIAPAGKL RFDSTAAPDI 
GQGDILARLL SEISREHHRD IASYARNFPE HWFEAGSQWL ARESFRPAPE TVVPTLGAHA 
AVVAVISAVT SPGDRIAFET LTYSQISRSA GLIGRRIALV ESDEFGMRPE DFERVCAQQH 
PKLAFLMPGA QNPTVAVMPL DRRRAIADIA RKYGVWLIED NLYGSMIGDP LPLLVELAPE 
RTFLVGGLSK SVAAGVRGGW VACPPHFSQR IRVAHKMVSG GLPFILAELC ARLVLSGSAS 
VLRNRGVEEI GARVALAREI FSGFEFNSHS KIPFFWLKLP EPWLSGTFKQ AALQEGVLID 
DEDEFKAGRS DRVFHRIRVG FSSPVDRSEV KRGFDVLRRL LDSGRVGYDS FD