Gene Smed_4240 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4240
Symbol
ID	5318001
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	724843
End bp	726261
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	64%
IMG OID	640776045
Product	hypothetical protein
Protein accession	YP_001312978
Protein GI	150376382
COG category	[R] General function prediction only
COG ID	[COG3800] Predicted transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.726169
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGATTG GCAAGCTGTA TATCGGCCGC AAGGTCAGGG ATCTGAGGGA TGGCAAGCGG 
CTGACGCAGG CGCAGTTCGC CGAGCGGATC GGCATATCCA CGAGCTATCT CAATCAGATC 
GAGAACAACC AGCGTCCGGT GTCGGCGTCG GTGCTGCTGG CGCTCGCCGA AAAATTCCAG 
ATCGATATCG CCGAACTTTC CTCGGGCGAG AGCGACCGGC TTCTCTCAGC GCTATCGGAG 
GCGCTGAGCG ATCCCCTGTT CGAGACCTAT TCGCCGAGCC TGCAGGAGCT GAAGCTCGTT 
GTCCAGAATG CGCCGGGTCT TGCCCATGCG CTGATCTCCT GCCACCAGGC CTATCGGCGC 
AACAGCGAGC AGCTCGCCAG CATCGACGAT ACGATCGGCC GCGGCGCTTC TTTCGTCGAG 
ACGACGCCTT ATGAAGAGGT TCGGGACTTC TTCCACTTCG TCGACAATTA CATCCACGAA 
ATCGATACGC TTGCCGAGAC TTTGGCCGAC GAGCTGGGCC TTGGCGATGG CGACAACCAT 
GCGGCCCTTG CGGCCTATCT CGAAGAGCGC CACGGGATAC GTGTCGTGCG CGGGGCAGCC 
GGCGACGAGG CGATCCGCCG TTTCGATCCG CGCGCCCGCG TGCTCACGCT CAATCCTTAC 
GCCCCGGCGG CGACACGCGA CTTTCAGCTG GCATTGCAGA TCGCCCAGAC ACGCGCCCGC 
GAGGAGATCG ATCGGGTGGC GGGGAGCGCC GGCTTCCGCA CCGAGGAGGC CTATGAGATC 
TGTCGAATCG GGCTGCAGAA CTATTTTGCC GGCGCGCTGA TCCTGCCCTA TCAGCCGTTC 
CTCAAGGCCG CGCGCGAATT GCGTCACGAC GTGGAACTCC TTGCAGCCCG CTTCGGTGCC 
TCGCTGGAGC AGGTTTGTCA CCGGCTTTCG ACGCTGCAGC GGCCCGGGCA GAAGGGCATC 
CCCATCTTTT TCGCGCGGAT CGACCGCGCC GGCAACATCA CCAAGCGCCA CAGCGCCGCC 
AAGCTGCAAT TCGCCCGTTT CGGCGCGGCC TGTCCGTTAT GGAACGTGCA CCAGGCCTTC 
GAGACGCCCG GCCGCATCAT CCGCCAGCTC GCGGAGACGC CGGACGGCGT GCGTTATCTC 
TGTCTCGCGA CCCAGATCAC CAAGGGCGGC GGCGGCTACC GCGCCGCCCA TCCCCGTTAT 
GCCTTGGCGC TCGGCTGTGA AATCTCCTAC GCCGATGCCT TCGTCTATGC GGACGACATG 
GACCTCGGCA ACCGCGCCGC CTACGATCCG ATCGGTATTT CCTGTCGCAT CTGCGAGCGC 
ACGAGATGCG CGAGCCGCGC GGTGCCGCCG CTCAAGCGCA AGCTGATCGT CGACCATGAC 
ATGCGCGGCG CTCTGCCGTA TCGTCTGAGT GAGAGCTGA

Protein sequence

MAIGKLYIGR KVRDLRDGKR LTQAQFAERI GISTSYLNQI ENNQRPVSAS VLLALAEKFQ 
IDIAELSSGE SDRLLSALSE ALSDPLFETY SPSLQELKLV VQNAPGLAHA LISCHQAYRR 
NSEQLASIDD TIGRGASFVE TTPYEEVRDF FHFVDNYIHE IDTLAETLAD ELGLGDGDNH 
AALAAYLEER HGIRVVRGAA GDEAIRRFDP RARVLTLNPY APAATRDFQL ALQIAQTRAR 
EEIDRVAGSA GFRTEEAYEI CRIGLQNYFA GALILPYQPF LKAARELRHD VELLAARFGA 
SLEQVCHRLS TLQRPGQKGI PIFFARIDRA GNITKRHSAA KLQFARFGAA CPLWNVHQAF 
ETPGRIIRQL AETPDGVRYL CLATQITKGG GGYRAAHPRY ALALGCEISY ADAFVYADDM 
DLGNRAAYDP IGISCRICER TRCASRAVPP LKRKLIVDHD MRGALPYRLS ES