Gene Smed_3561 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3561
Symbol
ID	5324449
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	3765994
End bp	3767862
Gene Length	1869 bp
Protein Length	622 aa
Translation table	11
GC content	65%
IMG OID	640792510
Product	thiamine pyrophosphate protein central region
Protein accession	YP_001329211
Protein GI	150398744
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3962] Acetolactate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.238424
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAGA AAACCGTGCG CCAGGGTACA GTGCGCTTGA CCATGTCGCA GGCCGTGGCG 
CGGTTCCTGA CCCGGCAGAT GACGATCATC GAGGGCGAGC GCGTGCCGAT TTTTGGCGGC 
GTCTTCGCGA TTTTCGGTCA CGGTAACGTC GCCGGGGTCG GGGAAGCGCT CTATGCCGTG 
CGCGAAACCC TTCCGACCTA CCGGGCCCAG AACGAGCAGG GCATGGCGAA CGCGGCGATC 
GCCTTCGCCA AAGCGAGCTT CCGCCGCCGC TTCATGGCAT GCACGACGTC CATCGGCCCG 
GGCGCCCTGA ATATGGTGAC GTCGGCCGCG CTCGCACACG TCAACCGGCT GCCGGTGCTC 
CTCCTGCCCG GCGACATCTT CGCCAATCGC CGGCCGGACC CGGTCTTGCA GCAGGTAGAG 
AGTTTTGGCG ACGGGACGAT CTCGGCGAAC GACTGCTTCC GCCCGGTCTC GCGTTACTTC 
GACCGCATCA CGCGACCGGA GCAGATCATT CCGGCGCTTC GCCGCGCCAT GCAGGTGCTT 
ACAGACCCGG CCGATTGCGG CCCGGTGACG CTTTCGCTCT GCCAGGACGT TCAGGCGGAA 
GCCTATGACT ACCCGGAATC GTTCTTCGAC GAAAAAGTCT GGGTACCGCG CCGCGTCGAG 
CCCGATCTCG ACGAACTGGC CGCGGCGATC GAGACGCTGA AGGTTGCCAG GAAGCCGATC 
ATCATCGCAG GCGGAGGCGT GCTCTATTCG GAAGCGAGCG CCGACCTTGC CGAGTTCGCC 
GAAAAACACG GCATTCCGGT CCTCGAGACG CAGGCCGGCA AGTCCGCCCT GCCGCACGCG 
CATCCGCTGA ACATGGGTTC GGTCGGCGTC ACCGGTACCT CTGCCTCCAA CGCCTTGGCG 
GAAGAGGCGG ACGTGGTGCT CGCCGTCGGC TCGCGGTTGC AGGATTTCAC TACCGGCTCC 
TGGGCGCTTT TCAAGAATGA AGCGGTGAAG ATCATCGGAC TCAACGTCCA GCCCTTCGAC 
GCCGGCAAGC ACGATGGACA GCCTTTGATC GCCGATGCGC GGGCCGGCCT CAACCGCATC 
TCGGGCGGGC TCGGCAGCTA CAGCGCCGAC AGCGCCTGGA CAGAGAAGGC GAGGGCCGGA 
AAGGCCGAGT GGCTTGCTGC AGCCGACAGG GCGACGGCCA CCACCAATGC GGCGCTTCCC 
TCCGATGCGC AGGTCATCGG CGCCGTGCAA CGCGCCCGTG GCGGGAGGCA AACGACACTG 
GTCTGCGCCG CCGGCGGGCT GCCCGGCGAG CTGCACAAGC TCTGGCAGGC GGAGTCTCCA 
GGCAGCTACC ATATGGAATA TGGCTTCTCG ACCATGGGCT ATGAGGTCGC TGGCGGCCTT 
GGCGTGAAAC TTGCCAAGCC CGAAAGTGAC GTGATCGTCA TGGTCGGAGA CGGCAGCTAC 
ATGATGCTGA ACTCCGAGAT CGCCTCTTCG GTCATGCTCG GTGCCAAGCT TACGATCGTG 
CTGCTCGACA ATGCCGGCTA TGGCTGCATC AACAGGTTGC AGATGGGTAC GGGCGGCGCC 
AACTTCAACA ACCTGTTGAA GGACACACAT CACGTGGCGC TGCCGCAGAT CGACTTCGCC 
GCCCACGCCG CCGCCATGGG CGCGGTCACC CGAAAGGTGG GATCGATCCC CGAACTCGAA 
GCGGCGCTTG CCGAAACGGC AGACGAGGCT CGCACGACCG TCATCGTCAT CGATACCGAT 
CCGCTGATCA CGACGGAAGC CGGTGGGCAC TGGTGGGACG TCGCGGTCCC GGAGGTTTCG 
GACCGCGACC AGGTAAAGGC CGCCCGCGAA GATTACGAAA ATGCCCTCCG GTCACAGCGG 
TTTGGTTGA

Protein sequence

MTQKTVRQGT VRLTMSQAVA RFLTRQMTII EGERVPIFGG VFAIFGHGNV AGVGEALYAV 
RETLPTYRAQ NEQGMANAAI AFAKASFRRR FMACTTSIGP GALNMVTSAA LAHVNRLPVL 
LLPGDIFANR RPDPVLQQVE SFGDGTISAN DCFRPVSRYF DRITRPEQII PALRRAMQVL 
TDPADCGPVT LSLCQDVQAE AYDYPESFFD EKVWVPRRVE PDLDELAAAI ETLKVARKPI 
IIAGGGVLYS EASADLAEFA EKHGIPVLET QAGKSALPHA HPLNMGSVGV TGTSASNALA 
EEADVVLAVG SRLQDFTTGS WALFKNEAVK IIGLNVQPFD AGKHDGQPLI ADARAGLNRI 
SGGLGSYSAD SAWTEKARAG KAEWLAAADR ATATTNAALP SDAQVIGAVQ RARGGRQTTL 
VCAAGGLPGE LHKLWQAESP GSYHMEYGFS TMGYEVAGGL GVKLAKPESD VIVMVGDGSY 
MMLNSEIASS VMLGAKLTIV LLDNAGYGCI NRLQMGTGGA NFNNLLKDTH HVALPQIDFA 
AHAAAMGAVT RKVGSIPELE AALAETADEA RTTVIVIDTD PLITTEAGGH WWDVAVPEVS 
DRDQVKAARE DYENALRSQR FG