Gene Smed_4354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4354
Symbol
ID	5318203
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	852461
End bp	853792
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	60%
IMG OID	640776159
Product	O-antigen polymerase
Protein accession	YP_001313092
Protein GI	150376496
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.201605
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.814699
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCGCG GGAGCTACGC AGAGGCCGAG CGGACGAGTG GATCGACGGC ACGTGTCGGG 
ACCGCCCTCT TCATCGCGAT TTTCCTGTTC TTCTGGATTT CCATCAACCC CTTCGTGGAC 
TTGACCGGCG AGGCGGTGCT GGATCCTTCC GCCGGAAATT CCAACCGGCT GAACCAGATC 
ATCTCGCTCC TGCTTTTCGC CGGCATGCTC TGTTACGGAC TGATCCATCC CTTGCGGGAA 
ACTATTCTGC GGCCCCGGTT GCTGCTGGCG ATCCTCTATT GTTGGTTCAT CGTCGTTTCG 
CTGATCTCGG CTCATCCGAT GCTCGGCATC AAGGGCGTGA TCCTTTCCGT AATGGTCACC 
GTCAATGCCA GCATCTACCT CTTGCTGCCC ACTTCGGAAC GCCACTTCGC CAGGATGCTC 
GGTATCGCCA TCCTCGTCAT GCTGAGCGTC GCCTATTACG GCATCGTCTT CAACCCGTCG 
CTCGCCATCC ACCAAGCCAC GGAACTGCGC GAACCGATGA ATGCAGGTTT GTGGCGAGGT 
CACTTCCCTC ACAAGAACAG CGCCGCGGCT GCGATGGTGA TCGCAGCCTT CATCGGCCTC 
TTCGTCATGA ACGCCTGGTC GCGCGTCGCC GGCATCGCCA TCGTCGCGCT TTCCTTCGTC 
TTCCTCGTCA ATACCGGGGG GAAAACGTCT ACGGCAATGC TGCCGGCGAT TCTGCTGGTC 
GCCTTCCTTT TCGAAAAGGT GCGCTTCCTT CGCATCCCGA TTGCCGTTGG CGGCGTCGGC 
CTGTTCAATC TGTTCGCCGT CGGCTCGGCC GTCATTGTTC CCTTGGGTGA ATTCATCAAC 
GGTCTCGGCG TTGACGCAAC CTTTACCAAT CGCGCCGATA TCTGGCGTTT CGCCTTCGGC 
GCGCTCGCCG AACAGCCCCT CACAGGATAT GGCTTCAAGG CTTTCTGGCA GACGGAAGAA 
CTCGTCTATA GCGGCGGCAC GGTTGAGACC TGGGCCGTCG CGGCCGCCAA CGGACATAAC 
TCCTACCTCG ATATCGCCCT GATGACGGGA TTTCCCGGAC TCGCCCTGAC CCTGATCTGG 
ATACTCTTCC TACCGCTCCG CAACATTGCG CGAATCGCTC CGGAGCGCGA ACACACGCAT 
CTGACGAGGC TCTTCGTTCG CATATGGCTC TACACGATCT TCAATGCCGG CCTCGAGAGC 
CTCTTCTTCG AGGGAGGAAG CCTTCTGTGG TTCACGTTCA TGGTCGCGCT CTACGGACTT 
TCCCTGCAAT CCAGCGCGGA ACTCGCGGCC GTTCCGGCGC GCGCTCGTGA GGGGAGGCTC 
GTGCATGCTT GA

Protein sequence

MDRGSYAEAE RTSGSTARVG TALFIAIFLF FWISINPFVD LTGEAVLDPS AGNSNRLNQI 
ISLLLFAGML CYGLIHPLRE TILRPRLLLA ILYCWFIVVS LISAHPMLGI KGVILSVMVT 
VNASIYLLLP TSERHFARML GIAILVMLSV AYYGIVFNPS LAIHQATELR EPMNAGLWRG 
HFPHKNSAAA AMVIAAFIGL FVMNAWSRVA GIAIVALSFV FLVNTGGKTS TAMLPAILLV 
AFLFEKVRFL RIPIAVGGVG LFNLFAVGSA VIVPLGEFIN GLGVDATFTN RADIWRFAFG 
ALAEQPLTGY GFKAFWQTEE LVYSGGTVET WAVAAANGHN SYLDIALMTG FPGLALTLIW 
ILFLPLRNIA RIAPEREHTH LTRLFVRIWL YTIFNAGLES LFFEGGSLLW FTFMVALYGL 
SLQSSAELAA VPARAREGRL VHA