Gene Smed_4810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4810
Symbol
ID	5318697
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	1329561
End bp	1331069
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	63%
IMG OID	640776604
Product	polysaccharide biosynthesis protein
Protein accession	YP_001313536
Protein GI	150376940
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.800331
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATCGC ATCCCAGGCC TGAGGAAGGT CATAGCTACG GTCAAATCCT CAAGTCGACG 
GCGCTGATCG GCGGTTCGTC GGCCGTCAAC GTGGTATTTG CGATCTTCCG CAACAAGGCG 
ACGGCTTTGC TGCTCGGTCC CGCGGGCGTA GGGCTGATGG GTCTCTACAG CTCCATCGCC 
GATATCGCCT GCGCACTCGC CGGGCTTGGA ATCCAGGCGA GCGGCGTACG CCAGATCGCC 
ATAGCCGTCG GCAGCGGCGA CGCGGACGCG ATCGCGCGGA CGGCCACTGC GTTGAGGCGC 
GTATCGGTCC TGCTGGGGCT TGTTGGCGCC CTTCTCCTAA CTGCTCTGGC AGTGCCAATC 
GCATGTTTCA CTTTCGGCGG TCATGGCTAT GCCGGATGCG TCACTCTACT CTCGGCCGCG 
ATCTTCCTCC GCCTGCTGGC GGACGGACAG ACTGCCTTGA TCCAGGGCAT GCGAGATATC 
GCCAGCCTTG CCCGCATCAA TGTCCTCGCC GCCTTCTTCA GCACGGTTGT CACAATCCCG 
CTGATCTATT TTTTTGGCGC GTCGGGCATC GTGCCCTCGC TCGTGGTCGT TGCTGCGGCT 
TCGCTCGCGA CCTCCTGGTG GTACGGCCGG CGACTGCGGG TAACCGCGCG CCCGATGTCG 
ACAGCACAAC TCCGCCGAGA GGTGGAAGCC CTCTTGAAGC TCGGCTCCGC CTTCATGGTC 
AGCAGCTTTC TAACATTGGG CGCAGCCTAT GCGGTGCGCA TCTTCGTGCT GCGCGCCGAA 
GGCTTGACGG CGGCCGGCCT CTACCAGGCA GCCTGGACAC TCGGCGGTCT CTATGCCGGC 
TTCATCCTGC AGGCGATGGG AACCGATTTC TACCCGCGCC TGACGGCGGT GGCGGAAGAC 
AATGGCGAAT GCAACCGCCT CGTCAACGAG CAAGCCCAGG TCAGCATGCT ACTCGCCGGC 
CCTGGCCTCA TAGCAACGCT CACCGCCGCG CCATTGGTGG TCAGGCTGCT GTATTCGCCC 
GAATTCTACC CCGCTGTGGA ACTCCTTCGC TGGATCTGCA TGGGCATGAT GCTGCGGATC 
ATTTCATGGC CAATGGGGTT CATCGTTCTC GCAAAAGGTG CCAGGAGAGC CTTTTTCTGG 
ACGGAGGTTA CGGCAACCGT GGTCCATGTC GGCCTCGCAT GGCTCTGTGT GGGCGTGTTT 
GGATCGGCCG GCGCAGGCCT GGCGTTTGTC GGTCTATATG TCTGGCACGG CTTGCTAATC 
TATGCGATCG CACGTCACCT CTCGGACTTC CGCTGGTCCG CCACCAACCG AAAGCTAGCC 
CTGTTCTTCC TGCCTGCGTC AGGCTTCGTC TTCGGTGCTT TCGTCGCTCT GCCGCCTTGG 
CCGGCGACGA TATTCGGCAT GCTGACAACC GCGCTGAGCG GAGCCTATTC ACTGCGGATG 
CTCATGGAAC TCGTCCGGCT GCCGTCCTTG CCGGCCGCAG TCCGCGCCTG GTGCTCCCGG 
TCGACCTGA

Protein sequence

MQSHPRPEEG HSYGQILKST ALIGGSSAVN VVFAIFRNKA TALLLGPAGV GLMGLYSSIA 
DIACALAGLG IQASGVRQIA IAVGSGDADA IARTATALRR VSVLLGLVGA LLLTALAVPI 
ACFTFGGHGY AGCVTLLSAA IFLRLLADGQ TALIQGMRDI ASLARINVLA AFFSTVVTIP 
LIYFFGASGI VPSLVVVAAA SLATSWWYGR RLRVTARPMS TAQLRREVEA LLKLGSAFMV 
SSFLTLGAAY AVRIFVLRAE GLTAAGLYQA AWTLGGLYAG FILQAMGTDF YPRLTAVAED 
NGECNRLVNE QAQVSMLLAG PGLIATLTAA PLVVRLLYSP EFYPAVELLR WICMGMMLRI 
ISWPMGFIVL AKGARRAFFW TEVTATVVHV GLAWLCVGVF GSAGAGLAFV GLYVWHGLLI 
YAIARHLSDF RWSATNRKLA LFFLPASGFV FGAFVALPPW PATIFGMLTT ALSGAYSLRM 
LMELVRLPSL PAAVRAWCSR ST