Gene Smed_4680 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4680
Symbol
ID	5318137
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1194993
End bp	1196096
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	61%
IMG OID	640776478
Product	glycosyl transferase family protein
Protein accession	YP_001313410
Protein GI	150376814
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.359899
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTTGC CCCTCGTCTC CGTCCTCCTA CCCGTCTACA ATGGCGAGCC ATACATTGCC 
GCAGCCCTCG AGAGCGTGTT GCGCCAGGAC TACCAACGTG TCGAGGTGAT CGCGATCGAC 
GACGGATCGA CGGACCGGTC GCGGGACATT CTCGAACGCT ACGGGAAGAC CGATTCCCGG 
CTTTCCATCA TCTCTCGCGA AAACCGCGGG CTGGTAGCAA GCTTGAATGA AGGGCTTGCT 
CTTGCAAAGG GCGAGCTTAT CGCGCGGATG GATGCAGACG ATATCGCCTA TCCCTCGCGT 
CTTTCCCGGC AGGTCGCGCT GTTTGGCGAA GAACCGCGGC TGGCCCTCTG CGGCACCGGC 
ATCGACATGC TCATCGGCAA CCGCATCATA CGCGGCAGAC CAAATCCCAT CTACCGGCCG 
GGAAGCCTGC GCACCCTGTC GATGTTCTTC ACCATCTTCA TGCATTCAAC GGTGGTCTAT 
AACAGGACAA TCATTCCCGA CGAGATGCTC CGCTACGATT CGAACTATGT GCACGCGGAA 
GACTTCGATC TCTTCAGGCG GATCGCGGAT CGCTTTCCGG TTCATATGAT CGACGAGCCC 
CTGGTTGCCT ATCGCATCCA TGAAGATAGT GTCACCAGCA AGCATAAGCG GCAGATGCGC 
CGCACCCATC TGAGCATCGT GGCCGAGAAC CTGGCACGGG ACGCTCTTCT CGATGATTCC 
GCCGCGCTCG AAGCACTCGG CGCCGCCGTA ACGGGCGAGA CGGTGGCACG TCTTGCCGAC 
TGTGTCCTGG CACTCGAACG TGCGATTGCG GCGCGGCCGG TGGAAGTCCG TGGTGCCTAT 
GAAGACGGCG CCCTGTGCTT CTTCTATTTC CTCTATCAGC TCATTGCCGA CGAGGAGCAG 
CCGCGGCTGA CCCACGAATT CCTGACGAGG ACAGGCAAAT GGGGCCTGAT CCGCCGTCGC 
GAACGCTATG GGCTGCTCGC CGCGACTCGG GCACCGTGGT GCAGCCGGAT TTCGCTTGCG 
GCAAGCAGGC GGGTGGACCG GCTAGCGCGC CATCTGCAGT CGGTACCGGC AGCGACCGTG 
CTTCCAGAAC ATGGCTTGAC CTGA

Protein sequence

MPLPLVSVLL PVYNGEPYIA AALESVLRQD YQRVEVIAID DGSTDRSRDI LERYGKTDSR 
LSIISRENRG LVASLNEGLA LAKGELIARM DADDIAYPSR LSRQVALFGE EPRLALCGTG 
IDMLIGNRII RGRPNPIYRP GSLRTLSMFF TIFMHSTVVY NRTIIPDEML RYDSNYVHAE 
DFDLFRRIAD RFPVHMIDEP LVAYRIHEDS VTSKHKRQMR RTHLSIVAEN LARDALLDDS 
AALEALGAAV TGETVARLAD CVLALERAIA ARPVEVRGAY EDGALCFFYF LYQLIADEEQ 
PRLTHEFLTR TGKWGLIRRR ERYGLLAATR APWCSRISLA ASRRVDRLAR HLQSVPAATV 
LPEHGLT