Gene Smed_4957 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4957
Symbol
ID	5318472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1469593
End bp	1470585
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	62%
IMG OID	640776739
Product	glycosyl transferase family protein
Protein accession	YP_001313671
Protein GI	150377075
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.083679
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTCCG AAGAACTGAC GTCCACGTCG AGCCTTATCG TCATACCGTG CCTCGACGAA 
GCTTCGCATA TCGAGGCGCT GATCGAAAAG CTGCGTCCGG CGCTCACGCC TTTGAACGCG 
CAGATCGTCA TTGCCGACGG CGGCAGCACC GACGGGACGC GCGATATCGC CCGCCGTCTG 
GCTACAGAGG ATCCGCGGGT GCTCTTCCTC GACAATCCGA AGCGCATACA GAGCGCTGCA 
ATCAATCGTG CCGTTGCGGA ACTGGGTGCC GACAGCGACT ACCTGATCCG CATCGACGCC 
CATGGCACCT ACCCGGACGA TTATTGCGAA CGGCTCGTCG AGGATGCACT GGCGACCGGC 
GCGGATTCGG TTGTGGTCGC CATGCAGACA GTCGGTTTCA GCACCTTCCA GAAGGCGACG 
GCATTCGCGC AGAACTCCAA ACTCGGCAAT GGCGGTTCCA AGCACCGCAC GGGCGCCGTC 
GGCCACTGGG CCGAACATGG CCATCATGCG CTGATGCGCA TCGAAGCCTT CAAGGCTGTT 
GGGGGATATG ACGAGTCCTT CAGCCACAAT GAAGACGCGG AACTCGACTA TCGGCTCGGC 
AAAGCGGGCT ACCGGATCTG GATGACCGAT AGAACCAGTA TGGTTTACTA CCCGCGTGCG 
AAGATCGTCC CTCTGTTCCG GCAATATTTC GGCTATGGCC GCGGCCGCGC AAAGAACTTT 
CTCAAGCATC GCGCCATGCC GGGGCTGAGG CAGATGGTGC CGCTTGCGGT CGCACCCGTC 
GTTTTCGGAG CGCTTCTCGC GATCGTCAAC TGGATGGCCG TTTTGCCAGC CGGCGTTTGG 
GCAGGGGCGT GCCTTGGTTA CGGCGTCTGG ATGGCGCTTG GTCAGCGAAA CCCCTATGGT 
CCGCTGGCCG CGGTTGCGGC TATGGTCATG CATCTCGCCT GGTCTGCCGG TTTCTGGCGC 
GAGCTCCTCG ACTTTCGCCG CAGGGTGGCG TGA

Protein sequence

MNSEELTSTS SLIVIPCLDE ASHIEALIEK LRPALTPLNA QIVIADGGST DGTRDIARRL 
ATEDPRVLFL DNPKRIQSAA INRAVAELGA DSDYLIRIDA HGTYPDDYCE RLVEDALATG 
ADSVVVAMQT VGFSTFQKAT AFAQNSKLGN GGSKHRTGAV GHWAEHGHHA LMRIEAFKAV 
GGYDESFSHN EDAELDYRLG KAGYRIWMTD RTSMVYYPRA KIVPLFRQYF GYGRGRAKNF 
LKHRAMPGLR QMVPLAVAPV VFGALLAIVN WMAVLPAGVW AGACLGYGVW MALGQRNPYG 
PLAAVAAMVM HLAWSAGFWR ELLDFRRRVA