Gene Smed_4583 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4583
Symbol
ID	5318999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1077445
End bp	1078635
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	61%
IMG OID	640776384
Product	glycosyl transferase group 1
Protein accession	YP_001313316
Protein GI	150376720
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGAAA ATTCGAACTC CCCGGCTGTC GTGGCTGGAA ACATGTCCGG GGCCCGTGTG 
ACGATTATCC TGCCGAGCCT TGGGGCCGGC GGCACCGAAC ATGTGGTAAA GCTGGTCGCC 
AACCATTGGG CCCAGCTCGG TTGCAAGGTG ACGCTGATCA CGCTCGAACT GCCTCATGCC 
AGACCTTATT ACGAATTCGA TCCGAGGATC GCGATCGAAC GTCTCGGTTT GCCGCCGCAG 
CAAGGCGGGA AGATTCGGGC GGGCCTGCTC GTGCTCAGGA GAATCTACCG CCTGCGCTCT 
GCAATTCGCC ACTCGCAGCC CGATTTCGTC TTGAGCTTCC TGACCCGGAC CAATGTACTG 
ACGCTTCTTG CAACGATCGG ACTGCCGGTG CCTGTGGTCG TTTCCGAGCG CAATAATCCG 
GCGCTGCAGC CTTTCGGTGT GTTCTGGAAA TGGATTCAGC GCCGTTTGTA TCCGCGCGCA 
TTCGGGCTCG TGACTATGAC GAGGGGCGCT CTCGACTATT TTCCGGAGAA GATGCGCAGC 
CGAGGGTGGG TTATCGCCAA TGCCGTCGAT CTCCCCGGCG AATGGCAGAA GAGACGCGGC 
AACAATATCC TGACCGCCGT CGGCCGGCTG ACGCGACAGA AAGGCTTCGA TCTCCTGATC 
GAGGCCTTTG CGAGGATTGC CTCGAGGCAC CCCGAATGGA AGCTCGTCAT CTGGGGCGAG 
GGCGACGACA GGAAGTCGCT CGAGGCCCTG CGGGATGCGT TGGATATGAC CGACAGGGTG 
GAGATGCCGG GCGTGACGCA AAGGCCCGGA GTGTGGGTTG AGACGGCTGA CGTATTCGTA 
TTGTCGTCGC GCTACGAGGG ATGGGGCATC GTTCTGCTCG AGGCCATGGC TGCAGGGCTT 
CCCGTGGTTT CCTTTGCATG CGAGTGGGGC CCCTCGGACA TGGTGGAGCA TGGGGAGGAT 
GGACTTCTCG TTCCCAGCAA TGACGTGGAT GCTCTTGCCG AGGCGCTCTC CAGGGTCCTT 
GCCGACGGCG AGCTCAGAAG CCGTCTGGCT GCAAATGCAG AGGCGAGCGC CAAGAGATAC 
TTGCCGGATC GCATACTTTC GCAATGGGAC GCAGTCGCCT TATCGGCCTT GAAACATACG 
GCTCGCGACC ATGCCGCAAC GGCTTCGGTC GTCGGAGCCG GCTCGGCTTG A

Protein sequence

MSENSNSPAV VAGNMSGARV TIILPSLGAG GTEHVVKLVA NHWAQLGCKV TLITLELPHA 
RPYYEFDPRI AIERLGLPPQ QGGKIRAGLL VLRRIYRLRS AIRHSQPDFV LSFLTRTNVL 
TLLATIGLPV PVVVSERNNP ALQPFGVFWK WIQRRLYPRA FGLVTMTRGA LDYFPEKMRS 
RGWVIANAVD LPGEWQKRRG NNILTAVGRL TRQKGFDLLI EAFARIASRH PEWKLVIWGE 
GDDRKSLEAL RDALDMTDRV EMPGVTQRPG VWVETADVFV LSSRYEGWGI VLLEAMAAGL 
PVVSFACEWG PSDMVEHGED GLLVPSNDVD ALAEALSRVL ADGELRSRLA ANAEASAKRY 
LPDRILSQWD AVALSALKHT ARDHAATASV VGAGSA