Gene Smed_4585 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4585
Symbol
ID	5319001
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1080932
End bp	1082029
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	64%
IMG OID	640776386
Product	glycosyl transferase group 1
Protein accession	YP_001313318
Protein GI	150376722
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATCG CCTTTCACGC GCCGCTGAAA TCGCCTGATC ATCCTGTCCC TTCCGGCGAC 
AGGCAGATGG CGCGCATGCT GATCGAAGCG CTCCGGCTGG CCGGGCACGA TGTCGGCGTC 
GTCTCTCAGT TGCGCAGCTT CTTGCGTGAA ACCTCGCACT CGGCATTTTC AGCCGTGCGC 
GACGAATCCC AACGGGAAAT CGACCGGATT AGGCGTCTTT GGCGGTCGGA AGGTCCGCCC 
GACATGTGGT TTTGCTACCA CCCTTACTAT AAGGCTCCGG ATCTCATCGG TCCTTCACTC 
TCGACGGAGT TCTCGATTCC CTACGTGACC GCTGAGAGTT CCTATTCGTA TCGGCGCAAC 
ATCGGCGCCT GGAAGCTTGC ACAGGATGAG GTTGCCGCGG GTGCACGGCG GGCCGCGGTC 
AACGTCTGTT TCACCCAGCG CGATCGGCAC GGCCTCGATG AGGCGATACC CGGAGCGCGC 
ACGGCGCTGC TCGCCCCTTT CATCGATGTG TCGCCGTTTC GGGACCTGCG AAGGACGAAA 
CAAGGCGAGA CCCGTCTGCT TGCGGTTGCG ATGATGCGAG CCGGCGACAA GATGGATAGC 
TTCCGCATGC TTGCCCGCTC CCTCGCTCTC GTGGCGGACC TGCCTTGGAA GCTGACGGTC 
ATAGGCGACG GTCCCGCCCG CGCCGAGGTG TTGGAGACCT TCGCGGCCTT TCCCTCAGAG 
CGGCTGGAGT GGCTGGGCGA AAAAGCGCCG CAGGCGGTTC CCGCGCTTCT TGCCGCCGGC 
GATCTTTATA TTTGGCCGGG CTGCGGAGAG GCCTACGGAT TGGCCTATCT GGAGGCGCAG 
GCTGCAGGCC TCCCGGTCGT TGCGCAACGC ACGGCCGGTG TGCCTGAGGT CGTCAGAGAC 
GGCGAAACGG GATGTCTGAC GACGCCCGGC AACACCGAGG CCTTCGCCGC GGCGGTTCGG 
CAATTGCTGG TGGACGAAGC CTCGCGCAAG CAGATGGCCG AGCGCGCGCG GCAATTCGTT 
TTCGAGCAGC GCTCGCTTCC CGCCGCCGCC GCGCGTCTCT CCGGCATATT CGCCGAGTTT 
GTGGATTGTG CGAAATGA

Protein sequence

MKIAFHAPLK SPDHPVPSGD RQMARMLIEA LRLAGHDVGV VSQLRSFLRE TSHSAFSAVR 
DESQREIDRI RRLWRSEGPP DMWFCYHPYY KAPDLIGPSL STEFSIPYVT AESSYSYRRN 
IGAWKLAQDE VAAGARRAAV NVCFTQRDRH GLDEAIPGAR TALLAPFIDV SPFRDLRRTK 
QGETRLLAVA MMRAGDKMDS FRMLARSLAL VADLPWKLTV IGDGPARAEV LETFAAFPSE 
RLEWLGEKAP QAVPALLAAG DLYIWPGCGE AYGLAYLEAQ AAGLPVVAQR TAGVPEVVRD 
GETGCLTTPG NTEAFAAAVR QLLVDEASRK QMAERARQFV FEQRSLPAAA ARLSGIFAEF 
VDCAK