Gene Smed_4899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4899
Symbol
ID	5318237
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1409881
End bp	1410972
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	60%
IMG OID	640776684
Product	glycosyl transferase group 1
Protein accession	YP_001313616
Protein GI	150377020
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.819948
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.982264
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATTG CGCAGATCGC ACCCCTTGCA GAACGCGTCC CGCCGAAGCT TTACGGAGGG 
ACGGAGCGAA TCGTCCATTG CCTTACCGAA GAGCTCGTTA AGCTGGGCCA TGACGTGACC 
CTCTTTGCCA GCGGCGATTC GCTCACCAGT GCCGAACTGG TGCCCTGTTG CGATGTTGCA 
CTCAGACTTA ATCCGAAGGT GCGCGATTTC CTTCCGCATC ATGTGGCCAT GCTGGAAGAA 
GTCCGCCGCC GCGCGCATCA ATTCGATATT CTGCATTTCC ATATCGAGTT CCTGCATTTC 
CCCCTCATCA AGGATTTCGC CGGCAAGACG GTGACGACGC TTCACACGCG CCTCGATCTG 
TCGGACGTGC ATCCCTTCTA TCTGGCCTTT CCGGATGTCC CGCTGGTTTC CATTTCGGAG 
CACCAACGAA CGCCGATGCC GCCGGTCAAC TGGAGAGGCA CGGTGCTGCA TGGGTTGGAC 
CCGACCGTTC TGCCGTTCAA GGAAAGGCCG TCCGGAGCTT ACCTGGCCTT TCTGGGGCGG 
ATTTCGCCGG AGAAAGGCCC CGATCGGGCG ATCGAGATCG CCGTGCGGGC AGGCATGCCT 
CTGAAGATCG CCGCGAAAGT CGACGCTCAG GACAGAGACT ATTGGGATTC GGTTGTCGAG 
CCACTGATCC GGAGGCATTC CAATGTCGAA TATGTCGGGG AAATCGGCGA AAGCCAGAAG 
GCGGACTTTC TCGGCAATGC GGCTGCACTC CTCTTCCCGA TAAACTGGCC GGAACCGTTT 
GGCCTCGTCA TGATCGAATC CATGGCGTGC GGCACGCCGG TGCTTGCCTT CCGTTACGGC 
TCGGCGCCGG AGGTGATCGA TGACGGCGTT TCGGGGATCC TGGTCGACAC GGTGGAACAG 
GCCGTCAAGC GCCTTGACCG AGTGCTGGGA CTCAACCGGC GGAAGGTACG GGAGAGCTTC 
GAGAAGCGGT TCACCACGGA CCGGATGACG CGGGATTATA TAGACATCTA TCGAAGTCTG 
CCGAGCATCC GAGCACCAGC TGACCCTACG CCGGAGGAGG AGCCGAAGAA AGTGGGGCTC 
GAGGCGGCGT GA

Protein sequence

MKIAQIAPLA ERVPPKLYGG TERIVHCLTE ELVKLGHDVT LFASGDSLTS AELVPCCDVA 
LRLNPKVRDF LPHHVAMLEE VRRRAHQFDI LHFHIEFLHF PLIKDFAGKT VTTLHTRLDL 
SDVHPFYLAF PDVPLVSISE HQRTPMPPVN WRGTVLHGLD PTVLPFKERP SGAYLAFLGR 
ISPEKGPDRA IEIAVRAGMP LKIAAKVDAQ DRDYWDSVVE PLIRRHSNVE YVGEIGESQK 
ADFLGNAAAL LFPINWPEPF GLVMIESMAC GTPVLAFRYG SAPEVIDDGV SGILVDTVEQ 
AVKRLDRVLG LNRRKVRESF EKRFTTDRMT RDYIDIYRSL PSIRAPADPT PEEEPKKVGL 
EAA