Gene Smed_5015 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5015
Symbol
ID	5318754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	1537297
End bp	1538286
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	59%
IMG OID	640776797
Product	KpsF/GutQ family protein
Protein accession	YP_001313729
Protein GI	150377133
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0794] Predicted sugar phosphate isomerase involved in capsule formation
TIGRFAM ID	[TIGR00393] KpsF/GutQ family protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.336764
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGTGG TTGTGAGTGA CCCAATACTG GCGTCGATCA GTCGTACGAT CGCCACTGCC 
GCCGACGGAA TCCATGCGCT GGCGGCCTGT CTGGAGGAGA ATGCGGCCTT GCGCCGTAGT 
TTTGTCGATG CCATCGAACT CGTCGCCTCC AAGCGTGGCC GGGTCGTTGT GGCGGGTGTT 
GGCAAGAGCG GGCACATCGG ACGCAAGATC GCCGCGACGC TAGCTTCTAC CGGTACGTCC 
GCCTATTTCG TGCATCCGAC GGAAGCAAGT CACGGCGATC TCGGCATGAT CACCGCCGAG 
GATTTGCTCA TCCTCCTTTC ATGGTCCGGT GAGACGGTCG AACTCGGGAA CGTGCTCACT 
TACGCCAAGC GCTTCAATGT CCCGGTCATT TCCGTCACGT CGAATGCCGA CAGCACAATC 
GCTCGCAACT CCACGATCCC AGTGATTCTG CCGAAAGTGC CGGAGGCATG CCCACATGGT 
CTAGCTCCGA CCACGTCTGC AATACTGCAG TTGGCGGTGG GGGATGCTTT TGCAATAGCC 
TTGCTTGAGC GGAGGGGGTT TTCGGCCGAG GACTTCAAGA CGTTTCATCC GGGCGGCAAG 
CTCGGTTCGC AGTTGCTGCT CGCCCATGAA CTGGCCCATT CGGGTGAGGC TGTGCCACTT 
TTGCCGATCG GCAGTCCGAT GAGCGAAGCA GTCATTCAGA TGTCTTGCAA GGGTTTCGGG 
GTCGTCGGCG TCGTTGGTGG CGACGGTGAG CTTGTCGGTG TCATTACCGA CGGCGATTTG 
CGGCGCCACA TGTCACAAAA TCTTTTGCTC CTCACCGTCG AGACCGTGAT GTCGCACATG 
CCTCGCGTGA TTACGCCTGG AATGCTGGCC AGTGCAGCCA TGGAAATGAT GCAATCGCAA 
AAGATCACGG TGCTGTTTCT GGTCGATGAC GTTGGCCGGC CGTCGGGCAT CTTGCACGTC 
CACGATCTTC TGCGTGCCGG CGTGGCCTAA

Protein sequence

MNVVVSDPIL ASISRTIATA ADGIHALAAC LEENAALRRS FVDAIELVAS KRGRVVVAGV 
GKSGHIGRKI AATLASTGTS AYFVHPTEAS HGDLGMITAE DLLILLSWSG ETVELGNVLT 
YAKRFNVPVI SVTSNADSTI ARNSTIPVIL PKVPEACPHG LAPTTSAILQ LAVGDAFAIA 
LLERRGFSAE DFKTFHPGGK LGSQLLLAHE LAHSGEAVPL LPIGSPMSEA VIQMSCKGFG 
VVGVVGGDGE LVGVITDGDL RRHMSQNLLL LTVETVMSHM PRVITPGMLA SAAMEMMQSQ 
KITVLFLVDD VGRPSGILHV HDLLRAGVA