Gene Smed_3031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3031
Symbol
ID	5323909
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	3179518
End bp	3180534
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	62%
IMG OID	640791981
Product	aldose 1-epimerase
Protein accession	YP_001328693
Protein GI	150398226
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2017] Galactose mutarotase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.331849
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACCG ACATGGAAAT CTTCGGCCAT CTGGCCTCAG GCGAGCCCGT CCACCGGGTG 
ACCCTCAAGG GCGGCGGTCT GACGGCGTCG GTAATCACCT GGGGCTCGGT CATCCAGGAT 
CTGCGGCTCG ACGGACATGC GCCGCCGCTG GTGCTCGGCT TCGAGGATTT CCCAAGCTAT 
CCAGCCCATT CCTCCTATTT CGGCGCCACG CCCGGCCGCA ACGCCAACCG CATCGGCGAC 
GGCCGTTTCT CGCTCGACGG CAGGGCCTAT CAGCTCGAAC GCAACGAGAA GGGCGTCACG 
CATCTACATG GGGGCAGTGA CAATATCGCC AGGCGCAACT GGACGATCGT CGGACGGGAC 
GAAGACAGTG TGACGCTCAA AATCACCGAT CCGGACGGCC GTGCCGGCTA TCCCGGCAAT 
TGCACGATCA CCTGCACATA TCGGCTGAAG CCCGGCGGTA CGCTCAACGT CGTCTACGAA 
ACCGAGACCG ACGCGCCGAC GCTCGCCAAT GTCTGCCAGC ACAGCTATTT CAACCTCGAT 
GGCGGATCGG ACGCGTTCGG CCACGATATC ATGATCGCGG CGGACCACTT CCTGCCTACC 
GACGAGCGGC AGATTCCAAC GGGAGAGATC CGCCCCGTCG ACGGCACCGC CTTCGACCTG 
CGCGAAATGA CCTCGCTCAA GCGACAACTG GACGGCGACA GGATAGGCTA CGATCACAAT 
TTCTGCCTCT CCCCGGAACG GATGCAGAAG CGATCCGTCG CGCTGGTACG CAGCATCAAT 
TCGGGCGTGT CGCTGGAAGT TCTGACGACG GAGTCCGGCG TCCAGCTCTA TACCGGAGAA 
AAACTCGACG TAGCCGTTCC CGGCCTCGAA GGCCGCCGCT ACGGCGCCTT TGCAGGCTTC 
TGTCTCGAAA CACAGATCTG GCCCGATGCG GTCAATCACG AAGGTTTTCC TAACGCAATT 
CTGCGGCCGG GCGAAACGCT TCGGCAGGAG ACGGACTACG TCTTCACCAG GAATTGA

Protein sequence

MTTDMEIFGH LASGEPVHRV TLKGGGLTAS VITWGSVIQD LRLDGHAPPL VLGFEDFPSY 
PAHSSYFGAT PGRNANRIGD GRFSLDGRAY QLERNEKGVT HLHGGSDNIA RRNWTIVGRD 
EDSVTLKITD PDGRAGYPGN CTITCTYRLK PGGTLNVVYE TETDAPTLAN VCQHSYFNLD 
GGSDAFGHDI MIAADHFLPT DERQIPTGEI RPVDGTAFDL REMTSLKRQL DGDRIGYDHN 
FCLSPERMQK RSVALVRSIN SGVSLEVLTT ESGVQLYTGE KLDVAVPGLE GRRYGAFAGF 
CLETQIWPDA VNHEGFPNAI LRPGETLRQE TDYVFTRN