Gene Smed_2789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2789
Symbol
ID	5323659
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2908274
End bp	2909584
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	60%
IMG OID	640791734
Product	xylose isomerase
Protein accession	YP_001328454
Protein GI	150397987
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2115] Xylose isomerase
TIGRFAM ID	[TIGR02630] xylose isomerase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCACAG GATTTTTCGG CGATACCGCT AAGATCAAAT ATGAAGGTCC GGAAAGCACC 
AATCCGCTCG CCTTCCGCCA TTACAACCCG GACGATGTCG TCCTCGGCAA GCGTATGGAA 
GACCATCTGC GCTTCGCCGT CGCCTATTGG CATAGCTTCG TCTGGCCGGG CGGCGATCCC 
TTCGGCGGGC AGACCTTCGA GCGGCCCTGG TTCAAGGACT CGATGGAGGC CGCGAAGCTG 
AAGGCGGACG TGGCCTTCGA ATTCTTCCAA TTGCTGGGCG CGCCATTCTA CTGCTTCCAC 
GACGCGGACG TTCGCCCCGA GGGGCGGAAT TTTGCCGAGA ACACGCGCAA CCTCAACGAC 
ATCGTCGATT ATTTCGCAAA GAAGCAGGAC GAGTCCGGCG TCAAGTTGCT GTGGGGCACG 
GCCAACCTTT TTTCGAACCG CCGCTTCATG GCGGGGGCTG CGACGAACCC GGACCCGGAT 
GTTTTCGCCT TCGCCGCGGC GACGGTTAAG ACCTGCATCG ACGCGACGCA GCGGCTCGGC 
GGCGAGAATT ACGTGCTCTG GGGCGGGCGC GAGGGCTATG AGACCCTGCT CAACACCGAC 
CTGAAGCGCG AGCTCGATCA GCTTGGCCGC TTTCTCAATC TGGTCGTCGA ATACAAGCAC 
AAGATCGGCT TCAAGGGTAC GATCCTGATC GAGCCGAAGC CGCAGGAGCC GACCAAGCAC 
CAGTACGACT ACGATGTCGC GACCGTCTAC GGCTTCCTCA AGAAATATGG TCTCGAGAAT 
GAGGTTAAGC TCAATATCGA GCAGGGCCAT GCGATCCTCG CCGGCCATTC CTTCGAGCAC 
GAGCTGGCGC TTGCCAATGC CCTCGGTGTC TTCGGTTCGA TCGACATGAA CCGCAACGAT 
TACCAGTCCG GATGGGATAC CGACCAGTTC CCGAACAATG TTCCGGAAAT GGCGCTCGCT 
TATTACCACG TCCTTGCGGG TGGCGGCTTC AAGACCGGTG GAACCAATTT CGACGCGAAG 
CTGCGCCGCC AGTCGATCGA CCCCGAAGAC CTGCTGATCG GCCATATCGG CGGGATGGAT 
TGCTGCGCGC GCGGCCTCAA GGCCGCAGCG AAGATGATTG AGGACAAGGC ACTCTCGGCG 
CCGCTCGAAG AGCGTTATGC CGGCTGGAAC GAGCTGGAGG CGCAAAAGAT GCTCCAGGGC 
GGCTTCTCGC TCGAGGAGAT CGAGGCTCGG GTTCTGAAGG CGGACGTAAA TCCGCAGCCG 
AAATCCGGGC GGCAGGAGCT CCTGGAAAAC GTGGTCAACC GCTACGTCTG A

Protein sequence

MSTGFFGDTA KIKYEGPEST NPLAFRHYNP DDVVLGKRME DHLRFAVAYW HSFVWPGGDP 
FGGQTFERPW FKDSMEAAKL KADVAFEFFQ LLGAPFYCFH DADVRPEGRN FAENTRNLND 
IVDYFAKKQD ESGVKLLWGT ANLFSNRRFM AGAATNPDPD VFAFAAATVK TCIDATQRLG 
GENYVLWGGR EGYETLLNTD LKRELDQLGR FLNLVVEYKH KIGFKGTILI EPKPQEPTKH 
QYDYDVATVY GFLKKYGLEN EVKLNIEQGH AILAGHSFEH ELALANALGV FGSIDMNRND 
YQSGWDTDQF PNNVPEMALA YYHVLAGGGF KTGGTNFDAK LRRQSIDPED LLIGHIGGMD 
CCARGLKAAA KMIEDKALSA PLEERYAGWN ELEAQKMLQG GFSLEEIEAR VLKADVNPQP 
KSGRQELLEN VVNRYV