Gene SbBS512_E4135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4135
Symbol
ID	6270581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3856412
End bp	3857542
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	52%
IMG OID	641727962
Product	UDP-N-acetylglucosamine 2-epimerase
Protein accession	YP_001882389
Protein GI	187730555
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0381] UDP-N-acetylglucosamine 2-epimerase
TIGRFAM ID	[TIGR00236] UDP-N-acetylglucosamine 2-epimerase

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAGTAC TGACTGTATT TGGTACGCGC CCGGAAGCCA TCAAGATGGC TCCGTTGGTG 
CATGCGTTGG CAAAAGCTCC TTTTTTTGAG GCTAAAGTTT GCGTCACTGC GCAGCATCGG 
GAGATGCTCG ATCAGGTGCT GAAACTCTTT TCCATTGTAC CTGACTACGA TCTCAACATA 
ATGCAGCCAG GACAGGGCCT GACAGAGATA ACCTGTCGGA TTCTGGAAGG GCTAAAACCT 
ATTCTTGCCG AGTTCAAACC AGACGTCGTG CTGGTTCACG GCGACACAAC AACGACGCTG 
GCAACCAGCC TGGCGGCGTT TTATCAGCGT ATTCCTGTTG GTCACGTTGA GGCTGGTTTA 
CGCACGGGCG ATCTCTATTC GCCGTGGCCG GAAGAGGCTA ACCGTACATT GACCGGGCAT 
CTGGCGATGT ATCACTTCTC TCCAACCGAA ACTTCCCGGC AAAACTTGCT GCGTGAAAAC 
GTTGCGGATA GCCGAATCTT CATTACTGGT AATACAGTCA TTGATGCACT GTTATGGGTG 
CGTGATCAGG TGATGAGCAG CGACACGCTG CGTTCAGAAC TGGCGGCAAA TTACCCGTTT 
ATCGACCCCG ATAAAAAGAT GATTCTGGTG ACCGGTCACA GGCGTGAGAG TTTCGGTCGT 
GGTTTTGAAG AAATCTGCCA CGCGTTGGCA GACATTGCCA CCACGCACCA GGACATCCAG 
ATTGTCTATC CGGTGCATCT CAACCCGAAC GTCAGAGAGC CGGTCAATCG CATTCTGGGG 
CATGTGAAAA ATGTCATTCT GATCGATCCC CAGGAGTATT TACCGTTTGT CTGGTTGATG 
AACCACGCCT GGCTGATTTT GACCGACTCA GGCGGCATTC AGGAAGAAGC GCCTTCGCTG 
GGGAAACCGG TGCTGGTGAT GCGCGATACC ACTGAGCGTC CGGAAGCGGT GACGGCGGGT 
ACGGTGCGTC TGGTAGGCAC GGATAAGCAG CGAATTGTCG AGGAAGTGAC GCGTCTTTTA 
AAAGACGAAA ACGAATATCA AACTATGAGC CGCGCCCATA ACCCGTATGG TGATGGTCAG 
GCATGCTCTC GCATTCTGGA AGCGTTAAAA AATAATCGGA TATCACTATG A

Protein sequence

MKVLTVFGTR PEAIKMAPLV HALAKAPFFE AKVCVTAQHR EMLDQVLKLF SIVPDYDLNI 
MQPGQGLTEI TCRILEGLKP ILAEFKPDVV LVHGDTTTTL ATSLAAFYQR IPVGHVEAGL 
RTGDLYSPWP EEANRTLTGH LAMYHFSPTE TSRQNLLREN VADSRIFITG NTVIDALLWV 
RDQVMSSDTL RSELAANYPF IDPDKKMILV TGHRRESFGR GFEEICHALA DIATTHQDIQ 
IVYPVHLNPN VREPVNRILG HVKNVILIDP QEYLPFVWLM NHAWLILTDS GGIQEEAPSL 
GKPVLVMRDT TERPEAVTAG TVRLVGTDKQ RIVEEVTRLL KDENEYQTMS RAHNPYGDGQ 
ACSRILEALK NNRISL