Gene BURPS668_3444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3444
Symbol
ID	4882629
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	3369084
End bp	3370157
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	73%
IMG OID	640129372
Product	aldose 1-epimerase family protein
Protein accession	YP_001060455
Protein GI	126440807
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2017] Galactose mutarotase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.381459
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGCGA CGCATTCTCG ATCCACAGCC ACCGATGCGG TGCAAACCTT GCAGACGCGC 
ACCGCACGGC GCGCGGCCGC CGCGCATCGG GTGAGCCCGG GGCCGCAGAC GTCGCAGATC 
GCGCGCGGCG CGGGCGTCAC CGAGACGGCG ATCGCGACGC TCTCGAACGA CATGCTGCGG 
CTCGACGTCG CGCCGCACCT GGGCGGCGGC GTCACGCGCT TCGACTGGCG CGGCGACGGC 
GCGCTCACGC CGATCTTCCG CCGTTGCGAT GCGCCCGGCG CGCGCACCGA TCCGAACGAG 
CTCGCGTGCT ATTCGCTGCT GCCGTATTCG AACCGGATCG GCGGCGGGCG CTTCGAGTGC 
GACGGGCGGC TCGTGCGCGT GCCGCGCAAC CGCTCGGCCG AGCCGCTGCC GATTCACGGC 
GACGGCTGGC TCGCGCACTG GCAACTCGAC GATGCGACCG ATACGCAGCT CGGCCTGTCG 
CTCGATCGCA GCAACGGCGC GCCGTATGCG TATCGCGCGA CGCAGGTCTA CGCGCTCGAC 
GGCGCGACGC TCACGATCGC GCTCGGCATC GAGAACACGG GCGCGACGCG CCTGCCGTTC 
GGGCTCGGCG TGCATCCGTT CATCGTGCGC GACGCGTCGA CCGAACTCGC GGCCGCCGCG 
AGCGGGCTGT GGCTGTCGAC GCCCGACTGG CTGCCGTCGC GCCATGTCGG CGCGCCGCCC 
GCGTGGCGCT TCGGCATCGC GTATCCGTTG CCGGACACGC TCGTCAATCA CGCGTTCACC 
GGCTGGGGCG GCGGCGCGAC GATCGCGTGG CCGCAGCGCC GGCTCGGGCT GACAGTCACG 
GCCGACGCCG ATTGCTATGT GTTGTATACG CCGCCCGGCG AGCCGTTCTT CTGCTTCGAG 
CCGGTCGATC ACCCGATCGA CGCGGTGAAC CTGCCGGGCG GCGGCGCCGC GCACGGCATG 
ACGCTGCTCG CGCCGGGCGA GCGCCTGATG CGGCGCTTTC GCTTCACCGT CGCGCGCACC 
GATGCGCGCG CGGCGCCCGT CGCCCGCCAA TCGAGGCGGC GCGCGATCGC GTAG

Protein sequence

MTATHSRSTA TDAVQTLQTR TARRAAAAHR VSPGPQTSQI ARGAGVTETA IATLSNDMLR 
LDVAPHLGGG VTRFDWRGDG ALTPIFRRCD APGARTDPNE LACYSLLPYS NRIGGGRFEC 
DGRLVRVPRN RSAEPLPIHG DGWLAHWQLD DATDTQLGLS LDRSNGAPYA YRATQVYALD 
GATLTIALGI ENTGATRLPF GLGVHPFIVR DASTELAAAA SGLWLSTPDW LPSRHVGAPP 
AWRFGIAYPL PDTLVNHAFT GWGGGATIAW PQRRLGLTVT ADADCYVLYT PPGEPFFCFE 
PVDHPIDAVN LPGGGAAHGM TLLAPGERLM RRFRFTVART DARAAPVARQ SRRRAIA