Gene BURPS1710b_A1968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A1968
Symbol
ID	3693766
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	+
Start bp	2408420
End bp	2409586
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	64%
IMG OID	637732222
Product	putative heptosyltransferase (O-antigen related)
Protein accession	YP_337119
Protein GI	76819408
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.78963
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCCCT CCATCAAGAT CAGAATCTAC AAGCGGCTGG ACCGGATGTT GTCGGATCTG 
GTCAGGGCCG TGCCGCATCC GAAACGCGCG CTCGGGCGGA CACCGACGCG CGTGCTGATC 
ATCAAGCTCT CGGCGATGGG GGATTCGCTG TGCCTCTTTC CCACCGTTCG GCAACTGGCG 
CTCGCGTTCC CGGGCGCGAC GATTGACTGG CTGACGTCCA ATCGCTCCAA TCCCGCGCTG 
TTCGCCGAGC TGCCGTTCAT CCGCACGATC TTCGTCACGC CGCCGTCGCT CGTGCGCGCG 
CTGACGTATC TGGGCGGGTG GCTCTTCAGG GCGCGCCGCT ACGACCTCAC GATCGATTAC 
GACCAGTACT ACTGCATATC CGAGCTGATC GCGGGCATGT CGGCGTGCAG CGCGGGTTTC 
AGGACGTCGC TCAAGGGCAC GACGTTCTCG CTGAGCGTCG AATACGATCC GCTGCTCAAC 
GAGAAGGCGA TGTTCCGCAA GCTGACCGAG CGCGTCTTCG CGACGTACGG CGTCTCGATT 
CCCGATTACC GGGCGGAACT GCCGGAACTG ATCGAGCGAT TCGTGCCGAG CGCGCAATTG 
CAGACGTTGC GCGCGCGGCT GAAGGCGCAG GGCAAGCCGA TCGTCGGCAT TTATCCCGGC 
TCGGGCGCGA ACGCGACGTT CAGGCGCTGG GGCGTCGGCA ATTACGTGGC GCTGATCGAG 
CGCTACAAGG ATCGCTACGC GTTCGTGCTC CTCGGCGGCC CGGACGAGCG TGACCTGCAG 
GCGGACCTGA AGGATATCGA CGGCGTGTTC AATCTGATCG ATTCGATGTC GTTCAAGGAG 
GTCGCGTGGT TCCTGAAGCA TACGATCGAC CTGCTCGTCG GCAACGACGG CGGGCTGCTG 
CACGTCGCCG AGAGCCAGGC GGTGGCGACC GTGGGGATAT TCGGGCCCGC GCTGTACCGG 
AAGTGGGGGT CGTCGCTGGA GCGTTCGATC GGCGTCGAGA AGGAACTGCC GTGCCGGCCG 
TGTCTGAAGA ACTATCTCGG CACCGTGCCG TCGGCGTGTT GTCTCGGCAC CACCGCATGC 
CTGAGCGCGA TCTCGACCGA CGACGTTGCG CAGGCGATGC ATCGCGCCGT CCATCGGATT 
CACGTCGTGC CGATCGCGCA TGCTTGA

Protein sequence

MQPSIKIRIY KRLDRMLSDL VRAVPHPKRA LGRTPTRVLI IKLSAMGDSL CLFPTVRQLA 
LAFPGATIDW LTSNRSNPAL FAELPFIRTI FVTPPSLVRA LTYLGGWLFR ARRYDLTIDY 
DQYYCISELI AGMSACSAGF RTSLKGTTFS LSVEYDPLLN EKAMFRKLTE RVFATYGVSI 
PDYRAELPEL IERFVPSAQL QTLRARLKAQ GKPIVGIYPG SGANATFRRW GVGNYVALIE 
RYKDRYAFVL LGGPDERDLQ ADLKDIDGVF NLIDSMSFKE VAWFLKHTID LLVGNDGGLL 
HVAESQAVAT VGIFGPALYR KWGSSLERSI GVEKELPCRP CLKNYLGTVP SACCLGTTAC 
LSAISTDDVA QAMHRAVHRI HVVPIAHA