Gene BTH_I1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BTH_I1039
Symbol
ID	3847384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia thailandensis E264
Kingdom	Bacteria
Replicon accession	NC_007651
Strand	-
Start bp	1181288
End bp	1182322
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	69%
IMG OID	637840711
Product	glycosyl transferase, group 1 family protein
Protein accession	YP_441593
Protein GI	83718848
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.147415
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCA TGATCGTCAC CGATGCGTGG GAGCCGCAAG TCAACGGCGT CGTGCGCACG 
CTCAAGAGCA CCGCGCGCGA GCTCACCGCG CTCGGCCACC GCGTCGAGCT CGTCACGCCG 
CTCGAATTCC GCACGGTGCC CTGCCCGACC TATCCCGAAA TCCGTCTGTC GATCCTGCCA 
TACCGGCGGC TGCGCGAGCG CCTGAACGCG TTCGAGCCGG ACGCGCTGCA CATCGCGACG 
GAAGGCCCGC TCGGCCTCGC CGCGCGCCGC TACGCGCGCG CGCGCAAGCT GCCGTTCACG 
ACCGCGTACC ACACGCGCTT TCCCGAATAC GTGCAGGCGC GCTTCGGCGT GCCGCTCGCG 
GCGACCTATC GCTTCCTGCG GTGGTTCCAC GGCGCGTCGC TCGCGGTGAT GGCGCCGACG 
CCCGTCGTCA AGGACGACCT CGAGCAATTC GGCTTCGACA ACGTCGTGCT GTGGACGCGC 
GGCGTCGATC TCGACATCTT CCGGCCGATG GAGTCGAAGG TGCTCAACAC CGCGCGGCCG 
ATCTTCCTGT ATGTCGGCCG CGTCGCGATC GAGAAGAACG TCGAGGCGTT CCTGAAGCTC 
GACCTGCCAG GCTCGAAATG GGTCGCGGGC GAAGGGCCTG CGCTCGCCGA GCTCAAATCG 
CGCTATCCTG AGGCGAATTA CCTCGGCGTG CTGACGCAGG CGGAGCTCGC CAAGGTATAC 
GCGGCGGCCG ACGTGTTCGT GTTCCCGAGC CGCACCGACA CGTTCGGTCT CGTGCTGCTC 
GAGGCGCTCG CGTGCGGCAC GCCCGTCGCC GCCTATCCGG TGACGGGGCC CGTCGACGTG 
CTCGGGAACG GCGGCGCCGG CGCGATGAAC GAGGACTTGC GCGAAGCGTG CCTCGAGGCG 
CTGAAGATCG ATCGGCGGCA CGCGCGCGAG TGGGCCGAGC GTTTCTCGTG GCGCGCGGCG 
TCCGAGCAGT TCGCGTCGCA CCTGAAGCCG CTGCCGAAAT CCGCCAGCCC ACATACCGAA 
GGCGCAGCCG TTTGA

Protein sequence

MKIMIVTDAW EPQVNGVVRT LKSTARELTA LGHRVELVTP LEFRTVPCPT YPEIRLSILP 
YRRLRERLNA FEPDALHIAT EGPLGLAARR YARARKLPFT TAYHTRFPEY VQARFGVPLA 
ATYRFLRWFH GASLAVMAPT PVVKDDLEQF GFDNVVLWTR GVDLDIFRPM ESKVLNTARP 
IFLYVGRVAI EKNVEAFLKL DLPGSKWVAG EGPALAELKS RYPEANYLGV LTQAELAKVY 
AAADVFVFPS RTDTFGLVLL EALACGTPVA AYPVTGPVDV LGNGGAGAMN EDLREACLEA 
LKIDRRHARE WAERFSWRAA SEQFASHLKP LPKSASPHTE GAAV