Gene BURPS1710b_A0909 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A0909
Symbol	hepB
ID	3692651
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	-
Start bp	1166879
End bp	1168045
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	71%
IMG OID	637731163
Product	HepB protein
Protein accession	YP_336067
Protein GI	76818835
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCATA CCGAAACGTC GATCAAGTCG CTGCAGATCG GCATGCACTG GTTTCCCGAG 
CGAGCGGGCG GGCTCGATCG CATGTATTAC TCGCTCGTTG GCGCGCTGCC GAGCGCGGGC 
GTCGCGGTGC GCGGCGTGGT CGCGGGCTCC GAGCGCGTCG CGGCCGACAC GGGCGGCGCG 
ATCCGCGGCT TCGGGCCGGC GACGTCGTCG TTGCCGCGGC GGATGATCGC CGCGCGCCAT 
GCGCTGCGCG ACGTGATGCG CATCGAGCGG CCCGACGTCG TGTCGTCGCA CTTCGCGCTG 
TACACGTTCC CTGGGCTCGA CGTGACGCGC GGCATTCCGC AGGTGTCGCA TTTCCAGGGC 
CCGTGGGCCG ACGAGAGCCA CGTCGAGGGC GCGGATTCGC TCGGGCAGAA GGTCAAGCAC 
CGGCTCGAGC AGGCGGTCTA TGCCCGCTCG TCGCGGCTCA TCGTGCTGTC GCACGCGTTC 
GGGCAGATTC TCACGTCGCG CTACAACGTC GATCCGGCGC GCGTGCGCGT CGTGCCCGGC 
TGCGTCGACA CCGCGCAATT CGATTTGCCG ATGACGCCCG CCGACGCGCG CCGCAAGCTG 
CAACTGCCGC AGGATCGGCC GATCGTGCTC GCGGTGCGGC GGCTCGTGCG GCGCATGGGG 
CTCGAGGATC TGATCGACGC GGTGAAGACC GTGCGCCGCC GGCATCCGGA CGTGCTGCTG 
CTGATCGCCG GCAAGGGGCG GCTCGAAGGC GAGCTGCGCA AACGGATCGA CGACGCCGAG 
CTCGGCGAGA ACGTGAAGCT GCTCGGTTTC GTGCCCGACA ATCATCTGGC CGCGCTGTAC 
CGCGCGGCGA CGCTCAGCGT CGTGCCGACC GTCGCGCTCG AGGGATTCGG GCTCATCACC 
GTCGAGTCGC TCGCGTCCGG CACGCCGGTG CTCGTGACGC CCGTCGGCGG GCTGCCGGAG 
GCGGTCGCGG GCCTGTCGGA GGCGCTCGTG CTGCCGGAGG TGGGCGCGGC CGCGATCGCG 
GACGGGTTGG CCGCGGCGTT GTCCGGCTCG CTCGTGCTGC CGGATGCGGA CGCATGCCGG 
CGATACGCGC GCGCGCATTT CGACAACACG GTGATCGCGC GCCGCGTCGC GGCGGTCTAC 
GAGGAGGCGA TTCGGGCCGC CGTTTGA

Protein sequence

MKHTETSIKS LQIGMHWFPE RAGGLDRMYY SLVGALPSAG VAVRGVVAGS ERVAADTGGA 
IRGFGPATSS LPRRMIAARH ALRDVMRIER PDVVSSHFAL YTFPGLDVTR GIPQVSHFQG 
PWADESHVEG ADSLGQKVKH RLEQAVYARS SRLIVLSHAF GQILTSRYNV DPARVRVVPG 
CVDTAQFDLP MTPADARRKL QLPQDRPIVL AVRRLVRRMG LEDLIDAVKT VRRRHPDVLL 
LIAGKGRLEG ELRKRIDDAE LGENVKLLGF VPDNHLAALY RAATLSVVPT VALEGFGLIT 
VESLASGTPV LVTPVGGLPE AVAGLSEALV LPEVGAAAIA DGLAAALSGS LVLPDADACR 
RYARAHFDNT VIARRVAAVY EEAIRAAV