Gene BURPS1106A_A3038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A3038
Symbol
ID	4903541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2952681
End bp	2953796
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	74%
IMG OID	640146141
Product	putative heptosyltransferase
Protein accession	YP_001077067
Protein GI	126457370
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.148139
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGCG ATCCTTCCGC GCGGCCCGCG GCCGCCGAGC GGCGCGGCAC GGGCGAATAC 
GCGAGCATCG CGGTGTTTCG CGCGCTGCAG CTCGGCGACA TGCTGTGCGC GGTGCCCGCG 
CTGCGCGCGC TGCGGCGCGG CGAGCCGCAG GCGCGGATCA CGCTGATCGG GCTGCCGTGG 
GCGAAGGCGT TCGCCGAGCG CTTCTCCGAT TACGTCGACG ACTTCATCGA ATTCCCCGGC 
GCGCCGGGGC TCGTCGAGCA GCCGCACGAC GTCGAGCGGC TCGCCGCGTT CGTCGCCGAA 
TGCCGGTCGC GCCGTTTCGA TCTCGCGATC CAGCTGCATG GCAGCGGCGC GCAATCGAAC 
GCGATCGTCG CGGGCCTCGG CGCGGCGTCG ACGGCGGGTT TCGCGCCCGA TGCGTTCGCG 
GCCGGCGAGC ACGCCGCGCC GCGGCTCGAC CGCACGATCG CATGGCCGTC GGCGCTGCCG 
GAAATCGCCC GCTACACGAA GCTGATGCGC CGGCTCGGCT ACGACGACTG GGGCGACTAT 
CTGGAGTTTC CGCTCGGCGG CCTCGATTAC GCGATCTGCC GCGTGCTGTG CGAGCAGCAC 
GATCTGCGGC CGCGCGAATA CGCGGTCGTG CATCCGGGCG CGCGCATGCA GTCGCGCCGC 
TGGCCGGTCG CGCGCTTCGC GGGCGTCGCG CGCGCGCTCG CCGAGCGCGG GCTGCGCATC 
GTGCTGACGG GCACGCGCGG CGAGGCGGCG CTCGCCGACG CGTTCGCCGC GCAACTGGGC 
GCGCCGTTCG TCGATCTGTG CGGCCGCACG CCGCTCGGCG CGCTCGGCGC GCTGATCGGC 
CGCAGCCGCC TCGTCGTCTG CAACGATACC GGCGTGTCGC ACGTGGCCGC CGCGCTCGGC 
GCGCCGAGCG TCGTGATCGC GTGCGGCAGC GACGCCGCGC GCTGGGCGCC GCTCGATCGC 
GAGCGCCATC GCGTGCTCGC CGACTATCCG CCGTGCCGCC CGTGCATGTT CGAAACCTGT 
CCGTACGACC ACGCGTGCGC GAACGCGATC GGCGTCGAGG ACGTCGTCAG GCGCGCGGAC 
GCACTGCTCG CCGTGGAGCC GCATCATGTC GCCTAA

Protein sequence

MSGDPSARPA AAERRGTGEY ASIAVFRALQ LGDMLCAVPA LRALRRGEPQ ARITLIGLPW 
AKAFAERFSD YVDDFIEFPG APGLVEQPHD VERLAAFVAE CRSRRFDLAI QLHGSGAQSN 
AIVAGLGAAS TAGFAPDAFA AGEHAAPRLD RTIAWPSALP EIARYTKLMR RLGYDDWGDY 
LEFPLGGLDY AICRVLCEQH DLRPREYAVV HPGARMQSRR WPVARFAGVA RALAERGLRI 
VLTGTRGEAA LADAFAAQLG APFVDLCGRT PLGALGALIG RSRLVVCNDT GVSHVAAALG 
APSVVIACGS DAARWAPLDR ERHRVLADYP PCRPCMFETC PYDHACANAI GVEDVVRRAD 
ALLAVEPHHV A