Gene BURPS668_3591 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3591
Symbol	hemK
ID	4883542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	3517254
End bp	3518111
Gene Length	858 bp
Protein Length	285 aa
Translation table	11
GC content	74%
IMG OID	640129519
Product	putative protein hemK
Protein accession	YP_001060596
Protein GI	126441418
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2890] Methylase of polypeptide chain release factors
TIGRFAM ID	[TIGR00536] HemK family putative methylases [TIGR03534] protein-(glutamine-N5) methyltransferase, release factor-specific

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.334574
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACGA CGAAACCCTC GCCCGCCACA GCCGCCGAGC TGCTGCGCGC GTCGCCGCTC 
GATGCGCTCG ACGCGCGCAT CCTGCTCGCG CACGCGCTCG GCTGGAGCCG CACGCAGTTG 
ATCACGCGCG CCGACGAACC GCTCGACGCG GCCGCGCGCG CGCGCTATCT GGCGCTTCAG 
GCGCGCCGCG CGGCGGGCGA GCCCATCGCG CAGCTCACCG GCGCGCGCGA GTTCTTCGGT 
CTCGAATTCG ACATCACGCC GGACGTGCTG ATCCCGCGCC CGGAGACGGA GCTGCTCGTC 
GAGACGGCGC TCGACGCGAT CGACGGCATC GCATCGCCAT GCGTGCTCGA TCTCGGCACG 
GGCAGCGGCG CGATCGCGGT GTCGATCGCA TCCGAGCGGC CCGACGCGCG CGTGTGGGCG 
CTCGAGCGCT CGGTCGCCGC GCTCGACGTC GCGCGCCGCA ACGCGCGCAA GCTGCTCGAT 
CCGGCGCGCG CGGGCGGCCC GCTGCGGTTT CTCGAAAGCG ACTGGTACGC GGCGCTCGAT 
CCGGGCCTGC GCTTTCACGT CGTCGTCAGC AACCCGCCGT ACATCGCGCG GCACGATCCG 
CACCTCGCCG AAGGCGACCT GCGCTTCGAG CCGCGCGGCG CGCTCACCGA CGAGAACGAC 
GGGCTTGCCG CGATCCGCAC GATCGTTGCG GGCGCGCATG CGTTCGTCGC ACCCGGCGGC 
GCGCTGTGGC TCGAACACGG TTACGATCAG GCGGCCGCGG TGCGCGCGCT CCTCGACGCG 
GCAGGCTTCG CCGACGTCGA ATCGCGCGCG GATCTCGCGT CGATCGAGCG CGCGAGCGGC 
GGGCGCCTGC CCGGCTGA

Protein sequence

MNTTKPSPAT AAELLRASPL DALDARILLA HALGWSRTQL ITRADEPLDA AARARYLALQ 
ARRAAGEPIA QLTGAREFFG LEFDITPDVL IPRPETELLV ETALDAIDGI ASPCVLDLGT 
GSGAIAVSIA SERPDARVWA LERSVAALDV ARRNARKLLD PARAGGPLRF LESDWYAALD 
PGLRFHVVVS NPPYIARHDP HLAEGDLRFE PRGALTDEND GLAAIRTIVA GAHAFVAPGG 
ALWLEHGYDQ AAAVRALLDA AGFADVESRA DLASIERASG GRLPG