Gene BURPS1106A_2562 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2562
Symbol
ID	4900334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	2516561
End bp	2517760
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	69%
IMG OID	640135789
Product	GHMP kinase domain-containing protein
Protein accession	YP_001066816
Protein GI	126452895
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4542] Protein involved in propanediol utilization, and related proteins (includes coumermycin biosynthetic protein), possible kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0349401
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATCA TCGAGAACAA CGAAGACCTC GGCGTACTGC GGTTCATCAC GGCGGGCAGC 
GTCGACGACG GCAAGCGCGC GTTGATCGGG CGACTGCTGT ACGACGGCGA GGCGATGGAG 
GCCGAGGCGC GCCGCGCACC GCCGCGCGAG ACGCGGATGC GCGCCGGCGG CGCCGCGCCC 
GAACCCGCGT CGGCCCCTCG CACGCACGTC GCGCCCGATC TCGATGCGAT GGCGGGCGGG 
CCGTCGATCG CCGCGGGCGG CCATGTCGGC CGCGACGGCG GGCGCACGTG CGCGAAGCCC 
GACAGGACGC GCGCGGCGAG CGCGCACGCA CCGCCCCGGC GCCTGTTCTC GATCGGCCGC 
GCGCCGGCCA CGTTCGGCGA ACTGGTTCAG GGGCGCGAGC CCGCGTCCGG CGACGATTTT 
CTGATCACGC TGCCGATCAC GCTGAGCTCG ACTGCCCGAT TCTGCCGGTT TCGCGATTCC 
GATCGCCTGT ATGTCTTTCC GGCGAGCAAG AAGAAATCGC TGAAGGCCGC CGCGCTCTTT 
CTCGAACGAT TCGGCATCCT GACGGGCGGC GTCCTGCAGA TCTGCAGCGA CGTGTCCGAG 
GGCAAGGGGC TCGCGAGCTC GTCGTCCGAC ATCGTCGCGA CGCTGCGCGC GCTCGCCGCG 
TGTTTCGACA TCCCGCTTTC TCCCGCCGAC ATGTGCGCGA TCATTCGCGA GATCGAGCCG 
ACCGACGGCG TGATGTTCGA CGAATCGGTC GCGTTCTTCC ATCGCCGGGT CGAGCTCGGC 
AAGGTGATGG GCCGGCTGCC GAAAATCTGC ATTCTCGCGA TCGACGAGGG CGGCACGATC 
GATACCGTCG AGTACAACTG CCATCGCTTC GAGTTTTCCC ACGAGGAAGC GGATCAGTAC 
GCGGCGCTGC TCGCCGACGT CGACGCGGCG ATCTCGCGCA GCGATGTGCG GCAGATCGGG 
CGCGCGGCGA CGCTCAGCGC GCAAATGCAC CAGAAGCGCA ACCCGAAGCG AACGCTGCGG 
CAGCTCGAAG CGCTGATGCG CGAAGTCGGC GCGCACGGCA TCGTCAATTG CCACAGCGGC 
ACGTTCATCG GCCTGTGCTT CGATGCGTCG GGCCCCGACG CGCTCGACAC GATCGCGCGT 
GCCGAGCGCA CGCTGCGCGA CGCGCTTGGC CAACCCATCT CGCGCTTCTT CACCAGGTGA

Protein sequence

MSIIENNEDL GVLRFITAGS VDDGKRALIG RLLYDGEAME AEARRAPPRE TRMRAGGAAP 
EPASAPRTHV APDLDAMAGG PSIAAGGHVG RDGGRTCAKP DRTRAASAHA PPRRLFSIGR 
APATFGELVQ GREPASGDDF LITLPITLSS TARFCRFRDS DRLYVFPASK KKSLKAAALF 
LERFGILTGG VLQICSDVSE GKGLASSSSD IVATLRALAA CFDIPLSPAD MCAIIREIEP 
TDGVMFDESV AFFHRRVELG KVMGRLPKIC ILAIDEGGTI DTVEYNCHRF EFSHEEADQY 
AALLADVDAA ISRSDVRQIG RAATLSAQMH QKRNPKRTLR QLEALMREVG AHGIVNCHSG 
TFIGLCFDAS GPDALDTIAR AERTLRDALG QPISRFFTR