Gene BURPS668_A2237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2237
Symbol
ID	4888164
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	2169246
End bp	2170598
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	72%
IMG OID	640132174
Product	putative regulatory protein HipA
Protein accession	YP_001063231
Protein GI	126442667
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGCCC GCCGCGCACG CGCGACGCGC CTGCACCTGT GGATGAACGG CCTGCCCGTC 
GGCTACTGGG AGCACGCGCG CGACGGCGAG CGCCTTGTCT ACTTCGACGA ATGGATCGGC 
GATCCGCAAG GCCGGCCGCT GTCGCTGTCG CTGCCGTTCA CGCCGGGCAA CCAGCCGTAT 
CGCGGTCGGC TCGTCAGCGA TTATTTCGAC AACCTGCTGC CCGACAGCGA GCCGATCCGC 
CGGCGAATCG CGATGCGCTA CCGCACGGGC GGCACGTCCG CGTTCGCGCT GCTCGCGACG 
CTCGGCCGCG ATTGCGTCGG CGCGCTGCAG ATGCTGCCGC CCGACGAAGC GCCGGACGAC 
ATCGAACGCA TCCGCGGCCA CGCGCTCGCC GACGCGGACA TCGCGCGCCT GCTGCGCGAA 
GTCACGTCCG CGCCGCAGGC CGGCCGGCAC GCGCCGCTCG ACGATCTGCG CCTGTCGATC 
GCCGGCGCGC AGGAGAAGAC CGCGCTGCTG CGCCATCGCG GCCGCTGGCT GCTGCCCGAA 
GGGAGCACGC CGACCACGCA CATCCTGAAG CTGCCGCTCG GGCTCGTCGG CAACCGGCGC 
GCCGACATGC GCACGTCGGT CGAGAACGAA TGGCTGTGCG CGCGGATCGT CGCCGCGTAC 
GGGTTGCCCG TCGCGCGCTG CGACATCGCG CAGTTCGACG ATCAGAAAGC GCTCGTCGTC 
GAGCGCTTCG ACCGCCGGCC GTCGCGCGAC GCACGCTGGC TCCTGCGGCT GCCGCAGGAA 
GACATGTGCC AGGCAACCGG CACGTCCGCG CTCGACAAAT ATCAGGCCGA CGGCGGCCCC 
GGCATCGAGA CGATCATGGA AGTGCTCGCC GGCTCCGAGC ACGCGCGGGA CGACCGCCGC 
GCGTTCTTCG CGGCGCAGAT CGTGTTCTGG CTGCTCGCCG CGACCGACGG CCACGCGAAG 
AACTTCAGCA TCGCGCACCT GCCCGGCAAC CGCTACCGTT CGACACCGCT TTACGACGTG 
CTGTCCGCGC ATCCGGTCAT CGGCCGGGGC GCGAACCAGT TGCCCGCGCA GCGCGCGCGG 
CTCGCGATGG GCGTGCGCGG CAAGCACATC CACTATCCGC TGCACCAGAT CCGGCGGCGG 
CACTGGATCG CGCAGGGCCA GCGCGTCGGC TTCGCGCCCG CCGACGTCGA CGCGCTGATC 
GACACGCTGA CCGCGCGCAC CGCGGACGTC GTCGACGCGG TGTCGGCGCG GCTGCCGCGC 
GATTTTCCGC GCGACGTCGC CGATGCGATC TTCAGCGGAA TGCTCGGCCT GAGCGCAAGG 
CTCGCCGGCG ACGCGGCCGC GCGCGCGCCA TGA

Protein sequence

MSARRARATR LHLWMNGLPV GYWEHARDGE RLVYFDEWIG DPQGRPLSLS LPFTPGNQPY 
RGRLVSDYFD NLLPDSEPIR RRIAMRYRTG GTSAFALLAT LGRDCVGALQ MLPPDEAPDD 
IERIRGHALA DADIARLLRE VTSAPQAGRH APLDDLRLSI AGAQEKTALL RHRGRWLLPE 
GSTPTTHILK LPLGLVGNRR ADMRTSVENE WLCARIVAAY GLPVARCDIA QFDDQKALVV 
ERFDRRPSRD ARWLLRLPQE DMCQATGTSA LDKYQADGGP GIETIMEVLA GSEHARDDRR 
AFFAAQIVFW LLAATDGHAK NFSIAHLPGN RYRSTPLYDV LSAHPVIGRG ANQLPAQRAR 
LAMGVRGKHI HYPLHQIRRR HWIAQGQRVG FAPADVDALI DTLTARTADV VDAVSARLPR 
DFPRDVADAI FSGMLGLSAR LAGDAAARAP