Gene BURPS1106A_0198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0198
Symbol
ID	4901637
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	187363
End bp	188643
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	69%
IMG OID	640133428
Product	sensor histidine kinase
Protein accession	YP_001064481
Protein GI	126453480
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACGAA TCACCACTAC CGGACGCGTC AACCTGAGCC ATCTGTTCTG GTTGCGCAAT 
CTCGCGATCA TCGGCCAACT CGTCACGATC GCCGTCGTAC AGACTTATTT CGGCGTCCAT 
TTGCCGTTGC CTGCGATGCT GATGGTGATC GCGCTCGAAA TCGTGTTCAA CGCGCTCACG 
TGGGTGCGCG TGCTGCGCGC GCGGCCCGAG ACCAATTTCG AGCTGCTCGG CCAGCTGTGG 
GTCGACCTCG GCGCGCTGTC GGCGCTGCTC TTCCTGTCGG GCGGGACCAC GAACCCGTTC 
GTTTCGCTGT ACCTGCCGTC GCTCGCGATC GCGGCCGCGG TGCTGCCGTG GCACCTGATG 
ATCTGGCTGG CGGCGTTCGC GGTGGCGTGC TACCTCGCGC TCGGCTTCGA TTCGGTGCCG 
CTCAACCTGG ATAATCCCGC GAACCTGTTC GATTATTTTC GTGCGGGCAT GTGGGTGAAC 
TTCATGGTGA GCGTCGGGCT CATCGCGTGG TTCGTCGCGC GGATGTCGAG CGCGCTGCGC 
CAGCGCGACG CGGCGCTCGG CGAGGCGCAG CAGGCGCTGT TGCGCGACGA GCGCGCGGTC 
GCGCTCGGCG TGCAGGCGGC CACCGTCGCG CACGAGATGG GCACCCCGCT GTCGACGATC 
GCGATGCTGA CCGAGGAATT GCGCGAGGCC GCCCGCACGG ACGCGGGGCT CGCGCGCTAC 
GATGCGGACC TGAAGGTGCT CGAGGAGCAG ATGTCGCAGT GCACGTCGGC GCTCGCGCGC 
CTGAGAAGCC GCGCGTCGGA GCGGCCGAGC CGCGAACCCG TCGGCGAGTG GCTCGACACG 
TTCGTCGAGC ATTGGCGGCT GCGCCATCCG CACGTGCTGT TCGAGCAACG GGGGCCGCAG 
CCCGTGGGCG TCGCGCTCGA CGATACGGTC GCGGTCGGCC AGATCCTGAC CATCCTGCTC 
GACAATGCCG CGCGCGCGAG CCGCGATCGC GTTACGCTGG CGGCAACGAT CGCGCACGAC 
GGCGCACGCG ACGAAATCGA GTTCGAGGTT TGCGATAACG GGCCGGGCAT TCCGGCCGCC 
TTGCGCGACA CGCTCGGCGC GGCGCCCGTC GACAGCACGC AGGGCGGCCA CGGGGTGGGC 
CTGTACCTGG CGTTCAGCGC GGCGGCGCGC CTGGGCGGCT CGATCGAGCT CGCCGACGCG 
CAGCCGCGCG GCACGCGGGC GATCCTGCGG CTACCGGTCG CACGTCAGGT GGCGGCCGAG 
ATGGCGAACG AAAACGGATA G

Protein sequence

MQRITTTGRV NLSHLFWLRN LAIIGQLVTI AVVQTYFGVH LPLPAMLMVI ALEIVFNALT 
WVRVLRARPE TNFELLGQLW VDLGALSALL FLSGGTTNPF VSLYLPSLAI AAAVLPWHLM 
IWLAAFAVAC YLALGFDSVP LNLDNPANLF DYFRAGMWVN FMVSVGLIAW FVARMSSALR 
QRDAALGEAQ QALLRDERAV ALGVQAATVA HEMGTPLSTI AMLTEELREA ARTDAGLARY 
DADLKVLEEQ MSQCTSALAR LRSRASERPS REPVGEWLDT FVEHWRLRHP HVLFEQRGPQ 
PVGVALDDTV AVGQILTILL DNAARASRDR VTLAATIAHD GARDEIEFEV CDNGPGIPAA 
LRDTLGAAPV DSTQGGHGVG LYLAFSAAAR LGGSIELADA QPRGTRAILR LPVARQVAAE 
MANENG