Gene BURPS1106A_A2229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2229
Symbol
ID	4904812
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2215341
End bp	2216510
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	65%
IMG OID	640145334
Product	sensor histidine kinase
Protein accession	YP_001076262
Protein GI	126457101
COG category	[T] Signal transduction mechanisms
COG ID	[COG4191] Signal transduction histidine kinase regulating C4-dicarboxylate transport system
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCTGAAT CGAGTCTCGT CGACGACGCG TCGGCCGACA TCCCCTCCCT GAAGAAGGAG 
ATCGTGCGGT TGAACAAGAT CGTGCGCTCG CTGATGGATC GCGCGGAGCG CAGCACGATC 
GTCTGCGGAT CGGATTTCAG CCTGTTTCAG ATGGCCGTCA CGCTCGAGGA TCAGGTGCGG 
CATCGCACGC GCGAGCTGGA GGCGGCGCTG CACGAGAACC AGAAGATCAT GCACGCGCTG 
CAGCGCACGC AGGCGCTGAT GGCGCAGGAG ATCGAGGAGC GCAAGAGGAC GCAGGCGGAG 
CTCGAGACCG AGCGCGAGGC GCAGCGCCAT TTGATCGAGC AGCTCGCGCA GGCGCACGGG 
CAACTGCTGC AATCAGAGAA GCTCGCGTCG ATCGGCCAGC TCGCGGCGGG CGTCGCGCAC 
GAGATCAACA ATCCGATCGG CTTCGTCGAT TCGAACCTGC GCACGCTGAA GACATGGGTG 
CGGCAATTGC TCGACGTGAT GGCGATCGAG GACGCGCTGA TCGCCGATTG CGGCGACGCC 
GCGCTCGCGC GCCTGCGTGC CGCGCACGCT GAGGTCGATC TCGACTATCT GCGCGGCGAC 
ATCGGAACGC TGATCGACGA ATCGATCGAA GGCGCGTCGC GCGTGCGGCG GATCGTGCAG 
GACCTGCGCG ACTTCTCGCG GGCGGGCAGC GAGGAATGGA ACTTCGCCGA CGTCCACGAG 
GGGCTGGAGG CGACGTTGAA CGTGTTGCGC AACGAACTGA AGTACAAGGC GGAGGTCGTC 
AAGGATTACG GCGAGCTGCC GGCCGTCGAA TGCATGCCGT CGCAGTTGAA CCAGGTCGTG 
ATGAATCTGC TGATGAACGC CGCGCAGGCG ATCGTCGAGC ACGGCACCAT CACGATCCGC 
ACGCGCCGCG AAGGCGACGG CGTGACGATC GCGATCGAGG ATACGGGCGT CGGCATTCCG 
GCGGACCGGC TCGCGAAGAT CTTCGATCCG TTCTACACGA CGAAGCCGGT CGGCAAGGGC 
ACCGGGCTCG GGCTATCGGT TTCGTACGGC ATCGTCGAAA AGCACGGCGG CCGGATCACG 
GTCGACAGCG AGCCGGGCAA CGGATCGCGC TTCACGATCT GGCTGCCGAT CGTCCGGCAG 
CGCTCGTTGC AGGACGTGGC GGCCGGCTAA

Protein sequence

MAESSLVDDA SADIPSLKKE IVRLNKIVRS LMDRAERSTI VCGSDFSLFQ MAVTLEDQVR 
HRTRELEAAL HENQKIMHAL QRTQALMAQE IEERKRTQAE LETEREAQRH LIEQLAQAHG 
QLLQSEKLAS IGQLAAGVAH EINNPIGFVD SNLRTLKTWV RQLLDVMAIE DALIADCGDA 
ALARLRAAHA EVDLDYLRGD IGTLIDESIE GASRVRRIVQ DLRDFSRAGS EEWNFADVHE 
GLEATLNVLR NELKYKAEVV KDYGELPAVE CMPSQLNQVV MNLLMNAAQA IVEHGTITIR 
TRREGDGVTI AIEDTGVGIP ADRLAKIFDP FYTTKPVGKG TGLGLSVSYG IVEKHGGRIT 
VDSEPGNGSR FTIWLPIVRQ RSLQDVAAG