Gene BURPS668_0041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0041
Symbol
ID	4884536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	38076
End bp	39455
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	72%
IMG OID	640125969
Product	sensor histidine kinase
Protein accession	YP_001057096
Protein GI	126439832
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCACA GCCTGCGCGG CCGACTGCTT TGGTGGCTGC TGCTGCCGCT CGCCGTGTTC 
GTCGCGATCG CGGGCGCGAT GTCGTACGAC ACCGCGCGCA AGACGGCCGA TCTCGTGCAG 
GACGGCGCGC TCGTCGCGTC CGCGCGCGTG ATCGCCGAGG ACGTCGATTG GGAAGGCGGC 
GCGCTCGTCG CGAACGTGCC GCCCGCCGCG CTCGAGCTGT TCGCATCGCC CGCGCAGGAT 
CACGTGTACT ACAAGGTGCG CACGGGCGGC GGGCGGCTGC TCGCCGGCAA TCCCGATCTC 
GACGGCCCGG CCGCGCCGGC CGCGTCCGGC GCGCAGCCGG TGCTGTTCGA CACGGCGCTC 
GGCGGGCTCG CGATTCGCGC GGTGGCATAC ACGCGCGAGC TGTACAACGC GGGCAACACG 
GAAACGGTGA CGGTTGTCGT CGGCAAGACG CAGACCTCGC GGCAGATGAT GATCGCGGCG 
ATCTGGCATC CGCAGCTCTG GCGGCTCGCG CTGATGCTCG CGCTCGCGAT GGCGCTCGTC 
TATCTCGGGC TCACGTTCGA GCTGCGGCCG TTGATGAAGC TGAAAGAAGA CGTCGCGGAC 
CGCGGGCCGA TGGAGCTCGA GCCGATCCGC ACCGAGCGGC TGCATTTCGA GCTGCGGCCG 
ATCGTCGACG CGATCAACCA GTGCATCGCG CGGCTGAACC TGCACGCGGC GACGCAGCGA 
CGCTTCATCG CCGACGCCGC GCACCAGCTA CGCACGCCGA TCGCGGTGAT CGACACGCAG 
ATCCAGTGCG CGCGGCAGCG CGAGAACGGC GACGCGGCGC TCGCCGCGCT GCTCGCGTCG 
ATGCAGCGCA GCAGCCGCCG GATGGCGGAC GTCACCGACA AGCTGCTGCT GCTCGCGCAC 
GCGGAAGCCG CGTCGCCCGC GCGGCTCGCC GCGCGCGTCG ACATCGCGGC CGTCGTGTCG 
GGCGTGCTCG AGGAGGCGAT CGTGCTCGCC GAGCGGCGGC GCATCGATCT CGGCGCGGAG 
CTCGACGACG ATCTGCAGGT GGCCGGCAGC GAAAGCCTGC TGTCGGCGCT GCTGATGAAT 
CTCGTCGACA ACGCGGTGCG CTATGCGCAC GAAGGCGGAC GCGTGACGGT GAGCGCGCGG 
CGCGACGGCG ACGCGGTGGT GCTCGAGGTC GTCGACGACG GCCCGGGCAT CCCGGCCGAG 
GCGCGGCCGC ACGTGTTCAA GCGCTTCTAT CGCGTCGCGA GGGACGAGGA AGGCACGGGC 
CTCGGGCTCG CGATCGTCGA GGAGATCGCG CAGTCGCACG GCGGCGCGGT GTCGCTCGCC 
ACAGGCCCCG GCAACCGGGG CGTGAGGATG ACCGTGCGGC TGCCCGCCTA TCGCAATTGA

Protein sequence

MSHSLRGRLL WWLLLPLAVF VAIAGAMSYD TARKTADLVQ DGALVASARV IAEDVDWEGG 
ALVANVPPAA LELFASPAQD HVYYKVRTGG GRLLAGNPDL DGPAAPAASG AQPVLFDTAL 
GGLAIRAVAY TRELYNAGNT ETVTVVVGKT QTSRQMMIAA IWHPQLWRLA LMLALAMALV 
YLGLTFELRP LMKLKEDVAD RGPMELEPIR TERLHFELRP IVDAINQCIA RLNLHAATQR 
RFIADAAHQL RTPIAVIDTQ IQCARQRENG DAALAALLAS MQRSSRRMAD VTDKLLLLAH 
AEAASPARLA ARVDIAAVVS GVLEEAIVLA ERRRIDLGAE LDDDLQVAGS ESLLSALLMN 
LVDNAVRYAH EGGRVTVSAR RDGDAVVLEV VDDGPGIPAE ARPHVFKRFY RVARDEEGTG 
LGLAIVEEIA QSHGGAVSLA TGPGNRGVRM TVRLPAYRN