Gene BTH_II0853 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BTH_II0853
Symbol
ID	3844856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia thailandensis E264
Kingdom	Bacteria
Replicon accession	NC_007650
Strand	+
Start bp	995098
End bp	996285
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	73%
IMG OID	637838156
Product	AraC family transcriptional regulator
Protein accession	YP_439050
Protein GI	83717752
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0449934
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTTGCC TGAGCGGGCG GCCGCGCCTG CGTCGCGCGT TACGCAACGC TCGCCTGCGC 
GACAGGCGGC CCGCACGGAC GCTTCGCAAA CGCGCTTCCA AGTCGCACCT TTCACGGGCC 
TTCAACATGG CGAAGACGCA CGCGCCCGGC AGCGGCACGC TGCTGCGGTT CTTTTCGACC 
GACGACATGC CGCTCGCGCG CGCAGCGGCG TTCTGGAGCG CGCACGTGTT CCACTGCGAG 
GATGTGCGCG CGGAGCAGGC GCGCGCGTTT CACGGGCACG GCTTTCTCTG CCGGTGCGAG 
CGCGGCCGGT TCGTTCGTTT CCGCGGCGCG TCGCTCGATG CGCGGATCAG CGACGCGTGG 
CTGAGCGCCG CGACGGCCGA CGCGCACGTG ACGATCTGCG CGCTGCACGC GGGCGAGTGC 
ACGGTCGAGG CGCCCGGCTT GCCGGATGCG CGCTTTCGCG CGAACGATCT GTTCCTGCTC 
GACGGCGGCC GGCCGATGCG CGTGCGCTGG GACGAGCCGT GCTTCAGCGC GCTCAGACTG 
CCGCGCGCGT CGGTGGCGCG CACGCTCGGG CAGGCGGCGA TGGATGCGTC GCCGAGCTCG 
GCTTCGTTGC AGGCGGCGCG GCTCGCGCCG TTTCTCGCGG CCGAGCTCGC GCTCATCGGC 
GGCCGCGGCC CGGCGCTGTC GTCCGACGAG CTCGATTACG TGCTCGCGCG CGCGGCGGAC 
CTCGGCCGCG CGCTGCTTCA GGCGGCGCTG TCGGCGCGCG TGCGGCGCGG CGCGCCCGCG 
CGCGCCGACC GGCTGCAGGC CGCGTATCGC TACATCGAAC AGCATCTCCA TCTGCCCACG 
CTCACGCCCG AGCGGATCGC CGATGCGATC CATTGCTCGC GCACGCAGCT CTATCGCCTG 
TTTCGCCACG AATCGCAGAC GGTGAAGGCC GCGTTGCGCG ACGCGCGGCT GAACCGCAGC 
CTCGGCTACC TCGAGCGGCC CGAGCTCGCG CTTAGCATCG GCGAGATCGC GCACGCGTGC 
GGTTTTCCCG ATCAGTCGAC GTTCGGCAAG CTGTTTCGCC GGCGCTTCGG AAGGACGCCG 
GGCGAGGTGC GGCGCGCCGC GCGGGGGCGC CGCGATGAAG CCGAGCCGCC CGACACCGCG 
CAAGGCGGCG ACGCGGCGCA AGCACAGGCG CAGACGCTTC AACGATAG

Protein sequence

MRCLSGRPRL RRALRNARLR DRRPARTLRK RASKSHLSRA FNMAKTHAPG SGTLLRFFST 
DDMPLARAAA FWSAHVFHCE DVRAEQARAF HGHGFLCRCE RGRFVRFRGA SLDARISDAW 
LSAATADAHV TICALHAGEC TVEAPGLPDA RFRANDLFLL DGGRPMRVRW DEPCFSALRL 
PRASVARTLG QAAMDASPSS ASLQAARLAP FLAAELALIG GRGPALSSDE LDYVLARAAD 
LGRALLQAAL SARVRRGAPA RADRLQAAYR YIEQHLHLPT LTPERIADAI HCSRTQLYRL 
FRHESQTVKA ALRDARLNRS LGYLERPELA LSIGEIAHAC GFPDQSTFGK LFRRRFGRTP 
GEVRRAARGR RDEAEPPDTA QGGDAAQAQA QTLQR