Gene BTH_II1174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BTH_II1174
Symbol
ID	3844996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia thailandensis E264
Kingdom	Bacteria
Replicon accession	NC_007650
Strand	-
Start bp	1372376
End bp	1373368
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	69%
IMG OID	637838477
Product	AraC family transcriptional regulator
Protein accession	YP_439371
Protein GI	83716412
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0789379
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCCAG ACCTCGAAAT CGTCCCCACC CGCCGCGACG AATCGTTTCG CGCGTGGTCG 
CACGACTATC CGCACACGGT CGCGAAGTGG CATTTCCATC CGGAGTACGA AATCCACCTG 
ATCCAGGGCT CGCGCGGCAA GTTCTTCGTC GGCGACTACA TCGGCGATTT CGCGCCCGGC 
AACCTCGTCG TCACCGGGCC GAACCTGCCG CACAACTGGA TCAGCGAACT CGGCCCCGGC 
GAGCGCGTGC CGTCGCGCGA CGTCGTGCTG CAGTTCTCGC GCGACGCGGC CGAGAAGATG 
GTCGCCGCGT TCGCCGAGCT GCAGCCGGTG CTCGACCTGA TCGACGAAGC GTCGCGCGGC 
GTGCAGTTCC CGGACGAAGT CGGGCTCGCT GTCGCGCCGC TGATGGTCGA GCTCGCGAGC 
GCGCACGGCT GCCGGCGCGT CGAGGTGCTG ATGGCGCTGT TCGACCGGCT GGCGTCGTGC 
GCCGCGCGCC GCCCGCTCGC GGGCCCCGGC TACCGGATCG ACGCGCAGCA CTACATGTCG 
TCGACGATCA ACCAGGTGCT CGCGTATCTG CGGCAGAACC TGCCGGGCGC GCTGCGCGAG 
GCGGACGTCG CCGAATTCGC CGGCATGAGC GTGAGCACGT TCACGCGCTT CTTTCGCCGG 
CATACCGGCT CGACGTTCGT CCAGTACCTG AACCGGCTGC GGATCAACGA AGCGTGCGAA 
TTGCTGATGT GCTCGGCGCT CAACGTCACC GACATCTGCT ATCGCGTCGG CTTCAACAAC 
CTGTCGAACT TCAACCGGCA ATTCCTCGCG ATGAAGGGGA TGCCGCCGTC ACGCTTTCGC 
GCGCTGCACC GGTTGAACGA GCCGCGCGAG CAGGACGCGG CGCCCGCTGC CGCGGCATCG 
GCATTGGCAT CGGCCACGGC GGCCTTCGCG GCCACGGCCC CCGCCCCCAT CGCGCGCACC 
GCCCCCCACT CGCACCGGAG CCTCCACCCG TGA

Protein sequence

MNPDLEIVPT RRDESFRAWS HDYPHTVAKW HFHPEYEIHL IQGSRGKFFV GDYIGDFAPG 
NLVVTGPNLP HNWISELGPG ERVPSRDVVL QFSRDAAEKM VAAFAELQPV LDLIDEASRG 
VQFPDEVGLA VAPLMVELAS AHGCRRVEVL MALFDRLASC AARRPLAGPG YRIDAQHYMS 
STINQVLAYL RQNLPGALRE ADVAEFAGMS VSTFTRFFRR HTGSTFVQYL NRLRINEACE 
LLMCSALNVT DICYRVGFNN LSNFNRQFLA MKGMPPSRFR ALHRLNEPRE QDAAPAAAAS 
ALASATAAFA ATAPAPIART APHSHRSLHP