Gene BTH_II1804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BTH_II1804
Symbol
ID	3846420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia thailandensis E264
Kingdom	Bacteria
Replicon accession	NC_007650
Strand	+
Start bp	2178793
End bp	2179920
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	70%
IMG OID	637839105
Product	AraC family transcription regulator
Protein accession	YP_439998
Protein GI	83717593
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCGCTC CGCTCAATTA CACTGATCGT TTTTGCCATA CCGCACCGCG GCACGCTCCT 
GCGATGAAGC ACGAAGAAAA GAAAGGCACC GTTTCGATCG AACTCGTCGA GTCGAGCCTC 
GCGCTGTCGC GGCGGCGCGG CGTCGACGAC GCGCCGCTCC TCGCGCAGGC GGGCATTGCG 
GCCGCGTTGC TCGCGCAGCG CAACGCACGC GTGTCCGCGC GGCAGTACGG CGCGCTGTGG 
AACGCGATCG CGCGCGCGCT CGACGACGAA TTCTTCGGCC AGGACTCGCA CCCGATGCGC 
TGCGGCAGCT TCATCGCGAT GAGCCAGGCG GCGCTCGGCG CGCGCAACGG GCTGCGCGCG 
CTCGCCCGCG CGGTCAACTT CATGCACTGC GTGCTCGACG ATCTGCACGC CGAGATCGAC 
GCGAACGCCG AGCGCGTGCG CCTGCGCTTC GTGCACCGCA ACAGCGCGAA TCCGCCGGAG 
ATGTTCGCGT ACGCAACCTA TTTCATCATC GTCTACGGCC TCACGTGCTG GCTCATCGGA 
CGGCGCATTC CGCTGCTGCA CGCGGGCTTT CGCTGCGGCG AGCCTCGCGC GGTCCACGAA 
TATCAGTTGA TGTTCTGCGA CGACATGCGC TTCGGCGAAT CCGAATCGTA TGTCGATTTC 
GATCCGGCGT TCGCCGCGCT GCCCGTCGTG CAGACGGCGA AGACGCTCAA GCCGTTCCTG 
CGCGACGCGC CCGCGAGCTT CATCGTCAAG TACCGCAACC CGCACGCGCT CGGCGGGCGC 
GTGCGCGCGG CGCTGCGCGC GCTGCCGCCC GCCGCTTGGC CCACCGCGCG GGCGCTCGCC 
GCGCGGCTGC ATGTAGCCGA GGCGACGCTG CGCCGCAAGC TGAAGCAGGA AGGCCACTCG 
TACCAGACGA TCAAGGACGC GCTGCGCCTC GATCTCGCGT GCGAGGCGCT CGCCGACCCG 
GCCCGCACGG TCGCCGACGT CGCCGCGGCG ACCGGCTTCG CCGAGCCGAG CGCGTTCTAC 
CGCGCGTTCC GCAAGTGGCG CGGGATGAGC CCCGCCGACT ACCGCGACGC CGCGCTCGCC 
GCGCGCGCGG CCGCTTCGCG CTTTCGCCGG AAACCGCCTA CTCTTTAA

Protein sequence

MLAPLNYTDR FCHTAPRHAP AMKHEEKKGT VSIELVESSL ALSRRRGVDD APLLAQAGIA 
AALLAQRNAR VSARQYGALW NAIARALDDE FFGQDSHPMR CGSFIAMSQA ALGARNGLRA 
LARAVNFMHC VLDDLHAEID ANAERVRLRF VHRNSANPPE MFAYATYFII VYGLTCWLIG 
RRIPLLHAGF RCGEPRAVHE YQLMFCDDMR FGESESYVDF DPAFAALPVV QTAKTLKPFL 
RDAPASFIVK YRNPHALGGR VRAALRALPP AAWPTARALA ARLHVAEATL RRKLKQEGHS 
YQTIKDALRL DLACEALADP ARTVADVAAA TGFAEPSAFY RAFRKWRGMS PADYRDAALA 
ARAAASRFRR KPPTL