Gene Bcep18194_B3011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_B3011
Symbol
ID	3754778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007511
Strand	+
Start bp	3399934
End bp	3400953
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	67%
IMG OID	637767858
Product	AraC family transcriptional regulator
Protein accession	YP_373765
Protein GI	78063857
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.476287
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.587833
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGATA CCGACCGTTA TACGACGGCG AATCTGCCGG TCCATCTGTT GCGGTGCCTC 
GCGGAGACAA GCAAGGAGCT GGGCATCGAC CCCACGCGGC TGTGCCTCGG GCTCGGCTTC 
GACGTCGCGG ACCTGTCGAA TCCGTCGTGC CGGATTTCCC TGCGTCAGGC GAGCACGATG 
ATCCGCCGCG CGCTCGACAT GGCGCCGGGG CGGGCGCTCG GCCTCGAACT CGGCACGAGC 
GAGACGATCG CGTCGATCGG CCTGGTCGGC TATGCGATGC TGACGAGCCC GACGCTGAAG 
GATGCGATCT CCGTCGGGAT GGAACTGCAG CGCCACACGG GGCCGCTGAT GCGCTTCGAG 
GTGATCTCGG ATGCGCGCAC GCTGTCGATC CGCGCGACCA ACGTCTTTCT CGAACCCGAC 
ATCGAGGCGT TCCTCGTCGA GGAAGCGTTC GGCAGCTTCA TGAAGATCGG GCGCTCGCTC 
GTCGGCCCCG CGTTCCAGCC GAAGGTCGTC GATCTCAGCT ACCCGCCGCC GGCCTATGCG 
GAGCAATACA CGCGCGTGTT CCCGTGCCCG GTGCGGTTCG AACAGGAGCA GAACCTGTTT 
TCATGCGACG CGGCGCTCGG CAACCGCCCG ATCGCGACCC ACGATCCGCT CGCGCATCGC 
CAGGCGCTCG AATTCCTGCA GGACGCGCTG CCGCCCGAAC CCGAAGGCAC CGAGTTTCTC 
GAATCGATCG AACGGATCAT GCGGCGCGAC CTGCGGCATG CGCCGTCGCT CGCCGAAATC 
GCCGCGCAGC TGTGCATGAG CGAGCGCACA CTCCGCCGGC GGCTTGCCGA CCAGGGCGTG 
TCGTATCAGA CGGTGATCGA CACGATCCGC AGGAAGCGCG CGTTCACGCT GCTGAGCAAC 
CCGCGGCTGT CGATCGAGGA CGTCGCGCAC GAAGTCGGGT TCAGCGACGC GCATAACTTC 
CGGCGCGCGT TCAAGCGGTG GACGGGGCAC GGGCCGCGCG AAGGACAGCG GCCGGCGTAG

Protein sequence

MDDTDRYTTA NLPVHLLRCL AETSKELGID PTRLCLGLGF DVADLSNPSC RISLRQASTM 
IRRALDMAPG RALGLELGTS ETIASIGLVG YAMLTSPTLK DAISVGMELQ RHTGPLMRFE 
VISDARTLSI RATNVFLEPD IEAFLVEEAF GSFMKIGRSL VGPAFQPKVV DLSYPPPAYA 
EQYTRVFPCP VRFEQEQNLF SCDAALGNRP IATHDPLAHR QALEFLQDAL PPEPEGTEFL 
ESIERIMRRD LRHAPSLAEI AAQLCMSERT LRRRLADQGV SYQTVIDTIR RKRAFTLLSN 
PRLSIEDVAH EVGFSDAHNF RRAFKRWTGH GPREGQRPA