Gene Bcep18194_A5038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_A5038
Symbol
ID	3750246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007510
Strand	+
Start bp	2075935
End bp	2076963
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	66%
IMG OID	637763334
Product	MerR family transcriptional regulator
Protein accession	YP_369276
Protein GI	78066507
COG category	[K] Transcription
COG ID	[COG0789] Predicted transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.99192
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACTGA AAGTGGGAGA ACTGGCGAAA CGCAGCGGGC TGACCGTCCG CACGCTTCAT 
CACTATCACG CGATCGGTTT GCTGACGCCT TCGGCGCGCG CCGACAACGG CTACCGGCTG 
TACGACCGCC ACGACATCGC CCGGCTCCAC CAGATCCAGG CGCTGCGTCG CTTCGGCCTG 
TCGCTCACCG AAATCGGCGA CCACCTGAAC CAGCCCGACA CCCCGCTCGT CGAGATCGTC 
GCGAAGCAGA TCGCGCTGCT CGACCGTCAG CTTGCGCAGA CCGCGCAGCT GCGCGAGCGG 
CTCGTCAGCC TGCATGCGCA GCTCGCCGCG GGCACGGAGC CGGAGCTGGC CGATTGGCTC 
ACCACACTGG AGTTGATGAC CGTGTACGAC AAATATTTTT CCGAGGAAGA ACTCGCGCGC 
CTGCCGATGT ACCAGAAGAG CCAGGCGGGC GACGCCGAAT GGATCGCACT CGTCGACGAG 
GTGCGTGCGC TGCACGACGC GGGCGTGCCC GCCGAGGACG AACGCCCCCG TGCGCTCGCC 
AGCCGCTGGA TGACGCTGCT CGTGCGCGAC ACGAACAACG ACCCGCGGCT GCTGGCGAAG 
CTGAACCTGA TGCACGAACA CGAACCGGCG ATGCAGTCGA AGATCGGCAT TTCGACCGCG 
CTGCGCGACT ATGTGCTGCG CGCGTCGTCG GAAACCAAGA TGCGGATCTT CGAGAAGTAT 
CTGGCGCCGG ACGAGATCCG CTTCATGCGG GCCCACTACG GTGAAAGCGC AATGGAATGG 
CCGCAACTGA TGGGCGACGT GCGCGACGCG ATCGATGCGG GCGCCAGACC GGATTCACCG 
GAAGGCCGCG CGCTCGCGCA ACGCTGGCTC ACGCTGTTCT GCCGCTATGC GGGCACCGAT 
CCGGCCACGC ATGCGAAATT CCGCCACGCG ATGATGAACG AGCCGTCACT GACGAAGGAT 
TCGTGGATCG ACGACACGTT GATCGGCTTC GTGCGGGAAG CGATGGCGCA GCTTGCGCCT 
GCGCGCTGA

Protein sequence

MRLKVGELAK RSGLTVRTLH HYHAIGLLTP SARADNGYRL YDRHDIARLH QIQALRRFGL 
SLTEIGDHLN QPDTPLVEIV AKQIALLDRQ LAQTAQLRER LVSLHAQLAA GTEPELADWL 
TTLELMTVYD KYFSEEELAR LPMYQKSQAG DAEWIALVDE VRALHDAGVP AEDERPRALA 
SRWMTLLVRD TNNDPRLLAK LNLMHEHEPA MQSKIGISTA LRDYVLRASS ETKMRIFEKY 
LAPDEIRFMR AHYGESAMEW PQLMGDVRDA IDAGARPDSP EGRALAQRWL TLFCRYAGTD 
PATHAKFRHA MMNEPSLTKD SWIDDTLIGF VREAMAQLAP AR