Gene Bcep18194_A4375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_A4375
Symbol
ID	3749574
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007510
Strand	+
Start bp	1330821
End bp	1331858
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	68%
IMG OID	637762664
Product	AraC family transcriptional regulator
Protein accession	YP_368615
Protein GI	78065846
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.987701
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGTCT GGAACTTTGC CCGCAGCCCG GCTTCCGTCC TGCTGATGAT CGACTTCGGT 
CGCGACCGCA AGATCGCGCC GCCGGCGTTG CTCAAGGGGT CGCAGCTCAC GCTGAAGCAG 
CTCGCCGACC CGGATTTCAC AGTGCTGGCC GCGCAGGAGC TGGCGGTGGC GTCGAACCTG 
CTCGACCTGA CCGCCGGCGA GGCCGGCGTC GGCCTCAAGG TCGGGCTGTC GTACCAGCTG 
TCGGCTTACG GGCTGCTCGG GTACGGGCTG CTGAGCAGCG CGACCGGCAT GGACGCGATC 
GCGCTCGCGG GCCGCTACCT GGCGCTGACC TATACGTTCG TCGGGATGAC GTTCCACCGC 
GCCGGGCAGC GCGACGTGAT TCAGTTCGAC GCGTCGCCGG AGCTTGCCGC GAACGTGCAG 
CGCTTCTTCG TCGAACGCGC GATGGGCGCG ACGTGCCGGG TGCTGCGCGA CGTGATCGGC 
AGTGCGTTCG AACTCGCGAC GTTCGATCTC GCGTATGGCG CCGGCCCCGG CGCTGACGCT 
GACGCTGACG CGAAGCAGCC GGTGCTCGGC GCGATGATCC GGCACGGGCA GCCGGCCAGC 
ACGCTCACGT TCGAGCATGC GCATCTCGAG CGGCCGTTGC CGCAGGCGAA TGCCGCGACC 
GCGGCGATGT GCGAGCGCAT GTGTGCCGAG CTGATCACGC GCAGGCGGAC GCGCGTCGAT 
CTCGTTTCGT TCCTGAACGA ATACCTGGCC ACGCGCCCGT TCGACCGGCC GCCGCAGCTG 
AAGGACATCG CGACGCTGCT CAACACCAGC GAGCGCACGT TGAAGCGCCG GCTGCAGGAA 
GAGGGCGCGT GCTTTCGGGA CATTTCGAGC GCGGTGCGCA AGACTCGCGC GCAGGCGCTG 
ATCGCCGAAG GGCGGCTGTC GATCAAGGAA ATCGCGCAGG AACTGGGATT CAGCGACATG 
TCGTCGTTCT CGCAGGCGTA CAAGCGCTGG ACGGGTGTCG CGCCGAGCGT ATCGCGACAG 
GAGACGGCCG GTTCGTAG

Protein sequence

MNVWNFARSP ASVLLMIDFG RDRKIAPPAL LKGSQLTLKQ LADPDFTVLA AQELAVASNL 
LDLTAGEAGV GLKVGLSYQL SAYGLLGYGL LSSATGMDAI ALAGRYLALT YTFVGMTFHR 
AGQRDVIQFD ASPELAANVQ RFFVERAMGA TCRVLRDVIG SAFELATFDL AYGAGPGADA 
DADAKQPVLG AMIRHGQPAS TLTFEHAHLE RPLPQANAAT AAMCERMCAE LITRRRTRVD 
LVSFLNEYLA TRPFDRPPQL KDIATLLNTS ERTLKRRLQE EGACFRDISS AVRKTRAQAL 
IAEGRLSIKE IAQELGFSDM SSFSQAYKRW TGVAPSVSRQ ETAGS