Gene Bcep18194_C7696 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_C7696
Symbol
ID	3734583
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007509
Strand	-
Start bp	1342940
End bp	1343965
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	66%
IMG OID	637761397
Product	LysR family transcriptional regulator
Protein accession	YP_367384
Protein GI	78060809
COG category	[K] Transcription
COG ID	[COG0583] Transcriptional regulator
TIGRFAM ID	[TIGR03418] putative choline sulfate-utilization transcription factor

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.349394
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGCGT CGACGAACCT GCTCGACTCA GGCGGCAATG CACGTTGCGC CGGTCCGGCG 
GCCCGCCCGC TTCGACGCGC CGCAATACGA CCGACTTCCG TCCCGAGAGA AGCCCCCGAC 
ATGGTTAGCC GCTTGAAGCA CCTCCCGCCG CTGTCGTATC TCACCGCGTT CGAGGCAGCG 
GCCCGGCATG AGAGTTTCAC GAGTGCCGCC GAGGAACTGT GCGTGACCCA GAGCGCGATC 
AGCCGGCAGA TCCGGCTGCT CGAGGAAACG CTGGGCTGCG CGTTGTTCGT GCGGTCTCAC 
AAGGCGGTGT CGCTCACCGA CGGCGGGCGG AAGTTCCAGC GGACCGTCAA TGCGGCGCTG 
GATCTGCTTG CCGCCGCCGC GTACGAATTG CGCGTGCAGG CGTCGACGTC GACGGTCACG 
GTGTCGGCGG ATCTCGCGAT CGCGTCGCAC TGGCTGATTC CGCGCCTGCC GAAGTTTCGG 
GCCGAGCATC CGGAGATCAT CATTCACGTC GATGCGTCGG ACGAGGACAC GCGCAACATC 
CGGGAAGGCG CGGACCTGGC GATCCAGTTC GGCGACGGCT ACTGGCCGGC CTGCAACGCG 
CGGTTCCTGC TCGAGGAAGA GATCTTCCCG GTGTGCACGC CGGCGTATCT GGCCCGACTC 
GCGCCGATGG CGCACACGCG GGATCTGCTG CGCGCGACGT TGATCCATCT CGAGACGCGT 
CATTGGGACT GGATGGACTG GGCAACCTGG TTCGCGCATC ACGACATCGC GCTGACCGAG 
CCGCGGCAGG ACCTTTACAT CAACAACTAT CCGGCGGTCC TGCAGGCCGC GATGGGCGGG 
CAGGGCATCG CGATGGGATG GCGCTATCTG GCCGACGACA TGCTGGCGAC CGGGGTGCTG 
GTGCGGCCGA TCGAGACCTC GGTGCGGACC GGCCGCGGGT TTTATCTGCT GCATCCGAGC 
GATACGTTGT TGAGCCCGGA GGCGCGGATC TTCTGCGACT GGATCGTCGG GCAATGCGCG 
GAATAG

Protein sequence

MFASTNLLDS GGNARCAGPA ARPLRRAAIR PTSVPREAPD MVSRLKHLPP LSYLTAFEAA 
ARHESFTSAA EELCVTQSAI SRQIRLLEET LGCALFVRSH KAVSLTDGGR KFQRTVNAAL 
DLLAAAAYEL RVQASTSTVT VSADLAIASH WLIPRLPKFR AEHPEIIIHV DASDEDTRNI 
REGADLAIQF GDGYWPACNA RFLLEEEIFP VCTPAYLARL APMAHTRDLL RATLIHLETR 
HWDWMDWATW FAHHDIALTE PRQDLYINNY PAVLQAAMGG QGIAMGWRYL ADDMLATGVL 
VRPIETSVRT GRGFYLLHPS DTLLSPEARI FCDWIVGQCA E