Gene BURPS668_A1008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1008
Symbol
ID	4888024
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	976862
End bp	977839
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	70%
IMG OID	640130948
Product	AraC family transcriptional regulator
Protein accession	YP_001062007
Protein GI	126445286
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.351707
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCAGC GCCACACCCG ACTCGAATCC GCCGCGCACG CGCCGCCCCG GCCCGATGCG 
CAAACGCTTG CGCCGCGCGA GGCCGCGCGC CGCGAGCTCG CCGCGCTGAT CGAGCGCTTC 
GCGCCCGCCG ACGGCGCGCA CCCGAGCGCG ATTCCCGCGC TGTCGTTCTT TCGCTGCTCG 
TCGCCCGTCG ATCTCGGCTG CAGCGTCACG CGCGCCGCGT TCGTGTTCGC CGCGCAGGGC 
GCGAAGCGGG TAACGGTCGC GGGGCAGGCG TACGAATACG ATCATCAGCA GTGCCTCGTC 
ACGTCGGTCG ATCTGCCGAT GCTGTCGCAG GTCACGCGCG CGTCGGCCGG CGCGCCGTAT 
CTGTGCGTGA AGGTCGCGCT CGACGTGCAG CGCATCGCCG AGCTCTCGGC CGAGATGCGG 
ATGCCGCCGC CGGAGGCGGT GCCCACGGGC GAGGGAATCG TCGTCGGCGC GCTGTCCGAG 
CCGCTTTTCG ACGCGGCGCT GCGGCTCGTG CGATTGCTCG ATACTCCAGC CGACATCCCG 
ATCCTCGCGC CGCTGATCGA AAAGGAGCTG CTGTACCGGC TGCTGACGAG CGGGCTGGGC 
GCGCGGCTGC GGCACATCGC GGTCGCGGGC AGCCAGACGT ACCGGATCGC GCGTGCGATC 
GAATGGCTTC GTCATCACTA CACGGAGCCG CTCAGGGTCG AGACGCTCGC GCAGCAGGTC 
AATATGAGCG TGTCGTCGCT GCATCATCAC TTCAAGCACG TGACGACGCT CAGCCCGCTC 
CAGTATCAGA AGCAACTGCG GCTGCACGAG GCGCGCCGGC TGCTGCTCGG CCAGCACGGC 
GACGTCGGTT CGGTCGCGCT CAGGGTCGGA TACGACAGCC CGTCGCAGTT CAGCCGCGAA 
TACAGCCGGC TGTTCGGCGC GCCGCCGTTG CGCGACGTCG TGCAACGGCG GCGCAACGGG 
ACGGGCGTTC AGGAGTGA

Protein sequence

MDQRHTRLES AAHAPPRPDA QTLAPREAAR RELAALIERF APADGAHPSA IPALSFFRCS 
SPVDLGCSVT RAAFVFAAQG AKRVTVAGQA YEYDHQQCLV TSVDLPMLSQ VTRASAGAPY 
LCVKVALDVQ RIAELSAEMR MPPPEAVPTG EGIVVGALSE PLFDAALRLV RLLDTPADIP 
ILAPLIEKEL LYRLLTSGLG ARLRHIAVAG SQTYRIARAI EWLRHHYTEP LRVETLAQQV 
NMSVSSLHHH FKHVTTLSPL QYQKQLRLHE ARRLLLGQHG DVGSVALRVG YDSPSQFSRE 
YSRLFGAPPL RDVVQRRRNG TGVQE