Gene BURPS668_A3005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A3005
Symbol
ID	4887797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	2856176
End bp	2857696
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	69%
IMG OID	640132942
Product	sigma-54 dependent transcriptional regulator
Protein accession	YP_001063997
Protein GI	126443116
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3829] Transcriptional regulator containing PAS, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000000526118
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGACAAGA AAGAAAAAGT GGAGACGAAT GCACCGATTT CGGGCGGCTG GGTTCGGCTG 
CCCGCCGATT ACGGCGACGT GCTGCGGCGC GCGGCGGAGT CGCTGTTCAA GACCTTCGAG 
CACTCGAGCG TCGGCACGCT GATCGTCGAC AAGGATGCGC GCGTCGTCTG GATCAATCAG 
CGTTACGCGG CGCGTTTCGG GTTCGCCGAT CCGCAGCAGG CGATCGGCCG CGATTGCGAA 
GCGGTGATTC CGCACAGCCT GATGCGCGAG GTGGTCGCGA CCGGCCGCCC GATCCTGCTC 
GACATCATGG AGACGGGCCG CGAGCCGCTC GTCGTCACGC GCCTGCCGCT GACGGACGAC 
GCGGGCGAGA CCGTCGGCGC GATCGGCTTC GCGCTGTTCG ACGAGCTGAA GACGCTCACG 
CCGCTCTTTT CGCGCTACAT GCAGGTCCAG CAGGAGCTGA TCGCGACGCA ACGCTCGCTC 
GCGCAGGCGC GGCGGGCGAA ATACACGTTC GCGAGCTTCG TCGGCACGAG CGCGGTGAGC 
CTCGAGACGA AGCGGCAGGG GCGGCGCGCC GCGCAGGTCG ATTCGCCGGT GCTGCTGCTC 
GGCGAGACGG GCACCGGTAA GGAGCTGCTC GCGCATGCGA TCCACGCGGC GTCCGCGCGG 
GCATTGAAGC CGCTCGTGAC CGTCAACGTC GCGGCGATTC CCGATGCGCT GCTCGAAACC 
GAGTTCTTCG GCGCGGCGCC GGGCGCGTAC ACGGGCGCGG ATCGCAAGGG GCGCGTCGGC 
AAGTTCGAGC TTGCCGACGG CGGCACGCTC TTTCTCGACG AAATCGGCGA CATGCCGGTG 
CCGCTGCAGG GCAAGCTGCT GCGCGTGCTG CAGGACAAGG AGTTCGAGCC GGTCGGCTCG 
AACCGGATCG TGCGCGCGAA TGTGCGGATC ATCGCGGCGA CGTCGGCCGA ATTGCCGGCG 
CTCGTCGCGG AAGGGCGCTT TCGCGCGGAC CTTTATTACC GGCTGAACGT GCTGACGATC 
CATGCGCCGC CGCTGCGCGA GCGCGCATCG GACATCGAGG CGCTCGTCTA CACGATGCTC 
GAGGAACTCG CCGCGCAGCA TGGGCTGGCC GAGCACTGCG AACTGACCGA CGACGCGCTG 
CGCCTGCTGT GCGCGTATCC GTGGCCCGGC AACGTGCGCG AACTGCGCAA CACGCTCGAG 
CGCGCGCTGA TGCTGTCCGA TCGCGCGTTG ATCGATGCGC GCGCGCTCGC GCCGTTCATC 
GGGCCGGCGC GCGGCGCGGG GGGCGGTGTC GGGGCGGGCG GCGTCGGTCC GGCCGCGGTC 
GCCATCGCGG CGCAGACTGC CATGGCCGAT ACGCGCGCGG CGGCGTCATC CTATGCGGAC 
GCATTCGCCG CGTGGGAGCG TCAATTCCTG ATCGACGCGC TTGCCGCGTC CAACGGCAAG 
GTGACGGAAG CGGCCGCGCG CATCGGCATC GGGCGTGCGA CGTTCTACAA GAAGCTCGCG 
ACGCTCGGCA TCGATACGTA G

Protein sequence

MDKKEKVETN APISGGWVRL PADYGDVLRR AAESLFKTFE HSSVGTLIVD KDARVVWINQ 
RYAARFGFAD PQQAIGRDCE AVIPHSLMRE VVATGRPILL DIMETGREPL VVTRLPLTDD 
AGETVGAIGF ALFDELKTLT PLFSRYMQVQ QELIATQRSL AQARRAKYTF ASFVGTSAVS 
LETKRQGRRA AQVDSPVLLL GETGTGKELL AHAIHAASAR ALKPLVTVNV AAIPDALLET 
EFFGAAPGAY TGADRKGRVG KFELADGGTL FLDEIGDMPV PLQGKLLRVL QDKEFEPVGS 
NRIVRANVRI IAATSAELPA LVAEGRFRAD LYYRLNVLTI HAPPLRERAS DIEALVYTML 
EELAAQHGLA EHCELTDDAL RLLCAYPWPG NVRELRNTLE RALMLSDRAL IDARALAPFI 
GPARGAGGGV GAGGVGPAAV AIAAQTAMAD TRAAASSYAD AFAAWERQFL IDALAASNGK 
VTEAAARIGI GRATFYKKLA TLGIDT