Gene BURPS668_A1497 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1497
Symbol
ID	4888908
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	1440838
End bp	1441851
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	71%
IMG OID	640131436
Product	AraC family transcription regulator
Protein accession	YP_001062493
Protein GI	126443160
COG category	[T] Signal transduction mechanisms
COG ID	[COG4753] Response regulator containing CheY-like receiver domain and AraC-type DNA-binding domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.141505
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGAGC GCAGCGATCG CCTCGATTTC TACATTCGCG ACGAGGCCGC CCGCCGGGCG 
ATCACCGAGC CGCACCGGCA TGCGTACTTC CAGATCCAGT TCAACCTCGG CGGCGACACC 
GAGCAGCGCA TCGGCGGGTT CACGCGAGCG TTCCCGCGCG GCGCGCTCGC GTTCGTGCTG 
CCGTACCGCG AGCACCTGAT CGCGCATCCG CCGGGCGCGC ACTTCGTCGT GATCAATTTC 
TCGCAAACGT TCCTGCGCGC CGATCTCGAC GTCGATCCGC TCGATCTCGA GGATGTCTGC 
GCGCAGCGCG CGCCCGAGCT TGCGCCGTTT CGCTTCCAGG AGCATCTGGA CTTCATCCTG 
ACCGGCGCGG CATTCGACGA CGCGCGCCGC CTCGCGCAGC GGATGCTAGA AGCCAACCGC 
GCGCGCACGT TCGGCTCGGT GCCGCTGCTG CGCGGCTATC TGCTGCAGTT GATCGGGCTC 
GTCTGCACAC AATACGCGGG GCCGCTCACG AAGCTCGCCC AGAGCGGCGC GCACCGCACG 
GGCCGCCGCG ACGCGTTCGC GCGCGTGCTG CGCCACGTCC GCGCGAACCT GACGAACGAC 
GCGCTCACGC TCGCGGGCAC CGCGCGCGCG GCGTGCCTGT CGCCGAACTA CCTCGCGCAC 
CTGATCCGCA AGGAGACGGG CAGCACGTTC ACCGATCTCG TCACCGCGCG GCGGATCGCG 
CTTGCCCAAT CGCTGCTCGC GCATACGACG CGGCGCATCG CCGACATCGC GCACGCGGTC 
GGGTTTCGCG ACGAGGGCTA TTTCTCGCGG CGCTTTCGCG CGTGCGTCGG CGTATCGCCG 
AAGGAGTATC GCGACGCGAA CGGCGCGCCC GGCCCGGCCG ATGCGCTCGA TTCGGCCGAT 
GCGCTCGATT CGGTCGATAC GGCTGGGCCG CGCGCCGCGC CCGGGCGCGG CGAAACGCGC 
GGCGCGGCCG GCGCGAAGAG CCCGGCGCGC GCGGCCGCGA AGCCGCGCGC GTAG

Protein sequence

MPERSDRLDF YIRDEAARRA ITEPHRHAYF QIQFNLGGDT EQRIGGFTRA FPRGALAFVL 
PYREHLIAHP PGAHFVVINF SQTFLRADLD VDPLDLEDVC AQRAPELAPF RFQEHLDFIL 
TGAAFDDARR LAQRMLEANR ARTFGSVPLL RGYLLQLIGL VCTQYAGPLT KLAQSGAHRT 
GRRDAFARVL RHVRANLTND ALTLAGTARA ACLSPNYLAH LIRKETGSTF TDLVTARRIA 
LAQSLLAHTT RRIADIAHAV GFRDEGYFSR RFRACVGVSP KEYRDANGAP GPADALDSAD 
ALDSVDTAGP RAAPGRGETR GAAGAKSPAR AAAKPRA