Gene BURPS668_0132 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0132
Symbol
ID	4883771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	128639
End bp	129652
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	64%
IMG OID	640126060
Product	AraC-type DNA-binding domain-containing proteins
Protein accession	YP_001057187
Protein GI	126440673
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.968788
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGTCAA GCGACAAACC CCGCTCGCTC GCCGCACGAC GTCCCGCGTC GCTGCATGCC 
GTCGCGGTCG CGGTCGACAT GTTGCAGCGG CGAGGCCTGA GCACGGAACT GATCCTCAGC 
GGCTCGGGCA TCGCGCCCGC CGAGTTGCGC CAGCCGAACA AGATCATCTC GCATGCGCAG 
GAGATGGTGA TCTATCACAA CGCGTGGCGG ATGACGGGCG ATTCGGCGAT CGGCCTCGCG 
ATGGCCGACG CCGTGCCGCT CACCGCGTAC ATGCCGCTCG GGCTCGCGAT GATGGTCAGC 
CCGACGCTCG GCGCCGCGAT CGAGCTCGCG AACAGTTGCC CGCTGCTCGC ATTGTGCTAT 
TTCACCACGC GCCTCGAAAC AAAAGGCTCG CGAGCCGTCA TCACGTTCTC CGATTATTCG 
TATCGGCCCG ATCTCTACGT GCTCAACACC GACATGTGTC TCGCGGGCCT GCGCAGGCAG 
ATGTTCGATC TGCTCGGCGG CCCGCCGACA TTCCGTCAGG TGACGCTCGC TTTCGACGCG 
CCGAAACATG CGTACGCATA CGAATCGCTG TTTCAATGTC CGATCAGATT CTCCGCGCCC 
GCGCATTCGT TCACGCTCGA CGCGAACTGC ATGAACACAC CGTTGCCGAT GGCGCATCAA 
CTCGAGCATA TGATCGCGAA GGACGCGTGC GTGCGGCGCG AGCAGGAACT CGAGCAATGG 
GTTGCGGCGG ACGTCGTCGG CAAGGCGCTC CATTATCTGT ACGACCATCC GTTCACGGGC 
ACCGTGCCCG CGCTCGCGGG TGCGCTCGGC ATGTCGACCC GCACGCTGCA GCGCAAGCTC 
AAGCAGTCGG GCACGTCGCT GCAGCGTCTG CTCGAACAGG TGAGGCGCGA TCTGCTGATT 
CAGGATCTGG CGCTGGGCTC GCGCTCGCGA AAGGACATCG CACGGCACAT CGGCTACAAG 
GATCCGACCT CTGTGAGCCG CGCGCGACGC AGATGGGCGA AAGAAGATTC GTGA

Protein sequence

MASSDKPRSL AARRPASLHA VAVAVDMLQR RGLSTELILS GSGIAPAELR QPNKIISHAQ 
EMVIYHNAWR MTGDSAIGLA MADAVPLTAY MPLGLAMMVS PTLGAAIELA NSCPLLALCY 
FTTRLETKGS RAVITFSDYS YRPDLYVLNT DMCLAGLRRQ MFDLLGGPPT FRQVTLAFDA 
PKHAYAYESL FQCPIRFSAP AHSFTLDANC MNTPLPMAHQ LEHMIAKDAC VRREQELEQW 
VAADVVGKAL HYLYDHPFTG TVPALAGALG MSTRTLQRKL KQSGTSLQRL LEQVRRDLLI 
QDLALGSRSR KDIARHIGYK DPTSVSRARR RWAKEDS