Gene BURPS1106A_1394 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1394
Symbol
ID	4901807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	1371947
End bp	1373158
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	70%
IMG OID	640134624
Product	EAL domain-containing protein
Protein accession	YP_001065667
Protein GI	126452958
COG category	[T] Signal transduction mechanisms
COG ID	[COG2200] FOG: EAL domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGATATC ACGACGTCAC CCTTGCCAGC GCCTTTCAGC CGGTCATCTC GATCACGCAC 
AAGCGCGTCG TCGGCTATGA GGCGCTCGCC CGCGCGACCG ACGCGAACGG CGCGCCGATT 
TCGCCCGACA CGCTGTTCGC GCGTGCGCAG GCGCGCGGCG AGACCATCCT GCTCGATCGG 
CTGACCCGGT GCCTGCACGT CGCGAACTTC GCCGCGCAGG ACACGGGCGC GTGCTGGCTG 
TTCCTGAACG TGCTGCCGCA GATGTTCGAC GCCGGCATCG CGCCGGGCGC GTTCATCGAG 
GCGCTTTGCG CGCACTTCGC GCTGCCGCCG ACGCGCGTCG TGCTCGAAGT GATCGAGCAG 
CCGTCGCGCA ACGAGGTCGC GCTCGCCCGC ACGATCGACA TGATCCAGCA CGGCGACTTC 
CTGATCGCGG TCGACGATTT CGGCACCGGC TTCTCGAACT TCGACCGCAT CTGGCAGATC 
AAGCCCGACA TCGTGAAGCT CGACCGCTCG ATCCTCGAGC GCTCGCTCGC GGCAAGCGAC 
GCGCATCGGA TCATTCATCA TCTCGTCACG ATGCTGCATC ACGCGGGCAC GATGGTGCTC 
GCGGAGGGCG TCGAAAACGA AGACGCGCTG CAGATCCTGA TGGACGCCGA CGTCGATTTC 
GTGCAGGGCT TCTGCTTCGG CCGGCCCGCC CCGTCGCTCG AGCACGCGCG CCGCGCCGCG 
CCGGCGCGCA TCGAGGCCGC GTGGCGGCGC TTCGCCGAGC GCACGAAGGC ACGGTGCGGC 
GACGTCGTGC ATCCCGGCTT CGACACGATC GAGCGGATCA TGCTCACGGG CGCCGCCGAC 
TATGCGCAGA CCCGAAACCT GCGCGACGCC GCGCAGCGGC TGCTGACGAG CCCGATCGTG 
CGGCGCGTGT TCGTGGCGGA AGCGAACGGC GAGCAAGTGG AGCCATCGGT CGCGATCGAG 
ACGCCGGACG CGCCGAGCGC GACGGCGCGG CGGCTCGCGC CGCTGCTGCC CGAGCTGCAC 
TGCAACTGGT CGCGGCGCGC GTACTTCCAG CGCGCGATCG CGGCGCCCGG ACGCGTCGCG 
CTGATGGGCC CGCACTTCTC GCTGACGGAC GGCCGCGACT GCTACACGGC CGCCGTCGCG 
ATCCACCTCG GGACGACGCT GAAGGTGTTC TGCGTCGACT TCGACTTTTC GTCGTACGGG 
GACGGACGCT AG

Protein sequence

MRYHDVTLAS AFQPVISITH KRVVGYEALA RATDANGAPI SPDTLFARAQ ARGETILLDR 
LTRCLHVANF AAQDTGACWL FLNVLPQMFD AGIAPGAFIE ALCAHFALPP TRVVLEVIEQ 
PSRNEVALAR TIDMIQHGDF LIAVDDFGTG FSNFDRIWQI KPDIVKLDRS ILERSLAASD 
AHRIIHHLVT MLHHAGTMVL AEGVENEDAL QILMDADVDF VQGFCFGRPA PSLEHARRAA 
PARIEAAWRR FAERTKARCG DVVHPGFDTI ERIMLTGAAD YAQTRNLRDA AQRLLTSPIV 
RRVFVAEANG EQVEPSVAIE TPDAPSATAR RLAPLLPELH CNWSRRAYFQ RAIAAPGRVA 
LMGPHFSLTD GRDCYTAAVA IHLGTTLKVF CVDFDFSSYG DGR