Gene BURPS1106A_A3098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A3098
Symbol
ID	4904182
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	3012195
End bp	3013256
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	75%
IMG OID	640146201
Product	hypothetical protein
Protein accession	YP_001077127
Protein GI	126456682
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.677062
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATCGTC ATTTTCTCGT TCCCGTCGAC GACACCGATG CCGGCATCGA CACGGTTGCC 
TATGCGCTCG AGTTCGCGCG CTCGATCGGC GCGCGCATCA CGTTCGTGCA GACGCGCATC 
GAATTCGAAG CAGCCGATGC GGCGCGCCGT ATCGGCGAAA CGGAACGAAA GGAACAAACG 
CAGCGAACAG ACGATGCCGG CAAGTCCGGC GAGTGCGGCA GATCAGACGA AAGCGTTCGG 
CCGGCGCCGA CGCCGGATGC GGCGGCGCGG CCCGCCGCCG AGGCAACGCC GGCCGCGCGC 
GCGCCGGAGC TGCCGATCGC GAAAGCCGAG GCCGCCGCCC GCGCGCAGGG CGTGCCGTGC 
GATTCGGTGC GCGCCGCCGG CGCGACGACG GCGGACGCGC TCGCCGGCGC GATGCTCGCG 
CACGATTGCG ACCTGCTGTG CGTCGGGCCC GCGCTCGGCG ATGCGGCAGC CGCGCCGCCG 
CACGCGTGCG TCGCGGACCG GCTCGCCGCG CGGGGCATCG CCGTGCTGAC CTGCGCGTTT 
CGGCGCACGC CGGCCGCCGC GCGCGCGATC GCCGCGCTGT ATGCCGCGCA TCGCGAAGCG 
GCCGGCGCGC TCGGCGCATG GCTCGCGCAG TTGCGCGCGG CGATCGCCGC CGGCCGCGCG 
CTCGACGCCG ACGCGGCGCA CGCGATCGCC AATGGTCTGA GCCATCTGCG CGACGGGCGG 
CAGCCGAAAG CGGCGCGCCG GCTCTACGCG GCGCTGCGCG GCGCGACGGG CGCGCTCGAC 
GCTGAACTCG GCGAGCTCGA GCGGCAGCGG CTGCGCAATG CGCGGATGTT GTCCGGGCTG 
CTCGAGGCGA TCCACGCGGG CATCGCGCGC GAAGCGCCGC CCGTGCGCCT CGAGCACGCG 
CTGAGCGCAT ACGCGCAATG CGTGTGCGAG CACGCCGGCC GCGGCGAAGG CGTGATCGTG 
CCGGCCGCGC AGCGCTATCT GGCCGACGAC GACTGGCGCG CGATCGACGC GTCGCTTGCC 
TTGATCGCGT CGGGCCCGGC GGCCGCGGCG CGCGGCGCGT GA

Protein sequence

MYRHFLVPVD DTDAGIDTVA YALEFARSIG ARITFVQTRI EFEAADAARR IGETERKEQT 
QRTDDAGKSG ECGRSDESVR PAPTPDAAAR PAAEATPAAR APELPIAKAE AAARAQGVPC 
DSVRAAGATT ADALAGAMLA HDCDLLCVGP ALGDAAAAPP HACVADRLAA RGIAVLTCAF 
RRTPAAARAI AALYAAHREA AGALGAWLAQ LRAAIAAGRA LDADAAHAIA NGLSHLRDGR 
QPKAARRLYA ALRGATGALD AELGELERQR LRNARMLSGL LEAIHAGIAR EAPPVRLEHA 
LSAYAQCVCE HAGRGEGVIV PAAQRYLADD DWRAIDASLA LIASGPAAAA RGA