Gene BURPS1106A_2831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2831
Symbol
ID	4899536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2786326
End bp	2787546
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	72%
IMG OID	640136057
Product	hypothetical protein
Protein accession	YP_001067078
Protein GI	126451891
COG category	[S] Function unknown
COG ID	[COG4394] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGTCGT CCGCCCCGCT TCCCCCGCCC GTTCCCCCGC CCGCCGACAC GGCGTCGCCC 
CTGCAAGCGG CAAGCCCGGT CGCGTGCGAC ATCTTCTGTG CGGTCGTCGA CAACTTCGGC 
GACATCGGCG TGTGCTGGCG TCTCGCGCGC CAGCTCGCGC TCGAGCACGG CTGGCAGGTG 
CGGATCTTCG TCGACGCGCT CGCGACGTTC GCGCGCCTGC AGCCGGCCGC GTTGCCCGAC 
GCCGCGCGGC AGACCGTCGA CGGCATCGTC GTCGAGCACT GGCGCGCGCC CGCGCACGCG 
GGCGACACGC TCGAGATCGC CGACATCGTG ATCGAGGCGT TCGCCTGCGA GCTGCCGGGC 
GCGTATGTCG CCGCGATGGC GCGCCGCGCG CGGCCGCCCG TCTGGATCAA CCTCGAATAC 
CTGAGCGCCG AGGACTGGGT CGGCGAATTC CATCTGCGCC CGTCGCCGCA TCCGCGCTAC 
CCGCTCACGA AGACGTTCTT CTTCCCTGGC CTCGGGCCCG GCACGGGCGG CGTGCTGAAG 
GAGCGCGATC TCGACGCGCG CCGCGCCGCG TTCGAAACCG GCGACGATGC GCGCCGCACG 
TGGTGGCAAA ACGTCGCGGG CGCGCCGATA CCCGCTCCGG ACACCACCGT CGTGTCGCTC 
TTCGCGTACG AGAATCCGGC GCTCGACGCG CTGCTCGAAC AGTGGCGCGA CGGCCGCGAG 
CCGGTCGCGC TGCTCGTGCC CGAAGGCAGG ATCTCGGCGC GCGTCGCGCG CTTCTTCGGG 
GCCGGCGCGT TCGGCGCCGG CGCGCACGCG GCGCGCGGCA GCCTCGTCGC ACACGGTCTC 
GCCTTCGTCG CGCAGCCCGA CTACGACCGG CTGCTGTGGG CGAGCGACGT GAACTTCGTG 
CGCGGCGAGG ATTCGTTCGT CCGCGCGCAA TGGGCGCGCC GGCCGTTCGT CTGGCAGATC 
TATCCGCAGG CCGACGACGC GCATCTGCCG AAGCTCGACG CGGCGCTCGC GCACGTCACC 
GCACGCGTCG ATCACGCGAC GCGCGCGGCG ACCGAGCGCT TCTGGCACGC CTGGAACGGC 
GCGGGCACGC CCGATTGGAC CGATTTCTGG CGGCACCGCG CGGCGCTCGC CGCGCGCGCC 
GCGAGTTGGG CGGACGAGCT CGCGGCCGTC GGCGACCTCG CCGGAAATCT GGCGAATTTT 
GCAAAAACTC AGTTAAAATA A

Protein sequence

MTSSAPLPPP VPPPADTASP LQAASPVACD IFCAVVDNFG DIGVCWRLAR QLALEHGWQV 
RIFVDALATF ARLQPAALPD AARQTVDGIV VEHWRAPAHA GDTLEIADIV IEAFACELPG 
AYVAAMARRA RPPVWINLEY LSAEDWVGEF HLRPSPHPRY PLTKTFFFPG LGPGTGGVLK 
ERDLDARRAA FETGDDARRT WWQNVAGAPI PAPDTTVVSL FAYENPALDA LLEQWRDGRE 
PVALLVPEGR ISARVARFFG AGAFGAGAHA ARGSLVAHGL AFVAQPDYDR LLWASDVNFV 
RGEDSFVRAQ WARRPFVWQI YPQADDAHLP KLDAALAHVT ARVDHATRAA TERFWHAWNG 
AGTPDWTDFW RHRAALAARA ASWADELAAV GDLAGNLANF AKTQLK