Gene BURPS1106A_2641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2641
Symbol
ID	4903190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2602192
End bp	2603268
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	74%
IMG OID	640135868
Product	hypothetical protein
Protein accession	YP_001066894
Protein GI	126452154
COG category	[S] Function unknown
COG ID	[COG4255] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.192728
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGCCC AACGTCTTCA TTTCCTCGTG CCCTTCGCGC TGCCGTCGAC CGCCGACGCC 
GCGTCCTCCC TTCATACGCT CGATCGTCCC GCGCTCGCGA AGCTCGTCGC CCGCGCGCGG 
CTCGTCGAGC ACACGCTCGG CGAGGATTTC CAGCGCACGC TGCCGCACGA ACGCTGGCTC 
GCGCGCCGGT TCGGCGCGAT CGCCGACGAC GCCGACGACG CGCCGCTCGC GCCGTACATG 
CTCGTCGCCG ACGGCGGTGC GCCCGGCGAC GACACATGGG CGTGCGTCGA GCCCGTGCAC 
GTGCGGATCG CGACCGATCA CCTCGTGCTG ATCGATCCCG CGTCGCTCGA GATCACCGGC 
GAAGAAGCCG CCGCGCTCCT GGACACCGCC CGCCCGCTGA TCGAAGAGCT CGGCGTGAAG 
GTGCAGGCGC CGCACGCGTC GCGCTGGTAT CTGTCGAGCC CGCAGCTCGC GGGGCTCGCG 
GGCGCCGCGC CGCTGCGCGC GAGCGGGCGC AACATCGAGA TCTGGCTGCC GCACGAGACG 
CGCACGGGTG AGCGTTCGCG CGCGTGGATG AAACTGCAGA ACGAAGTGCA GATGGCGTGG 
TTCCGGCATC CCGTCAACGA GGCGCGCGAC GCGCGCGGCG AGCCGGCCGT CAACTCGATC 
TGGTTCCATG CGCAAGGCGC GATGAAGCCC GTGACGAGCC CGTTCGCGCG CGTGCTGTCG 
CGCTCGCCCG GCGCCCGCGG GCTCGCGCTC GCCGCGGGCG CGGCCGCGGG CGGGCCGCCC 
GCCGCGTTCG ACGCGCTCGC GGCAGGCGCC GCGTCGCCGC CGGACGGCGC GACGCTCGTC 
GAGCTCGACG CGCTGACCAC GCCGTTCATC GAGCAGGACT GGGCGCGCTG GCACGACGCG 
CTCGCCGCGC TCGAACGCGA CTGGTTCGCA CCGGCGCTCG CCGCGCTCGC GCAAGGCCGC 
ATCGGTGAGC TCGCGCTCAC GCTGTGCGGC GACACGAGCG CCGCGACGCT CGCCGCGACG 
CGCGGCGATC TGCGCAAATT CTGGCGCCGC CGCGCGCTTG CCTCCCTGTT CGAATAA

Protein sequence

MRAQRLHFLV PFALPSTADA ASSLHTLDRP ALAKLVARAR LVEHTLGEDF QRTLPHERWL 
ARRFGAIADD ADDAPLAPYM LVADGGAPGD DTWACVEPVH VRIATDHLVL IDPASLEITG 
EEAAALLDTA RPLIEELGVK VQAPHASRWY LSSPQLAGLA GAAPLRASGR NIEIWLPHET 
RTGERSRAWM KLQNEVQMAW FRHPVNEARD ARGEPAVNSI WFHAQGAMKP VTSPFARVLS 
RSPGARGLAL AAGAAAGGPP AAFDALAAGA ASPPDGATLV ELDALTTPFI EQDWARWHDA 
LAALERDWFA PALAALAQGR IGELALTLCG DTSAATLAAT RGDLRKFWRR RALASLFE