Gene BURPS1106A_A2909 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2909
Symbol
ID	4904761
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2840751
End bp	2842442
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	74%
IMG OID	640146012
Product	putative lipoprotein
Protein accession	YP_001076938
Protein GI	126457654
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4632] Exopolysaccharide biosynthesis protein related to N-acetylglucosamine-1-phosphodiester alpha-N-acetylglucosaminidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.733186
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCGGACGA CGAAATCTCC CGGCATCTCC GTGATTCGGC AGCGGCTCGC CGTTGCGCTG 
CCGCTTGCGT TGACGCTCAC CCTCGCGAGC TGCGGCGGTG ACGATCTGAC GCCCGCCGCG 
CAGCGCTGGG CGATGCCCGG CACCGAACTG CCGCTCGGGC CGCAGGGCCT CGCGCAGAGC 
GTGTCGACGC AGACGCTCGC CGCAGGCGTC GCCTATTACC AGATCAAGCG CGGCGCGGCG 
AGCGCGGCCG ATTTCTGGAC CGTCAACCTC GGCTTCTACG CGACGCAGGC CGCGGCGCAG 
GCCGATGCGG CGAATCTCGC GGCGGCCGGC TTCGCGACGC GCGTCGACGC GTCGGCGGGC 
ACCGACCTGC AGGGCAAGGT GCTCGGCTAC TGGCTGTCGG CCGGCCGCTA CGCGACGCAG 
GCCGAGGCGA CGGCGGCCGC CGCACGCATC GCGCAGGCCA CGCAGAACCG CTACAAGCCG 
GGCACGCGGC ATACGTCGCT CGCCGGCGCG CCGACGACGG GGCCGTGGAT CGTCAACGTG 
CTCGCGATCG ACCCGTCGCG CGCCGGCGCG GCGCTGTCGC TCGCGCTGCC GGGCGGCAAC 
GATCTCGGTG CGGGCGGCGA GACGGTTTCG GCCGCGCGGG CGCGTGTGAA CGCGCTCGCC 
GGCGTCAACG GCGGCTTTTT CACGAACATC AATCCGTTCG GCGCGCCGCT GCCGCCGCGC 
TCACCCGTCG GCGCGACGGT AGTCGACGGG CGGCTCGTCG CGGCCGCGAT CGGCAGGCGC 
CCCGGCCTGC TGCTCGCGCG CGACGCGAAC GGCCGCCAAC GCGCGACGGT CGTGCGCAAT 
CTCGCGACGG CGATCACGCT GACCGACGCG CAAGGCAGTG CGATCGCGGT CCAGACGCTG 
AACCGGCCGA TCCTCGGCAC GGTCGTCAAT TGCGGCGCGC AGGCGCGCAC GCCGACGAGC 
GAGCCGGCGC AGGACACGGT GTGCACGAAC TACGATGACC TCGTGATGTA CGACTCGCTA 
TATCTGCGCG GCGGTGCGTC GAACACGCTC GTCGACGCCG GCTACCAGGG CGCGCGATAC 
GAACTCGTGG TCGACGCGAA CGGCGCCGTC GTCGCCGGCC ATGCGACGCT CGGCGCGCCG 
CCGCCGCCGA ACGGCTACGT GCTGCAGGGG CTCGGCGCGA GCGCCGCGTG GCTGCAGGCG 
CATGCGACGC CGGGCACGCG CCTCGCGGTA TCGCGCCGGC TGTCGGCCGA CGGCGCGGAT 
CTCGCGCTCG CGTCGGGCAC GTCGCTCGTC GAGGCGGGGC CGACGCTGTC CGTGCCGAAT 
CTCGCGCAAA GCGCCGCGCA AGAGGGCTTC GCGCCGACGG TGGGCGGCGT CGACGCGGGC 
GAAGGCGCCG CGGCGAACGG CAACTGGTAC AACGGCTGGT ATGTCGCGCG CAATGGGCGC 
ACCGCGGCGG GCGTCGCGGC GGACGGCACG ATCCTGCTCG TCGAGATCGA CGGCCGGCAG 
CCCGCGTTGA GCGTCGGCAC GAGCATTCCG GAGACGGCGG CGGTGATGGC ATGGCTCGGT 
GCGACGTCGG CCGTCAATCT CGACGGCGGC GGCTCGAGCA ACATGGTGGT CGGCGGCAAG 
ATGGTCGGAC ATCCGTCCGA CGCGGTGGGC GAGCGGGGCG TCGGCGATAC GCTGATGCTG 
CTGCCGGGCT GA

Protein sequence

MRTTKSPGIS VIRQRLAVAL PLALTLTLAS CGGDDLTPAA QRWAMPGTEL PLGPQGLAQS 
VSTQTLAAGV AYYQIKRGAA SAADFWTVNL GFYATQAAAQ ADAANLAAAG FATRVDASAG 
TDLQGKVLGY WLSAGRYATQ AEATAAAARI AQATQNRYKP GTRHTSLAGA PTTGPWIVNV 
LAIDPSRAGA ALSLALPGGN DLGAGGETVS AARARVNALA GVNGGFFTNI NPFGAPLPPR 
SPVGATVVDG RLVAAAIGRR PGLLLARDAN GRQRATVVRN LATAITLTDA QGSAIAVQTL 
NRPILGTVVN CGAQARTPTS EPAQDTVCTN YDDLVMYDSL YLRGGASNTL VDAGYQGARY 
ELVVDANGAV VAGHATLGAP PPPNGYVLQG LGASAAWLQA HATPGTRLAV SRRLSADGAD 
LALASGTSLV EAGPTLSVPN LAQSAAQEGF APTVGGVDAG EGAAANGNWY NGWYVARNGR 
TAAGVAADGT ILLVEIDGRQ PALSVGTSIP ETAAVMAWLG ATSAVNLDGG GSSNMVVGGK 
MVGHPSDAVG ERGVGDTLML LPG