Gene BURPS1106A_2254 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2254
Symbol
ID	4902428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2240211
End bp	2241959
Gene Length	1749 bp
Protein Length	582 aa
Translation table	11
GC content	70%
IMG OID	640135483
Product	hypothetical protein
Protein accession	YP_001066518
Protein GI	126454480
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0437004
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCCTG TCGTTCGCCT TACCGCTTCC GCCACCCGCG CGCTGCCGCG CTGGCTGCTG 
CTCACGCTCT GCATCGTCTA CGCGGCGTTC GGGCTGTTCG GCCGCGATCC GTGGAAGAAC 
GAGGACGCGG CAGGCTTCGG CGTGATGTGG ACGATGGCGC AAGGCGGCCT GCACGACTGG 
CTGCTGCCCA ATCTCGTCGG CAAATTCGTC ACGTCCGACG GGCCGCTCGG CTACTGGCTC 
GGCGGCCTCG CGATTCGCGC GCTGCCGTGG GTCGACGCGA GCAACGCGTC GCGCGTCTAC 
ACGGGTGTGC TGTTCTGCGT CGCGTGCGCA TTCGTCTGGT ACGCGGCCTA TCTGCTCGGC 
CGGCGCGCCG AGATCCAGCC GTTCAAGTAC GCGTTCGGCG GCGAGCCCGA GCCGCGCGAC 
TACGGGCGCA CGCTCGCCGA CGGCGCGCTG CTCGTGCTGC TCGCGTGCTT CGGCCTTGCC 
GAGCGCGGCC ACGAAACGAC GCCGCAGCTC GCGCAGTTCG CATGCATCGC GACGTTCGTC 
TACGGACTCG TGCGCGCGAT CGACAAGCCG ACGCAAGGCG CGCTCTGGTG GGGCCTCGCG 
CTCGGCCTCG TCGCGCTGTC GGGCAACCCG GTGCTCGTCG CCGCGCTCGC GCTCGGCACG 
CTCGCGCTCT ATCTCGTCAC GCCCGAGATC CGCTGCGTGC AACTGCCGGC GATCGGGCTG 
CCGCTCGCCG TGGCCGTGTT CGCGATCTGG CCGCTCGCCG CGTACATCGC GTTTCCCGAC 
GACGCGAACT GGTTCTTCAA CCAATGGCTG CACGGCAGCC TGATGCGCTT CTCCGGCCCG 
CCCACGACGG TGCTCGCGTA CGCGGCGAAG AACCTGCCGC TCTTCACGTG GCCCGCGTGG 
CCGCTCGCGA TCTGGGCATG GGTGAGCTGG GCGGGGCTGC GCCGCCGGCC GCACATCGCG 
ATTCCGCTGT CGGTCGCCGC GCCGCTCCTC GCGCTCGTGA TCCTGCAGAG CCAGCAGACG 
AACCGGATGT ACATGCTGCT GCTGCCCGCC CTCGCCGTCA TCGCGACGTT CGCGCTGCCG 
ACGCTCAAGC GCGGCGCGAT CAACGCGATC GACTGGTTCG CGGTGCTGAG CTTCACGATC 
CTCGGCACGT TCGTGTGGCT CGTGTGGCTC GCGTCGCTCA CGGGCTTCCC GCATCCGCTC 
GCGCGCAACC TCGGCCGCCT GGTGCCGGGC TACGAGCCGC ACTTCAAGGT GCTGTCGTTC 
GTGTGCGCGG TCGCCGCGAC CGCATGCTGG CTGATGCTCG TGCGCTGGCG CATCTCGCGG 
CAGCCGAAGG TGCTCTGGCG CAGCGTGGTG CTGTCGAGCG CCGGCACGAC GCTGATGTGG 
GTGCTGCTGA TGACGCTGTG GCTGCCGATC GTCAATTACA GCCGGACCTA TCGCGACGTC 
GCGCAGCAGA TCGCCGCGCA CCTGCCGTCC GATTACGAAT GCATCTCGCC CGTGCGGCTC 
GGCGACGCGC AGATCGCGAC GTTCGCGTAT TTCGGCGACA TGCACTTCTC GTTCACCGAT 
GACTGCGACG TGATCCTGCG CCAGGATCGC GCGGACTTCG GCGAGCCGAG TTCGATCTCG 
CAATACGTGT GGCGCCTCGT GTGGGAAGGC CGCCGCGTCG CCGACCGCGA CGAGCGCTTC 
CGCCTGTACG AGCGAATCGA GCGCCCGAAG ACGCCCGTCA AGCGCCGCCC GCCGCGCAAG 
GCCCGCTGA

Protein sequence

MKPVVRLTAS ATRALPRWLL LTLCIVYAAF GLFGRDPWKN EDAAGFGVMW TMAQGGLHDW 
LLPNLVGKFV TSDGPLGYWL GGLAIRALPW VDASNASRVY TGVLFCVACA FVWYAAYLLG 
RRAEIQPFKY AFGGEPEPRD YGRTLADGAL LVLLACFGLA ERGHETTPQL AQFACIATFV 
YGLVRAIDKP TQGALWWGLA LGLVALSGNP VLVAALALGT LALYLVTPEI RCVQLPAIGL 
PLAVAVFAIW PLAAYIAFPD DANWFFNQWL HGSLMRFSGP PTTVLAYAAK NLPLFTWPAW 
PLAIWAWVSW AGLRRRPHIA IPLSVAAPLL ALVILQSQQT NRMYMLLLPA LAVIATFALP 
TLKRGAINAI DWFAVLSFTI LGTFVWLVWL ASLTGFPHPL ARNLGRLVPG YEPHFKVLSF 
VCAVAATACW LMLVRWRISR QPKVLWRSVV LSSAGTTLMW VLLMTLWLPI VNYSRTYRDV 
AQQIAAHLPS DYECISPVRL GDAQIATFAY FGDMHFSFTD DCDVILRQDR ADFGEPSSIS 
QYVWRLVWEG RRVADRDERF RLYERIERPK TPVKRRPPRK AR