Gene BURPS668_A2079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2079
Symbol
ID	4886291
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	2017357
End bp	2018541
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	73%
IMG OID	640132017
Product	ApbE family protein
Protein accession	YP_001063074
Protein GI	126445269
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGAAGA CGTCTATTGA ATGGTCGCCC GGCGCGCGGC TGAATCGCTG CCGCGCAAGC 
GGCGCGACGA TGGGCACGCG CTACGGCGCG CAGTTCTACG CGCCGCCGAC GGCCGACGCG 
AGGGCGATCG CGGCCGCCCT CGACGCGGCG GTGCGGGCGG TCGACGCGCA GATGTCGAAC 
TGGAAGGCCG ATTCGGATCT GTCGCGGCTC AATCGCGCGA CGCCCGGAAG CTGGACGCCG 
ATCTGCGCGA ACCTCGCCGC GGTGCTCGTG CGCGCGCGGG AAATCGGCCG CGAGACGGAC 
AACGCGTTCA ACATCGGCGT CGGCACGCTC GTCGATCGAT GGGGATTCGG GCCGGGCGCG 
GCCGCGAACC GACAAGCGGA CAACGAATGG GCGGCGAATC GACAGGCGGC CGGCCGACAT 
ACGGTTGATC GACGTACGGT TGCTCGACAC ATGGTTGATC GACACACGGC GGACCGGCAA 
ACGAAGGACG GGCGCACGCC GTGCCGCCAG CCGGCGCGCC CGGCCGGCCC CGCGAACGGG 
TTGTCGGGCG CGATCGACGC GCGCCGCCGC GCGTCGATCC TGCGCGGCCC CGTGCCGTCG 
CCGTGCCGCC CGATCGACGA ACTGCTCGAA GTCGATGTCG CGCGGGGCCG GGCGCGCCGG 
CTCGCGGACG TCGCCTTCGA CCTGTGCGGG ATCGCGAAGG GCTTCGGCGT GGACGAGCTT 
GCGCGCGTGC TCGATCGCCA CGACATCGGC GCATGGCTCG TCGGCATCGA CGGCGAACTG 
CGCGCGCGCG GATGCAAGCC GGACGGCTCG CCGTGGGCGA TCGCGCTCGA AGCGCCCGAC 
TACGACCGGC GCGGCGCGAT GGGCGCGATC GATCTCGTCG ACGCGGCCGT CGCGACCTCC 
GGCGATTACC GGCATTGGGC CGACTTCGGC GGCGAACGCC TCTCGCATAC GATGGACCCG 
CGCGCCGGCG CGCCGCTGCG CGGCGACATC GCCTCGGTCA CGGTCGTCGC GCCGACCTGC 
ACCGACGCGG ACGCGTACGC CACCGCGTTG ATGGTGCTCG GCGCGCAGGC GGGATGCGCG 
CACGCCGAAC GCCACGGACT CGACGCGCTG TTCGTCGTGC GCGACGGCGA CGCGCTGCGC 
ACGATCGGCT GCGGCGCTTT CGCGGACGCG GGGCCGGCGG GCTGA

Protein sequence

MSKTSIEWSP GARLNRCRAS GATMGTRYGA QFYAPPTADA RAIAAALDAA VRAVDAQMSN 
WKADSDLSRL NRATPGSWTP ICANLAAVLV RAREIGRETD NAFNIGVGTL VDRWGFGPGA 
AANRQADNEW AANRQAAGRH TVDRRTVARH MVDRHTADRQ TKDGRTPCRQ PARPAGPANG 
LSGAIDARRR ASILRGPVPS PCRPIDELLE VDVARGRARR LADVAFDLCG IAKGFGVDEL 
ARVLDRHDIG AWLVGIDGEL RARGCKPDGS PWAIALEAPD YDRRGAMGAI DLVDAAVATS 
GDYRHWADFG GERLSHTMDP RAGAPLRGDI ASVTVVAPTC TDADAYATAL MVLGAQAGCA 
HAERHGLDAL FVVRDGDALR TIGCGAFADA GPAG