Gene BURPS1106A_A2787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2787
Symbol
ID	4904565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2716638
End bp	2717678
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	73%
IMG OID	640145890
Product	fatty acid desaturase family protein
Protein accession	YP_001076816
Protein GI	126456520
COG category	[I] Lipid transport and metabolism
COG ID	[COG1398] Fatty-acid desaturase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCACG CGAGCGCCGA GAGCCCCGAT AGCGCCGGCT GCGCCGAGAC GCCGGCGCGC 
GCGCCGGCCG GCTCGGCGGC GGATACGGCC GCCCCGCCCG CGCCCGACGA GCGCGCCTCC 
GGCCATCTGT CGCGCGCGTC GTCCGCGCGC CATCTGGGCG TCGCGGCGCT GCCCGCCGCC 
GGCACGGCCG CCGCGATCGC GCTCTGGGCC GGGTTCGGCC TCGCGCCGCG CGTGCAGGAC 
ATCGCCATGC TCGCGGTCTT CTACGTGCTC AACATTCTCG GCATGGAGCT CGCGCTGCAC 
CGCTATTTCG CGCATCGCAC GTTCAAGGCG AAGCCGGCCG TGAAGATCGC GCTCGCGATC 
CTCGGCTCGC TCGCGTACAT GGGGCCGCTG ATGTGGTGGG TGGCGATCCA CCGGCTGCAT 
CACGCGAACG CCGACCGGCC GGGCGACCCG CACACGCCGC AACTCGGCGG GCGCGGCTTC 
GCCGGCCGCG CGAAGGGCAT CCTGCACGGG CACGTCGGCT GGCTGTTCGA TCCGTCGTCC 
GCGCGCCCGA AGGGCTGGAA CCAATATGCG AACGACATGT ACCGCGACCC GACGCTGCTG 
CGCATCCATC TCGCGTACGA CTACTGGCTG CTGCTCGGCC TGCTGCTGCC GGGCGCGCTC 
GGCTGGCTGC TCGATCCTTC GTGGCGGGGC GCGCTGCTCG GCCTGCTGTG GGGCGGCACC 
GTGCGGATCT TTCTCGCGAC GAACGCGATC TGGGCGGTCA ATTCGATCGG CCACGCGCTC 
GGCGGCCGGC GGCCGTTTCC CGGCCGCGAC CAGAGCCGCA ACGCGGCGTG GCTCGCGCTC 
GTCACGCTCG GCGCGGGCTG GCACAACAAC CATCACGCGT TTCCGCAGTA TGCGAGCACG 
CGCCTGACCC GCTGGCAGAT CGACGTGACC GGCATGCTGA TCGCGCTGCT TGAACGGCTG 
GGCCTCGTGT GGGACGTTCA GCACCCGGAC CGGGACGCGG TGCGCGAGCG GCTCGCGAAC 
GCACGGCGCG ACGACGCGTA G

Protein sequence

MKHASAESPD SAGCAETPAR APAGSAADTA APPAPDERAS GHLSRASSAR HLGVAALPAA 
GTAAAIALWA GFGLAPRVQD IAMLAVFYVL NILGMELALH RYFAHRTFKA KPAVKIALAI 
LGSLAYMGPL MWWVAIHRLH HANADRPGDP HTPQLGGRGF AGRAKGILHG HVGWLFDPSS 
ARPKGWNQYA NDMYRDPTLL RIHLAYDYWL LLGLLLPGAL GWLLDPSWRG ALLGLLWGGT 
VRIFLATNAI WAVNSIGHAL GGRRPFPGRD QSRNAAWLAL VTLGAGWHNN HHAFPQYAST 
RLTRWQIDVT GMLIALLERL GLVWDVQHPD RDAVRERLAN ARRDDA