Gene BURPS668_A2941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2941
Symbol
ID	4888773
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	2788567
End bp	2789607
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	73%
IMG OID	640132877
Product	Fatty-acid desaturase
Protein accession	YP_001063932
Protein GI	126442549
COG category	[I] Lipid transport and metabolism
COG ID	[COG1398] Fatty-acid desaturase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCACG CGAGCGCCGA GAGCCCCGAT AGCGCCGGCT GCGCCGAGAC GCCGGCGCGC 
GCGCCGGCCG GCTCGGCGGC GGATACGGCC GCCCCGCCCG CGCCCGACGA GCGCGCCTCC 
GGCCATCTGT CGCGCGCGTC GTCCGCGCGC CATCTGGGCG TCGCGGCGCT GCCCGCCGCC 
GGCACGGCCG CCGCGATCGC GCTCTGGGCC GGGTTCGGCC TCGCGCCGCG CGTGCAGGAC 
ATCGCCATGC TCGCGGTCTT CTACGTGCTC AACATTCTCG GCATGGAGCT CGCGCTGCAC 
CGCTATTTCG CGCATCGCAC GTTCAAGGCG AAGCCGGCCG TGAAGATCGC GCTCGCGATC 
CTCGGCTCGC TCGCGTACAT GGGGCCGCTG ATGTGGTGGG TGGCGATCCA CCGGCTGCAT 
CACGCGAACG CCGACCGGCC GGGCGACCCG CACACGCCGC AACTCGGCGG GCGCGGCTTC 
GCCGGCCGCG CGAAGGGCAT CCTGCACGGG CACGTCGGCT GGCTGTTCGA TCCATCGTCC 
GCGCGCCCGA AGGGCTGGAA CCAATATGCG AACGACATGT ACCGCGACCC GACGCTGCTG 
CGCATCCATC TCGCGTACGA CTACTGGCTG CTGCTCGGCC TGCTGCTGCC GGCCGCGCTC 
GGCTGGCTGC TCGATCCTTC GTGGCGGGGC GCGCTGCTCG GCCTGCTGTG GGGCGGCACC 
GTGCGGATCT TTCTCGCGAC GAACGCGATC TGGGCGGTCA ATTCGATCGG CCACGCGCTC 
GGCGGCCGGC GGCCGTTTCC CGGCCGCGAC CAGAGCCGCA ACGCGGCGTG GCTCGCGCTC 
GTCACGCTCG GCGCGGGCTG GCACAACAAC CATCACGCGT TTCCGCAGTA TGCGAGCACG 
CGCCTGACCC GCTGGCAGAT CGACGTGACC GGCATGCTGA TCGCGCTGCT CGAACGGCTG 
GGGCTCGTGT GGGACGTTCA GCACCCGGAC CGGAACGCGG TGCGCGAGCG GCTCGCGAAC 
GCACGGCGCG ACGACGCGTA G

Protein sequence

MKHASAESPD SAGCAETPAR APAGSAADTA APPAPDERAS GHLSRASSAR HLGVAALPAA 
GTAAAIALWA GFGLAPRVQD IAMLAVFYVL NILGMELALH RYFAHRTFKA KPAVKIALAI 
LGSLAYMGPL MWWVAIHRLH HANADRPGDP HTPQLGGRGF AGRAKGILHG HVGWLFDPSS 
ARPKGWNQYA NDMYRDPTLL RIHLAYDYWL LLGLLLPAAL GWLLDPSWRG ALLGLLWGGT 
VRIFLATNAI WAVNSIGHAL GGRRPFPGRD QSRNAAWLAL VTLGAGWHNN HHAFPQYAST 
RLTRWQIDVT GMLIALLERL GLVWDVQHPD RNAVRERLAN ARRDDA