Gene BURPS668_A1721 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1721
Symbol
ID	4887180
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	1670671
End bp	1671855
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	62%
IMG OID	640131659
Product	terpene synthase family protein
Protein accession	YP_001062716
Protein GI	284159991
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.24708
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCTGC CGCGACGCCA CCGATGCCCT TTTGAGAATA CCCCCGCAGA TGCCACGCAA 
GAGGAACATT CCGTGACCGC CCTCGTGAAC CAGTCCGTCG CGCCGATACT CTGTCCGTTT 
CCATTACGGG AAATCCGGCC GGCCGACGCC CACATCGCCC GAACATCGGA ATGGTTGATT 
CGATCGGGTC TCGTCGGCAG CGATGCCCAC GCGCGTGCGC TAGCCGGCGT GGGCGCACAT 
TATGCAATGT GCTGCTATCC GGATATCGCC GCCGATCGGA TACCGGATCT GGCCGATTTC 
GCCGCATGGA ATTGCCTGTT GGACGACTTC GCCGAGAACG GGCCGTTGAG CGGCGAGCTC 
GCCGCACTCA CGCATTTCCT GAAGTCCGTC GAATACATTT GCGGCGCGTC GAACTACCGC 
TGCCCGTCCG ATTTCGGATT CGATCACGGC TATCGCATCG CCGAGGCCCT TGTCGACGTG 
AAGCGCCGAA TTTCCGCATG GGCCTCCTTC GCGCAAATCC GCAACCTGAT GAGCGCCACC 
GGCCATTTCA TGTCGGGCCT CGCGTGGGAA GCCGCCTATG CGAGCCTGCG CCAGGTGCCG 
GACCTCAACA CGTATTGCGC GATCAGAACG GCGAACTCCG GCATGTACAT GGCGAACGCG 
CTGGCGGAAT GCGCGAACGA CGTCGAGCTG ACGCCGGCGC AACGCGCGTG CCCCAGGACA 
GAGGCGCTGA CGCAATGCAT ACTGTTCGTC CTCGTGATCG ACAACGATCT CTACTCGCAT 
CACAAGGAAA AAAACGGCCG CGCCGCGTTT GCGAGCATGA TCGACGTCCT CATGCATTCA 
CGCGGCAGCG AAGACGCGCA CGCCGCGCTA TTGGAAGCAC TCGATCTGCG AAATCAGTGC 
CTGCGCTGCT ATCTGGCGTT GAAAGCGAAA TGCCGGCTGA CCGCCGGCGA TCGGCTCGAC 
CTTTACTTCA AGGGACTCGA AGACGTCATC AGCGGAAACC TGGTGTTCGG CAGCACGTGC 
GCTCGATACG CGGCACCGGG AAGCCCTCAG TTCCTCGGCA CGACGAACGC ACGGCACCTC 
AGGCCCGACA GCGTTCAGAT CCCCGTCGTC GAAGCGCTCG ACGTCCCCGC CTCGCCTCCT 
CGCCACATTC CGTCGATCAC GTGGTGGTGG ACACTCGCCG ACTGA

Protein sequence

MTLPRRHRCP FENTPADATQ EEHSVTALVN QSVAPILCPF PLREIRPADA HIARTSEWLI 
RSGLVGSDAH ARALAGVGAH YAMCCYPDIA ADRIPDLADF AAWNCLLDDF AENGPLSGEL 
AALTHFLKSV EYICGASNYR CPSDFGFDHG YRIAEALVDV KRRISAWASF AQIRNLMSAT 
GHFMSGLAWE AAYASLRQVP DLNTYCAIRT ANSGMYMANA LAECANDVEL TPAQRACPRT 
EALTQCILFV LVIDNDLYSH HKEKNGRAAF ASMIDVLMHS RGSEDAHAAL LEALDLRNQC 
LRCYLALKAK CRLTAGDRLD LYFKGLEDVI SGNLVFGSTC ARYAAPGSPQ FLGTTNARHL 
RPDSVQIPVV EALDVPASPP RHIPSITWWW TLAD