Gene BURPS1106A_4040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_4040
Symbol
ID	4901015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3945825
End bp	3947555
Gene Length	1731 bp
Protein Length	576 aa
Translation table	11
GC content	67%
IMG OID	640137266
Product	AMP-binding domain protein
Protein accession	YP_001068259
Protein GI	126453323
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGCAG ATTCAGGCAT GGGCGCGCTG ATCGCGCCGA TGCACGGGCT TTCGTACGTA 
CGCGGCCCGG CGGATGTCCC ATTGAGCGAC GCGACGATCG GGCAGTTCCT GCTCGATACG 
GTCGCCCGCT TTCCCGATCG CGCGGCGGTC GTGTTCCGCG AGCAGGGCGT GCGCTGGACG 
TGGCGCGAGT TCGCGGACGA AGTCGACGCG CTCGCCGCCG CGCTGATCGA GCTCGGCATC 
GCGCGCGGTG ACCGGGTCGG CATCTGGTCG CCGAACCGCG CCGAATGGCT GCTCACGCAA 
TTTGCAACCG CGCGTATCGG CGCGGTGCTC GTCAATGTCA ATCCCGCCTA TCGGCTGGCC 
GAGCTCGAAT ACGCGCTGAA CAAGGTCGGC TGCAAGCTGT TGATCGCCGC GGAGCGCTTC 
AAGACGTCCG CGTACGCGGA GATGATCGCG GAAATCGCGC CGGAGCTCGC GACGACGCGC 
GCGGGCGACG TGCTGTGCGC CGCGCGCGTG CCGAGTTTGC GCACGGTCGT GACGATGAGC 
GATGCGGCGC ACGCGGGCAT GCTGAGCTTC GCGGACGTGC TCGCGCGCGG GCGGGCGGCG 
CTCGCTTCCG CGCGGCTCGA CGCGATCGGC GCGACGCTCG ATTGCCGCGA TCCGATCAAC 
ATCCAGTTCA CGAGCGGCAC GACGGGCAGC CCGAAGGGCG CGACGCTCAC GCACCGCAAC 
GTCGTCAACA ACGCGCGCTC GATCGCGAAC GTGATGCGGC TGACCGAGGC CGATGCGATG 
TGCATTCCGG TGCCGCTCTA TCACTGCTTC GGGATGGTGC TGTCGGTGCT CGCGTGCGTA 
TCGGCGGGCG CGAAGATGGT GTTTCCCGGC GCGGCGTTCG AGCCGGGTGC GACGCTCGCG 
GCGGTGTCCG ACGAGCGCTG CACCGCGCTG CAGGGCGTGC CGACGATGTT CATCGCCGAG 
CTCGATCATC CGGATTTCGA CCGTTTCGAC CTGAGCACGC TGCGCACGGG CATCATGGCG 
GGTTCGCCGT GCCCGATCGA GACGATGAAG CGCGTGGTCG CGAAGATGCA CATGTCCGAG 
GTGACGATCG CCTACGGGAT GACGGAGACG AGCCCCGTGT CGTTCCAGAG CGCGACGACG 
GATTCGCTCG AGAAGCGCAC GACGACGGTC GGCCGGATCC AGCCGCATCT GGAGGCGAAG 
ATCGTCGACG CGACGGGCGC GATCGTGCCC GTCGGCGAGA CGGGCGAGCT GTGCACGCGC 
GGCTATTCGG TGATGCTCGG CTATTGGGAC GACGAGGCCA GAACGCGCGA GGCGGTGGTC 
GATGGCTGGA TGCGCACGGG CGACCTCGCG ACGCTCGACG AAGAAGGCTT TTGCAACATC 
GTCGGGCGCC TGAAGGACAT GCTGATTCGC GGCGGCGAGA ACGTGTACCC GCGCGAGATC 
GAGGAGTTTC TGTTCCGGCA TCCGAAGATC CAGAGCGTGC AGGTGTTCGG CGTGCCCGAT 
TCGAAGTACG GCGAGGAAGT ATGCGCGTGG ATCGTGCTGC GCGCGGGCGA GACGATGACG 
GACGACGAGC TGCGCGAGTT CTGCAGCGGC CAGATCGCGC ACTACAAGGT GCCGCGCTAC 
GTGCGCTTCG TCGACGAACT GCCGATGACC GTGACGGGGA AGGTGCAGAA GTTCGTGATG 
CGCGAACGAA TGATCGACGA ACTTGGTTTG AGCGTGCAGC AGACGGCTTG A

Protein sequence

MAADSGMGAL IAPMHGLSYV RGPADVPLSD ATIGQFLLDT VARFPDRAAV VFREQGVRWT 
WREFADEVDA LAAALIELGI ARGDRVGIWS PNRAEWLLTQ FATARIGAVL VNVNPAYRLA 
ELEYALNKVG CKLLIAAERF KTSAYAEMIA EIAPELATTR AGDVLCAARV PSLRTVVTMS 
DAAHAGMLSF ADVLARGRAA LASARLDAIG ATLDCRDPIN IQFTSGTTGS PKGATLTHRN 
VVNNARSIAN VMRLTEADAM CIPVPLYHCF GMVLSVLACV SAGAKMVFPG AAFEPGATLA 
AVSDERCTAL QGVPTMFIAE LDHPDFDRFD LSTLRTGIMA GSPCPIETMK RVVAKMHMSE 
VTIAYGMTET SPVSFQSATT DSLEKRTTTV GRIQPHLEAK IVDATGAIVP VGETGELCTR 
GYSVMLGYWD DEARTREAVV DGWMRTGDLA TLDEEGFCNI VGRLKDMLIR GGENVYPREI 
EEFLFRHPKI QSVQVFGVPD SKYGEEVCAW IVLRAGETMT DDELREFCSG QIAHYKVPRY 
VRFVDELPMT VTGKVQKFVM RERMIDELGL SVQQTA