Gene BURPS1710b_A2033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A2033
Symbol
ID	3691988
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	+
Start bp	2472907
End bp	2474532
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	71%
IMG OID	637732287
Product	2-aminobenzoate-CoA ligase
Protein accession	YP_337184
Protein GI	76817725
COG category	[I] Lipid transport and metabolism
COG ID	[COG0365] Acyl-coenzyme A synthetases/AMP-(fatty) acid ligases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.951217
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACAACT TTTGCCGCAC GAATCTGCCT GCACCGACCG ATCTGCCGGA GTTCGTCTTC 
GAGTTGCCGG GCCTGCAGTA TCCGGCGCGC ATCAACTGCG CGGCGGCGCT GCTCGACGAC 
GCGGTGACCC GCCGGGGCTG GGGCGAGCGC GTCGCGATCA GGACCGAGTC CGGTGCCGCC 
TGGTCGTATC GCGCGCTGTT CGAGCTGAGC AACCGGATCG CCAACCTGCT GGTGCGCGAC 
GGCGGGCTCG TGCCGGGCAA CCGGGTGCTG CTGCACGGAA CCAATCATCC GTTTCTCGCC 
GCCGCATGGT TCGCGATCGT CAAGGCGGGC GGCGTCGTGG TGACGACGAT GCCGCTGCTG 
CGCGCGGGCG AGCTGTCGAA AGTCATCGCG CAGGCGCAGG TCACGCACGC GCTGTGCGAG 
GCGGCGGTGT CCGCCGAGTT GCGCGCCGCG ATGGCGGCGG CGCCGGGCGT CGCGTTCGTG 
CGGTACTACG AGACCGACGA CGCGGCCGCG TTCGAGCCGC TGCTGCACGC GTGCCCGCGC 
ACGTTCGAGC CGGTCGATAC GCGCGCCGAC GAGCCGTGCA TCGTCGCGTT CACGTCGGGC 
ACGACGGGGC GCCCGAAGGC GACCGTGCAT TTTCATCGCG ACGTGATGGC GATCTGCCAT 
TGCTTTCCGC AGCACGTGCT GAAGCCGAAC GCCGACGACG TGTTCTGCGG CTCGCCGCCG 
CTCGCGTTCA CGTTCGGGCT CGGCGCGCTG CTGCTGTTTC CGCTGAGCGT CGGCGCGAGC 
GTCGTGCTGC TGCAGCGGGC GAAGCCGCAG CGGCTGCTCG CCGCGATCGG CGCGCATCGC 
GTGAGCATCC TCTTCACCGC GCCGGCCGCG TATCGCGCGA TGCTCGACGA GCTCGGCGCG 
CACGACATCG CCAGCCTGCG CAAGTGCGTG TGCGCGGGCG AGGCGCTGCC GGCGCCGACG 
CGCAACGCGT GGCTCGCGCG CACGGGCATT CGCATCATCG ACGGCATCGG CGCGACCGAG 
ATGCTGCACA TCTTCGCGTC CGCGGACGAA ACGCAGGCGA AGGAAGGCGC GATCGGCAAG 
GCGGTGCCCG GCTACCGGCT CGCGATCCTC GACGAGCGCG GCGAGCGCCT GCCGCCGTAT 
CACGTCGGCC GTCTCGCGGT GCAGGGGCCG ACCGGCTGCC GCTACCTGAA CGATGCGCGG 
CAGCGCGATT ACGTGCGGCA CGGCTGGAAC CTGACGGGCG ACGCCGCCTA CCTCGACGAG 
GACGGCTACC TGTTCTACCA GTCGCGCGCC GACGACCTGA TCATCAGCCT CGGCTACACC 
ATCTCGCCCG CCGAGGTGGA GGAGGCGCTG CTGAGCCACG CGGACGTGCT CGAGTGCGGT 
GTTGTCGGCG CGCCCGACGG GCGAGGCGGC ACGCTCGTGT GCGCGCACGT GGTGCCGCGG 
CCCGGCGTGC ACGGCTGCGA TGCGCTGACG GCCGCGTTGC AGCAGCACGT GAAGGCGCGG 
ATCGCGCCGT ACAAGTATCC GCGGCGCATC GAGTATCACG CGGCCGGGCT GCCGCGCAAC 
GATTCCGGCA AGCTGCAGCG CTTCAAGCTG CGGCAGGCGG CCGAGGAAGA CGTGCAGGCG 
GCCTGA

Protein sequence

MDNFCRTNLP APTDLPEFVF ELPGLQYPAR INCAAALLDD AVTRRGWGER VAIRTESGAA 
WSYRALFELS NRIANLLVRD GGLVPGNRVL LHGTNHPFLA AAWFAIVKAG GVVVTTMPLL 
RAGELSKVIA QAQVTHALCE AAVSAELRAA MAAAPGVAFV RYYETDDAAA FEPLLHACPR 
TFEPVDTRAD EPCIVAFTSG TTGRPKATVH FHRDVMAICH CFPQHVLKPN ADDVFCGSPP 
LAFTFGLGAL LLFPLSVGAS VVLLQRAKPQ RLLAAIGAHR VSILFTAPAA YRAMLDELGA 
HDIASLRKCV CAGEALPAPT RNAWLARTGI RIIDGIGATE MLHIFASADE TQAKEGAIGK 
AVPGYRLAIL DERGERLPPY HVGRLAVQGP TGCRYLNDAR QRDYVRHGWN LTGDAAYLDE 
DGYLFYQSRA DDLIISLGYT ISPAEVEEAL LSHADVLECG VVGAPDGRGG TLVCAHVVPR 
PGVHGCDALT AALQQHVKAR IAPYKYPRRI EYHAAGLPRN DSGKLQRFKL RQAAEEDVQA 
A