Gene BURPS668_3558 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3558
Symbol	trpD
ID	4884887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	3491202
End bp	3492233
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	68%
IMG OID	640129486
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_001060563
Protein GI	126441656
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.701795
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGATCA CTCCCCAGGA AGCGCTGCAG CGCACGATCG AGCACCGCGA GATCTTCCAC 
GACGAGATGC TGCACCTGAT GCGGCTCATC ATGCGCGGCG ACATGTCGCC CGTGATGGCG 
GCCGCGATCA TCACCGGCCT GCGCGTGAAG AAGGAGACGA TCGGCGAGAT CGCCGCCGCC 
GCCACGGTGA TGCGCGAGTT CGCGCGCCGC GTCGAGGTGG AGGACAACGC GAATTTCGTC 
GACATCGTCG GCACGGGCGG CGACGGCTCG CACACGTTCA ACATCTCGAC CGCGACGATG 
TTCGTCGCGG CGGCGGCGGG CGCGAAGGTC GCGAAGCACG GCAACCGCGG CGTGTCGAGC 
AAATCGGGCA GCGCCGACGT GCTCGAGGCG CTCGGCGTGA ACATCGACCT GCAGCCCGAG 
CAGGTGGCCG CGTCGATCGC CGAAACGGGG ATGGGCTTCA TGTTCGCGCC GAACCATCAT 
CCGGCGATGC GCAACATCGC GCCCGTGCGC CGCGAGCTCG GCGTGCGGAC GATCTTCAAC 
ATCCTCGGCC CGCTCACCAA CCCGGCGGAC GCGCCGAACC AGTTGATGGG CGTGTTCCAC 
CCCGATCTCG TCGGCATCCA GGTGCGCGTG ATGCAGCGGC TCGGCGCGCA GCACGTGCTC 
GTCGTCTACG GCAAGGACGG GATGGACGAG GTGTCGCTCG GCGCGGCGAC GCTCGTCGGC 
GAGCTGCGCG ACGGCGAAGT GCGCGAGTAC GAGATCCACC CGGAGGACTT CGGGATGCAG 
ATGGTGTCGA ACCGCACGCT GAAGGTCGAG AGCGCCGACG AATCCCGCGT GATGCTGCTC 
GAGGCGCTCG GCAACAAGCC GGGCGTCGCG CGCGAGATCG TCACGCTGAA CGCGGGCACC 
GCGCTTTATT CGGCGGACGT CGCGGGCTCG ATCGCCGACG GCATCCAGCT CGCGCGCGAC 
GCGATCGCAA GCGGGCGCGC ACGCGAAAAA GTCGACGAGC TCGTGCGCTT CACGCAGCAG 
TTCAAGCGCT GA

Protein sequence

MTITPQEALQ RTIEHREIFH DEMLHLMRLI MRGDMSPVMA AAIITGLRVK KETIGEIAAA 
ATVMREFARR VEVEDNANFV DIVGTGGDGS HTFNISTATM FVAAAAGAKV AKHGNRGVSS 
KSGSADVLEA LGVNIDLQPE QVAASIAETG MGFMFAPNHH PAMRNIAPVR RELGVRTIFN 
ILGPLTNPAD APNQLMGVFH PDLVGIQVRV MQRLGAQHVL VVYGKDGMDE VSLGAATLVG 
ELRDGEVREY EIHPEDFGMQ MVSNRTLKVE SADESRVMLL EALGNKPGVA REIVTLNAGT 
ALYSADVAGS IADGIQLARD AIASGRAREK VDELVRFTQQ FKR