Gene BURPS1106A_A2733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2733
Symbol
ID	4905969
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2665466
End bp	2667082
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	64%
IMG OID	640145836
Product	tryptophan halogenase PrnA
Protein accession	YP_001076763
Protein GI	126455699
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAACC CGATCCAGAA TATCGTCATC GTGGGCGGCG GCACCGCGGG CTGGATGGCC 
GCCTCGTACC TTGTCCGGGC GCTCCAACAG CAGGCGAACA TTACGCTCAT CGAGTCCGCG 
GCGATCCCCC GGATCGGCGT GGGCGAGGCG ACCATCCCGA GTCTGCAGAA GGTGTTCTTC 
GACTTCCTCG GGATTCCGGA GCGGGAGTGG ATGCCCCAGG TGAACGGCGC GTTCAAGGCC 
GCCATCAAGT TCGTGAACTG GAGGAAGTCT CCCGACCGCT CGCGCGACGA TTACTTCTAC 
CATTTGTTCG GCAGCGTGCC GAACTGCGAC GGCGTGCCGC TTACCCACTA CTGGCTGCGC 
AAGCGCGAAC AGGGCTTCCG GCAACCGATG GAGTACGCCT GCTACCCGCA GCCCGAGGCG 
CTCGACGGCA AGCTGGCACC GTGCCTGCCC GACGGCACCC GCCAGATGTC CCACGCGTGG 
CACTTCGACG CGCACCTGGT GGCCGACTTC CTGAAGCGCT GGGCCATCGA ACGCGGGGTG 
AACCGCGTGG TCGACGAGGT CGTGCAGGTT CACCTGAACG AGCGCGGCTA CATCTCCAGC 
CTGTCCACCC AGGAGGGGCG AACGCTGGAG GCGGACCTGT TCATCGACTG CTCCGGCATG 
CGAGGGCTCT TGATCAACCA GGCCCTGAAG GAGCCCTTCA TTGACATGTC CGACTACCTG 
CTGTGCGACA GCGCGGTCGC GAGCGCCGTG CCCAACGACG ACGCGCGCGT GGGGGTCGAG 
CCGTACACCT CCGCGATCGC CATGAACTCG GGATGGACCT GGAAGATTCC GATGCTGGGC 
CGGTTCGGCA GCGGCTACGT CTTCTCGAGC AAGTTCACCT CGCGCGACGA GGCCACCGCC 
GACTTCCTCA ATCTCTGGGG TCTCTCGGAC AAGCAGCCGC TCAACCAGAT CAAGTTCCGG 
GTCGGGCGCA ACAGGCGGGC GTGGGTCAAC AACTGCGTCG CCATCGGGCT GTCGTCGTGC 
TTTTTGGAGC CGCTGGAATC GACGGGAATC TATTTCATCT ACGCGGCGCT TTACCAGCTC 
GTGAAGCACT TCCCCGACAC CTCGTTCGAT CCTCGGTTGA CCGACGCGTT CAACGCCGAG 
ATCGTCTACA TGTTCGACGA CTGCCGAGAT TTCGTCCAGG CGCACTATTT CACCACGTCG 
CGCGAAGACA CACCGTTCTG GCGCGCGAAC CGGCACGACC TGCGGCTCTC GGACGCCATC 
AAAGAGAAGG TTCAGCGCTA CAAGGCGGGG CTGCCGCTGA CCACCACGTC GTTCGACGAT 
TCCACTTACT ACGAGACGTT CGACTACGAA TTCAAGAACT TCTGGTTGAA CGGAAACTAC 
TACTGCATCT TTGCCGGCTT GGGGCTACTG CCCGACCGAT CGCTGCCGCT CTTGCGGCAC 
CGATCGGAGT CGATCGACAA GGCCGAGACG ATGTTCGCCC GCATCCGGCG CGAGGCCGAG 
CGCCTGCGAA CGAGCCTGCC GACGAACTAC GACTACCTGC GCTCGCTGCG TGAGGGCGAC 
GTGGGGCTGT CTCGCAGCCG GCCCGGGCCG ACGCTCGCGG CACCGGAAAT CCTGTAG

Protein sequence

MSNPIQNIVI VGGGTAGWMA ASYLVRALQQ QANITLIESA AIPRIGVGEA TIPSLQKVFF 
DFLGIPEREW MPQVNGAFKA AIKFVNWRKS PDRSRDDYFY HLFGSVPNCD GVPLTHYWLR 
KREQGFRQPM EYACYPQPEA LDGKLAPCLP DGTRQMSHAW HFDAHLVADF LKRWAIERGV 
NRVVDEVVQV HLNERGYISS LSTQEGRTLE ADLFIDCSGM RGLLINQALK EPFIDMSDYL 
LCDSAVASAV PNDDARVGVE PYTSAIAMNS GWTWKIPMLG RFGSGYVFSS KFTSRDEATA 
DFLNLWGLSD KQPLNQIKFR VGRNRRAWVN NCVAIGLSSC FLEPLESTGI YFIYAALYQL 
VKHFPDTSFD PRLTDAFNAE IVYMFDDCRD FVQAHYFTTS REDTPFWRAN RHDLRLSDAI 
KEKVQRYKAG LPLTTTSFDD STYYETFDYE FKNFWLNGNY YCIFAGLGLL PDRSLPLLRH 
RSESIDKAET MFARIRREAE RLRTSLPTNY DYLRSLREGD VGLSRSRPGP TLAAPEIL