Gene Oant_2049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Oant_2049
Symbol	trpD
ID	5380980
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ochrobactrum anthropi ATCC 49188
Kingdom	Bacteria
Replicon accession	NC_009667
Strand	-
Start bp	2142932
End bp	2143951
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	58%
IMG OID	640834717
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_001370594
Protein GI	153009379
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.349859
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGATC TAAAACCCTA TATCGCGAAA GCTGCATCAG GCGAACCGCT TTCGCTTGAG 
GATTCCCGAG CCGCCTTCGA TATCATGATG TCAGGACAGG CAACGCCGTC GCAGATCGGC 
GGACTGTTGA TGGCGTTGCG CGTACGCGGT GAAACAGTAC CGGAAATCGC CGGTGCCGTT 
GCCTCCATGC GCTCGCGTAT GCTGGGAGTT TCCGCTCCCA ACAATGCCAT TGATATTGTT 
GGCACTGGTG GCGATCAGTC GGGTTCATAC AATGTCTCCA GCTGCTCGGC GTTTGTTGTT 
GCTGGAGCTG GCGTTCCTGT AGCAAAACAT GGCAACCGCG CCCTCTCCTC CCGCTCTGGT 
GCAGCCGATG CACTCGCGGC GCTCGGCATC AATATCGAGG CCGACGCGAG CATCATCGGT 
CGCAGCATCA CAGAAGCTGG CCTCGGCTTC ATGTTTGCAC CGATGCACCA TTCCGCCATG 
CGCCATGTCG GCCCCTCGCG CGTAGAACTC GGCACCCGCA CCATCTTCAA TCTGCTTGGC 
CCCCTCTCCA ATCCGGCCAG TGTCAAGCGT CAGCTTGTGG GGGTATTCGC ACCACAATGG 
CTTGTGCCGC TGGCTGAAGT GCTCAAGGAA CTCGGTTCCG AAGCGGCCTG GGTTGTCTAT 
GGCGACGGCC TCGATGAAAT GACCACCGCG GGAACGACAC AAGTTGCCGC CCTCGAAAAC 
GGTCGGATTC GTACCTTTGA AATTACGCCG GAAGAAGTTG GATTGCGTCG TTGCGACCCG 
GCCGAACTGA AAGGTGGCGA GGCTGCGGTA AACGCCAAGG CTCTGCTGGG CGTGCTTGAA 
GGCGAGAAAA ACGCCTATCG AGACATCGTC CTGCTCAATT CAGGCGCGGC GCTTGTGATT 
GCTGGCAACG CGAAGGACCT GAAAGAAGGC ATCGCACTCG CGGCACAATC CATCGACAGC 
GGCGCAGCAC TTGATGTTTT GCAGAAGGTG ATTGCCGTTT CCAACGACAA AGCCGCCTGA

Protein sequence

MADLKPYIAK AASGEPLSLE DSRAAFDIMM SGQATPSQIG GLLMALRVRG ETVPEIAGAV 
ASMRSRMLGV SAPNNAIDIV GTGGDQSGSY NVSSCSAFVV AGAGVPVAKH GNRALSSRSG 
AADALAALGI NIEADASIIG RSITEAGLGF MFAPMHHSAM RHVGPSRVEL GTRTIFNLLG 
PLSNPASVKR QLVGVFAPQW LVPLAEVLKE LGSEAAWVVY GDGLDEMTTA GTTQVAALEN 
GRIRTFEITP EEVGLRRCDP AELKGGEAAV NAKALLGVLE GEKNAYRDIV LLNSGAALVI 
AGNAKDLKEG IALAAQSIDS GAALDVLQKV IAVSNDKAA