Gene Saro_2023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2023
Symbol	trpD
ID	3917344
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2156671
End bp	2157663
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	69%
IMG OID	640444775
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_497296
Protein GI	87200039
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCTGC TCCCCGATCC CCAGCACCCG CTAGAGGAAG CCGAGGCCGA AGCCGCCTTT 
GCCGCGATTC TCGATGGCGC CGTGGCGGAT GAAGCCATCG CCCGGTTTCT CGTGGGCCTG 
TCCGACCGTG GCGAGAACGC CAGCGAGATC GCCGGCGCCG CCCGGGCCAT GCGCGCCCGG 
ATGATCCCGA TCAAGGCGCC CGCAAACGCC ATCGACGTCT GCGGCACCGG CGGCGACGGG 
CATCACACGC TCAACGTCTC CACCGCCGTC AGCCTCGTCG TCGCCGCCTG CGGCGTGCCC 
GTCGCCAAGC ACGGCAACCG CGCCGCCAGT TCCAAGGCCG GCGCCGCCGA TACCCTCGAA 
GCCCTGGGCC TCAATCTCGA CCGCGCCGCC GAAACCGCCG AAGAGACGTT GGCCGACCTC 
GGCATCTGCT TCCTCTTCGC CGCGCGTCAT CACCCGTCGA TGGGCCGTAT CATGCCCATC 
CGCAAGGCGC TCGGCCGCCG CACCATCTTC AACCTGATGG GGCCGCTCGC CAATCCCGCC 
AACGTGCGCC GCCAGCTCGT CGGCATCGCG CGTCCGGCCT ATGTCCCGAT CTATGCCGAA 
GCCATCCTGC GCCTCGGCAC CGATCACAGC TTCGTCATTT CCGGCGATGA GGGGCTCGAC 
GAACTGAGCC TTGCCGGCGG CAACGAACTG GCCGAAGTGC GCGACGGCGA AATCTCCATG 
CGCCGCGTAA CGCCTGCGGA CGCCGGCCTG CCCGAAAGCG CGGTCACCGC GATCCGTGGC 
GGCGACGCGG CCCATAACGC CCGCGCCCTG CGCGCCCTCC TCGAAGGCGA GCACGGTCCC 
TACCGCAACG CCGTGCTCTT CAACGCCGCC GCCGCGCTCA TCATCGCGGG CGAGGCGCAG 
GACTGGCACG AAGGCGTCGA GGAAGCAGCC GAAGCCATCG ACAAGGGCCT TGCCAACGCC 
CTTCTCAACT GCTGGATCGC CGCTCTCGAA TAG

Protein sequence

MTLLPDPQHP LEEAEAEAAF AAILDGAVAD EAIARFLVGL SDRGENASEI AGAARAMRAR 
MIPIKAPANA IDVCGTGGDG HHTLNVSTAV SLVVAACGVP VAKHGNRAAS SKAGAADTLE 
ALGLNLDRAA ETAEETLADL GICFLFAARH HPSMGRIMPI RKALGRRTIF NLMGPLANPA 
NVRRQLVGIA RPAYVPIYAE AILRLGTDHS FVISGDEGLD ELSLAGGNEL AEVRDGEISM 
RRVTPADAGL PESAVTAIRG GDAAHNARAL RALLEGEHGP YRNAVLFNAA AALIIAGEAQ 
DWHEGVEEAA EAIDKGLANA LLNCWIAALE