Gene Gdia_0158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0158
Symbol	trpD
ID	6973550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	172733
End bp	173863
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	69%
IMG OID	643389692
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_002274573
Protein GI	209542344
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.523516
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0330567
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGGCG TGCCGTCCCT GTCTGCCGAC CAAGCGGGTG CGTTCCGGAC CATCCTGAAC 
CGCCTGGCGC GGGGCGAAAC ACTGACTGAA ACCGAGGCCG AGGACGCGTT CGGCCTGATC 
ATGGACGGCG GCGTGCCCGA CACGCTGATC GCCGCCTTCC TGATGGCGTT GCGGGTCCGG 
GGTGAGAAGC GCGCGGAACT GCTGGGCGCG GTGCGCGCCG TGCGGTCACG CATGCGGGCG 
GTCGGCCCCG TTCCTCCGGG CACGATCGAT GTCTGCGGCA CGGGCGGCGA CGGCCTGGGC 
ACACTGAATA TTTCGACCGC CGTCGCCTTC GTCCTGGCCG CGCTGGGTGT TCCGGTCGCC 
AAGCATGGCA ACCGGGCCCT GTCGTCGCGT TCCGGCGCGA CCGACGTGCT GGGCGCGCTG 
GGCGTGGATC TGTCGGACGA CCCGTCGGTG ATCGCCGCGC GGATCAATGA CGGAAACCTG 
GCTTTCATGG CGGCGCCGGC GCACCATCCG GCCATGCGCC ATGCCGGACC GGTGCGGGCC 
GCGCTGGGAA TCCGCACGCT GTTCAACCTG ATCGGCCCCT TGTGCAATCC GGCCGGCGTC 
ACACATCAAC TGGTCGGTGT GTTCGATCCG GCATGGCTGC GCCCGGTGGT GGAGACGTTG 
CAGCTTCTGG GGTCGGAGCG CGTGTGGGCC GTGCATGGCT ATTGCGAAGG CGCGACGGGC 
GGCCGGGGCG TGGACGAACT GACGCTGGCC GGTCCTACCG CGATCGTGGC GTTGCAGAAC 
GGACGGATTT ACGACCTGAC GTTGCGGCCC GAGGATGCGG GCCTGCGCCC CGCGCCGATC 
ACGGCGATCG CGGGTGGCGG GGCGGAGGAA AATGCGGCGG CCCTTACGGC TTTGCTGGCG 
GGCGCCCATG GAGCCTATCG CGATACCGTG CTGCTGAACG CGGCGGCCTG CCTGCATGTG 
GCGGGACGCG GTGCGGCACT GGATGACGAT GGGAGATTGA GACCGGCGTC GCTACGGGCG 
CTGGTGGCGG ATGCGGCCCG CGTGCTGGAT GACGGATCGG CCCTGGCCAT GCTGAATTCC 
GCGCGCCGTC GCCACATGGA TACGCCGGAG GGGATTACAC AAAGCTTATG A

Protein sequence

MDGVPSLSAD QAGAFRTILN RLARGETLTE TEAEDAFGLI MDGGVPDTLI AAFLMALRVR 
GEKRAELLGA VRAVRSRMRA VGPVPPGTID VCGTGGDGLG TLNISTAVAF VLAALGVPVA 
KHGNRALSSR SGATDVLGAL GVDLSDDPSV IAARINDGNL AFMAAPAHHP AMRHAGPVRA 
ALGIRTLFNL IGPLCNPAGV THQLVGVFDP AWLRPVVETL QLLGSERVWA VHGYCEGATG 
GRGVDELTLA GPTAIVALQN GRIYDLTLRP EDAGLRPAPI TAIAGGGAEE NAAALTALLA 
GAHGAYRDTV LLNAAACLHV AGRGAALDDD GRLRPASLRA LVADAARVLD DGSALAMLNS 
ARRRHMDTPE GITQSL