Gene Anae109_1629 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_1629
Symbol
ID	5374283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	+
Start bp	1832112
End bp	1833773
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	77%
IMG OID	640843138
Product	para-aminobenzoate synthase, subunit I
Protein accession	YP_001378817
Protein GI	153004492
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0115] Branched-chain amino acid aminotransferase/4-amino-4-deoxychorismate lyase [COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00553] aminodeoxychorismate synthase, component I, bacterial clade

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.810406
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.772192
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGACCG ACGACCCCGC CCGCGTCCGG GCCGCCCTCG CGGAGGTCGA AGGCGAGGCG 
CGCCGCGGTC GATGGGCGGC TGGGTACGTG GCCTACGAGG CTGCGACCGG GCTCGAGCCC 
GCGCTCGCCG TCCGCGGCCG CTCGGGACCG CTCTTGTGGT TCGGCATCCA CGACGCGCCG 
GCGAACCCAT CGGCGCCGGC CGCGGGGGCG ATCGCGGGAG CGCGCGTCGG GGCGCTCGCG 
CCGGAGGTCA CGCGCGCAGA GCACGTCGCC GGAGTGGAGA CGGTGCGCGC CGCGCTGGGA 
CGCGGGGACG CCTACCAGGT GAACCTGACC TTCCGCATGC GCGGGAGCTT CGACGGCGAT 
CCCTTCGCGC TGCACGAGCG GCTCCGCGGC GCGCAGGGCG GCGGGTACAC CGGCTGCCTC 
GTCGTGGACG GGCGCGCGGT GGTGTCCGCG TCGCCCGAGC TGTTCTTCCT CCGGCGCGGA 
GACGCGATCC TCGTCCGGCC GATGAAGGGG ACCGCCCGGC GCGGCCGGAC CCTCGCCGAG 
GACGAGCGTG CGGCGAAGAC GCTGGCGGCC TCGCCGAAGG AGCGCGCCGA GAACGTCATG 
ATCGTCGACC TGCTCCGCAA CGACCTCGGC CGCGTCGCGC GAACCGGCTC GGTGCGGGTG 
GCCGAGCTGT TCACGGTCGA GCGCTACCGG ACGGTGCTGC AGCTCACCTC GACCGTCGAG 
GCGCGCCTCG CTCCCGCGGT CGGCCTCGCC GAGCTCTTCG CGGCCCTGTT CCCGTGCGGC 
TCGGTCACGG GGGCGCCGAA GATCGCGGCG ACGCGGATCA TCGCGGCGCT GGAGCGGAGC 
CCGCGCGGCC CGTACTGCGG CGCCCTCGGC GTCGTGGCGC CGGGCGGCGA CGCGGTGTTC 
AACGTGGCGA TCCGCACGCT CGACCTCGAC CTCGAGCGCG GCCTGGCGAC CTACGGCGTC 
GGCGGCGGCA TCACCTGGGG CTCGGATCCC GGGCGCGAGT GGGACGAGGC GATGGCGAAG 
GCCGAGGTGC TCGCCGAGCC GGCGGAGGAC CTCGAGCTGC TCGAGACCCT CCGCCTGGAG 
CGGGGCGTCT ACGCGCGGCT CGACCGGCAC CTGGCCCGGC TCGAGGCGTC GGCGCGCTAC 
TTCGGGATCC CCGTGGACCT CGCGGCGGTG CGAGCGGCCC TCGACGCGGA GGCGCGGAGC 
GCGCCCGCCG AAGGGGCGCG CGTCCGGCTC CTCGTCGGGG CCGACGGACG GCCGCGGACG 
GAGTCGGCGG CGCTCCCGGC GGCGTCGGCG GAGCCGCTGC CGGTGGCGCT CGCGCGGGCC 
CCCGTCGATC GCGCGGATCG GCTCCTCTTC CACAAGACCA CGCGCCGCGC GGTGTACGAC 
GCCCGGCGCG CCGAGCGGCC CGACGTCTTC GACGTGCTGC TCTCGAACCG CGAGGGCGAG 
CTGACCGAGC TCACCATCGG CAACCTCGTC GTCGAGCTCG GCGGCGAGCG GCTCACCCCG 
GCCCTCGACT CGGGCCTGCT CGCCGGGACC CTGCGCGCGG AGCTGCTCGA GCGGGGAGAG 
GTTCGCGAGG CCGTGCTGCG CGTCGCCGAC CTCGAGCGCG CCGCGCGGCT GTGGCTCGTG 
AACTCGCTGC GGGGGTGGGT GCCGCTCCGG CTGGTCCGGT GA

Protein sequence

MATDDPARVR AALAEVEGEA RRGRWAAGYV AYEAATGLEP ALAVRGRSGP LLWFGIHDAP 
ANPSAPAAGA IAGARVGALA PEVTRAEHVA GVETVRAALG RGDAYQVNLT FRMRGSFDGD 
PFALHERLRG AQGGGYTGCL VVDGRAVVSA SPELFFLRRG DAILVRPMKG TARRGRTLAE 
DERAAKTLAA SPKERAENVM IVDLLRNDLG RVARTGSVRV AELFTVERYR TVLQLTSTVE 
ARLAPAVGLA ELFAALFPCG SVTGAPKIAA TRIIAALERS PRGPYCGALG VVAPGGDAVF 
NVAIRTLDLD LERGLATYGV GGGITWGSDP GREWDEAMAK AEVLAEPAED LELLETLRLE 
RGVYARLDRH LARLEASARY FGIPVDLAAV RAALDAEARS APAEGARVRL LVGADGRPRT 
ESAALPAASA EPLPVALARA PVDRADRLLF HKTTRRAVYD ARRAERPDVF DVLLSNREGE 
LTELTIGNLV VELGGERLTP ALDSGLLAGT LRAELLERGE VREAVLRVAD LERAARLWLV 
NSLRGWVPLR LVR