Gene A2cp1_4033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A2cp1_4033
Symbol
ID	7297375
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter dehalogenans 2CP-1
Kingdom	Bacteria
Replicon accession	NC_011891
Strand	-
Start bp	4496072
End bp	4497520
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	77%
IMG OID	643596840
Product	para-aminobenzoate synthase, subunit I
Protein accession	YP_002494417
Protein GI	220919113
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00553] aminodeoxychorismate synthase, component I, bacterial clade

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.151682
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCGCCC CGCGCGCGGT GACCTTCCAG GCGGCGGTCG AGGCGCTCGA GCTCGGCGTC 
GAGGGCTTCG AGCGGTGCGT GGACGCGCTC CGGCGCAGGC CCGGGCTCGT GCTCCTCGAC 
AGCCGCGCGG TGGACGGCCG CCTGGGGCGG TTCTCGTTCG CCTGCTTCGA TCCGTTCGCG 
ACGCTGGTGG CGCGCGACGG CCAGGTCGAG CTGCGACGCT GGACCGGCGA GCGGGCCACC 
CTCCGCGGCA AGGTGCTCGA CGTCGTCGAA CGGCTCCTCG CGGCGCACCG CCTCGAGGTG 
GACGCGGGCG GGCTTCCCGC GCCGTTCGTG GGCGGGGCCG CCGGTTACCT CGGGTACGGG 
CTCGCGGGTG AGCTGGAGCG CCTGCCACGC GCCGCGCGCG ACGCGAGCGG CGCCCCGGAC 
GCCGTGCTCG GCCTCTACGA TCGCGTGCTC GTGCTCGATC GCGGCGCGGG CCGGGCGTAC 
CTCGCCTGCC TCGCCTCGCC CGACCTCCCG GGCCGCGCGC CCCTCGGCGA GGTCCGGCGC 
GCGGTGCTCG AGGCTGCGCG GCGGGGCACC GCGCCCGACG ACGCGGCGCC GGACGACGCG 
GCGCCGGACG AGCCGCTCTC GCGCGACCTG ACGCGCGACG CGTACCTCGC GGCGGTGCGG 
CGCATCCAGG ACCACGTCGC CGCCGGCGAC GCGTACCAGG TGAACTTCAC CGGGCGGTGG 
TTCGCGCCGG CGCGCGGGCG CGATCCCTGG GCGCTCCACC GCCGCCTCAT GCGGCTCAAC 
CCGGCGCCCT TCGCGGCCTG GCTCGGCTTC GACGCCGTGC AGGTGTCGTG CGCCTCCCCG 
GAGCGCTTCC TGCGGGTGGA CGGCGCCGAG GTGGAGACGC GGCCGATCAA GGGGACCGCG 
CCACGCGGGG CGACGCCGGA GGAGGACGCG CGCCTGCGGG CGGCGCTGCT CGCGAGCGCG 
AAGGACCGCG CCGAGCTGGC CATGATCGTG GACGTGGCGC GGAACGACCT CGGGCGCGTG 
TGCGCGCCCG GCTCGGTGCG GGTGGACGCG TTCCCCGAGG TCGAGCGCCA CCCCTCGGTC 
CACCACCTCG TCGCGACCGT GCGCGGCCGG CTCGCGCCCG GACGCGGCGT CTGCGACCTC 
CTGCGCGCCG CGTTCCCCGC CGCCTCGATC ACCGGCGCGC CCAAGATCCG CGCCATGGAG 
ATCGTGGACG AGCTGGAGCC GGTCGCGCGG GGCGTGTACA CCGGCAGCAT CGGCTACCTC 
GGCTTCCAGG GCACCGCGGA CCTGAACGTC GCCATCCGCA CGATCGTCGT CGCGGGCGGC 
CACGTGCACC TGCACGCCGG CGGCGGCATC GTGGCCGACT CCGTGCCCGA GGCGGAGCAC 
GGCGAGGCGG AGCTGAAGGC GCGCAACCTC ATCCGCGCCG TCGCGAGCTG GCACGAGGTG 
GCGAGGTGA

Protein sequence

MLAPRAVTFQ AAVEALELGV EGFERCVDAL RRRPGLVLLD SRAVDGRLGR FSFACFDPFA 
TLVARDGQVE LRRWTGERAT LRGKVLDVVE RLLAAHRLEV DAGGLPAPFV GGAAGYLGYG 
LAGELERLPR AARDASGAPD AVLGLYDRVL VLDRGAGRAY LACLASPDLP GRAPLGEVRR 
AVLEAARRGT APDDAAPDDA APDEPLSRDL TRDAYLAAVR RIQDHVAAGD AYQVNFTGRW 
FAPARGRDPW ALHRRLMRLN PAPFAAWLGF DAVQVSCASP ERFLRVDGAE VETRPIKGTA 
PRGATPEEDA RLRAALLASA KDRAELAMIV DVARNDLGRV CAPGSVRVDA FPEVERHPSV 
HHLVATVRGR LAPGRGVCDL LRAAFPAASI TGAPKIRAME IVDELEPVAR GVYTGSIGYL 
GFQGTADLNV AIRTIVVAGG HVHLHAGGGI VADSVPEAEH GEAELKARNL IRAVASWHEV 
AR