Gene AnaeK_3994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	AnaeK_3994
Symbol
ID	6785464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. K
Kingdom	Bacteria
Replicon accession	NC_011145
Strand	-
Start bp	4505387
End bp	4506868
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	77%
IMG OID	642765463
Product	para-aminobenzoate synthase, subunit I
Protein accession	YP_002136328
Protein GI	197124377
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00553] aminodeoxychorismate synthase, component I, bacterial clade

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.906481
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTCGCTC CGCGCGCGGT GACGTTCCGG GCCGAGGTCG AGGCGCTCGA CCTCGGCGTC 
GAGGGGTTCG AGCGGTGCGT GGACGCGCTG CGGCGCCGGC CCGGGCTCGT CCTCCTCGAC 
AGCCGCGTGG TGGACGGGCG CCTGGGCCGG TTCTCGTTCG CCTGCTTCGA GCCGTTCGCG 
ACGCTGATCG CCCGCGACGG CCGGGTGGAG CTGCGGCGCT GGACCGGCGA GCGGGACACC 
CTCCGCGGCA AGGCGCTCGA CGTCCTCGAG CGGCTCCTCT CGGCGCACCG CCTCGAGGTG 
GACGCGGGCG GGCTGCCCGC GCCGTTCGTG GGCGGGGCCG CCGGCTACCT CGGGTACGGG 
CTCGCCCGCG AGCTGGAGCG TCTCCCGCGC GCCGCCCGCG ACGCGTCCGG CGCGCCCGAC 
GCCGTGCTCG GCCTCTACGA TCGCGTGCTC GTCCTCGATC GCGTGGCGCG CCGCACGCAC 
CTCTCGTGCC TCGCGTCCCC CGACCTCCCC GGCCGCGCGC CCTTCGACGA GGTGCGGCGC 
GCGGTGCTCG AGGCCGCGCG GCAGGGCACC GCGGCGGTGG ATGCCGCGCC GGAGCCGTCG 
CGCGCGGGAG GCGAACCGGT CGAGCCGGTC GAGTCGGACG AGGAGCCGCT GCTGCGCGAC 
CTGACGCGCG AGGCGTACCT CGCGTCGGTG CGGCGCATCC AGGACTACGT CGCCGCCGGC 
GACGTGTACC AGGTGAACTT CACCGGGCGC TGGTTCGCGC CGGTGCGCGG GCGCGATCCC 
TGGGCGCTCC ACCGCCGCCT CATGCGGCTC AACCCGGCGC CGTTCGCCGC CTGGCTCGGG 
TTCGACGCGG TGCAGGTGTC GTGCGCCTCG CCGGAGCGCT TCCTGCGCGT GGACGGCGCC 
GAGGTGGAGA CCCGGCCCAT CAAGGGGACC GCGCCCCGCG GGCGGACGCC GCAGGACGAC 
GCGCGCCTGC GCGCGGCGCT GCTCGCGAGC GCGAAGGACC GCGCCGAGCT GGCGATGATC 
GTGGACGTCG CGCGCAACGA CCTCGGGCGC GTGTGCACCC TCGGCTCGGT GCGGGTGGAC 
GCGTTCCCGG AGGTCGAGCG CCACCCTTCG GTCCACCACC TCGTCGCCAC GGTGCGCGGC 
CGGCTCGCGC CCGGGCGCGG CGCCTGCGAC CTCCTGCGCG CCGCGTTCCC CGCCGCGTCC 
ATCACCGGCG CGCCCAAGAT CCGGGCCATG GAGATCGTGG AGGCGCTGGA GCCGGTCGCG 
CGGGGCGTGT ACACCGGCAG CATCGGCTAC CTCGGCTTCC AAGGCACCGC GGACCTGAAC 
GTCGCCATCC GCACCCTCGT GGTCGCGGGC AGCGCCGTCC ACCTCCACGC CGGCGGCGGC 
ATCGTGGCGG ACTCCGTGCC GGAGGCCGAG CACGACGAGG CGGAGCTGAA GGCGCGCAAC 
CTCGTCCGCG CCGTGGCGGG CTGGCACGAG GTGGCGCGGT GA

Protein sequence

MLAPRAVTFR AEVEALDLGV EGFERCVDAL RRRPGLVLLD SRVVDGRLGR FSFACFEPFA 
TLIARDGRVE LRRWTGERDT LRGKALDVLE RLLSAHRLEV DAGGLPAPFV GGAAGYLGYG 
LARELERLPR AARDASGAPD AVLGLYDRVL VLDRVARRTH LSCLASPDLP GRAPFDEVRR 
AVLEAARQGT AAVDAAPEPS RAGGEPVEPV ESDEEPLLRD LTREAYLASV RRIQDYVAAG 
DVYQVNFTGR WFAPVRGRDP WALHRRLMRL NPAPFAAWLG FDAVQVSCAS PERFLRVDGA 
EVETRPIKGT APRGRTPQDD ARLRAALLAS AKDRAELAMI VDVARNDLGR VCTLGSVRVD 
AFPEVERHPS VHHLVATVRG RLAPGRGACD LLRAAFPAAS ITGAPKIRAM EIVEALEPVA 
RGVYTGSIGY LGFQGTADLN VAIRTLVVAG SAVHLHAGGG IVADSVPEAE HDEAELKARN 
LVRAVAGWHE VAR