Gene Elen_0639 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0639
Symbol
ID	8414929
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	815580
End bp	816866
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	63%
IMG OID	645023616
Product	GCN5-related N-acetyltransferase
Protein accession	YP_003181013
Protein GI	257790407
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1670] Acetyltransferases, including N-acetylases of ribosomal proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.621487
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.635347
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTCAT GTGCTCAGAT GCCTTTCACT CACAGCGCTT ACAGGAACAT GCTTCAGATC 
CTGAAAGAAC GGGGGTACGG GTTCTGCGGG TACGGCGATT GGGGAGGTGT TGGGAAGCCT 
GTCATTTTGC GGCACGACAT CGACTTCGAT CCGATCGCAG CGCTCGCGAT GGCCGAGCTC 
GAATCGAGCG AGGGCGTCCG ATCGACGTAT TTCGTGCTCT TGCGAACGGA TTTCTACAAC 
CCTCTAGAGC GCGGAAACGT CGAGAGGCTT CGAGAGATCG CGAGGCTCGG CCACGACATC 
GGGCTCCATT ACGACGAAAC GCAGTACGAG GACGGCGACG ACGCGATCGC CGCGATCCAA 
CGCGAGGCGG ACACGCTGGG GGGCGCCCTC GGCCTGCCCA TCGAATGCGT TTCCATGCAC 
CGTCCGAGCA AGGCGTCGCT CGAAGCGCAG TGGAGCATCC CCGGCATCGT CAACAGCTAT 
TCGAGCGAGT TCTTCCAGGG CTTCGAATAC GCTTCGGACA GCCGGAGGCG GTGGCGCAAG 
CCCATTTTGG ACATGATCGA GTCCGGGAAG TATCCGCGCC TGCATATCTT GACCCATCCG 
TTCTGGTACG GCGGGACGGA GGCCTCGCTC GAGGAATCTC TACGGCGGTT CATAGAAAGG 
GCGGGCGCCG ATCGCCTGGG CAGCCTCGAT CGCAACTTTA CCGGGCTCGA CTCCGTGCTC 
GGCCCTGCGG ACGTCCTTTC CGCCCGCCTC GCTTCCCTGC GCAATGAGCG GTTTGGGACT 
GAAAGGCTCG TCTTGCGTCC CTTGCGGCTG GAGGATGCTG CCGACATGTT CGAATACACG 
TCGGACCCCG AGATAAGCAG ATTCCTGAAT TGGGCACCCC ATGGCGAACC CGGGGAGGCG 
CGGGATTGGA TAGCCTCCAA GCTCGCCCGA CCGGAGCCGG ACGACCTGCT GCTCGGCATA 
GAGCTCCGCG AGCCTCGCAA GCTCATCGGC ACCGTGCGCG CCTACCGCTT CGATGCCGCC 
GCCTGCTCCT GCGAGGTGTC TTACGCGCTC AACTCCGCCT TCCAGGGCTG CGGCTACATG 
GGAGAAGCTC TGGGAAAGCT CGCCGACATC TGCTTCGACG AGGTGCGCGT GGGCAGGATT 
GTCGCCCGCA TCGACGAGGA GAACGCCGCC TCGGCGCACG TTGCCCGCCG CCTGGGCATG 
AAGCGCGTCC GTGACGGGGA CTTCGTGGTT CCGATCAAGG GCGAGGAGCG GATCCAGCAC 
ACCTACGTTC TCGGAAGGAG GCCGTGA

Protein sequence

MPSCAQMPFT HSAYRNMLQI LKERGYGFCG YGDWGGVGKP VILRHDIDFD PIAALAMAEL 
ESSEGVRSTY FVLLRTDFYN PLERGNVERL REIARLGHDI GLHYDETQYE DGDDAIAAIQ 
READTLGGAL GLPIECVSMH RPSKASLEAQ WSIPGIVNSY SSEFFQGFEY ASDSRRRWRK 
PILDMIESGK YPRLHILTHP FWYGGTEASL EESLRRFIER AGADRLGSLD RNFTGLDSVL 
GPADVLSARL ASLRNERFGT ERLVLRPLRL EDAADMFEYT SDPEISRFLN WAPHGEPGEA 
RDWIASKLAR PEPDDLLLGI ELREPRKLIG TVRAYRFDAA ACSCEVSYAL NSAFQGCGYM 
GEALGKLADI CFDEVRVGRI VARIDEENAA SAHVARRLGM KRVRDGDFVV PIKGEERIQH 
TYVLGRRP