Gene Elen_0792 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0792
Symbol
ID	8415082
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	986727
End bp	988334
Gene Length	1608 bp
Protein Length	535 aa
Translation table	11
GC content	67%
IMG OID	645023758
Product	NLP/P60 protein
Protein accession	YP_003181155
Protein GI	257790549
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0791] Cell wall-associated hydrolases (invasion-associated proteins)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCG GCATCCGCGA GGTGGTCACG TCGGAAAAGG CCGACCTGCT GAACACCGGC 
ACGGTGAAGG ACGCGGAAGG GCAATCCGCG TCGACCTTGG CGCAAAGGGA AAGCGCCGCC 
ACGCAACGGC AGGCGGCGGC GCGGCCCGAT CCAGGCTGCG CCAAGCCCGC GGAGGGCAAG 
CGCGGCAAGT CTAAATGCGG CAAGGATCCC ATCGACGCAG ATCGGCACGC CGCAGACGTC 
GCCCGAAAGC CCGCCAAGCT CGAACGGGCG AAGGTCGAGG CGAAATCGGC GGCCATGTCG 
GCGCTCGTCG GAGAATTGGA CGATTCGGAG GAGCTTTCCG ACACGCAGCG CGTATACGAC 
GCGGCTCGTG CGGGAAAGAG GATCGCGGCG CGCGCGAAAG CCCGAAAGAG CTTAGGGCAA 
GAGGGCGGCA AGTCGAACGG CGCCGCAGCC CGAAGCCGTG TGCCGGGCGT GGGCGCGAAG 
ACGGGCAACG CCATATCCGC GGGAGCTTCG GCGCAGGGCG CGCCCGCCGC GATGGCGGCC 
CGGCCCGACG CCCAAATCCG GCTTGCCGCA GGAGCCGCGA AATCCTCGAC CGCAGCCACC 
GGCGCTGCCG GCGCCACAAC GGCCGCGCCC GCAGCGGGGA TCGTCGCCGG AATGCTCATG 
TTCGTCGTGA CGATGCTCGC CGTCAGCCAG ATCGCCGGCG CGCTCTTCGG GTTCTGGGAC 
AACGAGTCGA AGAAGCAGAG CCTCGCCGGC CTGCCGCCCT ACATCACCTA CGAGATGGTC 
GAGGCGGCGC TTGAGGCGCA AGAGGACTAC GGACATCCCG CCGGGTGCAC GATAGCCCAG 
ATCATCGTCG AATCGGGGCA AGGCGACCAC ATGAGCAGGC TCGCCACGCG CGACCACAAC 
CTGTTCGGGA TGAAATGGGC CCCTTCGTTC GCCGCGGCGC CCGAAGTCGC CGGCAAGGCG 
AACTGGGTCA CCGGCGAGGA GGTCGACGGT GCGCACGTGA CCATAACCGA CTCGTTCACG 
GTGTTCAAAT CGGACGCGGA CAGCATCAAG TTCAGGAGCC GCGTGTTCCT GGCTAGCTCG 
ACCTATTCGG GAAACGCCCT GATCGGGGAA GCTGTTTCCG AGCGGTCCTC CGACAAGATG 
GCGGAAGGCC TGAAAGACGC TGGCTGGGCG ACCGACTCGG CCTACGTCGA GAAGCTCAAG 
GCCGTGATGG ACCAATACGG GCTGCGCGCT TTCGACGCCA TGGCGCCCGG GGATCTGGCC 
AACCCCTCCG CCGGAGGCGC CTCCGTCATC GCGGCTGCGT TCTCGCAGCT CGGCGTGCCC 
TACGTATGGG GCGGCACCAC GCCGGGCGTG GGCCTCGACT GCTCGGGGCT CACGCAATGG 
TGCTATCGCC AGGCTGGCAT ATCGATACCC CGCAATTCCG AGGACCAGGC GGCCGCGGGA 
ACAAAGATCC CGCTTTCGAT GGCGGAGCCG GGCGACGTGC TCTGGCGGCC CGGGCACGTG 
GCAATCTATA TAGGAGACGA CTCCTACATC CACGAGCCCC AGACGGGCGA CGTGTGCAAG 
GTGTCGCAAG GAATCAGCTA CTTCACCTGC GCTCTCAGGT TCAAATAA

Protein sequence

MSAGIREVVT SEKADLLNTG TVKDAEGQSA STLAQRESAA TQRQAAARPD PGCAKPAEGK 
RGKSKCGKDP IDADRHAADV ARKPAKLERA KVEAKSAAMS ALVGELDDSE ELSDTQRVYD 
AARAGKRIAA RAKARKSLGQ EGGKSNGAAA RSRVPGVGAK TGNAISAGAS AQGAPAAMAA 
RPDAQIRLAA GAAKSSTAAT GAAGATTAAP AAGIVAGMLM FVVTMLAVSQ IAGALFGFWD 
NESKKQSLAG LPPYITYEMV EAALEAQEDY GHPAGCTIAQ IIVESGQGDH MSRLATRDHN 
LFGMKWAPSF AAAPEVAGKA NWVTGEEVDG AHVTITDSFT VFKSDADSIK FRSRVFLASS 
TYSGNALIGE AVSERSSDKM AEGLKDAGWA TDSAYVEKLK AVMDQYGLRA FDAMAPGDLA 
NPSAGGASVI AAAFSQLGVP YVWGGTTPGV GLDCSGLTQW CYRQAGISIP RNSEDQAAAG 
TKIPLSMAEP GDVLWRPGHV AIYIGDDSYI HEPQTGDVCK VSQGISYFTC ALRFK