Gene Elen_0066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0066
Symbol
ID	8414346
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	85881
End bp	86987
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	48%
IMG OID	645023042
Product	hypothetical protein
Protein accession	YP_003180449
Protein GI	257789843
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATCC GAAATTCTGT TGAAACGGCA CGCGCATCCG TTTCAAATAT CGAATCATAT 
ATTAGTAAAA AATGGCCGGG GTTTTTTGAC GAGATAGCCA CCACGCTATC CAAGCCTTTA 
TGGCGCATGG GCAAGAACGA CATGTTCGCG ATATGCGACC AGGATATCGA CGATATCAAC 
AAGGTCCAGT TCCTGGCAAT ACAAGAACGC GCGATCCAGC GCATTTTGCT TTCGAGCAAA 
ACCCTGCAAC GCCCAGGAGG AGCATGGGAC TGCATACCTC CAATAGATTT AGCAAATCTT 
TGCTGCGATT GGAAGAGATC CCCCGTGGTA CTCGAGTTCA ACTCTTCACT CGTTGAAGAA 
CTTCAGCGTT CCGACATCGA TCCAGACGTT GATCTTTCGG AGCATCTTGA ACACCTCCCG 
TTCTCCTGCT TCTTTATATC TGCCGAACAT CTTGGCTTCC GGCTCTCGAA TGCAGACGGC 
AAGCTCAAAC ATGCGGTTGG GTTTTTCCTG GATTACGCGT GGATGCCTCG ATCAGACCAA 
CCTCACCGAG TAGAAAAACA TTTCATAATT ACGATAATCG GAAGCAACGG CTACACGATC 
CCCGTCGTTA TCCCCTTAAG ATTTTCGACG ATAAAAGATT TATCCGCATA TGTAGTTGAA 
ACATATCTGC AAGCGAATGG CGGCAAGAGC AAGATGATCA AAGTGTTCGT CGACGAGGAT 
CTTCATACGA TTCTTAGCCT GCTTCTCTAT ATCGCTTCAA AAGAGCCGGA TATAGTAGAG 
AAGGAAATCG CACGGAGAAA GGACACGAAC GATCTTGATC GCAGTTCCAC TTTCAACAAC 
GATCAAGAGC CACTGGACGA GCCGCGAACG TTTCTCGTTG GGGGAAAAAT CGGGCCCTCT 
ATCGAGGCGC ATCGACACGC GAACAAAAAC GCAGGCAGCG GCCGTGCGAT AACTCCTCAT 
ATTCGCCGAG CCCATTTTCA CACGTATCTC ACGGGTTCAC GAAAAGACAG AACTCAAAAG 
AGAATTCTGA AATGGGTCGC ACAGACATCA GTGAACATGG AAAAGGAAGG CGATGCTTCG 
ACTGTCATGG TGAGAAAAGT CGAATAA

Protein sequence

MTIRNSVETA RASVSNIESY ISKKWPGFFD EIATTLSKPL WRMGKNDMFA ICDQDIDDIN 
KVQFLAIQER AIQRILLSSK TLQRPGGAWD CIPPIDLANL CCDWKRSPVV LEFNSSLVEE 
LQRSDIDPDV DLSEHLEHLP FSCFFISAEH LGFRLSNADG KLKHAVGFFL DYAWMPRSDQ 
PHRVEKHFII TIIGSNGYTI PVVIPLRFST IKDLSAYVVE TYLQANGGKS KMIKVFVDED 
LHTILSLLLY IASKEPDIVE KEIARRKDTN DLDRSSTFNN DQEPLDEPRT FLVGGKIGPS 
IEAHRHANKN AGSGRAITPH IRRAHFHTYL TGSRKDRTQK RILKWVAQTS VNMEKEGDAS 
TVMVRKVE