Gene Elen_0651 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0651
Symbol
ID	8414941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	828387
End bp	829490
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	66%
IMG OID	645023626
Product	protein of unknown function DUF917
Protein accession	YP_003181023
Protein GI	257790417
COG category	[S] Function unknown
COG ID	[COG3535] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.0286525
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAAGA TCGGCATCCA GGAAATCGAG GACATCGCGC TGGGCGCGAC GCTTCTCGGC 
GCTGGTGGGG GCGGCGACCC TTACATCGGA AAGCTCACGG CCATCGGCGC CGTGAAAGAA 
TGCGGCGAAG TGGAGCTGAT CGGCATCGAC GAGGTGCCCG ACGGCGCGTT CATCATGCCC 
GCCGCATCCA TGGGCGCACC CACCATCCTC GCCGAGAAGG GCGTGGGCGC CAACGAGTTC 
GCCAAGCTGT TCGACATGGT GTCGCGCTAC TACGGCAAGC CCATCTACGC CACCATGCCC 
ATCGAAGCTG GCGGCGTGAA CTCCATGCTG CCCATCGCCG CGGCCGCGCG CCTCGGCATT 
CCCATGGTGG ACGTGGACGG CATGGGCCGC GCGTTCCCCG AGCTGCAGAT GGTCACGTTC 
ACCATCGGCG GCGCGTCGGC CACGCCCATG GCGTTCATCG ACGAGAAGGG CAACTCCGGC 
ATCCTCGATA CCATCACGAA CAAGTGGACC GAGGACATCG CCCGCGCCGC CACCATGACC 
ATGGGCGGCA CGCTGACGGT CGCGCTGTTC TGCATGGACG TAGACACCTG CAAGCAGTAC 
GGCGTGCACG GCATCGTGAC GCGCTCCGAG GAACTGGGCC GCGCCATCCG CACGGCGAAG 
GACGAGGCGG CTGCGGCCGG CCTCACGCCC GAGGAGTTCT TCTTGAAGTT CACGGGTGGC 
CACAAGCTGT TCAAGGGCAA GATCTCCGAC GTGCTGCGCG AGACGCGCGG GGCGTTCAAC 
TTCGGCCGCG TGGTGCTGGA GGGCATCGGC GAGGACCGCG GCAGCCAGGC GTTCGTCGAT 
TTCCAGAACG AGAACCTCAG CTGCGTGGTG GACGGCCAGA TCAAGGCCAC CGTGCCCGAC 
CTCATCTGCC TCGTGGACCC CGACACGTTC ACGCCCGTTC CCACCGACGC GCTGAAGTAC 
GGCAAGCGTG TGCTGGCCGT GGGCCTGGAG TGCTTCCACC TGTGGCGCAC GCAGGCGGGT 
CTCGACCTCG TGGGGCCGCG CTACTTCGGC ATCGATACCG ACTATATCCC CGTCGAAGAG 
CGCAGCGCGC GGAAGGAGGC GTAA

Protein sequence

MRKIGIQEIE DIALGATLLG AGGGGDPYIG KLTAIGAVKE CGEVELIGID EVPDGAFIMP 
AASMGAPTIL AEKGVGANEF AKLFDMVSRY YGKPIYATMP IEAGGVNSML PIAAAARLGI 
PMVDVDGMGR AFPELQMVTF TIGGASATPM AFIDEKGNSG ILDTITNKWT EDIARAATMT 
MGGTLTVALF CMDVDTCKQY GVHGIVTRSE ELGRAIRTAK DEAAAAGLTP EEFFLKFTGG 
HKLFKGKISD VLRETRGAFN FGRVVLEGIG EDRGSQAFVD FQNENLSCVV DGQIKATVPD 
LICLVDPDTF TPVPTDALKY GKRVLAVGLE CFHLWRTQAG LDLVGPRYFG IDTDYIPVEE 
RSARKEA