Gene Elen_0688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0688
Symbol
ID	8414978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	870420
End bp	871565
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	69%
IMG OID	645023661
Product	hypothetical protein
Protein accession	YP_003181058
Protein GI	257790452
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAACCA TGGGGGATGA GCCGATCGAG CGTCCTGAGC GCGAAGAAGC GCGTTCGGGT 
GAGGCGGAGC GTGCCGTCAA GGAGGTGGGA TCCGCGAAGT CGGCCCGCGA TGCGGATGCC 
GCCGGCAAAG AAGGCGCGGA GCCGTACAAG CCCGGCTCGT TCGAAGGGGG CATCGTCGAG 
TTTCCCTCCG GGGACGAGCC CGCCGTACCG CCGCGCAAGC GCTTGCCGCT TGTGCTGGCG 
ATCATCGGCC TGGTCCTGTG CTTCACGGGA TCGCTCGCGC TCGTGGGCGC GGCGTGCGGC 
GCCGTGTCGC TCGGGCTGTT CGTGCGCGAC AGGAAGGCTA CGGAGGGCTC GCCGGCCCTC 
GCCGCCCCGA AGGCGACGCT CGGGTTGGCG GCGTGCTCGT TGCTGCTGGG TATCACGATC 
ATGGCGGGCA TGGCCTCCGG CGACGATGCG CAGGTGCAGC AGCCCGACCA GCCGGCTTCG 
CAGCAACAAG AGGCGCTTCT GGAAGCGGCC GAGGAGCACG AGCTGAGCTT CGTCGTCGAG 
GCCGCCGGCG AGGAGGACGT CCCCGCTTCC GTGACGGTGC TGGTGACCGG CACGCAGGCC 
GACGGCACAA AAGTGAGCGA TTCGCACAGG GCAGCCCTCG GAAAGACGTA CGTGCTGGCG 
TATCCGGCGG GCTCGTACAC GTTCGAGGTG TCCGCGTCCT CGCTCGAGGC GGGCGACGTG 
CTGTTCAAAG CCGAGCGCGT CGAATGCGCG TTCGACGGAT CCGCGGACCG CACGGTGCGC 
ATCAAGGTGT CGCAAGACGC CGCCGCCATG CAGAAGGCGC AGGAGGAGAA GGCTGCTCAG 
GAGAAAGCCG CGCAGGAGGA GGCCGAGCGC CAGAGGGCCG AGGAAGCGGC GGCTGCCGAA 
GCTGCTGCGG CAGCGGCAGC CGAGCAAGAA GCAGCAGCGG CCGCCGCTGC CGAACAAGAA 
GCAGCGGCCG CAGCAGCCGC GGCTGCTGCG GCGAGCGGCG GAGGCGGAGA TACCGTGTAC 
ATCACGAACA CGGGCGAGAA ATACCACCGT GACGGATGCC GGTACCTGAA GAAGAGCCAG 
ATCGCGATAT CGCGTTCCGA TGCCATCGCT CAAGGCTACG GCGCCTGTTC CGTGTGCAAT 
CCGTAG

Protein sequence

MGTMGDEPIE RPEREEARSG EAERAVKEVG SAKSARDADA AGKEGAEPYK PGSFEGGIVE 
FPSGDEPAVP PRKRLPLVLA IIGLVLCFTG SLALVGAACG AVSLGLFVRD RKATEGSPAL 
AAPKATLGLA ACSLLLGITI MAGMASGDDA QVQQPDQPAS QQQEALLEAA EEHELSFVVE 
AAGEEDVPAS VTVLVTGTQA DGTKVSDSHR AALGKTYVLA YPAGSYTFEV SASSLEAGDV 
LFKAERVECA FDGSADRTVR IKVSQDAAAM QKAQEEKAAQ EKAAQEEAER QRAEEAAAAE 
AAAAAAAEQE AAAAAAAEQE AAAAAAAAAA ASGGGGDTVY ITNTGEKYHR DGCRYLKKSQ 
IAISRSDAIA QGYGACSVCN P