Gene Elen_1251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1251
Symbol
ID	8415544
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	1503543
End bp	1504901
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	65%
IMG OID	645024216
Product	TPR repeat-containing protein
Protein accession	YP_003181610
Protein GI	257791004
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG5010] Flp pilus assembly protein TadD, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAACG ACTTATTCCA GCAAGCCCGG GCGGCGTACG CGCGCAAGGA CTTCCAAGGC 
GCCCTGGCTG CCTACACGCA GTGCTTGCAG GATGCGGGCA GCTCGCTTGC ACCCGGCGAG 
GTGGGGCTGC TGTACCACCA GATCGGCAAC TGCCTGGTCA AGCTCAAGAA CCCGAACGAG 
GCCATCCACG CCTACACGCA GGCGACCGCC GATGCGGCCT ACGACGCGTG CGGCGCGGTG 
AACTACAACC TCGGCATGGC CTACGCCTCG CTGCATGATT ACGAGGACGC CGTCAAGCAC 
TTCGAGATCG CCGTGTCCGA CGCCAAGTAC GATGCGTCCT ACAAGGCCTA CTCGGGCATG 
GGCAACGCGC TGTTGAAGCT GGGCAAGTCG GCCGAGGCCG GCGTGGCGTT TCGCGAGGCC 
GCGCTCGACG AGGCCAACCC CGATCCCACG AAGGCGCTGC TCAACCTCGG CGTGTGCTTC 
ATGGCGCTCG ACCGTCCGGC CGACGCCGTG GCCTCCTATG AAAGCGCGCT GCAGTTCGAC 
ATGCAGCCCG ACACGCGCAA CAAGCTGTAC GCGAACCTCG GCCAGGCCTA CGTGGCCAGC 
GGCCAGATGC AGAAGGCCGT GAACGCCTTC GACGAGTCCA TCGCCGACAA GACGTACTTC 
CTCAGCGACT CGGCCAGCGT CGACTACCAG CGCGCAATCG CCGCGGTCGC CCAGGGCACG 
TCCGAGATCA CTCAGGTGAT GGCTCCGGTG GCGCCCGTTG CCGACATGTC GGGGCTCGAC 
GTGGCCGCCG ACGGCACGGC CGTGTACGTG GATCAGGATC CGTACGCGGC GGGCGGCCAG 
GAACCGTACT ACTACGCCGA TCCGTACGCC CAGGCCGAGA CGAACCCCTA CGGCGCCCCG 
GGCGCGGAGG ATCATTTCTT CAACGCCAGC GACGAAGAGC TGGAGCAGTG GTCGAAGGGT 
CTCGCCAAGC AGGATCGCAA GCGCCGCAAC GTGGGTCTCA AGATCCTCGT CACCATCATC 
CTGATCGTGC TGGTCGCTTT CGGCGCCGCC GTGTTCCTGT ACACGCAGGG CTGGGGCTAT 
CCGTCGCAGG ACCAGGTGGT CGAGCAGCTG TTCTCGGATC CGAAAGCGGC CTTCGCCAGC 
GAGGTGACCG AGGAGAACGC CGCGTCCATG ACCGAGCTCC TCTCGACGGT GGGCAGCCCT 
GCGATCGACG GCATGGACAA GTCCATGAGC GATTCCACCG TGTACGTGAC GGCTAAGACG 
CCCGAAGGCG GCGACGTGCA GTACAAGGTA TCCCTCGTGC GCAACATGAT CGGGTGGAAG 
GTGTCGAACG TGGAGCTGTA CTTCCCGAGC CAGAACTGA

Protein sequence

MNNDLFQQAR AAYARKDFQG ALAAYTQCLQ DAGSSLAPGE VGLLYHQIGN CLVKLKNPNE 
AIHAYTQATA DAAYDACGAV NYNLGMAYAS LHDYEDAVKH FEIAVSDAKY DASYKAYSGM 
GNALLKLGKS AEAGVAFREA ALDEANPDPT KALLNLGVCF MALDRPADAV ASYESALQFD 
MQPDTRNKLY ANLGQAYVAS GQMQKAVNAF DESIADKTYF LSDSASVDYQ RAIAAVAQGT 
SEITQVMAPV APVADMSGLD VAADGTAVYV DQDPYAAGGQ EPYYYADPYA QAETNPYGAP 
GAEDHFFNAS DEELEQWSKG LAKQDRKRRN VGLKILVTII LIVLVAFGAA VFLYTQGWGY 
PSQDQVVEQL FSDPKAAFAS EVTEENAASM TELLSTVGSP AIDGMDKSMS DSTVYVTAKT 
PEGGDVQYKV SLVRNMIGWK VSNVELYFPS QN