Gene Elen_1311 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1311
Symbol
ID	8415606
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	1575542
End bp	1576771
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	65%
IMG OID	645024277
Product	RNA polymerase, sigma 70 subunit, RpoD subfamily
Protein accession	YP_003181669
Protein GI	257791063
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02393] RNA polymerase sigma factor RpoD, C-terminal domain [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.046516
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCCAAG CCTCAAGCAA GCAAGCCCAA GAGCGGAACA ACGCGGCGGT TGCCTCGATC 
GAAGCCGAAG ACATCCTGGA GGAAGACGCC CTCGACGACG AGCCCGATGT GGTCGACGCC 
GGCGACGGAC TCGACGACGA TAAGCTTGAA AGCCCCCTGT CCGATGACAG CGACGACGAA 
GACCTGCTCG AAGGCATTCC TGAAGAGGAG CTTAAGGCGA CGGTCGAGGT TCAGCTGCCC 
AAGGTGGCGG GCAAGAGCAA GGTGCGCTCC GTGCGCAAGC GCAATGCCGA CGCCAGCGTG 
ACCATGCTCA CGGGCGACCC CGTCCGCATG TACCTCAAGG AGATCGGCAA GGTCCCGCTG 
CTCACGGCCG CCGAAGAGAT CGACCTCGCC ATGAAGATCG AGGCCGGCGT GGCCGCCATG 
GAGGAGCTTG AGAAGGCCGA GGACGAGGGC ATCGAGCTCG AACGCCGCGA GAAGCGCCGC 
CTCGGCCGCA TCGAGCAGGT GGGCATCGAC GCGAAGCAGC AGCTTATCGA GGCGAACCTG 
CGTCTCGTCG TGTCCATCGC CAAGCGCTAC GTAGGACGCG GCATGCTGTT CCTCGACCTT 
ATCCAGGAGG GCAACCTCGG CCTCATCCGC GCCGTCGAGA AGTTCGACTA CACGAAGGGC 
TTCAAGTTCT CGACGTACGC CACCTGGTGG ATCCGCCAGG CCATCACGCG CGCCATCGCC 
GATCAGGCCC GCACCATCCG CATTCCCGTG CACATGGTGG AGACCATCAA CAAGCTCGTG 
CGCATCCAGC GCCAGCTGTT GCAGGAGCTC GGCCGCGAGC CCAGCCCCGA GGAGATCGGC 
AAGGAGATGG GTCTGCCCGC CGAGCGCGTG CGCGAGATCC AGAAGATCTC GCAGGAGCCC 
GTGTCGCTGG AAACGCCTAT CGGCGAGGAG GAGGACTCCC AGCTGGGCGA CTTCATCGAG 
GACGACGCCG CCGTGGTGCC GCCTGACGCC GCCTCGTTCA GCATGCTGCA AGAGCAGCTG 
TCGAAGGTGC TCGACGGCCT GGCCGAACGC GAGCGCAAGG TGATCAGCCT GCGCTTCGGC 
CTGGAGGACG GCCATCCCCG CACGCTCGAG GAGGTCGGAC GCGAGTTCGG CGTCACGCGC 
GAGCGCATCC GCCAGATCGA GAGCAAGACG CTGGCGAAGC TGCGCCACCC GTCCCGCTCG 
AGCAAGCTGA AAGACTACCT GGAAGATTAA

Protein sequence

MAQASSKQAQ ERNNAAVASI EAEDILEEDA LDDEPDVVDA GDGLDDDKLE SPLSDDSDDE 
DLLEGIPEEE LKATVEVQLP KVAGKSKVRS VRKRNADASV TMLTGDPVRM YLKEIGKVPL 
LTAAEEIDLA MKIEAGVAAM EELEKAEDEG IELERREKRR LGRIEQVGID AKQQLIEANL 
RLVVSIAKRY VGRGMLFLDL IQEGNLGLIR AVEKFDYTKG FKFSTYATWW IRQAITRAIA 
DQARTIRIPV HMVETINKLV RIQRQLLQEL GREPSPEEIG KEMGLPAERV REIQKISQEP 
VSLETPIGEE EDSQLGDFIE DDAAVVPPDA ASFSMLQEQL SKVLDGLAER ERKVISLRFG 
LEDGHPRTLE EVGREFGVTR ERIRQIESKT LAKLRHPSRS SKLKDYLED