Gene Elen_2000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_2000
Symbol
ID	8416311
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	2344264
End bp	2347068
Gene Length	2805 bp
Protein Length	934 aa
Translation table	11
GC content	67%
IMG OID	645024977
Product	preprotein translocase, SecA subunit
Protein accession	YP_003182353
Protein GI	257791747
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0653] Preprotein translocase subunit SecA (ATPase, RNA helicase)
TIGRFAM ID	[TIGR00963] preprotein translocase, SecA subunit

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0000011814
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCAGGAT TTCTTTCCAA GCTCCTGACG CTTGGCGAGG GCAAGCAGCT CAAGCACTAC 
GAAGCCACCG CGGCCAAGAT CAACGGCCTC GAATCCGAGA TGCAGGCGCG CTCTGACCAG 
GAGCTTCGCG CGCTCACCGC CGCGTTCCGC GAACGCGCCC AGAACGGAGA GGATCTCAAG 
AGCCTTCTGC CCGAAGCGTT CGCCGCCGTG CGCGAGGCCT CGGTGCGCAC GCTGGGGCTG 
CGTCACTTCG ACGTGCAGCT CATCGGCGGC ATGGCTTTGA ACGACGGCCA GATCGCCGAG 
ATGAAGACCG GCGAGGGCAA GACGCTCGTC TCCACGCTGG CCGGCTACCT GAACGCCCTG 
CCCGGCAACA ACGTGCACGT GGTCACCGTC AACGACTACC TGGCCCGTCG CGACAGCGAG 
TGGATGGGGC AGGTGTACCG CTTCCTCGGC ATGGAGGTGG GCCTCATCCA GAACGGCATG 
CGCCCCGACA AGAAGATACC CGCCTACAAG GCGGATGTCA CTTACGGCAC GAACAGCGAG 
TTCGGCTTCG ACTACCTGCG CGACAACATG GTGACGCGCG CAGAGGCCCG CGTGCAGCGC 
GGCCACCACT TCGCCATCGT CGACGAGGTG GACTCCATCC TCATCGACGA AGCCCGCACG 
CCGCTCATCA TCTCGGGAGC GGGCACGCAG GCGGCCGAGA CGTACAATAA GTTCGCGCGC 
GTCATGGTCG GCCTCGTGCC CGAGGCCGAC TTCGACATGG ACGAGGCGAA GAAGACCATC 
AACGCCACCG AGAGCGGCCT GGAGAAGATC GAGGCCATGC TCGGCATCGA CGACATCTAC 
GCCGACCCGT CCGGCCAGCT GCCGAACCAC TTGCAGCAGG CGCTCAAGGC CCAGTTCCTG 
TTCCACCGCG ACGTGGACTA CGTCGTGGTG AACGGCGAGG TGAAGATCGT CGACGAGTTC 
ACCGGCCGCA TCATGGAAGG CCGCCGCTAC TCCGAGGGCC TGCACCAGGC GCTCGAGGCG 
AAAGAGCGCG TGCTCGTGCG CGAGGAGAAC CAGACGCTGG CCACCATCAC GCTGCAGAAC 
TACTTCCGCC TGTACGAGAA GCTCTCCGGC ATGACCGGCA CGGCCATGAC CGAGGACGCC 
GAGTTCCGCG AGATCTACAA GCTGCCGGTC GTGGCCATCC CGCCGAACCG CCCAGTCGCC 
CGAAAGGACG AGGACGACCT CATCTACCGC ACGGTGGAGG CGAAGTTCAA CGCCGTGGCC 
GACGACGTGG CCGAGCGCAA CAAGGCGGGC CAGCCCTGCC TCATCGGCAC CGTGTCCATC 
GAGAGCTCCG AGAAGTTGTC GCGCCTGCTG GACAAGCGCG GCATCAAGCA CGAGACCTTG 
AACGCGAAGA ACCACGAGCG CGAGGCACAC ATCATCGCGC AGGCGGGCCG CGTGGGCGCC 
GTGACCATCG CCACGAACAT GGCCGGCCGA GGCACCGACA TCCTGTTGGG CGGCAACCCC 
GACGTGCTGG CCGACGACGT GCTGCGCGAG CGCGGGCTCG ATCCGGACGC CGAACCTTTG 
ACCGAGGACG GCGAGCCGAA CCCGGCCCTT CCCACCGACG AGCAGCGCGC GGACGCGCTG 
GCCGAGGCGA AGCGCGTGTG CGCCGAGGAG CACGACCAGG TCATCGCGGC CGGCGGCCTC 
ACCGTCATCG GCACCGAGCG CCACGAGTCG CGCCGTATCG ACAATCAGCT GCGCGGCCGT 
GCCGGCCGTC AGGGCGACCC CGGCGTGACG CAGTTCTACC TGTCGCTCGA AGACGACCTC 
ATGCGCCTGT TCGGCGGCAA CCGCATGGAC TCCATCGCCC GCATGATGGA GAAGACCGAC 
ATGCCCGAGG ACATGCCCAT CCAGGCCGGC ATGGTGTCGA AGGCCATCGA AGGCGCCCAG 
CGCCAGGTGG AGAGCATGCA CTTCGCCGCC CGTAAGAACG TCCTCGAGTA CGACGACGTC 
ATGAACCTGC AGCGCGTGGC CATCTACAGT GAGCGCAACG CCATCCTCGA CGGCAAAGAC 
ATGGACGAGC GCATCCCCGA GATCATCGGC GACGCGGTGG AAGCCGTCGT CGCGGAGAAC 
TGCCCGGCCA AGGTGCCCAG CGACGACTGG GATGCCAAGG CCGTGGAGCT GTGGGCCGCC 
AACATGACGG GTCGCGACGA CTTCAGCGTG GCCGAGGTCG ACCACGACGA CGACCCCGCC 
GTGCTGTCCG AAGCGTTGGA AGCGTACTTG GAGGACGTGT TCGCGAGCAA GTCCGAGCAG 
CTGGGCGAGC CGGTGATGAA GATGCTGGAG GGCCAGGTCA TGCTGCGCAT GATCGACACG 
CGCTGGATGG CGCACCTCCA GGAGATGGAT TATCTCAAGG CCGGTATCGG CCTGCGCGCG 
TTCGGCCAGC GCGACCCGCT GGTGGAGTAC AAGAACGAGG CGTACAACGC GTTCCAGAAC 
CTGACTGCGG GCATGTACGA GGATTATCTG CGCACGCTGT TGCGGCTCCA GGTGGCTGTG 
AAGCAGGAGC AGCCGGCGTT GGCGGAGGAC AAGAGCCCGC TCGACGGAAA GGTGAGCTAC 
TCGTCTCCCG AGCAGGCTCT CGAGCAGACG GGCGTGGGCG CCGCGCGCAA GCAGGCGGCC 
GCGTCGCCGA GCGGCGCCCC GGCGGCTCCG CCCAAGCCCG CGGCGGCGAA GCCCCAGACG 
TACACGAAGG ACAAGGACGA TCCCTTCGCC AACGTCGGGC GCAACGAGCC GTGCCCCTGC 
GGCTCGGGCC TCAAGTACAA GAAGTGTCAC GGACGAGATC AATAA

Protein sequence

MAGFLSKLLT LGEGKQLKHY EATAAKINGL ESEMQARSDQ ELRALTAAFR ERAQNGEDLK 
SLLPEAFAAV REASVRTLGL RHFDVQLIGG MALNDGQIAE MKTGEGKTLV STLAGYLNAL 
PGNNVHVVTV NDYLARRDSE WMGQVYRFLG MEVGLIQNGM RPDKKIPAYK ADVTYGTNSE 
FGFDYLRDNM VTRAEARVQR GHHFAIVDEV DSILIDEART PLIISGAGTQ AAETYNKFAR 
VMVGLVPEAD FDMDEAKKTI NATESGLEKI EAMLGIDDIY ADPSGQLPNH LQQALKAQFL 
FHRDVDYVVV NGEVKIVDEF TGRIMEGRRY SEGLHQALEA KERVLVREEN QTLATITLQN 
YFRLYEKLSG MTGTAMTEDA EFREIYKLPV VAIPPNRPVA RKDEDDLIYR TVEAKFNAVA 
DDVAERNKAG QPCLIGTVSI ESSEKLSRLL DKRGIKHETL NAKNHEREAH IIAQAGRVGA 
VTIATNMAGR GTDILLGGNP DVLADDVLRE RGLDPDAEPL TEDGEPNPAL PTDEQRADAL 
AEAKRVCAEE HDQVIAAGGL TVIGTERHES RRIDNQLRGR AGRQGDPGVT QFYLSLEDDL 
MRLFGGNRMD SIARMMEKTD MPEDMPIQAG MVSKAIEGAQ RQVESMHFAA RKNVLEYDDV 
MNLQRVAIYS ERNAILDGKD MDERIPEIIG DAVEAVVAEN CPAKVPSDDW DAKAVELWAA 
NMTGRDDFSV AEVDHDDDPA VLSEALEAYL EDVFASKSEQ LGEPVMKMLE GQVMLRMIDT 
RWMAHLQEMD YLKAGIGLRA FGQRDPLVEY KNEAYNAFQN LTAGMYEDYL RTLLRLQVAV 
KQEQPALAED KSPLDGKVSY SSPEQALEQT GVGAARKQAA ASPSGAPAAP PKPAAAKPQT 
YTKDKDDPFA NVGRNEPCPC GSGLKYKKCH GRDQ