Gene Elen_0918 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0918
Symbol
ID	8415208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	1123517
End bp	1125550
Gene Length	2034 bp
Protein Length	677 aa
Translation table	11
GC content	63%
IMG OID	645023883
Product	TRAG family protein
Protein accession	YP_003181280
Protein GI	257790674
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3505] Type IV secretory pathway, VirD4 components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCACCC TCAAGGGATT TCTGTACCTC ATCCTCGGCG GCACGCTCTG CGGCTGGATG 
TTCAACCGAA TCGCCGCATG GTTCATCGAC AACCCGCTCA CCGTCGGCTC CAACCACACC 
GTCGCCGAGT GGGCCGTGAT CCTGCAAGAC CCGTTCTACC TCGACTCCCG CACGATGCCG 
TTCTTCTTTC TGGCCTTCGG CGCCATCGCG CTGGTGGCCA TGACAAAATA CGACTGGACC 
GGCGAGCGCG AGGAGCAGAA GAAGCTCCGC GGCGAGGAGT ACGGCAACCA GCGCTGGGCG 
CGCGACGACG AGATGCAGCA GTTCGCGCAC ACCTCGACCG TGAAGCGCGT GCCCATCCGC 
ATCCCGCAGC GCACCGCCGA CGCGATGCGC TTCGCCCGCA ACAACCCGAA GGACTTCATC 
AAGGCCAAGC TCGGCATGAC CAACAAGGTC GCCAACCCCA AGCCCGACTA CGTCGAGAAG 
ATCGAGGACG ACAACATCAT CCTGTCCGAG CGCGCCGAGC TCCAGATGTC GAAGATCCCC 
GACCCGGCGC TCGAGCGCAA CAAGCACGTC TACGTGCTCG GCGGCTCCGG CTCGGGCAAG 
ACCTTCAACT TCGTCGGCCC CAACCTTCTC CAGCTCAACA GCTCGATCGT GACGACCGAC 
CCCAAGGGCG ACACGCTCAA GCAGTACGGC AACTTCTTCC TGCGCCACGG CTACAAGCTC 
AAGGCTGTCA ACACCAAGCC CGACCAGATC AACCAATCGA TGCACTACAA CCCGCTGCTC 
TACCTCCAGG ACTCCACGTC GATCATGCAG ATCGTCAACC TGCTGGTGGA GAACACGTCG 
GGCAACGCGG AGGCCGAGAA GGAGGACTTC TTCGTCAAGG CCGAGAGGCA GCTGTACATG 
GCGCTGATGG GCTACCTCTT CTACTTCTAC GCGGACCAGC CGCAGTACCA GACGTTCCCG 
CAGATGCTCG ACCTGCTCCA GCTCGCCGGC AAGGACAACC CCAGCCAGAC CAAGACCCCG 
CTGGACATCA TCATGCTCGG CACGACCGCC GAGGACGGCT TCCAGGGCTT CGAGGAATGG 
ATCGTCGCCA ACCACGGCGG CGACGAGGCG GCCGCGCAGG CCTCCGAGGA GTACTTCGTC 
ATCAAGCAGT ACAAGGGCTT CAAGTCGACC TCCGAATCGC CGGAGACCGA GGCCTCGGTC 
ATCGCGTCGT GCAACGTCCG CCTGGCGCCG TTCGCCGTCT CCGCGGTCCG CGAGTTCTTC 
AGCGAGGACG AGCTGGAGCT CGAGATGATC GGCGAGGAGC GCACGGCGTT CTTCCTGGTC 
ATGTCCGACA CCGACAAGAC GTTCAACTTC ATCCTGGCGA TGCTGCTCTA CCAGCTGTTC 
GACGTCAACA CTGCCATCGC CGACAGGAAC CCCGGCTCGC ACTGCAAGAT CCCGATCAAC 
TGCATCCTCG ACGAGCTCGC CAACATCGGC CGCATCCCCG ACCTCGACGT CAAGATCGCG 
ACCCTGCGCT CGCGCTGGAT CTACATCACG GCCATCCTGC AATCGGTCAC GCAGCTCAAG 
AAGATGTACA AGGACAACGC CGACATCATC GAGGGCAACT GCGACACGAC GCTGTTCCTC 
GGCCGCTGCG ACCTCGAGAC CAACAAGAAG ATCTCCGAGC GCCTGGGCAA GTTCACCGCC 
ACCGTCCGCA ACCGCAGCGA GTCGCACGGC CGGCAGGGAT CGTGGTCCGA GAGCGAGAAC 
AAGATCGGCA AGGAGCTCAT GGCCGCCGCC GACCTCGGCA ACAACCCCGA GAAGTTCGGC 
GGCGACGACT GCATCGTCTT CGTGAAGAAC GCCTTCCCGT TCCTCGACAA GAAGTACAGG 
ACGATCGACC ACCCGCGCTA CCACGAGCTG CGCGAGGTCG GCGAGTTCAA CCTGGACGAC 
TGGAACTGGG ACCGCAAGTG CGAGCGCGAG CGCGCGCACC GCGCCGAGGT CGAGGAGATG 
CGCTGGCGCA TCGAGGAGGC CCGTTCGTTC TTCGACCCCG AGTTCTTCAT GTAG

Protein sequence

MRTLKGFLYL ILGGTLCGWM FNRIAAWFID NPLTVGSNHT VAEWAVILQD PFYLDSRTMP 
FFFLAFGAIA LVAMTKYDWT GEREEQKKLR GEEYGNQRWA RDDEMQQFAH TSTVKRVPIR 
IPQRTADAMR FARNNPKDFI KAKLGMTNKV ANPKPDYVEK IEDDNIILSE RAELQMSKIP 
DPALERNKHV YVLGGSGSGK TFNFVGPNLL QLNSSIVTTD PKGDTLKQYG NFFLRHGYKL 
KAVNTKPDQI NQSMHYNPLL YLQDSTSIMQ IVNLLVENTS GNAEAEKEDF FVKAERQLYM 
ALMGYLFYFY ADQPQYQTFP QMLDLLQLAG KDNPSQTKTP LDIIMLGTTA EDGFQGFEEW 
IVANHGGDEA AAQASEEYFV IKQYKGFKST SESPETEASV IASCNVRLAP FAVSAVREFF 
SEDELELEMI GEERTAFFLV MSDTDKTFNF ILAMLLYQLF DVNTAIADRN PGSHCKIPIN 
CILDELANIG RIPDLDVKIA TLRSRWIYIT AILQSVTQLK KMYKDNADII EGNCDTTLFL 
GRCDLETNKK ISERLGKFTA TVRNRSESHG RQGSWSESEN KIGKELMAAA DLGNNPEKFG 
GDDCIVFVKN AFPFLDKKYR TIDHPRYHEL REVGEFNLDD WNWDRKCERE RAHRAEVEEM 
RWRIEEARSF FDPEFFM