Gene Elen_0202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0202
Symbol
ID	8414486
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	281300
End bp	282445
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	65%
IMG OID	645023182
Product	hypothetical protein
Protein accession	YP_003180585
Protein GI	257789979
COG category	[S] Function unknown
COG ID	[COG3581] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.531807
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGCACGC GGCGCGGCCC GTTCAAGCTG CTGCCCTCGC TGCCGAAGAA GCCGCGCGCC 
AAGCGCGAAC GCCACGCCCG CACGCGCGTG GCGTTCTTCC GCTACAGCTA CTACGACATC 
GCGTTCAAAT TCTTCGTCGA ACACGTGCTG GACGCCGATT TCGTCGCACT GCCGAAGCCC 
ACGAAGCGCA CCATCGAGCT GGGCTCGCGC CACTCCAGCG ACATGGTGTG CGCGCCGTTC 
AAGCACATCC TGGGCGACTA CATCGAGGCG CTGGAGCTGG GCGCCGACGT GCTGGTGCAG 
TTCGCCGGGC CCTGCCGCCT GGGGTATTAC GGCGAGCTGC AGCAATCCAT CATGCGCGAT 
CTGGGCTACG AGTTCGACAT GCTGAACTTC GCCATGCTCA CCGGCAAGCC CCTGACCGAG 
TACATCTCGG TATGCAAGAA GAAGGTGAAC CCAGACCTGT CGGTGCCGCA TGGCGTGCGT 
AACATGCTGG CCGTGTTTAA AATGATCGAG CACCTGGACG AAGTGAACGA TTTCTACCTG 
GCGAACGCCG GGTTCGAAGC CGAGCCCGGG TCGTTCGAGC GCGCGCGGGA GGCGTACTTC 
GCCGACATGC GCGCGGCCAC GAACGAGCGC GAGATCGCCG AAGCGCAGCG GAAGGGCCTC 
GATGCGTTGC GCGCGCTGCC GCAGCATCGC CCCGCCCGCC CCTTGCGCGT GGGCATCGTG 
GGCGAGTACT TCACCGCAGC CGACCCAGCC AGCAACCTTG ATCTGGAGCG CAAGTTCCTG 
GACATGGGCG TGGAACTGCA CCGAGCGCTG AACATGACGA ACCGCAACCT GCGCTACAAC 
GAGAAGAACC TGCGCGCCGG CATCTCGGAG TACGTGCAGT ACGACATGGG CCCCACGTCC 
AGCATGACCA TCGCGGCCGC GCGCAAGTAC GCGCAGGAAG GGTTCGACGG CATCGTGCAC 
CTCAAGTCGT CGGGCTGCAC GCCCGAGGTC GACTGCATGC CCGTGCTGCA GCGCATCAGC 
CGCGACACCG GCGTGCCCGT GCTGTACCTC AGCTACGACT CGCAGACCAG CGACACCGGT 
TTGGACACGC GCCTCGAAGC GTTCTACGAC ATGATCGCCA TGAAGAAGGA GAAGACGGCC 
CGATGA

Protein sequence

MGTRRGPFKL LPSLPKKPRA KRERHARTRV AFFRYSYYDI AFKFFVEHVL DADFVALPKP 
TKRTIELGSR HSSDMVCAPF KHILGDYIEA LELGADVLVQ FAGPCRLGYY GELQQSIMRD 
LGYEFDMLNF AMLTGKPLTE YISVCKKKVN PDLSVPHGVR NMLAVFKMIE HLDEVNDFYL 
ANAGFEAEPG SFERAREAYF ADMRAATNER EIAEAQRKGL DALRALPQHR PARPLRVGIV 
GEYFTAADPA SNLDLERKFL DMGVELHRAL NMTNRNLRYN EKNLRAGISE YVQYDMGPTS 
SMTIAAARKY AQEGFDGIVH LKSSGCTPEV DCMPVLQRIS RDTGVPVLYL SYDSQTSDTG 
LDTRLEAFYD MIAMKKEKTA R