Gene Elen_2556 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_2556
Symbol
ID	8416880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	2989936
End bp	2991225
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	62%
IMG OID	645025537
Product	protein of unknown function UPF0118
Protein accession	YP_003182900
Protein GI	257792294
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAGACTC CCAGCTCCGA AGCGACGAAA ACCGACAAAG CGAAGCGAAG CTTTCTCATA 
GTCTGGACGA TCGTGGGCGG CATTCTGCTC ACGGGCGTTC TCGTTTACCT GTTCAATATC 
TTGAGCGTGC CTATCGGCAT CGTCATCTGG TCCATCGTCA TCGTATTCTG CCTGCGAGGA 
CCGGTGAACA AGCTGGAGAA ACTGGGCGTT CCCCGCGTGG CCGGCACGAC GATCGCCTAC 
GTCCTGATGT TCGTTGTTCT GGCTTTGGTG GGGCTTCTCA TGTTCTCGCC GGCGTTCGGC 
GTGGGCGACC AGTTCACCAA CCTCATCGAG AGCATTCCGG GCTACGTTCA GACCATCGCC 
GGGTGGGGCA ACGACCTGTA CACGCGCTAC GCCGACGTGC TTCAGAACGA CACGGTGCAA 
ACGTGGATCA ACAATGCGCT GGACGCCATC GTCTCATGGG CTTCGACGTT CGCCCGCGAT 
AGCGCCAACG GCGTGGTCGC CATCGGGACG GGTCTGGTCA ACACGTTCGT TGCGCTCGGG 
TTTGCGCTGG TGGTGGCTTT CTGGATCCTC ATGGAGCTTC CGCAGCTTGG ACGCGAATGC 
ATGCGCCTCG TCAACCCGAA GCGCCACGAG GATCTGGAAA TGCTGCACGT CACGTTCACG 
CGCGTCATGG GCGGCTACAT CAAGGGCACG CTTTTGCAGT GCGCCATCAT CGGCGTGGGC 
TGCGTCGTTC TGTTCGGCGC CATCGGCATC CCGAACTACG CGGCGCTCGG CGGTATCGCC 
GGCCTGTTGA ACATCATCCC CATCGTGGGC CCGTGGCTCG GCGGTGCGCT TGCGGCCATC 
GTGGGCGTGT TCGTCAGCCC CTGGATCGCG GTCATCGCGC TCGGCGGCAC CATTGCCATC 
CAGCAGATCG TCTATACGTT TATTTCGCCG AAGATCATGG CGAACTCGGT GGACGTTCAT 
CCGGCGCTCA CCCTCATCGC TTTGATGGCG GGCTCCGCTA TAGGCGGCGC TATGAGCGGC 
TTCACGGGCT CGCTTGTGGG TATGTTGGCT TCCATTCCCG CCGTCGCGGT TGCGAAGTCG 
GTTTTCGTGT ATTATTTCGA AAAGCGCATG GGGCGGCAGC TGGTAAGCGC AGACGGCGTG 
TTCTTCCAAG GCACCACCGC CTCGGACGGC ACGCTCGATC CCATCGCCGA TGCCACGTCG 
CCGCATCCCG ACATCTCGGC GGCGTTCGAG CGCGTCGAGC AGCGCAAGGC CGAGGCCGAT 
CAGAAGGCGC AGCATCGTAA GAAGCGTTGA

Protein sequence

METPSSEATK TDKAKRSFLI VWTIVGGILL TGVLVYLFNI LSVPIGIVIW SIVIVFCLRG 
PVNKLEKLGV PRVAGTTIAY VLMFVVLALV GLLMFSPAFG VGDQFTNLIE SIPGYVQTIA 
GWGNDLYTRY ADVLQNDTVQ TWINNALDAI VSWASTFARD SANGVVAIGT GLVNTFVALG 
FALVVAFWIL MELPQLGREC MRLVNPKRHE DLEMLHVTFT RVMGGYIKGT LLQCAIIGVG 
CVVLFGAIGI PNYAALGGIA GLLNIIPIVG PWLGGALAAI VGVFVSPWIA VIALGGTIAI 
QQIVYTFISP KIMANSVDVH PALTLIALMA GSAIGGAMSG FTGSLVGMLA SIPAVAVAKS 
VFVYYFEKRM GRQLVSADGV FFQGTTASDG TLDPIADATS PHPDISAAFE RVEQRKAEAD 
QKAQHRKKR