Gene Elen_1684 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1684
Symbol
ID	8415983
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	1987548
End bp	1988603
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	70%
IMG OID	645024651
Product	selenide, water dikinase
Protein accession	YP_003182039
Protein GI	257791433
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0709] Selenophosphate synthase
TIGRFAM ID	[TIGR00476] selenium donor protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.815145
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGA CAGAGCGCAT TCGTCTCACC CGCCTTACCG AGAAGGGCGG TTGAGCGGCG 
AAGTGGGGTC CGGGAGACCT CGAAGAGATA CTGAAGGACA TCGCGCCGCC GCCCGACGCA 
GATTTGCTGC TGGGCTTCGA CACGTCCGAC GACGCCGCCG TCTACCGTCT GAACGACGAC 
ACGGCCGCGG TGCTGACGCT CGATTTCTTC ACCCCGGTGG TGGACGACCC CTACGAGTTC 
GGCGCCATCG CCGCGGCGAA TGCGCTGTCC GACGTGTTCG CCATGGGGGC GAAGCCTCTG 
ACGGCGCTCA ACATCCTCGC GTTCCCGTGC AGCCTGGGCA CCGACGTGGT GGCCGACGTG 
CTGCGCGGCG GCGCCGACAA GGTGCGCGAG GCGGGCGCGT TCGTGGTGGG CGGCCACTCC 
ATCGAGGACG ACGAGCCGAA GTACGGCCTG TCGGTGTTCG GCACCGTGCA CCCCGACTGC 
ATCGTGCGCA ACGGCGGCGC ACAGCCGGGC GACGCGCTGT TCTACACGAA GGTCCTCGGC 
TCGGGGATCA TGAACTCGGC GTTCCGGGCC GGCTTCGAAG ACGACGAGGG CATGCGCCCC 
GTCATCGCGT CCATGATGGA GCTCAACAAG GCGGGCTCCG AGGCGATGGC GGCCGCGCAC 
GTGCACGCCG CCACCGACGT GACGGGCTTC GGGTTGGCCG GGCACCTCCA CGAGATGCTG 
GACGCCTCGG ACGCGTCGGC CGAGCTCGTC TGGGACGACC TGCCGCTGTT CGAGGGCGTC 
TACCGGTATT CCTGCGACTT CTGCCGCCCC GCCAAGACGT TCGGCATCAT CGACTGGGCG 
CGCGCCTTCG TGAGGCAGGG CGGCCTCGGA GACGAGGAGT TCGAGAACCG CATGGGCGTG 
CTGTGCGACC CGCAGACGTC CGGCGGCCTG CTGGTGGCCG TGGCGCCCGA CGAGGCCGAC 
GAGTTCGCGC GCGCGTTCGA AGCGGCCGCC GGTCGCGCGC CCGCGCTGAT CGGCCATGTT 
CGCGACGGCG CGGCGGGCGA GATCAGCATG AAGTAG

Protein sequence

MSETERIRLT RLTEKGGUAA KWGPGDLEEI LKDIAPPPDA DLLLGFDTSD DAAVYRLNDD 
TAAVLTLDFF TPVVDDPYEF GAIAAANALS DVFAMGAKPL TALNILAFPC SLGTDVVADV 
LRGGADKVRE AGAFVVGGHS IEDDEPKYGL SVFGTVHPDC IVRNGGAQPG DALFYTKVLG 
SGIMNSAFRA GFEDDEGMRP VIASMMELNK AGSEAMAAAH VHAATDVTGF GLAGHLHEML 
DASDASAELV WDDLPLFEGV YRYSCDFCRP AKTFGIIDWA RAFVRQGGLG DEEFENRMGV 
LCDPQTSGGL LVAVAPDEAD EFARAFEAAA GRAPALIGHV RDGAAGEISM K