Gene Elen_1559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1559
Symbol
ID	8415857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	1854105
End bp	1855139
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	69%
IMG OID	645024527
Product	pseudouridine synthase, RluA family
Protein accession	YP_003181916
Protein GI	257791310
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.627219
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.0055148
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCCGCA TGTTGAGCTA CGTCGCAGCA CCCGACGACG CGGGTCAGCG CCTCGATGCG 
CTTTTGGCCG CGCGCGGTCT GTATCCCAGC CGTAGCGCGG CTGCGCGCGC GGTGGACGAC 
GGCCTCGTGT TCGTGAACGG CGCGGAGGTT GCGAAGAAGC ATCCCGTGGC GCCGGGCGAC 
ACGATCGTGT ACCAGGTTGA GGAGCCGGTA GAGCCCGGCC CTTTGCGCGG CCAACCCATC 
GATCTGGACA TACGCTTCGA GGACGAAGAC CTCATCGTGC TGTCGAAGCA GGTGGGGCTC 
GTGTGCCATC CGTCGGTCGA CCATGACGAC GGCACGCTGG TGAACGCCCT CATCTACCAC 
TGCGGCGCCG AGAACCTGTG CAACGTGCAG GGCGAGGACG ACCGTCTGGG CATCGTGCAC 
CGCCTCGACC GCGACACGAG CGGCCTCATG CTGGCGGCGA AGAACGACGA GACGGGCTAT 
GCCCTCATGT CGGACATCCG CGATCGCGCG GTCGACCGAC GTTACCTGGC GCTCGTGCAC 
GGCGTGATCG CCCACGACAC CGGTATGATC GACGCTCCCA TCGCGCGCGC CGAGAAGGAG 
CGCACGCGCA TGGCCGTCCG CGACACGCCG TCGGCTCGCG AGGCCATCAC GACGTTTCGG 
GTGCTCGAGC GCTTCGAGCA CGGGGCGCGC GACGACGGCT ACACGCTCAT CGACTGCAAG 
CTGTTCACAG GGCGCACCCA TCAGATACGC GTGCATCTGG AGTACGCGAA GCACCCTCTT 
GTGGGCGACC CGGCGTACAC GTCGGGCGCG CCGAGCGCGC CTGCGGCCGA CCTCGGCCTC 
GACCGCCAGT TCCTGCACTC GTTCCAGCTG TCGTTCCAGC ATCCCGTCAC GGGGGAGGGC 
CTGCGCTTCG CGGACAACCT GCCCGTCGAC CTGCAGGAAG CGCTCGACGA CCTCGCCTCC 
CGCAGCACGG GCCGCACGAC GGCGGGGGAG GAAGTGCGAG CGTTGCTGGA AGACGCCCCG 
AGGCCGCGGC TGTAG

Protein sequence

MSRMLSYVAA PDDAGQRLDA LLAARGLYPS RSAAARAVDD GLVFVNGAEV AKKHPVAPGD 
TIVYQVEEPV EPGPLRGQPI DLDIRFEDED LIVLSKQVGL VCHPSVDHDD GTLVNALIYH 
CGAENLCNVQ GEDDRLGIVH RLDRDTSGLM LAAKNDETGY ALMSDIRDRA VDRRYLALVH 
GVIAHDTGMI DAPIARAEKE RTRMAVRDTP SAREAITTFR VLERFEHGAR DDGYTLIDCK 
LFTGRTHQIR VHLEYAKHPL VGDPAYTSGA PSAPAADLGL DRQFLHSFQL SFQHPVTGEG 
LRFADNLPVD LQEALDDLAS RSTGRTTAGE EVRALLEDAP RPRL