Gene Elen_0304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0304
Symbol
ID	8414588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	399426
End bp	400436
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	70%
IMG OID	645023281
Product	transcriptional regulator, AraC family
Protein accession	YP_003180684
Protein GI	257790078
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGATTCGCG CAGACGGAAA TCGGGACGGC ACGGCTGCCG CATGCGCCGA CTACGACATC 
ATGCGCGAGG TGTTCCTCCC CTGCCTCGCC GACATGCAGA TGGAGGAAAC GTGCGCGGCG 
GACGTGGGCG CGCCCGAACG CGAGGGGCGC ATGTTCCGCA TGCCGCGCGA CGTGGCCTCG 
GGATACTTCT GGCTGTACGC CGAGCGCGAT TTCGCCATCT CGGCGACCGA CATGCTGTTC 
CCCCGCGACT TCCGCGAGCA ATGCCGGCAT CCGCGCTTCG TCTCGGTGCG CTACTACCTG 
TCGGGAAGCT GCGTCGAGAG CGTCACGAAC CGCACGGTGG AGGCACCTTA CCTGGAGGGG 
CACGTTCTGG ACACGCCGCA TTGGGACTGC CTGTGCCGGG CCGGCACGCC CATCCGCAAC 
GTCGAGATCA TGCTCGCCCC GCCGTTTTAC GAGCAGTATT TGCGCGAGGT GTACCGGGAT 
GAGGCCTTCA GCGCCGAGGA GGCGTTCGCC AGCATCGACG GGCTTTCCGA CTTCCCCGAG 
ATGGTGGTGC TGCTCAAGCA GGTGGAAGCC TACCGCGGAC GCGGCGCGTC GGCGCGGCTG 
TTCTACCGCA GCAAGGTTGA GGAAGCGGTG GCGCTCGTCG TGGACAAGTC GCGCGCGATG 
GCCGGCGAGC GCGCCAGCGA ACTGGCCAGC GAGGACATGC ACGCCATCGA GCGCGTGCGG 
CGGCGCCTGG AGCAGCAGCT GGCCGCGCCC GTGGACGCCG ACGAGCTGGC CCGCATCGCC 
TGCATGGGCC AGACCAAGCT GCGGCGCACC TTCAAGCAGG CGTGCGGCTG CACCATCGTG 
GAGTACCGCC AGCGCTTGCG CTGCGCGAAG GCCGCCGAGC TGCTGGCCGC CGGCGACGCG 
CCCGTGGCGC AGGTTGCCGC AGCCGTCGGC TACCGCCCCG AGCGCCTGGC CGAGCTGTTC 
GCCCGCACCC ACCACACCAC CCCCAGCGCC TACCGTGCCG CCATGCGCTA G

Protein sequence

MIRADGNRDG TAAACADYDI MREVFLPCLA DMQMEETCAA DVGAPEREGR MFRMPRDVAS 
GYFWLYAERD FAISATDMLF PRDFREQCRH PRFVSVRYYL SGSCVESVTN RTVEAPYLEG 
HVLDTPHWDC LCRAGTPIRN VEIMLAPPFY EQYLREVYRD EAFSAEEAFA SIDGLSDFPE 
MVVLLKQVEA YRGRGASARL FYRSKVEEAV ALVVDKSRAM AGERASELAS EDMHAIERVR 
RRLEQQLAAP VDADELARIA CMGQTKLRRT FKQACGCTIV EYRQRLRCAK AAELLAAGDA 
PVAQVAAAVG YRPERLAELF ARTHHTTPSA YRAAMR