Gene Elen_3044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_3044
Symbol
ID	8417379
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	3539991
End bp	3541307
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	60%
IMG OID	645026024
Product	signal transduction histidine kinase, LytS
Protein accession	YP_003183376
Protein GI	257792770
COG category	[T] Signal transduction mechanisms
COG ID	[COG3275] Putative regulator of cell autolysis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGAAG AGACCGGGGA GTCGAAATCG GCGCTGCCGC GCTTCTTCAC GCTCGAGATG 
TTCATGTTCA CGGTGACGGC GCTTTCGGGT CTTGTGTTGC TGTGGTCCAT CGCGGTGCCG 
TACCGCAACG TGGCAATCAT GGTATGCGCA GGCGTGGTGT TCACGCTGTC CATAGTGGTG 
GTCATCCGTC TCATCATGGA TCCCGATTCG GTGCGCGCTC GTCAGTCTGA CTCCATGTTG 
AAGCTGGCTA GCCAAACGCT GACCTGCATG AACGACGGCA TGGATTACAA GGCCGCGCAG 
AAGATCTGCG GGTTGCTGCT GCCGTCCACC GCGGCTATCG CCGTGGCTAT CACCGACAAA 
AAGCAGATTT TGGGATACGC AGGCTTCGAG GAAGCTCAGA ACCTGCCGGG CAGCATCATC 
CGCACCCACG CGACCCATGC CACGCTCGCC GACGGCAAGC TGCGCATCCT GTTCACGCCC 
GAAGATATCG GCTTCCCCAG CGAGTCGTCG AATATCAAGG CAGCCATCAT CGTGCCGCTT 
GCCATAGGCC GCAACGTCGA GGGCACGCTC AAGTTCTACT ATCGCCGAGC GAAGCATATC 
AGCGAGACGC AGAAGTCCAT CGCCGAAGGG TTCGGCAAAC TGCTGTCCAC GCAGATGGCG 
GCATCGGCGC TGGAAGAGCA GACGCAGTTG GCCACGCGCA TGGAGCTGAA GATGCTCCAA 
AGCCAGATCA ACCCGCACTT CTTGTTCAAT ACCATCAACA CCATCGCCTC ACTCATTCGC 
ACCGACCCCG AAACGGCGCG CAAGCTGCTG CGCGAATTCG CCGTGTTCTA TCGCCGAACG 
CTTGAAGACT CCGCCGATCT GATCGTGTTC GCGCGTGAGA TGGAGCAAAC GAAGCGGTAC 
TTCACGTTCG AAGTGGCGCG TTTCGGTGCC GACCGCGTGG AGATGGAGAT GCGCATCGAT 
CCTCGTGTGG AAGACATGCT GGTGCCGCCT TTTTTGCTGC AACCGCTCGT GGAGAACGCT 
GTACGCCACG CCATGCCGAG CGAGGGGAAG TTGACTATCG AGGTGACGGG CGAGGTCACG 
GGCAACGACG TGATTGTGCG CGTGTGCGAC AACGGCGTGG GTATGACCGA AGAGGCGCGC 
TGCAACATTC TTCATCCCGA ATCGTCGCTC GGCCTCGGCA TCGCGGTGAA GAACGTGCAC 
GATCGAATCT GCGGCTACTT CGGTCCCGGT ACGCATATGG AAGTGGAAAG CGAGCTCGGC 
AAGGGAACCT GCGTGATCCT CGTATTGAAG GAAGGGGCTC TGCGCGAGTA CCAGTAG

Protein sequence

MQEETGESKS ALPRFFTLEM FMFTVTALSG LVLLWSIAVP YRNVAIMVCA GVVFTLSIVV 
VIRLIMDPDS VRARQSDSML KLASQTLTCM NDGMDYKAAQ KICGLLLPST AAIAVAITDK 
KQILGYAGFE EAQNLPGSII RTHATHATLA DGKLRILFTP EDIGFPSESS NIKAAIIVPL 
AIGRNVEGTL KFYYRRAKHI SETQKSIAEG FGKLLSTQMA ASALEEQTQL ATRMELKMLQ 
SQINPHFLFN TINTIASLIR TDPETARKLL REFAVFYRRT LEDSADLIVF AREMEQTKRY 
FTFEVARFGA DRVEMEMRID PRVEDMLVPP FLLQPLVENA VRHAMPSEGK LTIEVTGEVT 
GNDVIVRVCD NGVGMTEEAR CNILHPESSL GLGIAVKNVH DRICGYFGPG THMEVESELG 
KGTCVILVLK EGALREYQ