Gene Elen_1246 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1246
Symbol
ID	8415538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	1497533
End bp	1499821
Gene Length	2289 bp
Protein Length	762 aa
Translation table	11
GC content	63%
IMG OID	645024210
Product	histidine kinase
Protein accession	YP_003181605
Protein GI	257790999
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0124717
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAACG CCCGCTACGA CTGGAAGAGG GGCGTCCTCC CTATGGAACT GATTACCCGC 
TCGCGCGAGC GGCGGCGCAT CGCCATCATC GTGGTCGCGC TCGTCCTTGC GCTTCTGATC 
GCGCTCGCGT ACACGATCGT CTCGTCGCGT CAGGCGACGG CGGCCGCGGT GGAAACCATG 
AGCGAAGTGT ACTTGCAAGA GCTCAGCAAC CAGGTCATCT CCCATTTCAA CACCGGCATC 
GACGGCAAGT TCTGCCAGCT GGAAACCGTG GGCAGCTCGC TTGAGCTGTA CGACCCGGAG 
AATCTCGACG AGGTGAGGGA TTTCCTCGCC TGCATGGAGG CGGACGATGA CGAGTACGCC 
TACCTTGCGC TGCGTGGCAG CGACGGGCTC TACTACACGT CGTGGGGCTC GGACGCCGCC 
TCGGATGAGG AGCTTGCCGC CCGCAGCGAG CTGGGGCTGT CGTATCGGGA CGCGCACGGC 
CACGACGTGA TGCTATACAA CGGAACCATC GCGCTCGTGG ATTCCTTCGA GCCCGTTACC 
TGCGGAGGCG TCACGTTCAC CGCCGTCGTC GCCGGGTTCG GCGTCGACAC CGTTTCCGGG 
AAGCTCAACC TCGATCTGGT CAATGGCAGC GCGCGGTCGA GCGTCATCGG CTTCGACGGC 
ACTTGCATCG CAGGATGCGA TGCCGAGGGG CTGTGCAACG GCGAGAACCT GTTCGACGCG 
TTGGAATCGA GCGCTCGCCT CGACAAGGGG TACAGCATGG ACCAGGTGCG AGAAGCCGTG 
GAGAACGGGG AGACGTTCCT GCTTCCCTTC TGGTACGGGG GTCATCACGA GTACCTGTAC 
TTTCGGCCGA TGAGCAATCA AGACTGGTAT CTGTGCACCG CCATGCCCTA CGGCGTGGTG 
GACGAGGACG TGGCGGGACT CAGCTGGGTG CTCATGCAGA ACGCCGTTCT CATGGCGACC 
ATGATCATCG CGGTCATAGC CATCTTCTTC TCGATCTACT ATCAGCTGGT CAAGCGCAAC 
ACGCGTCTGC TGTCGGACGA GAAGAACCGT GCCGAGCGCG CTTCCGAGGA AGCGCGGCGC 
GCCAGCTTGG CGAAAAGCGA GTTCCTCTCG CGCATGTCGC ACGAGATTCG TACGCCGATG 
AACGGCATCA TGGGCATGAC CGCCATCGCG CTCGAGAATG CGCACGACGA GGAGAAGGCG 
CGAGCCTGCC TCGAGAAGAT CGACGTGACG TCCGAGCATC TCATGGCGCT CATCAACGAC 
ATCCTCGACA TGAGCAAGAT CGAGAGCGGC AAGATCGACA TCAAGCGCGA GACGTTCGAT 
TTCGGGACGT TCGTAGGGTC GCTCGACGAC GTGTTCGGAA CGCAGGCTCT CGAACAGGGG 
ATTCGCTACA AGACGGAAGA AGTGGGCGCG CTGCCCTCGC TGCTCGTCGG CGACGGGCTT 
CGGCTGAACC AGATCGTTTA CAATCTCGTT GGCAACGCTT TCAAGTTCAC TCCTCGCGAC 
GGCAGCGTCA CGCTGCGCAT AGAGGAGCTT CCCGCGCCGC CGGAAGAGGA TGCTGCGCAC 
GACGACGCGA TCTGGCTGCG CTTCTCGGTG ACCGATACGG GTTGCGGCAT CAAGCCGGAG 
AACCGCGAGC GGATATTCTC GTCTTTCGAG CAGGGCGACG AGTCTTCATG CAGACGCGGA 
GGCACGGGTC TGGGCCTTGC CATCACGAAG CGGTTCGCGG AGATGATGGG CGGCCGTATA 
TCGTTGTCGA GCGAGGTGGG GAAGGGGTCG ACCTTCACGG TGGACGTGCC GTTCGGGCGA 
GCCTCGGGCG AAGGGGCCGC CACGTGCGAC GATGCGTTCG CCGCGCGGTC CCGAACGCAC 
GGCGACGGAG TTTCGTACGA TTTCTCCGGC AGGCGCGTCA TCGTCGCCGA AGACAACGAG 
CTCAACCGCG AGATAGCCAC CGAGGTGCTG GCCATGGCGG GTGCCGAGGT CCTGGCGGCA 
TCCACGGGCG CCGAGGCCGT GCGCGCGTTC GAGCGCTCGC ACCCGGGCTC CGTCGACCTG 
ATCTTCATGG ACATCCAGAT GCCCGAGATG GACGGCTACG AGGCGACCCG CGTCATTCGC 
TCGCTCGATC GCGACGACGC GCGTTCGGTG CCCATCGTCG CGATGACGGC CAACGCGTTC 
GTCGAGGACG AGGAGCGCAG CCGCATGAGC GGAATGGATG GCCATCTGAG CAAACCCCTT 
GATATCCATC TCGTATATGC CACAATGGAC AGGTTTTTGA GAGGGCGCTC GCGGGGAGGG 
GGCGCGTAG

Protein sequence

MKNARYDWKR GVLPMELITR SRERRRIAII VVALVLALLI ALAYTIVSSR QATAAAVETM 
SEVYLQELSN QVISHFNTGI DGKFCQLETV GSSLELYDPE NLDEVRDFLA CMEADDDEYA 
YLALRGSDGL YYTSWGSDAA SDEELAARSE LGLSYRDAHG HDVMLYNGTI ALVDSFEPVT 
CGGVTFTAVV AGFGVDTVSG KLNLDLVNGS ARSSVIGFDG TCIAGCDAEG LCNGENLFDA 
LESSARLDKG YSMDQVREAV ENGETFLLPF WYGGHHEYLY FRPMSNQDWY LCTAMPYGVV 
DEDVAGLSWV LMQNAVLMAT MIIAVIAIFF SIYYQLVKRN TRLLSDEKNR AERASEEARR 
ASLAKSEFLS RMSHEIRTPM NGIMGMTAIA LENAHDEEKA RACLEKIDVT SEHLMALIND 
ILDMSKIESG KIDIKRETFD FGTFVGSLDD VFGTQALEQG IRYKTEEVGA LPSLLVGDGL 
RLNQIVYNLV GNAFKFTPRD GSVTLRIEEL PAPPEEDAAH DDAIWLRFSV TDTGCGIKPE 
NRERIFSSFE QGDESSCRRG GTGLGLAITK RFAEMMGGRI SLSSEVGKGS TFTVDVPFGR 
ASGEGAATCD DAFAARSRTH GDGVSYDFSG RRVIVAEDNE LNREIATEVL AMAGAEVLAA 
STGAEAVRAF ERSHPGSVDL IFMDIQMPEM DGYEATRVIR SLDRDDARSV PIVAMTANAF 
VEDEERSRMS GMDGHLSKPL DIHLVYATMD RFLRGRSRGG GA