Gene Elen_3055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_3055
Symbol
ID	8417390
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	3552145
End bp	3553833
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	64%
IMG OID	645026035
Product	histidine kinase
Protein accession	YP_003183387
Protein GI	257792781
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGAAGC ATGCTTTCAG TCTGAAGACC ATCTATCTTG CCGCTCTGAC GGCGGTGTTC 
GCCGTGTCGT TTTTCGCGTT CGTCGCGTTC GATTTGTACT CGCAGCAGCG GCAGACCGAG 
CAGGCCATGC TGGAGGAAGC GCGCACGTTC GCGCGCGAGA TGGACGCGGT GTGGCAGTTC 
ATGGACAACT CCCAAAGCAT CATCAACAAT TCGTCCAGCG GCGGCTACGA GTTCAAGGGC 
CTGCACTGCT CGGTGGTGGG CAAGAGCGTC GGCCGGCTGT TCTCGGCGGG CAGCGACTAC 
CACATCCGGT ACACGAACTT CGACCCGCGC AGCGAGCAGG ATATTCCCGA CGAGTTCGAG 
ACGAAGGCGC TCGAGGCGTT CAACGCCGAT CGTTCGGTGA CCGAGTACTA CGGCGTGGCC 
CCGTTCGACG GCGAGGATCG GTTCCGCTAC CTGCAAGCGC TCGAAGTGGA CGACAGCTGC 
CTCGAATGCC ACGGCGAGCC GGTCGGCGAG CTCGACATCA CCGACCACGC GAAGGAAGGT 
TGGACGCTCG AGTCGGTCGG CGGGGCAATC AGCATCGTGA TCCCCCTCGA TCAGCAGCAG 
GCGGCCATGC GCGGCAACGT CATCCGAGAC ATGGCGTACT TCCTGTTGAT CACCGTGTTC 
ATCGGCTTGG TCATCTTGGT GGTGACCACT GTGTTCGTGC TGCGGCCGTT GGGCGGCATG 
CACGCGGCGT TCGGCGAGCT GAAACAGGGA CGCTTGGGCG CGTCCGTCAG CCAGCGCTTC 
GCCGCGAAGG AAGTGAGGAG CCTCATCGCC GGCTTCAACG ACATGGCGGG CGAGCTGCGG 
GGCATGTACG AGCATCTGGA ATCGCAGGTG CAGGAGCGTA CGGTGGACCT GCGCGAGGCG 
AACGCCCTGC TGGAACGCCA GCGCGACAAG CTGGAGCAGC TTAACGCCGA CCTGGCGCAG 
GAGACGCAGT TCAAGTCCGA CCTGCTAAGC ATGGTGAACC ACGAGCTGCG CACGCCGCTG 
ACGTCCATCA TCACGTTCGC GCAGATATCG CGCGAGGCGT GCGACCCGGC CAACGAGCAC 
GACCGTCGCT CGTGGGAGGA GATCGAGAAG AACAGTCGCA TCCTGCTCAA CATGATCAAC 
AACATGCTGG ACATCGCGCG TTCGGATGCG GGCGGCATGC GCGCCACCTG CGAGCCGATG 
GATTTGGGCG ACGTGGCGGC ATCGGTGAAG GGCACCATGG CTCCGCTGGC GCGCAAGTAC 
GAGGTGTCGT TCAGCACGAA GGTGGCGTCG GACGTGCCCT TGGTCAACGG CGACTACGAG 
AAGACGACGC GCATGCTGGA GAACCTGGCC AGCAACGCCA TCAAGTTCAC GCCCGACGGC 
GGCTCCATCG AGCTGCGCGT GGCGTACGAC GCCGAGGCGC GCGTGGTGAC GTTGTCGATG 
GTGGACGACG GCATCGGCAT CGCGCCCGAG GACCAGGCGC GCATCTTCGA GCGGTTCGTG 
CAGGTGGACA GCACGTCCAC GCGTAAGTAC AACGGCAGCG GCCTCGGTTT GGCACTGGTG 
CGCGAATACG GCGACATGCA AGGGTTCGCC GTGTCGGTGG AAAGCGAGCT CGGTCGCGGC 
AGCAGGTTCG TCATCACGAT TCCCGCGAGC GCGATCGTGG GCGAGATAGA GGGGGAGGAC 
GATGTATAA

Protein sequence

MGKHAFSLKT IYLAALTAVF AVSFFAFVAF DLYSQQRQTE QAMLEEARTF AREMDAVWQF 
MDNSQSIINN SSSGGYEFKG LHCSVVGKSV GRLFSAGSDY HIRYTNFDPR SEQDIPDEFE 
TKALEAFNAD RSVTEYYGVA PFDGEDRFRY LQALEVDDSC LECHGEPVGE LDITDHAKEG 
WTLESVGGAI SIVIPLDQQQ AAMRGNVIRD MAYFLLITVF IGLVILVVTT VFVLRPLGGM 
HAAFGELKQG RLGASVSQRF AAKEVRSLIA GFNDMAGELR GMYEHLESQV QERTVDLREA 
NALLERQRDK LEQLNADLAQ ETQFKSDLLS MVNHELRTPL TSIITFAQIS REACDPANEH 
DRRSWEEIEK NSRILLNMIN NMLDIARSDA GGMRATCEPM DLGDVAASVK GTMAPLARKY 
EVSFSTKVAS DVPLVNGDYE KTTRMLENLA SNAIKFTPDG GSIELRVAYD AEARVVTLSM 
VDDGIGIAPE DQARIFERFV QVDSTSTRKY NGSGLGLALV REYGDMQGFA VSVESELGRG 
SRFVITIPAS AIVGEIEGED DV