Gene Elen_1744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1744
Symbol
ID	8416043
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	2051599
End bp	2052798
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	64%
IMG OID	645024710
Product	histidine kinase
Protein accession	YP_003182098
Protein GI	257791492
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.376505
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.0197179
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGAGCGT CCAATTTCAG CGAGCGGGAG CTGGCGGGCG CGTGCGAGAA GTACGCGCGT 
GCGGTGAACG ACATCAAAGA TCGGTACGGG TTCGATTTCG TGTCCATCGG GTTGACGGCG 
TTCATCGGCG CGCCGCTCAA GTGGATATAC AGCGCAGGCG CTACCGGCGA GCGCCATCGC 
CGCATCGTGC TGGCGCCGGG GCACGGCATC GGCGGCATCA CCATCAAGGC GGGCAAGCCC 
ATGATGTTCA CGAACATCGA CGAGGAGATC GACCCGCGCG AGTACTCGTC GTACCCTATC 
GTGTTCGCCG AGGATCTGCA TAGCTTCTGC GCGTTGCCGC TCACGCGCGA CGGGCGCGTG 
GTCGCCGTGC TGCTGTGCGC GTTCCGCACG GTGAGCGATC GGCACGAAGC GGCGTACCGC 
CAGGTCATCG ACGATCTGGA CGGCACCTTG TGCGATTTGG ACGTCGTTTC CGACGACTTC 
ATGGATTTCG AAAGAATCGC GGTGGAGAAA CGCGCCGACG ATCAGAAGAA CCCTATCTTC 
ATCCGTTCGG AGCTTGCGCG CGTCATCGCC GCTCAGGAGG ACGAGCGCAA GCGCATCTCG 
CGCGAGCTGC ACGACGGCAT AGCGCAGGAG CTGCTGACGC TGTCGTTCGT GTTCAAGCGC 
CTTGTCGCGT ATGTTGACGA AGAGGGCTAC GAGCTGCTGG CGGAAGCGAA CAACGATCTT 
GCCAACGTGC TTGACGAGCT GCACAACCTG TCGGTGAAGC TGCGACCCTC GGCTCTCGAC 
CATCTTGGTT TCGTTGCGGC TCTGCGCTCG CAGGCTGCCG TGTTCGAGCG CACGTACGGC 
AACGAGATCG TGTTCGAGGG CAGCCTGTCG TGCGATCGCT TCGATCAGGC TCTCGAGACG 
CAGGCGTACC GCATCTGCCA GGAGGCCATC CTCAACGCCT GCAAGTACTC GGGTTCCGAG 
AAGGTGATCG TCCGGCTCGA GGATTCGGCC GGATGGCTGC ATGTGAGCGT GATCGACCAC 
GGATGCGGCT TCGACACCGA GCAGCCGGAG ATCAAGGGGA GCGGCTGCGG TCTCGTAGGC 
ATGCAGGAGC GCGCGAGCGT CATCGGCGCC CGGCTCGCGA TGGAATCCGA CGAGCATGGC 
ACGAAGATGA CGCTGGTTGC GCCGATGCAC GTGGCGGAAG GCAAGGAGGC GGGCGCATGA

Protein sequence

MGASNFSERE LAGACEKYAR AVNDIKDRYG FDFVSIGLTA FIGAPLKWIY SAGATGERHR 
RIVLAPGHGI GGITIKAGKP MMFTNIDEEI DPREYSSYPI VFAEDLHSFC ALPLTRDGRV 
VAVLLCAFRT VSDRHEAAYR QVIDDLDGTL CDLDVVSDDF MDFERIAVEK RADDQKNPIF 
IRSELARVIA AQEDERKRIS RELHDGIAQE LLTLSFVFKR LVAYVDEEGY ELLAEANNDL 
ANVLDELHNL SVKLRPSALD HLGFVAALRS QAAVFERTYG NEIVFEGSLS CDRFDQALET 
QAYRICQEAI LNACKYSGSE KVIVRLEDSA GWLHVSVIDH GCGFDTEQPE IKGSGCGLVG 
MQERASVIGA RLAMESDEHG TKMTLVAPMH VAEGKEAGA