Gene Elen_3020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_3020
Symbol
ID	8417354
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	3505106
End bp	3506830
Gene Length	1725 bp
Protein Length	574 aa
Translation table	11
GC content	68%
IMG OID	645025999
Product	ABC-1 domain protein
Protein accession	YP_003183352
Protein GI	257792746
COG category	[R] General function prediction only
COG ID	[COG0661] Predicted unusual protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCACGC TCAAGGAAGT GGCGCAGGTG GCCGTGGAGG CGCGACGCGA CAAAGGGTCG 
GGGTCGGGGA GGCGCCTGCG CGAGATCGAG CGCATCCTGC GGCAGCATCG CGTGCTGTCG 
GGCCTCACGC CGGAAAAGGC GACCAGCTTG CTTGAGGACT TGGGGCCGAC GTTCGTGAAG 
ATGGGACAGA TCGCGGCGAA CCGCAGCGAC GTCATCCCGC CCGCGTACGC CGACGCGTTC 
AAGCGGCTGC GCGCCGACGT GCCGCCCATG CCGTTCTCCA CGGTGCTCGC CACCATCGAG 
GAATCGCTGG GGCATCCGTG GCGGGAAACG TTCTCGTGCA TCGAGGAGAA GCCGCTCGGA 
TCGGCGTCCA TCGCCCAAGC GCACCGGGCG CGCATCGCGC CGCATGCGGT TGGCGATGCG 
GGAGCGGGCA CCGGCGCCGC GGCGGTCCCG TTGCCTGCCG ACGCTCCGAA GGCGGGGTCG 
TACGTGGCCA TCAAGGTGCG TCGACCGCAC GTGGTGGAGC AGATGACGCA GGATCTCGCG 
CTCATCCGCC AGGCGGTTGC GCTCGTAGGG CTCACCCGTG CAACCGACGG CATCAAGCTG 
TCGCTGGACG ACCTGGTCAC CGAGCTGGAG CGCACGACGC GCCAGGAGCT TGACTTCTGC 
GTCGAGCAGC ACAATCTCGT GCGGTTCCGC CAGTTTCTCG ACGATCAGCC GGGAGTGGAA 
AGCCCGCGCC CGTATCCGCA CCTCAGTTCC GACGACGTGC TGGTCATGGA CTTCGTCGAG 
GGCCCCATGA TCAACGACGT TCCCGCCCTG CGCGCTATGG GCCTTGATCC GGCGAAGCTG 
GGCCAGCGCC TGGCCGAGAG CTTCGTGACG CAGATCGTGG ACAACGGGTT CTTCCATGCC 
GACCCGCATC CGGGCAACAT CCTCGTGCGC GGCGACGACA TCGTGTGGAT CGATTTGGGG 
ATGGTGGGCC AGCTGTCGGC GCTCGAGCGC GCGCTGATCG GGCGCATGTT CCGCGCTGTG 
GCCGAGAACG ATCCGTATGC GCTGATGGAA GCGCTGCTGG GCGCCGTGCG CTCGGAGGGG 
CCGGTCAACC ACGGGCGGCT GCTCAGCCAG CTGGGCAACC TGCTGGTCTC GTACACCACG 
GTGAACCTGG CCGACATCAA CGTGGGCTCG GCGCTGATGG ACGTGTTCGG CGTGCTGCAG 
ACGCAGAACC TGGCGCTGCC GCCTTCGTTC ACCCTGCTGG CGCGCGGCAT GGTCACCATC 
GAGGGCGTGC TGGTGGACAT CGCGCCCGAC ACCAGCGTCA TCGACATCAT CGCCGCCCAC 
GTGAAGCGCC GCGAGCGCAC CTGGGAGGCG TTCGAAACCA AGGCGCGCGA GTTCGTCTCG 
ACCGCGGCGA CGTCCGCGCA GGCCGCGGTG CGCTTGCCCA CCCAGGCATC GCACACGCTC 
GACATGATCG ATCGCGGCCA GGTTCGCGTC GGCGCCGACC TCGGCATCCC GATCGACGCC 
ATCGCCGCGC TCTACTCCGT CAGCGGGACG GTGGCTATGG CGCTCATCTC CGCCGGGCTG 
TTCATCGGAT CGAGCCTGCT TGCTACCACG AACATGCACC CGCAGTTTCT GGGCGTGCCC 
CTGCTGGGCG TGTTGGGCTA CGTGGGCGCG TTCGTCCTCG GTGCCTACGT GGTGTGGCGC 
AACCTCGTCA TCCGCCACAG GCAAAAGAAC GAGGAGAAGC TGTAG

Protein sequence

MATLKEVAQV AVEARRDKGS GSGRRLREIE RILRQHRVLS GLTPEKATSL LEDLGPTFVK 
MGQIAANRSD VIPPAYADAF KRLRADVPPM PFSTVLATIE ESLGHPWRET FSCIEEKPLG 
SASIAQAHRA RIAPHAVGDA GAGTGAAAVP LPADAPKAGS YVAIKVRRPH VVEQMTQDLA 
LIRQAVALVG LTRATDGIKL SLDDLVTELE RTTRQELDFC VEQHNLVRFR QFLDDQPGVE 
SPRPYPHLSS DDVLVMDFVE GPMINDVPAL RAMGLDPAKL GQRLAESFVT QIVDNGFFHA 
DPHPGNILVR GDDIVWIDLG MVGQLSALER ALIGRMFRAV AENDPYALME ALLGAVRSEG 
PVNHGRLLSQ LGNLLVSYTT VNLADINVGS ALMDVFGVLQ TQNLALPPSF TLLARGMVTI 
EGVLVDIAPD TSVIDIIAAH VKRRERTWEA FETKAREFVS TAATSAQAAV RLPTQASHTL 
DMIDRGQVRV GADLGIPIDA IAALYSVSGT VAMALISAGL FIGSSLLATT NMHPQFLGVP 
LLGVLGYVGA FVLGAYVVWR NLVIRHRQKN EEKL