Gene Elen_3002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_3002
Symbol
ID	8417335
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	3487161
End bp	3488225
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	64%
IMG OID	645025980
Product	polysaccharide deacetylase
Protein accession	YP_003183334
Protein GI	257792728
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0726] Predicted xylanase/chitin deacetylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.885061
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGAGCC TGCCTGCCTC CATAACCCTC AATGGAGCCA ACCTGGAAGT AGGCGGTCAC 
AAGACGTTGG AAGACGCGCT GCGCGCCAGC GGCATCAAGC CGAAACCCGG CGATTTCGTT 
GCCGTGGACG GCTCGGTGAT CGAAGCAGGA AAGGGCGAGC CGTTTCACGC CACCGTCAAC 
GGCGAAGTCG CTACCGACAT GGATACGAAG CTGAACAACG GCGACGTGGT CGAACTGGGC 
GACGGCAGCG CCATCGAAGA GCCGAGCGAA ACCGCCGAGG AAAGCATCCC CTACTCGATC 
GAAGAGGAAG GGCGCGGACC TATCCACGTG CTCGAGGGGC AAGGCGCCGA CGGATTGAAG 
CGCACGAAAA CCGGCTCGGT CTCCGGCCTG ACGACGGAAG AAGTCGTGCA GGAGCCTTCC 
AACGTGGTGC GCCGAAACGT TTCGCCGCAG GTAGGCGAGG ACAAAGTGGT GGCACTCACG 
TTCGACGACG GCCCCTGGCC CGAATCCACC GCCGCAGTGC TCGACGTGCT GGCCGACCAA 
GGGGCGAAGG CCACATTCTT CACCGTGGGC AATCGCATCG ACGGAGAAGG CGTCGACCTC 
GTAAAGCGCG CAGCAGCCGA AGGCCATCAG ATATGCTCGC ACTCGTTCGA CCACGCGGCG 
GGCGACGGTC AAAGCGTGAA CCTCGGCTAC ATGACGCCTG AGGATCAGGT CGCCGAAGTG 
CAGAAGGGCT ACGAAGCCAT CGAAGCCGCC ACCGGCGCCG AAGCCAGCCA TGTATTCCGC 
ACGCCGGGAG GCAACTACGG CGAAGGCGTC ATGCGCAATG TCGGGCCGCT GATCAGCGCG 
GAAATCGGCT GGAACATCGA CTCGCAAGAC TGGCGCAAGC CCGGAGCCGC CGCCATCGCC 
AACCAGGTGA AAAACGCCTG GCCGGGCGCC ATCGTGCTCA TGCACGACGG AGGCGGCGAC 
CGATCGCAAA CGGTCGAGGC GCTCAAAGAC GCGCTCCCCT ATCTCAAGTC GCAGGGCTAC 
CGCTTCGTCA CCATGGACGA GCTGCTCGGC TATCCGCTCT CCTAA

Protein sequence

MQSLPASITL NGANLEVGGH KTLEDALRAS GIKPKPGDFV AVDGSVIEAG KGEPFHATVN 
GEVATDMDTK LNNGDVVELG DGSAIEEPSE TAEESIPYSI EEEGRGPIHV LEGQGADGLK 
RTKTGSVSGL TTEEVVQEPS NVVRRNVSPQ VGEDKVVALT FDDGPWPEST AAVLDVLADQ 
GAKATFFTVG NRIDGEGVDL VKRAAAEGHQ ICSHSFDHAA GDGQSVNLGY MTPEDQVAEV 
QKGYEAIEAA TGAEASHVFR TPGGNYGEGV MRNVGPLISA EIGWNIDSQD WRKPGAAAIA 
NQVKNAWPGA IVLMHDGGGD RSQTVEALKD ALPYLKSQGY RFVTMDELLG YPLS