Gene Elen_1201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1201
Symbol
ID	8415492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	1440749
End bp	1441981
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	73%
IMG OID	645024164
Product	Galactokinase
Protein accession	YP_003181560
Protein GI	257790954
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.267073
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACCC TGGAGGATGC CCGCACTCCT GCGCCGGCGC GCCTGCGCAA GCGGTTCGCC 
GAGCGCTTCG GGAACGCGGG CGCACGGCCG CTCGCATTCG CATCCGCTCC CGGGCGCGTG 
GAGCTGGCCG GCAACCATAC CGACCATCAG GGCGGGCGCA CGATCTCGGC CGCCATCGAC 
CGCCGCATCT ACGCGCTCGC CGCCCCGAAC GGCACCGACG AGATGCGCGT GAGCATGGAG 
AGCTTCGGCG ACATCGCGCT GAGCTGCGGC GACTTGGACG CGCGCGAAAG CGAGCGCGGG 
ACGTCGCTTG CGCTCGTGCG CGGCATGGCG GCCGCCTTCG TGCGCGCGGG CGGAAGGCTT 
TCCGGGTTCG ATGCGGCCAC CTGCTCCGAC ATCCCCGCAG GCGCCGGGGT CTCGTCGTCG 
GCCGCGTTCG AGATGCTGGT CGGCGTGCTG CTGCGCGTGC TGTGCGACCC GACGGGCGCC 
GTGCCGTGCG ACCCCGTGGC GCTGGCGTTG GAGGGCGCTC AGGTCGAGCA GGCCTACTTC 
GGGAAGCCCT GCGGCGTGCA GGACCAGCTG GCCAGCGCGC AGGGCGGCGC GGCGGCCTTC 
GACTTCGCGG GCGACCTGCC GCGCGTCGAG CCCATCGCCT TCGACTGGGA GGCGTGCGGC 
TATGCGCTCT GCCTGGTGGA CAGCCGATGC GACCACTCCG TCCACGCGGA CGAGTACGCG 
GCCGTTCCCG CCGACATGCG CGCGGTCGCG CGGCGCTTCG GATGCGAGCG GCTGGAAGAC 
GTTCCCTACC CCGTCTTCCT CGCCCGGCTG GCCGACGTGC GCGCGCACCT GGGCGACCGT 
GCGGCCTTGC GCGCGCTCCA CTACTTCGAG GAGACGCGGC GCGTTGCCGC GCAGCAGCGG 
GCGTTGGAAT CCGGAGACAT CGAAGGGTTT CTCGAAGGCG TGCGGCAATC GGGCGCGTCG 
TCGGCGCAGT TCCTGCAGAA CGTGTCGCCG CGCGGCGACG GCTTGGGCGC ACGGCAGCCG 
GCCATGATGG TCCTCGCGCT GTGCGCGCAC CTCCTGGACG GGCGCGGCGC GTACCGCATC 
CACGGCGGCG GGTTCGGCGG CAGCGCGCTG GCCTTCGTGC CGGCGGAGGA CATCGACGCG 
TTCTGCGAGT CGATGGATGC GCTGCTGGGC TACGACGCCT GCCTGCGCGC GAAGGTAGAC 
GGCCGCGGCG CGTACGCGGA GCGGATGGCC TGA

Protein sequence

MTTLEDARTP APARLRKRFA ERFGNAGARP LAFASAPGRV ELAGNHTDHQ GGRTISAAID 
RRIYALAAPN GTDEMRVSME SFGDIALSCG DLDARESERG TSLALVRGMA AAFVRAGGRL 
SGFDAATCSD IPAGAGVSSS AAFEMLVGVL LRVLCDPTGA VPCDPVALAL EGAQVEQAYF 
GKPCGVQDQL ASAQGGAAAF DFAGDLPRVE PIAFDWEACG YALCLVDSRC DHSVHADEYA 
AVPADMRAVA RRFGCERLED VPYPVFLARL ADVRAHLGDR AALRALHYFE ETRRVAAQQR 
ALESGDIEGF LEGVRQSGAS SAQFLQNVSP RGDGLGARQP AMMVLALCAH LLDGRGAYRI 
HGGGFGGSAL AFVPAEDIDA FCESMDALLG YDACLRAKVD GRGAYAERMA