Gene Elen_1221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1221
Symbol
ID	8415512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	1466682
End bp	1467809
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	66%
IMG OID	645024184
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_003181580
Protein GI	257790974
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.0728047
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTTCTTT CGGTGAAGAA CCTCTCAACG GAGTTCCCCG TCAAGAAGGG CATCGTCCGC 
GCCGTCGAAG ACGTGAGCTT CGACGTGGAC CAAGGCGAGA TCCTGGCGAT CGTGGGCGAG 
TCGGGTTCCG GCAAGTCCGT GACCAGCCTC TCCATCATGG GTCTTTTGGC CGAGCCGGGA 
CACGTGGCCG GCGGCTCCCT GGAGTTCGAA GGCAAGGACC TCGCAACCCT GTCCGAGAAG 
CAGTACCGCG AACTGCGCGG CAACGACATG GCGATGATCT TCCAGGAGCC CATGACCTCG 
CTCAACCCGG TGTACCGCGT GGGCAACCAG ATCGTGGAGG CCATCCGCAC CCACGAGAAG 
GTGTCGAAGG CCGAGGCGAA GGACCGTGCC GTCGACCTGT TGCGCAAGGT GGGCATCCCC 
AGCCCCGAGG CACGCATCAA CGACTACCCG CACCAGATGT CGGGCGGCAT GCGCCAGCGC 
GTGATGATCG CCATGGCGCT GGCCTGCAAC CCGAAGCTGC TCATCGCCGA CGAGCCGACG 
ACGGCCCTCG ACGTGACCAT CCAGGCGCAA ATCCTCGATC TTCTGCGCCG CCTGCGCGAC 
GACACGGGCA TGGCCGTGCT GCTGATCACG CACGACCTGG GCGTGGTGTC GGAGACGGCC 
GACCGCGTGG TGGTCATGTA CTGCGGCCAG GTGGTGGAGG AAGCCGAGGT CCGCACGCTG 
TTCGACCACC CGATGCACCC CTACACGCTG GGCCTGCTGA AGTCCATCCC CCGCCTGGAG 
GACGACGATT CGAAGCGCCT GTACATGATC AAGGGCATGG TGCCGAACCC GTTGGAGATG 
CCGCCGGGCT GCCATTTCTC AGACCGCTGC GACTCCTGCA TGGACATCTG CCGCACGAAG 
GTTCCCGAGC TTGTGGACGT CGACGGCCAT AAGGTGCGCT GCTTCCTGTA CGAGAGCGCC 
GACGGCGAAG TGAAGAGCGA GGAAGCCATC GCCCGAGCCG AGGCCGAGGC GCTGGCCGAC 
GTCGAAGCGG CGCGCGAGGT GGAGACCGCC GAGGCGCTGT TGGCTGCCGA AGATCTGCGC 
GAGGCGGAGA TCGAGGAGAT CGAGAAGGAA GAGGAGGCGA GCCGATGA

Protein sequence

MLLSVKNLST EFPVKKGIVR AVEDVSFDVD QGEILAIVGE SGSGKSVTSL SIMGLLAEPG 
HVAGGSLEFE GKDLATLSEK QYRELRGNDM AMIFQEPMTS LNPVYRVGNQ IVEAIRTHEK 
VSKAEAKDRA VDLLRKVGIP SPEARINDYP HQMSGGMRQR VMIAMALACN PKLLIADEPT 
TALDVTIQAQ ILDLLRRLRD DTGMAVLLIT HDLGVVSETA DRVVVMYCGQ VVEEAEVRTL 
FDHPMHPYTL GLLKSIPRLE DDDSKRLYMI KGMVPNPLEM PPGCHFSDRC DSCMDICRTK 
VPELVDVDGH KVRCFLYESA DGEVKSEEAI ARAEAEALAD VEAAREVETA EALLAAEDLR 
EAEIEEIEKE EEASR