Gene Elen_2200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_2200
Symbol
ID	8416522
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	2583981
End bp	2585102
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	69%
IMG OID	645025186
Product	ABC transporter related
Protein accession	YP_003182551
Protein GI	257791945
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0704641
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGAAG CGAACCGCAA GAACCCGCTT GAAACGGACG GCAGGAACCC GCTGCCGGAG 
CATCTGGCCG CTCGCGAGCG GGCGCTGTAC GAGGCCGCTG CCGAGCTGGA GCGCCTGACC 
GACCAGCTGT TCGGTGCGGA AGGCGCCGGC CGCGACTGCG CGATAGCGTC CGAGGATCCG 
ATCGACGGCC TCGCGCCCGA CGTCGTGCCG CACGAGGCTC TTTCGCACAA AGACGCGCAG 
GTGCACCACC ATCATACGCA CGCGCCCGTT TCCCGCCACG AGCACGGCCA CCACCTGCTG 
CAGGTGGAGG ACCTCAGCGT GGGGTTCCGC ATGTACGACG AGGACGCCCC CTTCTTTCGC 
GCGAAGCAGC GCGAGGTCGA GGTCATCCAT TCTTTAAGCA TCTCCGTACA TGCGGGCGAG 
ATCGTGGCCG TGGTAGGCGC GTCGGGTTCC GGCAAGACGC TTTTGGCCGA TGCCGTGTTG 
GGGCTGTTCG AGCCGAACGC CACGGTGCGC GGCCGCGTCT GGTTCGACGG CGCGCAGCAG 
GATGCGGCGT CGCTTTCCGC GCTGCGCGGC CACGGCATCT CGCTGGTGCC GCAGAGCGTG 
AACAACCTCG ACCCGCTCAT GAAGGTGGGC CGTCAGGTGG AGGGCTTCGC GCGCGCACAC 
GAGTCGCGCG CCGAGCGTCG TCGTCGGCGC GCGCAACTGT TCGAGCGCTA CGGACTGCCC 
GAGGACACGG CGGGGAAGTA TCCGCACGAG CTGTCGGGCG GCATGGCGCG CCGCGTTCTT 
TTGTGCTGCG CGCTCATGGA CGACCCGCGC GTCATCGTGG CCGACGAGCC CACGCCCGGC 
CTCGACCTGG ATCTGGCCGT GCGCGCGCTC GACGACTTCC GCGCCTTCGC CGACGCGGGC 
GGCGGCGTGA TGCTCATCAC GCACGACATC GAGCTGGCCC TGCGCGTGGC CGACCGCGTG 
GCGGTGTTCC GCGACGGCAC GGTGGTGGAG GAGACGGCAG TTGCGAACTT CGCGTCTCCC 
GACCTGCTGC AGCACCCGTT CAGCCGCGAG TTGTGGCATG CGCTTCCCGA GCACGGCTTC 
GAGGCGCCGG GCGGGTCGAC GGAAGGGGGT TCCCATGCTT GA

Protein sequence

MDEANRKNPL ETDGRNPLPE HLAARERALY EAAAELERLT DQLFGAEGAG RDCAIASEDP 
IDGLAPDVVP HEALSHKDAQ VHHHHTHAPV SRHEHGHHLL QVEDLSVGFR MYDEDAPFFR 
AKQREVEVIH SLSISVHAGE IVAVVGASGS GKTLLADAVL GLFEPNATVR GRVWFDGAQQ 
DAASLSALRG HGISLVPQSV NNLDPLMKVG RQVEGFARAH ESRAERRRRR AQLFERYGLP 
EDTAGKYPHE LSGGMARRVL LCCALMDDPR VIVADEPTPG LDLDLAVRAL DDFRAFADAG 
GGVMLITHDI ELALRVADRV AVFRDGTVVE ETAVANFASP DLLQHPFSRE LWHALPEHGF 
EAPGGSTEGG SHA