Gene Elen_0015 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0015
Symbol
ID	8414292
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	20306
End bp	21316
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	60%
IMG OID	645022988
Product	ABC transporter related
Protein accession	YP_003180398
Protein GI	257789792
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1119] ABC-type molybdenum transport system, ATPase component/photorepair protein PhrA
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.0396331
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATATCC AAACGCCTCC CTTCCTCGAA CTGCACAACG CGGTCGTGCA GCGTGCGGGC 
GCGCCTATTC TGACGGTCGA CTCGTTTCGA CTGGAGGAAA GAGAGCATCT TGCGTTGCTG 
GGTCCGAACG GGTCGGGAAA GTCGACGTTT GTGATGCTGA TCACGCGCGA GGTGGTCCCC 
TTGCACCGGG AAGTGCCGCC GGTTCGGTTT CGCGGCAGCG AGCGTGCGAC CCTTGCGGAC 
GTGAAGCGGA GCTTGGGCGT CGTCTCGTCG ACGATGCAGG ATCAGATTTC CGTACATCTG 
CCTACGGCGG ACGTGGTGGC GGGAGGGTTG TACGGAACGC TGGGCGTCCC GGCGCGGGTC 
GACGCCCGGC ACTTGCATGA AGCCCGTGAG CGAGCTCGTG AGGTTATGGA GCTGCTGGGT 
GTTGACGAGT TGGCGGCACG CGACATCATG ACGCTGTCCA CCGGCCAGGC GCGACGAGTG 
CTCATAGCTC GTGCGCTCGT GCACGACCCC GACGTTCTTG TGTTCGACGA GCCGTGCACC 
GGACTTGATC CCGAAGGTAT GTATTACGTT CGGTCGAGTA TGCGCACGCT TGCAAAAGCG 
GGAAAGGGAA TCGTGCTGGT CACGCACTAT CCCGAGGATA TTATCCCCGA GATCAAGCGC 
GTCGTGCTAT TGAAAAACGG TACGGTGTTC GCCGACGGGT CGAAAGGCCG GCTCTTGACG 
GATGGCGTGA TGAGCGAGCT GTTCGACGTT CCTTTGCACG TGCAGCGCAT GATCGCCGGA 
CGTTCTACGG AGCCGGCCAC GCAAACTTCT CATTCCGCTG CATCCCCCAC GACGTCTCCG 
CGATCAGCCG TACCTCATAG CACGCTTCCG CGATCCGTTG TTGACGCTGC GTCGACATCT 
TCTATACCCT GCGCGTCGAG TGCGAAATCC GCCTCGCCCT GTGTGCAAGC AGACGAAAAT 
TTCGATGATG CTCGTGAAGA GGAATATTTC TCGCTTGTGA GTGCGTATTA G

Protein sequence

MDIQTPPFLE LHNAVVQRAG APILTVDSFR LEEREHLALL GPNGSGKSTF VMLITREVVP 
LHREVPPVRF RGSERATLAD VKRSLGVVSS TMQDQISVHL PTADVVAGGL YGTLGVPARV 
DARHLHEARE RAREVMELLG VDELAARDIM TLSTGQARRV LIARALVHDP DVLVFDEPCT 
GLDPEGMYYV RSSMRTLAKA GKGIVLVTHY PEDIIPEIKR VVLLKNGTVF ADGSKGRLLT 
DGVMSELFDV PLHVQRMIAG RSTEPATQTS HSAASPTTSP RSAVPHSTLP RSVVDAASTS 
SIPCASSAKS ASPCVQADEN FDDAREEEYF SLVSAY