Gene Emin_1233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1233
Symbol
ID	6263688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	1332918
End bp	1333892
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	38%
IMG OID	642611711
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001876120
Protein GI	187251638
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATACAT TACTTCAGGT TAAAGATTTG TCTGTGTTTT TTAAAACGTC CGAAGCAAAT 
ATAAAAGTAT TAAAAGAACT ATGTTACCAA CTTAATGCCG GCGAAACTTT GTCTATAGTG 
GGTGAGTCCG GCTCGGGCAA AACGGTACAC GCTCTAAGTA TTTTAAGGTT AATGTCTACA 
AACGCAAAAA TAACGGGTGA AATAATTTTT AAAAATGAGA ACCTGTCCGT TTTACCTGAA 
AGCAAACTAA AAAATATACG GGGCAAAAAA ATAGCCATGA TTTTCCAAGA TCCTATGACA 
AGCCTCAACC CCGTTATGAC AATAGGTTCG CAAATTTACG AAACACTGCT TACGCATAAA 
AAAGCTACAA AAAAAAATAT AAAGGAAAAA ACTTTATCTC TCTTAAAATC AGTTGAAATA 
CCTGACGCGA AAAAAAAACT TGACTCTTAC CCGCATGAAT TTTCAGGAGG ACAGAGGCAG 
CGTATTATGA TAGCCATGGC CCTTGCCTGC GAACCGGACA TTTTAATAGC CGACGAACCT 
ACTACCGCCT TAGACGTAAC CATACAAAAA CAAATATTAG CTCTTTTGAA AAAATTACAG 
GAAGAAAGAA AAACAGCTTT AATTTTTATA ACGCATAACC TTGCCCTGGT AAACGAACTA 
GGCGGAAGAG TGCTTGTTTT ATACGCGGGG CAATGCGTAG AAGAATGCAC AACCGAGCAG 
CTTTTTAAAA GACCTCTTCA CCCTTATTCA CAAGGTCTTA TCGCTTGCGC AGCGGGCATA 
ACACAAAAAG GCAGGTTAAA GACGATAGAA GGAACACCGC CTGCGCCGGG AACAATTTTT 
GAAGGCTGTC CTTTTGAGCC AAGATGCCCT AAAAAACTGG AAAGATGCAA ATTCCAAAAT 
CCGGAAATGT TTAATTTAGG ACAAAGAAAA TCTAGATGCT GGTTAAACGC TAATGAAGAA 
TATCTTGGAG ATTAA

Protein sequence

MDTLLQVKDL SVFFKTSEAN IKVLKELCYQ LNAGETLSIV GESGSGKTVH ALSILRLMST 
NAKITGEIIF KNENLSVLPE SKLKNIRGKK IAMIFQDPMT SLNPVMTIGS QIYETLLTHK 
KATKKNIKEK TLSLLKSVEI PDAKKKLDSY PHEFSGGQRQ RIMIAMALAC EPDILIADEP 
TTALDVTIQK QILALLKKLQ EERKTALIFI THNLALVNEL GGRVLVLYAG QCVEECTTEQ 
LFKRPLHPYS QGLIACAAGI TQKGRLKTIE GTPPAPGTIF EGCPFEPRCP KKLERCKFQN 
PEMFNLGQRK SRCWLNANEE YLGD