Gene Emin_0732 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0732
Symbol
ID	6263113
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	807531
End bp	808586
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	40%
IMG OID	642611206
Product	peptidase M24
Protein accession	YP_001875624
Protein GI	187251142
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.000000296906
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCAGATT ACAAAGTAAA AATAAAAACG TTTTTAAAAA CTTTAAAACA ATGCGAAATT 
GAAGGATATA TAACCACTAA CGTTATTGAT ATGCAATATT TTTGCGCGCG CCCTTTCCAG 
CCAAGCGAAA GAAGCGTGCT TTTAATAACG CCTAAACACT TCATGATATT CGCCCGCCCG 
CTTGCTTTTA ATGCTATTAA AGAAAGCGTT AAGGAAGCTA AGGTTGTAAT GGCCGAAGAT 
ATTTCAGCAA TAGCAGCGGC GGCTGAGTTT GTTATTAAAA ACAAAATTAA AAATATTTGT 
TTTGACCAAG ATAAAGAGCT GTTTTCAGCG GGGCAGATTT TCCAAAAAGC GGGTATAAAG 
CCCGAACTTG CCGTTACCAA TACGGTAAGA ATGGTAAAAA ATAAAGAAGA AATTAAAAAT 
ATCCGCAAAG CCTGCCAAAT AGCTTATAAC GCTTTTCTTT ATATAAAACC CAGGATTAAA 
ACGAGTATGA CAGAGCTTGA AGCGGCCTCA ATGCTTGAAA ATTATATGAA ATCACAAGGA 
GCGAGCGGCG TTTCTTTTGA CACAATTATG GCTTTTGGCA AAAACAGCGC TGACCCGCAT 
CACGCCACTG ATACGACTAA GCTTAAAAAT GAGGATGTGA TTTTGGTAGA TTTCGGCTGT 
ATTTACAAAG GCTACTGCTC TGACATTACA AGAACCTGGT GGCACGGCAA AAAACCGGCG 
GCAGAATTTA CAAAAGTTTG GAATATTGTC GAACGGGCCA GAAAAGAGGG TGTAAAAAAA 
GTTCGCCCCA ACATGAGCGC GCGTAACGCC GATAAAATAT GCCGTGATAT TATTGAAACG 
GCTTCTTACG GCCCGCTTAT ACATTCAACA GGGCATGGCG TGGGGATGAA TTTGCATGAG 
TCGCCCTTTC TTAACCCTCC TTCACAGGAA ATACTTAAAA AGGGTAATGT TTTTACTATA 
GAACCGGGCA TTTATATACC CGGCAAATTC GGAGTACGCC TTGAGGATAC CGTTGAACTT 
ACGGCAAAAG GCGCGAATAT TTTAACTAAA AAATAA

Protein sequence

MADYKVKIKT FLKTLKQCEI EGYITTNVID MQYFCARPFQ PSERSVLLIT PKHFMIFARP 
LAFNAIKESV KEAKVVMAED ISAIAAAAEF VIKNKIKNIC FDQDKELFSA GQIFQKAGIK 
PELAVTNTVR MVKNKEEIKN IRKACQIAYN AFLYIKPRIK TSMTELEAAS MLENYMKSQG 
ASGVSFDTIM AFGKNSADPH HATDTTKLKN EDVILVDFGC IYKGYCSDIT RTWWHGKKPA 
AEFTKVWNIV ERARKEGVKK VRPNMSARNA DKICRDIIET ASYGPLIHST GHGVGMNLHE 
SPFLNPPSQE ILKKGNVFTI EPGIYIPGKF GVRLEDTVEL TAKGANILTK K