Gene Emin_0304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0304
Symbol
ID	6263532
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	326310
End bp	327284
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	36%
IMG OID	642610769
Product	TPR repeat-containing protein
Protein accession	YP_001875201
Protein GI	187250719
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4235] Cytochrome c biogenesis factor
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.000296078
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.00226693
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGAAATA AAAAACTTAT TATTTTTATT TTATTTTTAC TTTGCTGCGC TTTAAGCGCG 
GAGGCTGCCG TATGGCCTTT TGGAAAAAAA CAAAAAAAAC TGCTTAATGA CGCCAGACAA 
GATTATTCGG AAGGAAATTA TTATTCGGCC ATAGATAAGC TCAAAGTTTT TCTTGTTGAA 
GGTACCGTTA AAAGGCGCGA AAAAAGAGCC TATCTTCTCC TTGGTGAAAG TTATGAAAAA 
ATAGGAGAAA TTGATTCAGC TCTTAACACA TATCTTGAAG GCGTTGAGTT AAACCCCAAA 
GATAAAGACC TTTTGTTAAA GCTGGGAGCT CTTTACCAAA GAAACGATTT AATACGGGAC 
AGCATAGAAA TTTATGAGCG TATTTTAGCT CTTGATAAAA ACAATTCACA GGCTTTTCTG 
GGGCTTGCCA GGGCATATAC AGATGAAGGA TTTTTTTCTA AAGCGGAAGG ATATTTCCAG 
CAATATTTAA GGATAACAAA GATAGAGGAT TTTGACGGTG ATATTTTTTT GGAACATGCC 
GGCGCTTATT TCAGACAGAG GAAATATAAT GAAGCTCTCT TTAACGCGGC CTTATCTATT 
GACAAGCTTG GCGAAAATAA AGATAACACA TTTCTTGTTG CCAAAATAAA CAGAATGCAG 
GGAAATATGG AAGACGCTTA CATTTATATA GATAAAGCGA TAAATCTTGA AGGTTACGAT 
AATTGTTATA CCGCTTTACT TACAAAGGCC CTGTGGCTTA CGCAAGATAA AAGATATGAA 
GAAGCAAAAA TAATATCGGA CTCCGTTTTA TTGGAAAAAC CAAATAACAG ACTTGCGTTA 
TACGTTAACT TCCTGGCATA CAGGGGTAAA GGAAATAAAA ATAAAGCGGA CGAGTATTTA 
AAACGCATAT CCGCTTATGA GGATAACAGT TTTATATCCC GCGTTGCACG TACGCATCTT 
AGTGTTGATA ATTAA

Protein sequence

MRNKKLIIFI LFLLCCALSA EAAVWPFGKK QKKLLNDARQ DYSEGNYYSA IDKLKVFLVE 
GTVKRREKRA YLLLGESYEK IGEIDSALNT YLEGVELNPK DKDLLLKLGA LYQRNDLIRD 
SIEIYERILA LDKNNSQAFL GLARAYTDEG FFSKAEGYFQ QYLRITKIED FDGDIFLEHA 
GAYFRQRKYN EALFNAALSI DKLGENKDNT FLVAKINRMQ GNMEDAYIYI DKAINLEGYD 
NCYTALLTKA LWLTQDKRYE EAKIISDSVL LEKPNNRLAL YVNFLAYRGK GNKNKADEYL 
KRISAYEDNS FISRVARTHL SVDN