Gene Emin_0389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0389
Symbol
ID	6262473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	414916
End bp	415956
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	40%
IMG OID	642610855
Product	hydrogenase formation HypD protein
Protein accession	YP_001875283
Protein GI	187250801
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0409] Hydrogenase maturation factor
TIGRFAM ID	[TIGR00075] hydrogenase expression/formation protein HypD

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.483899
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0000000115047
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATAAAAA AATTAAATGA TTTAGCTAAA AGGCTGTCGC GTAAGGTTAA CATAATGGAA 
GTTTGCGGCA CGCATACAAA CTCAATAGCT AAAAACGGTT TAAAAAGCCT CTTAAATGAA 
AATATTAATT TAATTTCAGG CCCCGGCTGT CCTGTTTGCG TAAGCGCGGA CGGTGATATC 
GAGGCCGCTA TAGATTTAGC CTTAAAAAAG GATAATATAA TTTTTACTTT TGCCGATATG 
CTCCGCGTGC CGGGGCGTAA CGGCAGTTTG CAGGAAGCTA AAGCTTCGGG TGCGGATGTC 
AGAGTTATTT ACAGCCCTTT AGACGCTTTT TTGGAAACAG GAAAAACAAA TAAAACCGTA 
ATTCTTTTAG CAAGCGGTTT TGAGACGACG GCCCCTTTAA TAGCCGTTTG TTTAAAAAAA 
GCGAAAGAAG CGGGGTTTAA AAACTTTTTT GTTTTTCCCG TTTTAAAACT TATTAACCCC 
GCCATAACAG CGCTTTTAAG TGAAGAAAAT AAAATAGACG GGTTTTTGTT GCCCGGGCAT 
GTCAGTTTGG TTATAGGCAA AAAACCTTAC AGTTTTATAA GCAAAAAATT TAATAAACCG 
GGTGTTATAG GCGGTTTTGA AGCGGAGGAA ATTGTTGCCG CTCTTATAGA AATAGTTAAA 
CAGCTTTTAG AAGGCAAAGC CCAAATACAA AATGCCTACC CCGCAATAAA AGAAGAAGGC 
AACCAAACCG CCCTAAAAAT GATAGAGGAT GTTTTTGAGC CTTACGACGC GGTTTGGAGG 
GGATTTGGCG TAATTCCTTC CTCAGGGCTT AAAATAAAAA AAGAATTTAG AGAGTTTGAC 
GCTTTAATAA AATTTAACAT TAAACCCTGT TACGGCGGTT CTTTAAATAA AGCATGCAAA 
TGCGCGGAAG TTTTAAAGGG TAAAATAAGC CCCGTAAAAT GCCCGCTTTT TGGCAAAAAA 
TGCGCGCCCG GCAAACCTTT AGGGCCGTGT ATGGTATCAA GCGAGGGGGC ATGCAACGCC 
TTATACAATT ATGAAAAATA A

Protein sequence

MIKKLNDLAK RLSRKVNIME VCGTHTNSIA KNGLKSLLNE NINLISGPGC PVCVSADGDI 
EAAIDLALKK DNIIFTFADM LRVPGRNGSL QEAKASGADV RVIYSPLDAF LETGKTNKTV 
ILLASGFETT APLIAVCLKK AKEAGFKNFF VFPVLKLINP AITALLSEEN KIDGFLLPGH 
VSLVIGKKPY SFISKKFNKP GVIGGFEAEE IVAALIEIVK QLLEGKAQIQ NAYPAIKEEG 
NQTALKMIED VFEPYDAVWR GFGVIPSSGL KIKKEFREFD ALIKFNIKPC YGGSLNKACK 
CAEVLKGKIS PVKCPLFGKK CAPGKPLGPC MVSSEGACNA LYNYEK