Gene Emin_1130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1130
Symbol
ID	6263805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1229925
End bp	1231133
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	46%
IMG OID	642611610
Product	NADH-ubiquinone oxidoreductase chain 49kDa
Protein accession	YP_001876019
Protein GI	187251537
COG category	[C] Energy production and conversion
COG ID	[COG3261] Ni,Fe-hydrogenase III large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	87
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAAAAA TAACAGTGCC TTTAGGGCCG CAGCATCCCG CCTTAAAAGA ACCGGGCAAT 
TTTATGCTTC TTTTGGAAGG TGAACAAATT GTAGACGCTA CGCTTCGCCT TGGTTATAAC 
CACAGAGGCG TTGAGAAAGC CGCCGAAAGC AGAAACTATT TGCAAGCCAT GTATCTTATT 
GAGCGTGTTT GCGGCATTTG CTCTCACTCG CACGCCACGT GTTATGTTAT GAATGTTGAG 
GAAATAGCCG GCGCCGAAGT GCCTAAAAGA GCGCAGGCTA TACGCGTTAT CATAGGCGAA 
CTTGAAAGGC TGCACAGCCA TTTGCTTTGG CTTGGCGTGG CGGCGCATGA AATAGGGTTT 
GACACTCTTT TTATGTACTC CTGGCGCGAC AGGGAAAGCG TTATGGACGC TTTGGAAACT 
ATTTCAGGCA ACCGCGTGCA CTATTCCATT AACACTATTG GCGGGGTAAG AAGGGATATT 
ACGCCTGAAA TGGTTAAAAC TGTGTTAATG AAAATAGAAC ATCTTGAAAA AAGAGTTAAA 
TATTATATCT CATTAGCTAC CGAAGAGCCC ACCGTTATCG CCAGAACAAA AGGCGTGGGG 
CATCTTCCTA AAGAAGAGGC TTTAAGACGC TGCGCGGCCG GGCCTTTGGC AAGAGCTTCA 
GGTATAGCCA GAGACGTAAG AAAAGACGAC CCTTATTTAA TTTACGGCGA ACTTGATTTT 
AAAGTTATAA CCTCCGACGC GTGCGACGTT TTTGGCCGGT TATATGTGCG CGCTTTTGAA 
ATGTTAGAAT CTTGCAGACT TTTAAAACAG GTGCTTAACT GGCTGCCCGA AGGCGCCATA 
AAAGTTAATG TACCCGTTAA AATACCCGCC GGACATGCGG TTAACCGCTA TGAAGCGCCC 
AGGGGCGAGG ATGTGCACTA TGTTAAATCA GACGGCGGTT TAAACCCGGC AAGAGTTAAA 
GTGCGCGCGC CTACGCTGGC TAATTTTGAA AGCGTTGACT ATATGCTGCG CGGAGACGCA 
CTTGCGGACG CGGCTTTAAT TATAGCCGCC ATTGACCCGT GTTTTTCCTG CACTGACAGG 
GCAACAATTA TCAGTCCCTC TTTAAACTCA GTTAAAACTA TAGATTGGAA GGACATGCGG 
GCGCACGGCA TAGAGTATTA TAAAAAGAAA GGAATAGATT TTTCAAAAGT AAAAGTTTTT 
GATAAATAA

Protein sequence

MPKITVPLGP QHPALKEPGN FMLLLEGEQI VDATLRLGYN HRGVEKAAES RNYLQAMYLI 
ERVCGICSHS HATCYVMNVE EIAGAEVPKR AQAIRVIIGE LERLHSHLLW LGVAAHEIGF 
DTLFMYSWRD RESVMDALET ISGNRVHYSI NTIGGVRRDI TPEMVKTVLM KIEHLEKRVK 
YYISLATEEP TVIARTKGVG HLPKEEALRR CAAGPLARAS GIARDVRKDD PYLIYGELDF 
KVITSDACDV FGRLYVRAFE MLESCRLLKQ VLNWLPEGAI KVNVPVKIPA GHAVNRYEAP 
RGEDVHYVKS DGGLNPARVK VRAPTLANFE SVDYMLRGDA LADAALIIAA IDPCFSCTDR 
ATIISPSLNS VKTIDWKDMR AHGIEYYKKK GIDFSKVKVF DK