Gene Emin_0477 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0477
Symbol
ID	6262658
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	509761
End bp	511197
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	42%
IMG OID	642610948
Product	hydrogenase large subunit
Protein accession	YP_001875371
Protein GI	187250889
COG category	[R] General function prediction only
COG ID	[COG4624] Iron only hydrogenase large subunit, C-terminal domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAAAAA GAAAGATTAA CAATTCGGAA CACTTGAAAA GAGAAGTACT TGTAGAAATA 
GCAGCAATGT TTTTTCACGG TAACCTTGAA AAAGATATAC ACAAAATTCC TTATAACATA 
ATACCAACAG GCTCGGAAGC GCAATTCAGA TGCTGCGTTT ATAAAGAACG CTCAATATTG 
AAATTCCGCG TTTTGGCCGC GTTGGGCTAC TCCGTAAACG AAGTTGACGA AGCTGAACAT 
TTAAATAACT TTGTAGAGCA GAAAGATTTA AACAATAAAG AAGGTAAACT TTTAACCGTT 
TTAGATTCAG CCTGCAAAGC TTGTATGAGA AGTAATTATA TGGTGACGGA AGTCTGCCAG 
GGCTGCGTGG CCAGGCAGTG TATTTACGAC TGTCCTTTTA ACGCTATAAG CATGCAAAAC 
GGACGTGCTT ACATAGAGCC GGCAAAATGC AAAAACTGCG GTAAATGTAA GTCAGCCTGT 
CCTTACGGAG CTATTTTAAA ATTAAACGTG CCTTGTGAGG AAGCTTGTCC CGTTAACGCT 
ATTAAAAAAG ACCAAAAAGG CCGCGCTATA ATTGACCACA GCATGTGTAT AAGCTGCGGC 
AGATGTATGA AGGTTTGCCC TTTTGGCGCT ATTATGGAGC GCAGCCAAAT ACTTAATGTT 
TTAAAAGCCT TTAACAGTGA TAAAAAAGTT GTGGCAATGG TGGCCCCTGC TATAGCAGGC 
CAGTTTGACG CAAGTATGGG CGTGCTTACA ACAGCTTTAA AAAAAATCGG GTTTGACTAC 
GTCTATGAAG TCGCAAAAGG CGCGGAAGTT ACCGCTTCTA ACGAAGCCGC TGAGTTTAAA 
GAGCGCGTTA TTGAAAAAAG GCAAAAGTTT ATGACAAGCT CCTGCTGTTT CGCTTACACA 
AAGCTTGTGC AAAAGCATGT GCCGGAACTT CAGCAGTATA TTTCGCATAC CAAAACGCCT 
ATGCACTACA CCGCTGAAAT AGTAAGACGT GAACTGCCTG GCGCGGTTAC GGTGTTTATA 
GGCCCTTGTT TATCAAAAAG AAAAGAAGGC CAGCAAAGCG GTTTGGTTGA CTTTGTTCTT 
AATTTTGAAG AACTTTACGC CATTTTAACC GCCAAAGGTA TAAATTTGCT TCAGTGCGAG 
GAAGAAAAGC TTGAAAACAG GCCCAGCGGC GCGGCAATGA GATTTCCTTT AGCGGGCGGC 
GTTACAAAGG CTGTAAGAGC CGCGTCTAAA GAAGATCTTG GCATTAAGGC GGAGCTTATT 
AACGGCTTAG ACCAAAAAGT TATTTACAAA CTTAAAGCTT ACTGCAACGG CAACTGTCCG 
CATAACTTTT TAGAAGTTAT GACTTGTTTG GGCGGCTGCG TAGGCGGGCC CGACGCTATA 
AGAGATAAAA TTAAAGCCGC TGTAGACGTT GAAAAATACT CGGCCCAAAA CGATTAA

Protein sequence

MIKRKINNSE HLKREVLVEI AAMFFHGNLE KDIHKIPYNI IPTGSEAQFR CCVYKERSIL 
KFRVLAALGY SVNEVDEAEH LNNFVEQKDL NNKEGKLLTV LDSACKACMR SNYMVTEVCQ 
GCVARQCIYD CPFNAISMQN GRAYIEPAKC KNCGKCKSAC PYGAILKLNV PCEEACPVNA 
IKKDQKGRAI IDHSMCISCG RCMKVCPFGA IMERSQILNV LKAFNSDKKV VAMVAPAIAG 
QFDASMGVLT TALKKIGFDY VYEVAKGAEV TASNEAAEFK ERVIEKRQKF MTSSCCFAYT 
KLVQKHVPEL QQYISHTKTP MHYTAEIVRR ELPGAVTVFI GPCLSKRKEG QQSGLVDFVL 
NFEELYAILT AKGINLLQCE EEKLENRPSG AAMRFPLAGG VTKAVRAASK EDLGIKAELI 
NGLDQKVIYK LKAYCNGNCP HNFLEVMTCL GGCVGGPDAI RDKIKAAVDV EKYSAQND