Gene Mlg_2010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2010
Symbol
ID	4269610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2281880
End bp	2283328
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	64%
IMG OID	638126766
Product	nickel-dependent hydrogenase, large subunit
Protein accession	YP_742842
Protein GI	114321159
COG category	[C] Energy production and conversion
COG ID	[COG0374] Ni,Fe-hydrogenase I large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCGTG TGGTGGTCGG CCCGTTTAAT CGCGTGGAAG GGGACCTGGA GGTCACTCTG 
GACGTTCGCG ATGGGTATGT GCATCAGGCA TGGGTTAACT CGCCTCTATA CCGCGGGTTC 
GAGCGGGTGC TGCTGGGACG GGAGCCGCTG GATGCCCTGG TCTTTGCACC GCGCATCTGT 
GGAATCTGTT CCGTATCGCA GTCTGTCGCC GCTGCCAGCG CACTGGCAGA CCTGGCTGGA 
GCGCAGATGC CTCGGAACGG GGCGTTGATA CGAAACCTGA TACATGCGGC CGAGAATCTG 
GCGGACCACT TCACTCATTT TTATCTCTTT TTCATGCCCG ATTTTGCCCG GGAAGACTAC 
GCGGATCGCA CCTGGCACTC GGCGGTACAG ACCCGGTTTC GGGCGGTGCG TGGCCAGGCC 
CCGGCCCAGG CCCTGCCAGC CCGGGCGCGC TTCCTGACCC TGATGGGGCT ATTGGCCGGT 
AAGTGGCCGC ACACCCTGGC CATTCACCCA GGTGGCGCCT CCCGGGCAGT GGAGCCGGCC 
GAGAGGCTTC GACTGCTCGC GATAGTGCGG GAGTTTCGCA CCTGGCTGGA GCGTCACCTG 
TTTGGTGACC GGCTGGAGTG TGTACTCGCC TTGGAGAGTC CGGCGGCACT TGAGGCCTGG 
CGGGCACGGC CTGGCCCCGC CCAGGGTGAT TTCGCCGGGT TTCTTCGCCT GGCGGATGAT 
CTGGATCTGG TATCGCTGGG GCGGAGTCCG GGTGGCTTTC TAAGTTATGG GAGCTACCCC 
ATTGGCGATG AAACCGCTTT CGCACCTGGC CAGTGGGTGG ACGGGCAGGT GCAGCCTTTG 
AATACTGAAG CCATTGACGA AGACCTGACG AGCGCCTGGC TGTCCGGGCC GGGGAAACCG 
GCACATCCTC TTCACGGCGT GACAGAACCT GTGGTGCAGA AGGCCGACGC CTATAGTTGG 
TGCAAGGCAC CGCGGATGGG CGGGGCCGTG GTGGAGACGG GGGCACTCGC CCGTCAGTTG 
GTGGATGGGC AACCGCTGAT TCGCGCACTG GTGGCGGAAA GCGGTGGTAA CGTGCGTAAC 
CGAGTGATTG CCCGCCTGAT TGAACTGGCG CGAGTTCCGC CATTGATGGA GCATTGGGTG 
AGATCACTGC AACCGGGCGA GCCCTGCTAT GCCGATTACA CCCTGCCCGG CGAGGGCGTC 
GGGGTCGGTT TGACCGAGGC GGCCCGCGGT AGCCTGGGCC ACTGGCTCAC GGTTAGAAAC 
GGCATGATCA GCAATTATCA GATCATTGCG CCGACGACGT GGAACTTTTC GCCTCGGGAT 
CACGCCGGTG TGCCCGGGCC GCTGGAGCAG GCGCTGGTAG GGACACCTGC TGCGGATGCG 
GGGGAGTCGG TAGCGGTCCA GCATGTGGTG CGGTCGTTTG ATCCCTGTAT GGTGTGTACC 
GTGCACTGA

Protein sequence

MSRVVVGPFN RVEGDLEVTL DVRDGYVHQA WVNSPLYRGF ERVLLGREPL DALVFAPRIC 
GICSVSQSVA AASALADLAG AQMPRNGALI RNLIHAAENL ADHFTHFYLF FMPDFAREDY 
ADRTWHSAVQ TRFRAVRGQA PAQALPARAR FLTLMGLLAG KWPHTLAIHP GGASRAVEPA 
ERLRLLAIVR EFRTWLERHL FGDRLECVLA LESPAALEAW RARPGPAQGD FAGFLRLADD 
LDLVSLGRSP GGFLSYGSYP IGDETAFAPG QWVDGQVQPL NTEAIDEDLT SAWLSGPGKP 
AHPLHGVTEP VVQKADAYSW CKAPRMGGAV VETGALARQL VDGQPLIRAL VAESGGNVRN 
RVIARLIELA RVPPLMEHWV RSLQPGEPCY ADYTLPGEGV GVGLTEAARG SLGHWLTVRN 
GMISNYQIIA PTTWNFSPRD HAGVPGPLEQ ALVGTPAADA GESVAVQHVV RSFDPCMVCT 
VH