Gene Mlg_2011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2011
Symbol
ID	4269611
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2283325
End bp	2284344
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	62%
IMG OID	638126767
Product	NADH ubiquinone oxidoreductase, 20 kDa subunit
Protein accession	YP_742843
Protein GI	114321160
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA)

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCGGT TGAACGCCCG CCCGCTCAAT GTGCTCTGGT TGCAGTCCGG AGGGTGTGGC 
GGATGCACAA TGTCTCTGCT GTGTGCTGAC ACGCCGGATC TTTTTGGTGA GTTGGCCGGC 
ATGGGTATCA ATCTGCTCTG GCACCCCTCG CTCAGTGAGC CGTCCGGCCG GGACGTTCGG 
GAGATACTCG ATGCCTGTCT GCGCGGTGAA CTGACGCTGG ACGTGCTTTG TCTGGAGGGC 
GCCGTGATGT GCGGCCCCGG TGGGACCGGC AGGTATCACC TGTTTGCCGG AACCGGCCGA 
CCTATGAGGG ATTGGGTGAG GGATTTGGCC GAAGTGGCGG ACTACACCGT TGCGGTGGGA 
AGTTGCTCGG CCTATGGGGG AATCTCAGCT GCAGGACATG CCCCGGGTGA AATGCCTGGC 
TTGCAGTATG AATCGGATCT GGTCGGTGGC CTCTTGGGCG CCGATTTCCG ATCCAAGGCC 
GGCCTTCCGG TGATTAACCT GGCGGGCTGC CCGACCCATC CGGAGTGGGT CACGGAAACC 
CTAATGGCGG TGGCAATGGG GCTTCTGGAT GAGGATGCTC TGGATGAATG GCGGCGGCCC 
CGCTTTTATG CCGACCACTT GGTTCACCAC GGTTGTGCAC GTAACGAGTA CTACGAATTC 
AAGGCGAGCG CGGAAAAGCC CTCTGACCTT GGCTGCATGA TGGAGCACCT GGGCTGCAAG 
GGGACCCAGG CCCACGCCGA TTGCAATATC CGGCCCTGGA ATGGGCAGGG CTCCTGCCTT 
CGTGGCGGTT ACGCGTGCAT TAGTTGCACG GAGCCGGGGT TTCAGGACCC CGGTCACGGC 
TTCCTGAGCA CCCCCAAGGT GGGAGGCATC CCCGTGGGCT TGCCGACCGA TATGCCTAAG 
GCTTGGTTTG TGGCGTTGGC GGCACTGTCC AAGTCGGCCA CTCCGGAGCG GCTCCGGCGC 
AATGCCGTCG CCGACCATCA GGTCGTACGG CCCAAGAACC GAAAGACGGG GTTGAAATGA

Protein sequence

MMRLNARPLN VLWLQSGGCG GCTMSLLCAD TPDLFGELAG MGINLLWHPS LSEPSGRDVR 
EILDACLRGE LTLDVLCLEG AVMCGPGGTG RYHLFAGTGR PMRDWVRDLA EVADYTVAVG 
SCSAYGGISA AGHAPGEMPG LQYESDLVGG LLGADFRSKA GLPVINLAGC PTHPEWVTET 
LMAVAMGLLD EDALDEWRRP RFYADHLVHH GCARNEYYEF KASAEKPSDL GCMMEHLGCK 
GTQAHADCNI RPWNGQGSCL RGGYACISCT EPGFQDPGHG FLSTPKVGGI PVGLPTDMPK 
AWFVALAALS KSATPERLRR NAVADHQVVR PKNRKTGLK