Gene Mlg_1965 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1965
Symbol
ID	4268167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2235872
End bp	2237149
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	65%
IMG OID	638126720
Product	NADH-quinone oxidoreductase, F subunit
Protein accession	YP_742797
Protein GI	114321114
COG category	[C] Energy production and conversion
COG ID	[COG1894] NADH:ubiquinone oxidoreductase, NADH-binding (51 kD) subunit
TIGRFAM ID	[TIGR01959] NADH-quinone oxidoreductase, F subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.789602
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.0852998
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAATC AGGTGTGTCT GACCACGCTG GACAAGGAAA CCCCCTGGAG CCTGGAGACC 
TACCGGGCGA TGGGCGGCTA CCAGGCCTGG GAGAAGATTC TCAAGGAGAA GACGCCCCAG 
GAAGAGATTA TCGAGACGGT CAAAAAGGCC AACCTGCGCG GCCGCGGTGG CGCCGGCTTC 
CCCGCCGGGG TTAAGTGGGG CTTCATGCCC CGAAATGCGC CGGGCCAGAA GTACATTGTC 
TGTAACTCTG ACGAATCGGA GCCCGGCACC TGTAAGGATC GCGACATCCT GCGCTTCAAT 
CCCCACGCCC TGGTGGAGGG CATGGCGATT GCCGGCTATG CCATGGGTGC CACCGTGGGC 
TACAACTACC TGCGCGGTGA GTTTCACCAC GAGCCCTTCG AGCGGATCGA GCAGGCGGTG 
CGCGAAGCCC GCGAGGCCGG CCTGCTGGGG CGCAACATCC AAGGCAGTGG CATCGATTTC 
GAGCTCCACA ATCATATCGG GGCGGGCGCC TATATCTGTG GCGAGGAATC GGCGCTGATG 
GAGTCGCTGG AGGGCAAAAA GGGCCAGCCC CGCTACAAGC CGCCTTTCCC GGCCCAGGTC 
GGCGTATACG GGCGCCCCAC CACCATCAAC AACACCGAGA CCCTCGCCTC CGTGCCCTCG 
ATTATGCGCA AGGGCAGCGA GTGGTTCCTC GAGCTGGGCA AGCCCAATAA CGGCGGTGAG 
AAGATCTTCT GTGTCTCCGG GCACGTGGAA AGGCCGGGTA ACTTTGAGGT CCCGCTGGGG 
ACGCCGTTCA AGGACCTTTT GGAGATGGCC GGGGGCGTGC GCGGCGGGCG TAAGCTCAAG 
GCCGTGATCC CGGGCGGTTC CTCCATGCCC GTGGTCCCCG GCGAGACCAT GCTGCAGGCC 
ACCATGGACT ACGACGGCCT GGCGGAGATC GGCTCGGCCC TCGGTTCCGG CGGGGTCATC 
GTGATGGACG AGACCACCGA CATGGTCAAG GCGATCCTGC GCATCTCGCG GTTCTACTTC 
GCCGAGTCCT GCGGTCAGTG CACCCCCTGC CGGGAGGGCA CTGGCTGGAT GCAACGGGTG 
CTCCGGCGCA TCGTCGAAGG CAAAGGCCGG CACGAGGACA TCGAACTGCT GGAGGCGGCG 
GCGGGGCAGA TCGCCGGCCA CACGATCTGC GCCTTCGGCG AGGCCGCGGC CTGGCCGGTG 
CAGAGCTTCC TCAAGCACTT CCGTCACGAG TTTGAATACT ACGTGGAGCA TAAGCGTTCC 
ATGGTGGAGG CCGCCTGA

Protein sequence

MANQVCLTTL DKETPWSLET YRAMGGYQAW EKILKEKTPQ EEIIETVKKA NLRGRGGAGF 
PAGVKWGFMP RNAPGQKYIV CNSDESEPGT CKDRDILRFN PHALVEGMAI AGYAMGATVG 
YNYLRGEFHH EPFERIEQAV REAREAGLLG RNIQGSGIDF ELHNHIGAGA YICGEESALM 
ESLEGKKGQP RYKPPFPAQV GVYGRPTTIN NTETLASVPS IMRKGSEWFL ELGKPNNGGE 
KIFCVSGHVE RPGNFEVPLG TPFKDLLEMA GGVRGGRKLK AVIPGGSSMP VVPGETMLQA 
TMDYDGLAEI GSALGSGGVI VMDETTDMVK AILRISRFYF AESCGQCTPC REGTGWMQRV 
LRRIVEGKGR HEDIELLEAA AGQIAGHTIC AFGEAAAWPV QSFLKHFRHE FEYYVEHKRS 
MVEAA