Gene Dred_2042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dred_2042
Symbol
ID	4958038
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum reducens MI-1
Kingdom	Bacteria
Replicon accession	NC_009253
Strand	-
Start bp	2241872
End bp	2242921
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	42%
IMG OID	640181211
Product	respiratory-chain NADH dehydrogenase, subunit 1
Protein accession	YP_001113384
Protein GI	134299888
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000268939
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAGAACT TATTTGTTAA TTTAGCCAGC GGGTCTCGGA CCCTGCTGGG GTCCGCTGGC 
CTACCCGGTG CGGCAACTGA TTTCATAGTA ATGTTCTTAA AATTAGGTGC TATTCTTGTA 
TACATCTTAG TCAGTGCTCT CTGGCTGGTG TACATGGAAA GGAAAGTATC GGCCTATATG 
CAGTGTCGGA TAGGTCCTAA CCGGGTTGGA CCCTTGGGTT TGTTACAGAC CACAGCGGAT 
ATCGGGAAAT TAATAAGCAA AGAAATTATT ATTCCTAGAT GTGTAGATAA AAAGTTGTTT 
TTGCTGGGAC CTATGTTGAT TTTTATGCCA CCCTTGGCAG TCTTTGCTGT TGCTCCCTTT 
GGCAAAGATA TGGTGGCCAT CGATTTGAAC ATAGGAGTTT ACTACTTCTT GGCTGTAGCT 
TCTTTATCAA CTGTAATTGT CTGGATGTCT GGTTGGGCCT CTAACAACAA GTACTCCTTA 
ATTGGAGGTA TGCGCGTAGT GGCTCAAATG GTAAGCTACG AAATGCCTTT AATTTTATCC 
ATTGTCGGGG TCATCATTTT AACCGGAACC TTAAACATGA GCGAAATTAT CCAGGCACAG 
GAAGGAGTTT GGTTTATCTT TCTGCAACCC CTTGGTTTTT TAATTTACTT AATCGCAGGA 
GTTGCCGAAA CAAACCGGGC CCCCTTTGAC TTAGTAGAAG GAGAATCGGA AATTATCTGC 
GGACCCTTTA CTGAATATAG TGGCATGGGT TTTGCCATGT TCTTTCTGGC TGAGTATGCC 
AATGTTGTGC TTGTTTCCGT AATGGCAACC ACTTTGTTTT TAGGAGGTTG GCAAGCACCC 
TTTGGGCTTA CTTTTATTCC ATCCTGGATT TGGTTTTTGT TTAAAGTATA TGTGATGATT 
TTTCTCTTCA TGTGGTTCCG TTGGACCTAT CCAAGGGTTA GGGTGGATCA GTTAATGGAA 
TTTGGTTGGA AGGTACTGGT TCCTCTTTCT ATTGCGAATA TTTTCTTAAC TGGTATTGGT 
AAATATCTGT ATCAAACACT AGGGTGGTGA

Protein sequence

MENLFVNLAS GSRTLLGSAG LPGAATDFIV MFLKLGAILV YILVSALWLV YMERKVSAYM 
QCRIGPNRVG PLGLLQTTAD IGKLISKEII IPRCVDKKLF LLGPMLIFMP PLAVFAVAPF 
GKDMVAIDLN IGVYYFLAVA SLSTVIVWMS GWASNNKYSL IGGMRVVAQM VSYEMPLILS 
IVGVIILTGT LNMSEIIQAQ EGVWFIFLQP LGFLIYLIAG VAETNRAPFD LVEGESEIIC 
GPFTEYSGMG FAMFFLAEYA NVVLVSVMAT TLFLGGWQAP FGLTFIPSWI WFLFKVYVMI 
FLFMWFRWTY PRVRVDQLME FGWKVLVPLS IANIFLTGIG KYLYQTLGW