Gene GSU0341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU0341
Symbol	nouD
ID	2686736
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	369296
End bp	370468
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	52%
IMG OID	637125007
Product	NADH dehydrogenase I, D subunit
Protein accession	NP_951401
Protein GI	39995450
COG category	[C] Energy production and conversion
COG ID	[COG0649] NADH:ubiquinone oxidoreductase 49 kD subunit 7
TIGRFAM ID	[TIGR01962] NADH dehydrogenase I, D subunit

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0211499
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTAGCA CTGAGATAAT GACAGTCAAT ATGGGACCGC AGCACCCGAG TACGCACGGC 
GTTCTGCGGA TGGTCATCGA ACTTGATGGA GAGGTTATCC AGAAGATTAC TCCGCATATC 
GGATATCTGC ATCGGGGAGT GGAGAAGCTC TCCGAGCATC GTACCTATCA CCAGACCATA 
CCTCTAACTG ACCGTCTCGA CTACTTGGCG CCGATGAGCA ATAACCTCGG CTATGTGTTG 
GCGGTTGAAA AGCTTTTGGG TATTGAGATT CCTGAGCGCG CTCAGACAAT TCGCGTCATC 
ATGGCTGAGC TCACCCGTCT CAAATCCCAT TTGGTCTGGA TTGCCTGCCA CGCACTTGAT 
ATCGGAGCGA TGACAGTCTT CATCTACGCT TTCCGTGAGC GTGAGATGAT CATGAGTCTC 
TATGAAAAGA TATCCGGTGC ACGGATGACC AGCAACTACT TCAGGGTCGG TGGACTTTCA 
TCCGATGTTT ATGACGGGTT CGAAAAGGAT GTGCGGGAAG TCATCGACAC ATTCCCCGGT 
CACTTCGATA CCTACGAAGG CCTTCTTACC AAAAACACCA TCTGGGTCAA CCGTACTGTT 
GGCAATGGCG TGATATCGGC TGAGGATGCC GTCGACTACG GGATAACCGG TCCTGCACTC 
CGCGGCTCGG GCGTTGATTG GGATTTGCGT CGTGACAATC CTTACAGTGG CTACGAGAAG 
TACTCGTTCA AGGTTCCTGT CGGTGAGAAG TGTGACACCT TTGACCGCTA CAAGGTCAGG 
CTCATTGAAA TGCGCGAAGC GGTCAATATC ATCCGCCAAG CACTCGACTC GCTCAAGCCT 
GGGCCCGTGC TGGCTGACAA TCCGCAGGTC ACCTACCCGC CGAAGGAGAA TGTTTACAAC 
TCTATCGAAG GCCTCATTCA CCACTTCAAG ATAGCCAGCG AAGGTTTCCC TGTGCCAGAA 
GGTGAGGTGT ACCAGTCGGT GGAAGCTCCC AAAGGAGAGC TTGGTTACTA CATCGTCAGC 
GACGGTGGCC CCAAGCCATA CCGGATGAGA ATAAGACCTC CTTCATTTGT AAACTTGGGG 
GCTATCGAGA AGATGGCTAA GGGATCGATG ATTGCCGACT TGGTTGCAGT CATCGGGACC 
TTGGATATCG TGCTTGGTGA AATCGACCGG TAA

Protein sequence

MASTEIMTVN MGPQHPSTHG VLRMVIELDG EVIQKITPHI GYLHRGVEKL SEHRTYHQTI 
PLTDRLDYLA PMSNNLGYVL AVEKLLGIEI PERAQTIRVI MAELTRLKSH LVWIACHALD 
IGAMTVFIYA FREREMIMSL YEKISGARMT SNYFRVGGLS SDVYDGFEKD VREVIDTFPG 
HFDTYEGLLT KNTIWVNRTV GNGVISAEDA VDYGITGPAL RGSGVDWDLR RDNPYSGYEK 
YSFKVPVGEK CDTFDRYKVR LIEMREAVNI IRQALDSLKP GPVLADNPQV TYPPKENVYN 
SIEGLIHHFK IASEGFPVPE GEVYQSVEAP KGELGYYIVS DGGPKPYRMR IRPPSFVNLG 
AIEKMAKGSM IADLVAVIGT LDIVLGEIDR