Gene Noc_2111 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2111
Symbol
ID	3704421
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2429011
End bp	2430030
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	53%
IMG OID	637738586
Product	dehydrogenase, E1 component
Protein accession	YP_344101
Protein GI	77165576
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID	[TIGR03182] pyruvate dehydrogenase E1 component, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0196685
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAAAA TTGATCGTAA ACGGCTACTG CGGGAGATGG TTTTCTTCCG CCGCTTTGAG 
GACCGCTCGT TTGAGGCATA CATGGAGCGT AAAGTTGGTG GCTTTCTGCA TCTCTATTCG 
GGGCAGGAAG CGGTGGCAAC GGGGGTACTC GAGATGGTGC AAGCGGATCG AGGGGTCGGC 
TTCGATTATG CTATTACAGG TTACCGGGAT CATATCCATG CTATCAAAGC GGGAGCACCA 
GCGCGGGAAG TTATGGCAGA GCTTTATGGT AAGGAGACCG GGAGTTCCAG AGGGCGTGGG 
GGGTCAATGC ATATCTTTGA CCCAAGCGTG CGTTTTATGG GGGGCTATGC CTTAGTAGGC 
CAGCCCTTCC CCCTGGCGGC AGGGCTAGCC TTGGCTTGCA AGCACCAGAA AGAAGGACGG 
ATCGCGGTCT GCTTCCTTGG GGATGGGGCG AATAACCAGG GTACCTTCCA TGAAACCATG 
AACATGGCTT CCCTATGGAA ATTGCCGGTA TTGTTTGTAT GCGAGAATAA CTGCTATGCC 
ATCGGTACGG TTATTCAACG ATCAACCGCC GTGATTGACC AATACAAGCG CCTTGAAGCT 
TATAATATTC CCGCTAGCCA GCATCCTGGT CAGGATATCG AGGTGGTTAT GGAGGCAGCC 
CAATCTGCCA TAGCCCATGT GCGTAGTGGT GCAGGACCTT ATTTCCTGGA ATTTCTGACT 
TATCGTTACC GGGGCCATTC CATGTCGGAT GCGGGAGCCT ACCGCAGCAA GGAAGAGGTG 
GCGGAGTGGA TGCAGCGGGA TCCCATTCAG ATTCTAGCCA AGCGCCTAAT CGAAGCGGGC 
GAATTAACAG AGGAGGAATT CAAAGCCATG GAACAGGCGG TTCAGAGTGA GATCGACAAT 
GATATCATCC AATTTGCGGA AGAGAGTCCA GAGCCAAAAG TAGCCGATCT GGCGAAGTAT 
GTCCTGGAGG ATAATCCCGA TCCTCGCTGG ATTGGGCCGT TACAGGGGCA AGGAGGATAA

Protein sequence

MRKIDRKRLL REMVFFRRFE DRSFEAYMER KVGGFLHLYS GQEAVATGVL EMVQADRGVG 
FDYAITGYRD HIHAIKAGAP AREVMAELYG KETGSSRGRG GSMHIFDPSV RFMGGYALVG 
QPFPLAAGLA LACKHQKEGR IAVCFLGDGA NNQGTFHETM NMASLWKLPV LFVCENNCYA 
IGTVIQRSTA VIDQYKRLEA YNIPASQHPG QDIEVVMEAA QSAIAHVRSG AGPYFLEFLT 
YRYRGHSMSD AGAYRSKEEV AEWMQRDPIQ ILAKRLIEAG ELTEEEFKAM EQAVQSEIDN 
DIIQFAEESP EPKVADLAKY VLEDNPDPRW IGPLQGQGG