Gene Noc_2110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2110
Symbol
ID	3704420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2428029
End bp	2429009
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	53%
IMG OID	637738585
Product	pyruvate/2-oxoglutarate dehydrogenase complex dehydrogenase (E1) component
Protein accession	YP_344100
Protein GI	77165575
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.140374
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGAAC TGGCTTACTG GGAGGCACTG CGCCGTGCCC ACGATGAAGA ACTGGCCCAT 
GATCCCCTGG TTATTGCCAT GGGCGAGGAT ATTGGGGTGG CGGGCGGTAC CTATAAAGTT 
ACCCTGGGCC TCTACGGCAA ATATGGGGAG GAGCGAATTA TTGATACCCC TATTTCCGAG 
AATTCCTATA CCGGTATCGG AATTGGGGCC TCGATGGCCG GAATGCGGCC TATCATCGAA 
ATCATGTCCA TTAATTTTGC CTTGCTGGCT CTGGATACTC TCATCAATGC GGCTGCTAAG 
ATCCGTTATA TGTCGGGTGG CCGCGCTCAG TGTCCTATCG TAATGCGAAC TCCAGGGGGA 
ACGGCCCACC AGCTTGCCGC TCAACATTCG GCACGGTTAT CAAGGCTCTT TATGGGAACG 
CCGGGTCTGC GGGTTGTCAC GCCGAGTACC CCCTTGGATG CCTACGGCAT GCTTAAATCT 
GCGGTGCGTT GTAACGATCC AGTGATCTTT CTTGAGCACG AAAGTATGTA TAACCTCAAA 
GGGGAAGTGC CCGATGAGGA GACTTTTCGG CCTTTGGAAG GTGCCGGGGT CGTTCGTGAG 
GGAACGGATA TTACCCTTAT AGGCTATAAC TATAGCGTGC ATTGGTGTTT AACCGCGGCG 
GATAAATTGG CCCAGGAAGG CATTCATGCC GAGGTTATTG ATTTACGCTC CCTTAAACCC 
ATCGACCGGG AAACCATTCG CCGCTCCATA GAAAAAACCC ACCGGGTTCT GGTGGCCGAA 
GAAGATGAGG CGCCGGTGGG TGTTGGCAGT GAGGTGATCG CTGGAATCAT CGAGGATTGC 
TTCTTCGCTT TAGATGCCCA GCCAGTACGG GTTCATGCAG CGGATGTTCC GGTGCCTTAC 
AACTATAGCC TGGAGAAGGC TGCGATTCCT GATGCTAAGG ATGTCTACCA GAGTGCCCTT 
AAGGTATTGG GAAAAGTTTA G

Protein sequence

MAELAYWEAL RRAHDEELAH DPLVIAMGED IGVAGGTYKV TLGLYGKYGE ERIIDTPISE 
NSYTGIGIGA SMAGMRPIIE IMSINFALLA LDTLINAAAK IRYMSGGRAQ CPIVMRTPGG 
TAHQLAAQHS ARLSRLFMGT PGLRVVTPST PLDAYGMLKS AVRCNDPVIF LEHESMYNLK 
GEVPDEETFR PLEGAGVVRE GTDITLIGYN YSVHWCLTAA DKLAQEGIHA EVIDLRSLKP 
IDRETIRRSI EKTHRVLVAE EDEAPVGVGS EVIAGIIEDC FFALDAQPVR VHAADVPVPY 
NYSLEKAAIP DAKDVYQSAL KVLGKV