Gene Noc_0244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0244
Symbol
ID	3706299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	268636
End bp	269841
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	51%
IMG OID	637736760
Product	malate dehydrogenase
Protein accession	YP_342304
Protein GI	77163779
COG category	[C] Energy production and conversion
COG ID	[COG0281] Malic enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGACTG CCTTAGGCTA TCATGCGGAG CCGCGGCCTG GAAAATTGGA GATCAGTATT 
ACCAAGCCTT GCGCGACACA GCAGCAGTTG AGTTTAGCCT ATAGTCCTGG AGTTTCTGTA 
CCGGTGGGAG CTATTGTGGC TGATCCTGAA GCTGTCTATC GTTATACCGC TAAGGGTAAT 
TTGGTTGCGG TAATTACCGA TGGCAGCGCC GTATTGGGGT TGGGAAATAC AGGTCCTTTG 
GCCAGCAAAC CCGTGATGGA AGGCAAGGCG GTTTTGTTTA AGTCTTTCGC CGGGCTAGAT 
GCTATCGATA TCGAAGTAGA GGCGGAGTCT CCCGAGGCCT TCGTGGATAC AGTAGCCCGT 
ATCTCACCGA CTTTTGGCGG AATCAATCTG GAGGATATTG CCGCACCTCA CTGTTTTATG 
ATCGAGCAAG CCCTTATTGA GCGTCTGGAT ATCCCGGTTC TGCATGATGA CCAGCATGGT 
ACGGCCATCA CAATTGCGGC AGCGCTTCAA AATGCCCTGG AATTGCAGGG AAAATCTTTA 
CCAGAGGCCC GAATCGTTTG TGTGGGTGCT GGGGCGGCTG GGATTGCAAC GCTTCGGCTG 
CTGGTTGCCC TAGGTCTGGA TCAGGAGAAC ATTTTACTCG TTGATCGCCA AGGGGTTATT 
CGCGAAGAGA GCCAAGCACC GCATTCTTAT TGCCGTCCTT TTATCTCTTC CTCGCCAAAG 
CGTACCCTAG AAGAAGCGAT AGAGGGGGCG GATGTCTTTA TTGGCGTGGC GGCTCCCAAT 
CTGTTGACTA TGGAGATGCT AAAATCCATG GCTTCACGCC CTATTGTCTT TGCACTTTCT 
AACCCGGATC CAGAGATAGA TCCAGGTTTA GCCCATGCCG CTCGTGATGA TTTAATCTTG 
GCTACCGGCC GCACCGACTA TCCCAACCAG GTAAATAATG TATTAGTTTT TCCTTTCTTG 
TTCCGCGCTG CCCTCAATGT TCGTGCCCGA TGCATTAATG ATGCAATGAA GCTTGCGGCA 
GTGCGAGCAT TGGTTGAGCT GACAAAGGAG CCAGTTCCCA AACAAGTGCT TGAAGCTTAT 
GGCGAGCAGC AACTTGCTTT CGGAGCCAAT TACATTCTTC CCAAGCCACT GGATCCCCGT 
TTAAGAGAGT TTGTGACGAT GGCTATTACT CAAGCAGCCA TTGAGTCGGG GATAGCACGA 
ATTTAA

Protein sequence

MATALGYHAE PRPGKLEISI TKPCATQQQL SLAYSPGVSV PVGAIVADPE AVYRYTAKGN 
LVAVITDGSA VLGLGNTGPL ASKPVMEGKA VLFKSFAGLD AIDIEVEAES PEAFVDTVAR 
ISPTFGGINL EDIAAPHCFM IEQALIERLD IPVLHDDQHG TAITIAAALQ NALELQGKSL 
PEARIVCVGA GAAGIATLRL LVALGLDQEN ILLVDRQGVI REESQAPHSY CRPFISSSPK 
RTLEEAIEGA DVFIGVAAPN LLTMEMLKSM ASRPIVFALS NPDPEIDPGL AHAARDDLIL 
ATGRTDYPNQ VNNVLVFPFL FRAALNVRAR CINDAMKLAA VRALVELTKE PVPKQVLEAY 
GEQQLAFGAN YILPKPLDPR LREFVTMAIT QAAIESGIAR I