Gene Noc_1047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1047
Symbol
ID	3707230
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1153766
End bp	1154797
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	53%
IMG OID	637737552
Product	N-acetyl-gamma-glutamyl-phosphate reductase
Protein accession	YP_343085
Protein GI	77164560
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0002] Acetylglutamate semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01850] N-acetyl-gamma-glutamyl-phosphate reductase, common form

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.545554
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCAGAG CAGCTATCGT AGGTGGAACG GGATACACAG GCGTTGAACT ACTACGTCTA 
CTGGCCAATC ATCCCAATGT TGAAATCGTA GCCATCACCT CACGCACTGA GGCAGGCAGG 
CCGGTGAGCA AGCTATTTCC AAACCTTCGA GGCTATTTGG ATATTTGCTT TACAGAACCT 
GAGCCCGCCC AGCTAGCCGC CGAATGCGAC GTAGTTTTCT TTGCAACTCC CCATGGAGTC 
GCCATGGATA TGGTGCCCGC CCTGCTCGCA CAAAATACTC GCGTCATTGA TTTATCTGCC 
GATTTCCGCC TTGCTGATCC TACGATATGG GAGCAATGGT ATGGCCGTCC TCACGCTGCA 
CCCCATTTAT TGGCTGAAGC GGTTTATGGA CTCCCTGAAA TCAATCGGGA AGCGATTCGC 
CAAGCTCGCC TAATCGCCTG TCCGGGCTGC TACCCCACTG CGGTCCAGCT TGGATTTCTC 
CCCTTGCTAG AGCATCAACT AGTTGACCCT AGCCGGCTTA TCGCCGATGC GAAATCAGGC 
GCCAGCGGAG CAGGCCGCAA AGCAGCCTTA GGAACCCTCC TTTGCGAGGC AGGTGAAAAT 
TTTAAAGCCT ATAGCGTCAG CGGACACCGG CATCTACCTG AAATCATTCA AGGACTTCAA 
TGGGCCAGCC GATCCTCCGT AGACTTGACC TTTGTTCCCC ACCTTATCCC CATGATTCGG 
GGAATTCATG CAACCCTCTA CGCCCAGCTT GAGCATGAGG TTGATCTCCA AGAACTTTAT 
GAGCAACGTT ATGCCCCGGA GCCCTTTGTG GATGTATTGC CGCCGGGAAG CCACCCAGAA 
ACCCGCAGCG TCCGGGGAAA CAATATGTGC CGCCTCGCTA TCCACCGCCC ATCGGCAGGC 
AACACTGTAA TTGTGCTCTC AGTAACCGAT AACCTAATAA AAGGCGCCTC CGGCCAGGCA 
ATACAAAATA TGAACCTTAT GTTCGGTCAA GAAGAAACAC GCGGGTTAAT GCACATTGCT 
GTCATACCTT GA

Protein sequence

MIRAAIVGGT GYTGVELLRL LANHPNVEIV AITSRTEAGR PVSKLFPNLR GYLDICFTEP 
EPAQLAAECD VVFFATPHGV AMDMVPALLA QNTRVIDLSA DFRLADPTIW EQWYGRPHAA 
PHLLAEAVYG LPEINREAIR QARLIACPGC YPTAVQLGFL PLLEHQLVDP SRLIADAKSG 
ASGAGRKAAL GTLLCEAGEN FKAYSVSGHR HLPEIIQGLQ WASRSSVDLT FVPHLIPMIR 
GIHATLYAQL EHEVDLQELY EQRYAPEPFV DVLPPGSHPE TRSVRGNNMC RLAIHRPSAG 
NTVIVLSVTD NLIKGASGQA IQNMNLMFGQ EETRGLMHIA VIP