Gene Noc_1016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1016
Symbol
ID	3707277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1125035
End bp	1126057
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	52%
IMG OID	637737521
Product	aspartate-semialdehyde dehydrogenase, USG-1 related
Protein accession	YP_343054
Protein GI	77164529
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0136] Aspartate-semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01296] aspartate-semialdehyde dehydrogenase (peptidoglycan organisms)

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAGAA CATTTGATGT GGCTGTCGTT GGAGCTACCG GCGCGGTGGG GCAGGCTATG 
ATGGAAATCC TGGCCCAGCG GGGCTTCCCC GTCAGCCGGG TGTACCCCTT GGCGAGCGAG 
CGCTCCGCTG GGGAAAAACT TTCGTTTGGG CGCGATGAAG TCATCGTGGA AAACCTGGCT 
GGCTTTGATT TTTCTAAGGT ACAGCTTGGC TTGTTTTCCG CCGGCGCTAA AATCTCGGCC 
GAGTATGCGC CTAAAGCAGC GAGTGCGGGT TGCGTGGTGG TGGATAATAC TTCCCAGTTT 
CGCTATGACA ATCGGATTCC TTTAGTGGTG CCCGAGGTCA ATCCCCAGGC AATTGAGGGT 
TATAAGGACC ATGGGATCAT TGCCAATCCC AATTGTTCGA CTATCCAGAT GTTGGTGGCT 
CTTAAGCCCA TCTATGATGC GGTGGGTATC GAGCGAATCA ATGTAGCCAC TTACCAGGCT 
GTTTCTGGCA CCGGTAAAGA AGCTATCGAG GAGTTGGCAA AGCAAACCTC CACCCTGCTG 
AATGGGCGGC CTATTTCGCC TCAAGCTTAC CCCAAGCAGA TTGCCTTTAA TGTATTGCCC 
CATATCGATG ATTTTCTGGA TAACGGTTAC ACCCGCGAAG AGATGAAAAT GGTATGGGAG 
ACACGAAAAA TTTTTGGTGA CGAGTCTATC TTGGTAAATC CAACCGCGGT GCGGGTGCCG 
GTTTTTTATG GGCATTCGGA AGCCGTGCAT CTGGAAACCC GTGATAAGAT CACTGCCGAT 
GAGGTTAAGG CGTTGCTGCA GCAGGCGCCT GGGGTTACGG TTTTGGATGA GCACACCAAT 
GGAGGATATC CCACGGCGGT TACCGAAGCT TCAGGCAGGG ACCCAGTATT CGTGGGGCGT 
ATCCGGGAAG ATATTTCCCA TCCCAAGGGT ATAGACCTCT GGATTGTAGC CGATAACGTC 
CGCAAGGGCG CGGCGTTAAA TAGCATCCAA ATTGCGGAAT TGCTAATCAA GGATTACCTA 
TAA

Protein sequence

MSRTFDVAVV GATGAVGQAM MEILAQRGFP VSRVYPLASE RSAGEKLSFG RDEVIVENLA 
GFDFSKVQLG LFSAGAKISA EYAPKAASAG CVVVDNTSQF RYDNRIPLVV PEVNPQAIEG 
YKDHGIIANP NCSTIQMLVA LKPIYDAVGI ERINVATYQA VSGTGKEAIE ELAKQTSTLL 
NGRPISPQAY PKQIAFNVLP HIDDFLDNGY TREEMKMVWE TRKIFGDESI LVNPTAVRVP 
VFYGHSEAVH LETRDKITAD EVKALLQQAP GVTVLDEHTN GGYPTAVTEA SGRDPVFVGR 
IREDISHPKG IDLWIVADNV RKGAALNSIQ IAELLIKDYL