Gene Noc_1956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1956
Symbol
ID	3704970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	2241402
End bp	2243018
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	53%
IMG OID	637738432
Product	AMP-dependent synthetase and ligase
Protein accession	YP_343948
Protein GI	77165423
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID	[TIGR01733] amino acid adenylation domain [TIGR03098] acyl-CoA ligase (AMP-forming), exosortase system type 1 associated

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.536259
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAGAA TCCATTCAGC AAATTCCTTA GTACACTCTT TAGTACTCGA TAACGCCCTC 
AAGGGCCCGG ATGCGTCAGC ACTCGTGCAT GGTGACCAAA CTCTAACTTA CGCCTCCCTC 
GGTGAAACGG TCGAAGCCTG CGCTCGTGGG CTTCTAGCGC TTGGACTTGC TTCCTCCGAG 
CGCGTTGCCA TATATTTGCC CAAACGCCCC GAAACGGTAG TTACCCTCTT CGGCGCTGCA 
GCCGCCGGCG GCGTATTTGT ACCTATCAAT CCTTTGCTCA AACCCCGGCA AGTTGCTCAC 
ATCCTTCGAG ATTGCAATGT CCGGGTACTC GTCACCGCCA GCAACCGTAT TGATTTTTTA 
CAAGATGCGC TTGCTGAATG CCACGATCTG CGAAGCCTCG TCATTGTGGA TGCCCCGACT 
CAGACGATTG AAAAATTAGC GCAGCCAATG GCTATCTCCT GGGAGCGTCT CTTATCACTG 
GGAACTACTC AACAATCCCC AGGGCATCGC CGTATTGACA GTGATATGGC TGCCATCCTC 
TACACTTCTG GAAGCACGGG ACGCCCTAAA GGCGTGGTGC TTTCCCATCG AAATTTAGTC 
GCAGGTGCGC AAAGCGTAGC CCAGTATCTG GAAAATAATT CCAACGATCG TCTACTCGCG 
GTATTGCCCT TAAGCTTCGA CGCCGGCTTT AGCCAGCTCA CGACCGCCTT TTCTGTCGGC 
GCAAGCGTAG TACTAATGGA ATATCTGCTG CCAAAAGATG TCATTAAAAG CATCACTCGC 
CATGGGATCA CAGGGATAAC TGCCGTACCC CCCCTCTGGG TCCAACTTGC CTCCCTTGCC 
TGGCCCCCCG AAGCCGCGGA TACTCTGCGG TATATTGCCA ATACCGGAGG CCGAATGCCC 
AAAGCAGCCA CGACAGCCTT GAGACGATCT TTGCCTCAAA CCAAAGTATT TCTGATGTAT 
GGACTCACAG AAGCATTCCG CTCCACCTAC CTTCCTCCTG AAGAAGTTGA TAAACGCCCC 
GATTCCATTG GCAAAGCCAT CCCCAACGTA GAAATCCAAG TAGCCCGCGA GGATGGCAGC 
CTATGCCTGC CTGGGGAATC AGGAGAGTTG GTACACCGGG GTGTCCTGGT AGCCATGGGT 
TACTGGAACG ATCCTAAAAA AACGGCGGAA CGCTTCCGTC CTACTCCAGG GCAACCCCCT 
GAACTTCCTC TCACCGAGAT AGCGGTATGG TCCGGTGATA CAGTACGTAT GGATGAGGAC 
GGTTTCTTCT ACTTCATCGG CCGCCAAGAC GAGATGATCA AAACCTCCGG CTACCGGGTA 
AGCCCAACCG AAGTAGAAGA AGTCCTGTAC CAAGCAGGGC TTGTAGCTGA AGCTGCAGTC 
GTGGGTGTGC TCCATCCAAA ACTTGGCCAA GGGATCGTCG CCATAGTAAA ACCAAACAAG 
GATAATTTTG ATCCTGAGGA TTTATTGGCT ACTTGTCGCG CCGAACTTCC GAATTTTATG 
GTTCCTCTTG CCGTGATAGT TTCCGAGAAT CTACCCCGAA ACACGAATGG TAAGATTGAC 
CGGCGCGCAC TCGCCATGGA ATTCGAACTT CTATTCAAGG AACAAACCGC CCCATGA

Protein sequence

MSRIHSANSL VHSLVLDNAL KGPDASALVH GDQTLTYASL GETVEACARG LLALGLASSE 
RVAIYLPKRP ETVVTLFGAA AAGGVFVPIN PLLKPRQVAH ILRDCNVRVL VTASNRIDFL 
QDALAECHDL RSLVIVDAPT QTIEKLAQPM AISWERLLSL GTTQQSPGHR RIDSDMAAIL 
YTSGSTGRPK GVVLSHRNLV AGAQSVAQYL ENNSNDRLLA VLPLSFDAGF SQLTTAFSVG 
ASVVLMEYLL PKDVIKSITR HGITGITAVP PLWVQLASLA WPPEAADTLR YIANTGGRMP 
KAATTALRRS LPQTKVFLMY GLTEAFRSTY LPPEEVDKRP DSIGKAIPNV EIQVAREDGS 
LCLPGESGEL VHRGVLVAMG YWNDPKKTAE RFRPTPGQPP ELPLTEIAVW SGDTVRMDED 
GFFYFIGRQD EMIKTSGYRV SPTEVEEVLY QAGLVAEAAV VGVLHPKLGQ GIVAIVKPNK 
DNFDPEDLLA TCRAELPNFM VPLAVIVSEN LPRNTNGKID RRALAMEFEL LFKEQTAP