Gene Noc_0501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0501
Symbol
ID	3706672
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	540703
End bp	542106
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	54%
IMG OID	637737010
Product	argininosuccinate lyase
Protein accession	YP_342554
Protein GI	77164029
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCACA ACAATGTCAC TCATGGCAAA CCCTGGTCCG GTCGTTTCCA CGAACCCACC 
GATACCTTTG TCGAAGAATT CACCGCCTCT ATCGGCTTTG ACCACCGGCT TTACCGGCAA 
GATATCCACG GTTCCATCGC CCACGCTCGT ATGCTAGCCA AGGTGGGCGT ACTCTCCAGG 
GAGGAATGCG ATGCCATCAT CCAAGGTCTA GAAACTATTG CTCAAGACAT CAGCCGAGGG 
CAATTTTCCT GGTCTGTAGC CCTTGAAGAT GTGCATATGA ACATTGAAGC CGCCCTTACC 
GAGCGTATTG GCCCCGTCGG AAAAAAGCTC CATACCGGCC GCTCCCGAAA TGATCAGATC 
GCCACCGATA TCCGGCTGTA TCTACGAGAT GCCATTGATC TTATCACCGC CCAGCTACAG 
CGCTTGCAAG AAGGATTGCT AGCGATAGCC GAGCGGGAAG CAGCCACCAT CATGCCAGGG 
TTTACTCACC TACAAACAGC GCAACCGGTC ACTTTTGGCC ATCATTTAAT GGCCTGGTTT 
GAGATGCTGC TAAGAGATAC CGGGCGTCTC GCAGACTGCC GCCACCGGGT TAATGTTTTG 
CCCTTGGGAG CAGCGGCATT AGCGGGAACT ACCTTCCCCA TCGATCGGGC CTATACAGCC 
GAGCTACTAG GCTTTGATGG TATAGCGGAA AACTCATTGG ATGCCGTATC TGATCGGGAT 
TTTGCCATTG AGTTTACCGC CGCTGGCGCC CTTCTTATGA CCCATTTGTC CCGGTTCGCC 
GAGGAATTGG TGCTCTGGTC CTCAGCCCAA TTCGACTTTA TCACCCTGCC GGATCGATTC 
TGCACGGGCT CTTCCATTAT GCCCCAGAAA AAAAACCCGG ATGTACCAGA ATTGGTAAGG 
GGAAAAACAG GGCGGGTCAA CGGTCATTTA GTGAGTCTTC TCACCCTGAT GAAAGGCCAA 
CCGCTGGCTT ATAACAAGGA TAACCAGGAA GACAAAGAAC CGCTCTTTGA CACCGTTGAT 
ACTCTCTTGG GATGCCTGCG GGCCTTTGCG GATATGATCC CAGCAATCAC AACCAATCCC 
GATAAAATGC GGGAAGCAGC AACTAAAGGC TATGCGACCG CAACCGATCT TGCTGACTAT 
CTGGTACGCA AAGGCGTTTC ATTCCGGGAT GCCCACGAAA TCGTGGGCAA AGCCGTGGCC 
CTTGCCATCG AACAAAGCAA AGATCTGGCC GCCCTCAAGT TGGCTACCCT CCAAGACTTC 
TCTCCTGTTA TCGAGGAAGA TGTCTTTGAT GTCCTGACCC TAGAAGGCTC AGTGGCGGCA 
AGAAATCACC TGGGAGGTAC CGCGCCCGCC CAGGTGCGTG CGGCCATCCA ACGGGGGCGG 
GAGAAACTAA ACTCCCTGGC CTAA

Protein sequence

MSHNNVTHGK PWSGRFHEPT DTFVEEFTAS IGFDHRLYRQ DIHGSIAHAR MLAKVGVLSR 
EECDAIIQGL ETIAQDISRG QFSWSVALED VHMNIEAALT ERIGPVGKKL HTGRSRNDQI 
ATDIRLYLRD AIDLITAQLQ RLQEGLLAIA EREAATIMPG FTHLQTAQPV TFGHHLMAWF 
EMLLRDTGRL ADCRHRVNVL PLGAAALAGT TFPIDRAYTA ELLGFDGIAE NSLDAVSDRD 
FAIEFTAAGA LLMTHLSRFA EELVLWSSAQ FDFITLPDRF CTGSSIMPQK KNPDVPELVR 
GKTGRVNGHL VSLLTLMKGQ PLAYNKDNQE DKEPLFDTVD TLLGCLRAFA DMIPAITTNP 
DKMREAATKG YATATDLADY LVRKGVSFRD AHEIVGKAVA LAIEQSKDLA ALKLATLQDF 
SPVIEEDVFD VLTLEGSVAA RNHLGGTAPA QVRAAIQRGR EKLNSLA