Gene Noc_1661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1661
Symbol
ID	3705641
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1854815
End bp	1855840
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	44%
IMG OID	637738138
Product	aminodeoxychorismate lyase
Protein accession	YP_343663
Protein GI	77165138
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.148869
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCAAAT CTTTTTTCTT TTTATTAGCG CTATCAGGAA TCGCGGTAGG GTTAGGAATA 
GTATGGTTAA AATTTGAATA TGATCGCTTT ACTCATATCC CGCTTCAGAT AGACCAAGAA 
GGCTTGAATT TGGTAATTCC TAGTGGTGCC ACAATACATT CCGTTGCTAC CGAACTGTAT 
CAACGGGAAG CTTTAGAGCA ACACCCTCTG TATTTAGTAT TACTAGCCCG TTGGCAGGGG 
ATAGCTAGGG ACATCAAGGC TGGCGAATAC CATATTCAGG CGGCCACAAC ACCGTCGGCA 
TTGCTGCGCC AAATTGTAGC AGGTAAGGTC AAACAATATA GCTTGACTTT AGTGGAAGGA 
TGGACTTTTC CACAGGTAAG AAAGGCTATC CAAAACAGTC TTTATCTTCA ACAAACATTG 
AATCGGCAAT TACCAGCTTC TGAGATTATG AAACGTCTGG GCTATCCTAA TGAACATCCA 
GAGGGTCGGT TTTTTCCTGA TACCTACTTC TTTCCCGCTG GTACTTCCGA CGTGGATTTC 
TTACGGCGCG CTTATCAATT TATGGTAAAT CATCTAACCC ATGAATGGGA AAACCGTGAG 
CTTGAGCTTC CTTACCGAAG CTCCTACGAT GCTTTGATAC TAGCTTCCAT TATTGAACGG 
GAGAGCGCAT TAATCGAAGA ACGGCCTTTG ATTGCTGGTG TGTTCGTGCG ACGTCTTCAA 
AGGGGAATGC GTTTGCAAAC CGATCCGACA GTTATCTATG GTCTAGGGAA CCGCTTTGAT 
GGAGATTTAC GGCGCCAGGA TTTAAAAAAG GATACGCTTT ATAATACTTA TACACGTTCG 
GGACTTCCTC CAACGCCTAT TTGTATGCCT AGTCTAGGAG CATTACGGGC AGCGTTGCAC 
CCGGCAGAAG GGAAATCATT ATATTTCGTT TCTCGTGGTG ACGGCAGCCA TCATTTTTCG 
GCTACTTTTA AAGAACATAA GGAAGCAGTA CGAAACTATC AATTGGTCAG GAAAAATAAT 
CATTGA

Protein sequence

MRKSFFFLLA LSGIAVGLGI VWLKFEYDRF THIPLQIDQE GLNLVIPSGA TIHSVATELY 
QREALEQHPL YLVLLARWQG IARDIKAGEY HIQAATTPSA LLRQIVAGKV KQYSLTLVEG 
WTFPQVRKAI QNSLYLQQTL NRQLPASEIM KRLGYPNEHP EGRFFPDTYF FPAGTSDVDF 
LRRAYQFMVN HLTHEWENRE LELPYRSSYD ALILASIIER ESALIEERPL IAGVFVRRLQ 
RGMRLQTDPT VIYGLGNRFD GDLRRQDLKK DTLYNTYTRS GLPPTPICMP SLGALRAALH 
PAEGKSLYFV SRGDGSHHFS ATFKEHKEAV RNYQLVRKNN H