Gene Noc_A0019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_A0019
Symbol
ID	3704322
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007483
Strand	+
Start bp	15233
End bp	16756
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	51%
IMG OID	637736514
Product	hypothetical protein
Protein accession	YP_342062
Protein GI	77163536
COG category	[S] Function unknown
COG ID	[COG0397] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAGGA CACCTCAGTC ACGATTGAAG GTTTGGAGAC CCATGCCATC GTCCACAGCC 
ATGAAGCATC AGGATATCGG TTGGCATTTT GATAACACCT ATGCGCAGCT GCCCGACCAC 
TTTTACACGA AGCTGCATCC GGTTCCGGTG CATGAACCAC GCCTTGTCAT TGTCAATAAT 
GCCCTGGCAG AAGAACTAGG ATTAAATCTC AAAGCCTCCT CTGAGGATGA ATTAGCGCAG 
CTTTTTTCAG GCAATCAGCT TCCAGAAGGT GCAGAGCCTC TGGCGCAGGC CTACGCCGGG 
CATCAGTTTG GCCATTTTAC CTATTTGGGT GATGGGCGGG CCCATTTAAT CGGCGAGCAT 
CTCACCCCAG ACGGTAAACG GGTGGATATT CAGTTCAAAG GCTCGGGCCA AACACCCTAT 
GCCCGGCGCG GTGATGGGCG TGCAGCGTTG GGTCCGATGC TGCGAGAGTA TATCATCAGC 
GAAGCCATGC ATGCGCTGGG CATCCCTACC ACCCGTAGTC TTGCGATAGC CACCACCGGC 
GAATCTGTTT ACCGGGAAAC GGTACTGCAA GGAGCGATTC TGACCCGCGT CGCATCCAGT 
CACTTGCGTG TGGGCACATT TGAATATCTG GCCGCACAAG AAGATAAAGC AGGCCTGAAG 
CAACTTACTG ATTATGCTAT ACAGCGCCAT TATCCAGAAA TAATAGACTC TGATACTCCC 
TATCTTGAGC TGCTCAAGGC CGTCATGGCT TGCCAGATAA AACTTATCAC CGAATGGCTG 
CGAGTAGGGT TTATTCACGG CGTGATGAAC ACGGACAATA TGGCCGTTTC CTGTCAGACC 
ATTGATTATG GCCCCTGTGC ATTCATGGAT AGCTATGATC CCAACACCGT GTTCAGCTCC 
ATCGACCACA TGGGGCGTTA TGCCTATGCC AATCAGCCCC GTATCGCGCA GTGGAACTTA 
GCACGGTTTG CTGAAGCTAT CCTTCCGCTA CTGCATGAAA ATATTGAGAA GGCTGCCGCA 
ATGGCAGAGG AAGTCATCCA GTCATTTAAG GCATTATTTC AGCAGGAATG GCTAGCAATG 
ATGCGTCGCA AGCTGGGGCT GTTCGGTGAA GAAAAAGAAG ATAGGGAATT CATCACCGGG 
CTTCTGCAAT GGATGCAACG CAGTCATGCG GATTATACCA ATACATTCCG TGATTTGATG 
GATGAGCATT TTCCCGAAGA GCCACACTAT CAGGATCAAG AATTCAAACA TTGGTACGAT 
AGATGGCAAC AGCGGCTGGA ACATAACACC AACCCGTTCC CATCCTCCCT GTGCCTCATG 
GGTGCGACCA ACCCGGTGGT CATACCCCGT AATCATCGTG TAGAAGCAGC GCTTAACGCT 
GTAGAACAGA ACGCTGACTT CTCAAAGCTA CATGAATTGC TGGATGTGCT GTCTGAGCCC 
TATAAAGATA AAGAGAAATA CACTGAATTC AAAAACCCTC CTGCGCCGAA AGAACGGGTG 
TACCAAACCT TTTGTGGTAC TTGA

Protein sequence

MTRTPQSRLK VWRPMPSSTA MKHQDIGWHF DNTYAQLPDH FYTKLHPVPV HEPRLVIVNN 
ALAEELGLNL KASSEDELAQ LFSGNQLPEG AEPLAQAYAG HQFGHFTYLG DGRAHLIGEH 
LTPDGKRVDI QFKGSGQTPY ARRGDGRAAL GPMLREYIIS EAMHALGIPT TRSLAIATTG 
ESVYRETVLQ GAILTRVASS HLRVGTFEYL AAQEDKAGLK QLTDYAIQRH YPEIIDSDTP 
YLELLKAVMA CQIKLITEWL RVGFIHGVMN TDNMAVSCQT IDYGPCAFMD SYDPNTVFSS 
IDHMGRYAYA NQPRIAQWNL ARFAEAILPL LHENIEKAAA MAEEVIQSFK ALFQQEWLAM 
MRRKLGLFGE EKEDREFITG LLQWMQRSHA DYTNTFRDLM DEHFPEEPHY QDQEFKHWYD 
RWQQRLEHNT NPFPSSLCLM GATNPVVIPR NHRVEAALNA VEQNADFSKL HELLDVLSEP 
YKDKEKYTEF KNPPAPKERV YQTFCGT