Gene Noc_0076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0076
Symbol
ID	3705914
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	75986
End bp	77884
Gene Length	1899 bp
Protein Length	632 aa
Translation table	11
GC content	60%
IMG OID	637736596
Product	DNA helicase II
Protein accession	YP_342143
Protein GI	77163618
COG category	[R] General function prediction only
COG ID	[COG3972] Superfamily I DNA and RNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAATTTTA ACATCGGGTG GATCGCCCGC TACCGGAATT TCGACACCAT GGCCACGTTC 
ATTCCAGCAC TCACCACAAT CCCCCGGATG ACTCGCGGCG AGCGCCGTTT CGGTCGCCGG 
CTTGACAGCC TGCTGGAAGA AGACTATCTC GTCTGGTACG ACATTCCATT GGGACGCCGG 
CGTCGCTATC CCGACTTCAT CATTCTGCAT CCCGCTCGCG GCCTGCTGTT TCTCGAGGTC 
AAGGACTGGA AAATCGAAAC CATTCGCTCG ATCACCCCTG ACAGCGTCGT GATCGATACC 
CAAGAGGGCC GCAAGACGGT CAGCAACCCG TTGGCTCAAG CTCGCCAATG TGCCTTTGCC 
GCCATCGACC AGCTGAAGCG CGACCCTCAG CTGACTCAGA GCGATAAGTG CTACCGCGGC 
AAGCTATGCT TTCCCTATGG GCACGGTGTG GTCTTTCCCA ATATCACGCG TCGGCAGTGG 
AACCAAGCCA TTCCCGAGGC AGAGCAAGAA ATCCTGCTGC CGGCGCATCG CGTGATCTGC 
AAGGACGAGA TGCTCACCAC CGCCGACCCG GAGGCATTCC AGCAGCGGCT CTGGAACATG 
TTCGACTACC GGTTCGGCGA GCAGTTCAGC GTCCCGCAGC TCGACCGGAT CCGCTGGCAG 
CTCTTCCCGG AAGTGCGCAT CGATGCCCCC ACAACGGATC TCTTCGGTAA CGATGAAGCC 
GCGGAGGATG AGCCCGCGAG CAACCTCGTC CCCAATATCG TTCGCGTCAT GGATCTGCAT 
CAGGAGCAGC TGGCCAGAAG CATGGGCGAC GGCCACCGGG TCATTCATGG CGTTGCCGGC 
TCCGGCAAGA CCTTGATACT CGGCTACCGC TGCCTGCATT TGGCCCAGGC CATCAGCAAG 
CCGATCCTGG TGCTGTGCTT CAACATCACC CTGGCAGCGC GCCTGCGCTG CTTCATCGCC 
GAAAAGGGAA TCAGCGAGAA GGTTAAGGTG CACCATTTCC ATGAGTGGTG CAGCCTGCAG 
TTGAAGACCT ATCAGGCCGA CCTGGCGCCG GGAAAAGGCC CTATCTGGGA GCGTCAGGTG 
GAAAGCGTCA TTCGGGCAGT CGATCAGTCA CGCATTCCCC GGGCACAATA CGGCGCGGTG 
ATGATCGACG AAGGCCACGA CTTCGAGCAG GCCTGGCTCA AGCTGGTGGT ACAGATGGTC 
GATCCCGACA CCAACTCGCT GCTGCTGCTT TATGACGATG CCCAGTCCAT TTATCAGAAG 
AGCTCGCTGA AATTCCCGCT TTCCTCGGCT GGCGTCCAGG CCCGCGGGCG CACCACTATT 
CTCAAGCTGA ACTATCGAAA CACCCGGGAA ATCCTGACGT TCGCCTATGA TTTCGCCCAG 
GATTTTCTGA AAGCTCACGA TGCCGATGAT GACCATATTC CTTTGATCGC CCCCGAGGTG 
GCCGGGGTGA GCGGGCCCAG GCCGGCGTTT CGTCGCCTCA GCAGCCCCCG CGATGAAGCG 
CGCTATCTGG TGCGCTGCAT CCAGACATGG CGTAGCCAGG GTAGCGGCTT GAACAGTATC 
GCGGTGGTCT ATACTGGCAA CTCGCAGGGG CGTCTCTTCT ATGACGCCCT GCGCGAAGCC 
AGCATCCCAA GCCGCTGTCT GCAACAGTCT GCCGACAAGC GCAGCTACGA CCCGCAGGCC 
GATGAAGTGG TGCTGCTCAG TCGACAGAGC AGCAAGGGGC TGGAGTTCGA TACCGTGCTG 
CTGTGTGGTC TCGGGGCATT GAGCAACGAC GAGGAACGGC TGGCTCAGGA AGCGCGACTG 
CTTTATGTCG GCATGACCCG CGCTCGCCGC CGGCTGCTGG TAACCAGCTG CAAGCCAAAC 
TGGTACACCC AGCGGCTAAC AGAGCTCGCC TCGGCCTGA

Protein sequence

MNFNIGWIAR YRNFDTMATF IPALTTIPRM TRGERRFGRR LDSLLEEDYL VWYDIPLGRR 
RRYPDFIILH PARGLLFLEV KDWKIETIRS ITPDSVVIDT QEGRKTVSNP LAQARQCAFA 
AIDQLKRDPQ LTQSDKCYRG KLCFPYGHGV VFPNITRRQW NQAIPEAEQE ILLPAHRVIC 
KDEMLTTADP EAFQQRLWNM FDYRFGEQFS VPQLDRIRWQ LFPEVRIDAP TTDLFGNDEA 
AEDEPASNLV PNIVRVMDLH QEQLARSMGD GHRVIHGVAG SGKTLILGYR CLHLAQAISK 
PILVLCFNIT LAARLRCFIA EKGISEKVKV HHFHEWCSLQ LKTYQADLAP GKGPIWERQV 
ESVIRAVDQS RIPRAQYGAV MIDEGHDFEQ AWLKLVVQMV DPDTNSLLLL YDDAQSIYQK 
SSLKFPLSSA GVQARGRTTI LKLNYRNTRE ILTFAYDFAQ DFLKAHDADD DHIPLIAPEV 
AGVSGPRPAF RRLSSPRDEA RYLVRCIQTW RSQGSGLNSI AVVYTGNSQG RLFYDALREA 
SIPSRCLQQS ADKRSYDPQA DEVVLLSRQS SKGLEFDTVL LCGLGALSND EERLAQEARL 
LYVGMTRARR RLLVTSCKPN WYTQRLTELA SA