Gene Noc_3012 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_3012
Symbol
ID	3705720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	3405155
End bp	3406261
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	54%
IMG OID	637739486
Product	SMF protein
Protein accession	YP_344984
Protein GI	77166459
COG category	[L] Replication, recombination and repair [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0758] Predicted Rossmann fold nucleotide-binding protein involved in DNA uptake
TIGRFAM ID	[TIGR00732] DNA protecting protein DprA

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATGAAC GAGCCTACTG GCTCGCCTTG CACCGCGCTC CTGGTGTCGG CAGTGTCAGT 
TTTTGCCGCC TCTTGGAGAA ATATGGCTCG CCGACTGCCT TATTTACTTC CCCGGAAAGG 
CTGGCGGGCC TTAGCGATGG AATCCAGCAT TATTTGCGGC AACCTGATTG GAAAGCGGTA 
GAGCAGGATC TAAAATGGCT GGAGCAGCCA GACCATTATT TGCTCACTTT GGCCGATCCA 
GGATATCCGC CGCTACTGCG GGAGATTCCC GACCCGCCTC CCATCTTATT CGTCCATGGT 
GATCCGTCCT TGCTCTCTTT ACCCCAACTA GCAATTGTGG GCAGCCGCAA TCCTTCCCCT 
GCGGGGGCTG AAACTGCTGC GCAGTTTGCT ACCTATCTGG CCAATTCAGG TTTAGTTATT 
AGTAGCGGGC TGGCGCTTGG TATTGATGCT GCCGCCCATG AGGGAGCGCT AGCTGCAAAA 
GCGGCGACGA TAGCTGTGGC GGGAACCGGG CTAGACAGAG TTTATCCGGC CCGTCATCAT 
GCCTTGGCTC ATGCCATTGC CGAGAGCGGG GCATTAGTAT CAGAGTTCCC CATTGGAACT 
CCTCCGTTAC CTCAGAATTT CCCACGCCGT AACCGGCTTA TCAGCGGCCT TAGCTGGGGT 
ATTCTTGTGG TTGAAGCCGC TTTACAAAGT GGCTCTCTCA TTACAGCCCG CCTAGGCGCG 
GAACAGGGGC GGGAGATATT TGCTATCCCT GGTTCTATCC ATAACCCCCT CGCCCGGGGC 
TGTCATCATC TTATCCGAGA GGGTGCCAAG CTAGTGGAAG CCGCCCAAGA TATTTGGGAG 
GAATTGGGAT CTTTGGCAGG CGCAATACCA AACCTCCAAT GCCAGGAAGC GCCCCAAAAA 
ATAGAGGCAT CAACCGATGA TCTGGAATAT CAACTTCTAC TGGATTGCTT AGGTTATGAT 
CCTCTTCCCA TAGATCTCTT AGTTGAGCGT TGTGGATTGA CGGCAGAAGC GGTTTCCTCC 
ATGCTTTTAA TATTAGAGTT ACAAGGCCGC ATCACGGCAT TGCCTGGAGG ACGCTACCTC 
CGATGCGGTA AAGAGGGCCA ATCATGA

Protein sequence

MDERAYWLAL HRAPGVGSVS FCRLLEKYGS PTALFTSPER LAGLSDGIQH YLRQPDWKAV 
EQDLKWLEQP DHYLLTLADP GYPPLLREIP DPPPILFVHG DPSLLSLPQL AIVGSRNPSP 
AGAETAAQFA TYLANSGLVI SSGLALGIDA AAHEGALAAK AATIAVAGTG LDRVYPARHH 
ALAHAIAESG ALVSEFPIGT PPLPQNFPRR NRLISGLSWG ILVVEAALQS GSLITARLGA 
EQGREIFAIP GSIHNPLARG CHHLIREGAK LVEAAQDIWE ELGSLAGAIP NLQCQEAPQK 
IEASTDDLEY QLLLDCLGYD PLPIDLLVER CGLTAEAVSS MLLILELQGR ITALPGGRYL 
RCGKEGQS