Gene Noc_0621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0621
Symbol
ID	3706853
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	668471
End bp	669730
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	53%
IMG OID	637737129
Product	hypothetical protein
Protein accession	YP_342670
Protein GI	77164145
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGATG AAGAGGAAAC ACTGCGGCCG GAGACCATTG CCCTCGATGC GTTAATCAAG 
GCGACCGTTG CCAAGATTCG TGAACAGACT GATCCGTCGC ACCCGGACGC CATGTTGTTT 
ATGGGTAATT GGCACCAGGC CGTTCCGGCA ATGGTCATTC AGGATCCGGT GCTGGAACCC 
GTCGATAAAC TGGTGTGGAT GGTCATCATG CTGCATGCCA GAGAGACTGG CGGGCGAACG 
GCATTTCCCG ACTACGATAC GATCGCCAGT AAAACCAATG TTTCCTCAAC CTCCACGGTC 
TCGCGCGCTA TTGCGATCCT GCGTTTGACG CGCTGGCTGA CCCTGTGCGC CCGGATCCGG 
CAAACGAGCG GCCGCTTCAC GGGTAACGTC TACATACTCC ACGATGAGCC GTTGCCACTG 
GTCGATGCCA TCTATCTGGA CGATGCCTAC ATGGCGTTCG TGACTCAATC TCAGGAGCAC 
CATCACGCGC GTGTCCGCCG CGTGGCTCAG GCTGTGACAG CGAGTCTCGA TATGGATATT 
CGTCGGGGTG AACATTTGGC GGACCAGGAA TCAGCGATCG AGCGTCGATT ACAGGCAGTG 
AAGATGCTGG CGGATACCAG CAGAAATAAC GACAAAAGCG GTCGCTATTT TACCTTCAAC 
GCAGCGGCAC TAAGCCAGCT GAAAAATTCG TCAGACACTG GAATTGCAGA GCAATCAGAC 
CAGCACCAAT TTTCAAAGGC GGAGACGAAG ACGCACTACA GTAGTGGTTG TAGTAGTCAT 
TATAAAAAAA CAACTACAAC AACCACTACA CAAAATACCC ACAATGAAAA GAAAGCATTC 
TCCGAATCCA GCCAATCAAT ACCGTTGCCA ACGGATCAAA CGCTGATCTA TCCACCACGT 
TTGTCGGAGA ACCAGAAACT CCTGGCTGAT AGGTATCTTG CGATGATTGC GCCCGAAGAC 
CGGCAGTTGG TGCTGGATGA ACTGCAAGGC CGCCTGTCCT CTGAGCAAAA GGGTATGAAG 
CCCGTCTACG ACGAACTGAG GTTTTTGCAC TCGCTGTGCA AGGCTGCGCA AAAAGATGAA 
TTTGTGCCTA ACCTGGGCAT CAAGGTGGCG GAGGCTCGAA AAGAGCGGGT GCGTCATGTT 
CAACCGCCGG AAGATGAAAC GCAGAAAGCC CAAACCGCCG AAGAACGAGA ACGCTCCCAG 
GCCTATGCGC GTGAGCAACT GGCCAAGTTG CGCGCATCGT TGAACATGGA CAAAAAATAA

Protein sequence

MADEEETLRP ETIALDALIK ATVAKIREQT DPSHPDAMLF MGNWHQAVPA MVIQDPVLEP 
VDKLVWMVIM LHARETGGRT AFPDYDTIAS KTNVSSTSTV SRAIAILRLT RWLTLCARIR 
QTSGRFTGNV YILHDEPLPL VDAIYLDDAY MAFVTQSQEH HHARVRRVAQ AVTASLDMDI 
RRGEHLADQE SAIERRLQAV KMLADTSRNN DKSGRYFTFN AAALSQLKNS SDTGIAEQSD 
QHQFSKAETK THYSSGCSSH YKKTTTTTTT QNTHNEKKAF SESSQSIPLP TDQTLIYPPR 
LSENQKLLAD RYLAMIAPED RQLVLDELQG RLSSEQKGMK PVYDELRFLH SLCKAAQKDE 
FVPNLGIKVA EARKERVRHV QPPEDETQKA QTAEERERSQ AYAREQLAKL RASLNMDKK