Gene Noc_1003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1003
Symbol
ID	3707395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1109592
End bp	1110710
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	49%
IMG OID	637737508
Product	hypothetical protein
Protein accession	YP_343041
Protein GI	77164516
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCATA CTATTCATCT TGCTGCGGGG ACTTTGACCA TTGAAGTCCA CCAAGCCCTT 
CTTCCGCTGC ATGATTTATT AGATTTTGCT AGCCGAATTA ACCCCAAGCG CGGATATTTG 
TTTGTTTCCA AGGTGCTTGG CAAGCATATT CCCTGCCAGC CTTCGAGAAT GCGGGATATT 
TACAATCGCT TAGCCCTGTC TCTTTTAGAG ATACCCGGCC CCGCTATTTT TATCGGTATG 
GCTGAAACGG CTACGGGCTT GGGCGCTGGG GTTGCAGATA GTTTAGTTCG AAGAACACAG 
CGCTGTGATA TTGTTTTCCA ACACACAACC CGCCATAGCC TGCCGGTCAG CGAATGGATG 
CGTTTTGATG AAGCGCACAG CCATGCGCCT GAGCATATCC TCTATCTGCC TTTGCCGGTT 
TTTCGTGAAC GATTCTCCCA AGCACAAACC TTGGTTCTTG TGGATGATGA AATCAGCACA 
GGGCGGACGC TGAGAGAGCT AAGCTACAGA GTGATACAAG CGTTACCCCA TATTCGGCAA 
ATTATGCTGG TGTCAATTGT CAATTGGCTT TCGCCCGCTC AAAAGCAGGT ATTTCAAGAA 
AATGTTAACC GGCCGGTGTC TTTTGTTAGT TTGTTAGAAG GCGTGTTTTC GTTTATTCCT 
AATTTGGAAT TTAGCCCTTC CTTGCCAGGA AAAGCTAGGC TATTTCAGCC GGCGCGGCAT 
GCTTGCCAGC AGACCGGCCG GCGGGGAATA GAGATAGGAG AAAAGTTCCA GGTGTCGAAC 
GGTCCTTATC CAAAGGAGCG TAAGGTGTCT GTGGTGGGGA CCGGTGAGTT TCAATTTCAA 
CCTTTTTTAT GGGCGGAGCA GCTGGAAAGA AAAGGCTTTG ATGTTCTGTT TCAGAGCACT 
ACCCGTTCCC CTATTCGGGT GGGCGGACCC ATTGGCGAAA GTCTTAGCTT CAAAGATGAA 
TATGGGGGAG GCATCCATAC CTATCTTCAT AATCCTCCTC GCGGCAGGGA AGTTATTATT 
GCCTACGAAT TTGCCGAATT AGCACGTAAT CACAATCTTC CGGAGCAGCT TGGTGGAAGT 
ATTTGGGGAG CGGCTGCCAA TACGGGATGG GATGGCTGA

Protein sequence

MSHTIHLAAG TLTIEVHQAL LPLHDLLDFA SRINPKRGYL FVSKVLGKHI PCQPSRMRDI 
YNRLALSLLE IPGPAIFIGM AETATGLGAG VADSLVRRTQ RCDIVFQHTT RHSLPVSEWM 
RFDEAHSHAP EHILYLPLPV FRERFSQAQT LVLVDDEIST GRTLRELSYR VIQALPHIRQ 
IMLVSIVNWL SPAQKQVFQE NVNRPVSFVS LLEGVFSFIP NLEFSPSLPG KARLFQPARH 
ACQQTGRRGI EIGEKFQVSN GPYPKERKVS VVGTGEFQFQ PFLWAEQLER KGFDVLFQST 
TRSPIRVGGP IGESLSFKDE YGGGIHTYLH NPPRGREVII AYEFAELARN HNLPEQLGGS 
IWGAAANTGW DG