Gene Noc_2733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2733
Symbol
ID	3705369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	3102923
End bp	3104359
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	50%
IMG OID	637739215
Product	hypothetical protein
Protein accession	YP_344716
Protein GI	77166191
COG category	[S] Function unknown
COG ID	[COG5316] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGCCAA GATTAATTCC CGCGGGAGCC CTTGCGCTTT GGATTCTGGT TCCGCCCTCT 
ACCGCCTGGA GTCAAGAAGA GATACACACC ACCCACACCG ATCAAAAAAA GGTGGCGATT 
ACTATCTATA ATAATGATTT AGCCTTGATA AAAGACCAAC GCCAGGTGGC ATTAAAAAAA 
GGGCATAATA CGCTAGCTTT TATGGATGTG AGCACCGGTA TTCAATCCGA GACCGCCCTG 
CTTCGCAATC TTACCCACCC CCAGGGTTTT TCTATTGCTG AGCAAAACTA CGAATTTGAC 
TTGCTCACCG CTGAAGCTTT ACTTCAGAAA CATGTGGGAC AGCAGGTAGG CGTCATTTCC 
CGCCATCCCA CGACCGGCGA GGAAACTATT GAACAGGCGA TCCTATTAGC CGCCAATCCG 
GGGGTAATCC TGCGTTTCAA GAACCGCATT GAAACAGGGA TTTCTCCGGA TAGGCTGGTT 
TACCAACAGA TTCCCCAAGA TCTACGGGAG CGCCCTTCTT TAATTTTGCA ACTCCAAACG 
GAAGTGGCAG ACAAGCAGGC CTTAGAGCTA AGCTATCTGA CCAGTGGCCT AAACTGGAAG 
GCTGATTACG TGGCTCAGCT CAATCAAACT GAGGATCGCT TCGATCTAAA TGGCTGGGTG 
ACTCTCACGA ACCAGTCTGG AATTTCTTAC CAAAATGCCC ACCTGCAATT AGTGGCGGGC 
AGCGTCCATC AGGTCACCCC GCAAGTCCAC TACGCCAAAC GCCCAGCGCA AGAGGCCAGG 
ACATTTGCAG ACGTTCCCCC CATGGAGGAA GAAGGTTTAC TAGACTATCA TCTGTACACA 
TTAGATCACA CCACAACTCT CAAAAACAAT CAGACCAAAC AGGTCGCCCT ACTCAGCGCC 
CATAACGTCA TAGCTCAAAA ACAATATGAG CTCCGAAGCC ACACACCGCG ACTCTACTAC 
GGTCACTCCC AATCTTTTCC CGTCTTAAAA CCGCCGGTCA TGGTTTACCT GCATTTCGAT 
AACACCCAAC AGGCTGGACT GAAGCTGCCC TTGCCAGCGG GTATCATCCG GGTCTATAAG 
CAAGACTCAA GAGGTAACAC CCAATTTGTG GGCGAGGATC GGATTAATCA TGTCTCCAAA 
AACGCTTCTG CTAAACTTAG GCTAGGGCAA GCTTTTGACA TCACCGCAAA AAAACAGCGG 
ACCGAGTACC GCAAACTGGA TTCCGATTCT TTCGAGGCCA CCTTCAAAAT AGAGCTTCGC 
AATGGCAAAA AAGAATCCGT TCTGGTTAAG GTCGCCGAAT TTATTCCTGG CGATTGGTAT 
ATTATTACCG AGAGCCACCC CCACCAGCGG GAAACCGGCA ATACCGCGCT TTGGCAACTA 
TCCATCCCGG CAGAGGGCCA GGTTACCCTT ACCGTAAGTT TCCAAACCCG AACCTAG

Protein sequence

MMPRLIPAGA LALWILVPPS TAWSQEEIHT THTDQKKVAI TIYNNDLALI KDQRQVALKK 
GHNTLAFMDV STGIQSETAL LRNLTHPQGF SIAEQNYEFD LLTAEALLQK HVGQQVGVIS 
RHPTTGEETI EQAILLAANP GVILRFKNRI ETGISPDRLV YQQIPQDLRE RPSLILQLQT 
EVADKQALEL SYLTSGLNWK ADYVAQLNQT EDRFDLNGWV TLTNQSGISY QNAHLQLVAG 
SVHQVTPQVH YAKRPAQEAR TFADVPPMEE EGLLDYHLYT LDHTTTLKNN QTKQVALLSA 
HNVIAQKQYE LRSHTPRLYY GHSQSFPVLK PPVMVYLHFD NTQQAGLKLP LPAGIIRVYK 
QDSRGNTQFV GEDRINHVSK NASAKLRLGQ AFDITAKKQR TEYRKLDSDS FEATFKIELR 
NGKKESVLVK VAEFIPGDWY IITESHPHQR ETGNTALWQL SIPAEGQVTL TVSFQTRT