Gene Noc_2136 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2136
Symbol
ID	3705328
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2462194
End bp	2464104
Gene Length	1911 bp
Protein Length	636 aa
Translation table	11
GC content	37%
IMG OID	637738612
Product	hypothetical protein
Protein accession	YP_344126
Protein GI	77165601
COG category	[S] Function unknown
COG ID	[COG3011] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.810683
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATCAAA AAGTATTCAG TCTCGTCAAA ATTGGACTTG AAAAACAGGT GCCGGCGTTA 
GGGCTTGGCG TTTTTCGTAT TTTCTTGGGT TTAGTTATTC TTCAAGAAAT TGTTTTTCTC 
TATTATTTCC GCCATCTTAT TTTTGATACT ATTCCTTTTA TTGATGTCGC TTCGCCTTCC 
ATTTATTTTT TCTTGATTTT ATGGGGCATT AATACCCTTT TTTTAACTAC GGGTTACCAT 
ACGCGTCTCG CCGCTATTGT CAATTATTTT TTTTGGGTCA TCTTTACCGC CTTTACCCCT 
ATGTGGCGAG ATTTTGATGG GGGTTTTGAT CAGTTTATGA TCGGATCGAG TTTTCTTCTT 
ATTTTCTTGC CCACGGAAAG AGCATTCTCC TTAGACAATC TTAGAGTAAG ACTTAAATTT 
CTGAAATCGG AATTGCACCA CGATCCTGTT AGTACCGTTT CTGTTCTTAG CTATTATCTT 
CCTCTCGCTA TCTCTTTAGG ACTCATTTAC TTTGATTCGG CTGTTCATAA ATTATTTGCG 
GAGCATTGGC GTAATGGATT AGGCGCATGG TTACCTTTGA CGATGCCTTA TTATATTTCC 
GCGATCGATA TGACGTGGTT CCTGAATCAA GAATTCCTGC AAAAATTTAT TGGTTATTTG 
ATTATAGTTT TTGAATTTAT TTTTATTTTT ACTTTTTATC TCCGGTCTTT TCGCGTGCCT 
TTGATGATTA CGGGGATCTC TCTCCATAGC GGTATTATTT TATCCCTTAA TATTTATCCT 
TTTGGCTTCG GAATGCTGGT TTATTACTTT TTGATGGTCC CTTTTTCATG GTGGCAGGGC 
TTAAAGAAAA CATTACAGTT TAAGTCGCCA CAATTGGTTG TTTTCTATGA TCAACAATGC 
CCGCTTTGCA ATCGCACCAG AATTATTATA GAGCATTTTG ATATTTTTAA AGCTATCAAT 
TTTGAAGGAC TGCAAAAGCG TGCAAAAAAA TATCCTGAAC TGAATAACAT TTCTGAAGAA 
CAATTGCTAA AAGACATTTA TGCTCTCGAT CAAAAAGGAC ATCTGTACGT AGGTATAGAC 
GCCTACCTGC AAATTTTATT GAAAATGAAA TATCCTGCTC TTGCAGGAAT TTTTATAAGA 
ATTCCAGGGG TTTATCATTT TGGGAAAAAA ATATATCGGC GAATTGCTGA TCAGCGTGCT 
CGTCTTACCT GCGATGAGAG CTGCTTTGTT TCTTCAGAAA ATTCCCTACA GGAGGCATAT 
AGCTTCAAAA GAAGCTACGA ATATTATGCT GGAACAAAAA AACAACGCTC TAATCGGATT 
ACCAAGTTTT TAGTATTGAT CATGCTTTTG CAGTTAAATA GTACGATTCA CTATGGGATA 
TTTTATCGCC TCAACGAGGA TGGAGCAGAA AGCGAGATCG GCCAGATTTT ATCGCCGATA 
AGCAATGCAG TATTGTTTCT ATCTCATGCC TTTCTAGGAA TAACACCCCA TGCGCTTTAT 
ATGCATGATC ATTTTCATGG TTATAACCAC ATTTTGGCGC TCACCTACAA AAACAGCCAG 
GGACAGGAGC AATGGCTTCC ATTTGTGAAC GAGGAAGGAA GGTTAGTTGC GCCAAACTGG 
GGAAGAGTTC AGTCTATGTG GGCAAATGTG GCAGTGACTC CCCATATAGA GCAAAGGCGT 
CTTTATAAAT TTATTAAAAA AATGACTGCT TTTTGGGGTA AGAAGATAGA TCTGGATTTA 
CAAGATACTG AATTTATCAT AAAAATGAAG AGAATAGATG TTCCTGTGCA TTGGGAAAGG 
AATCTGCGTA ATAAGAATAT AAATCGGCCA TGGGTAAATA TTGGGAGAGT AATTTGGCAC 
AAAGGCTTGG CAAGAATAGA GATACAGGAT ATTAATCTTG AGTCATTATA G

Protein sequence

MYQKVFSLVK IGLEKQVPAL GLGVFRIFLG LVILQEIVFL YYFRHLIFDT IPFIDVASPS 
IYFFLILWGI NTLFLTTGYH TRLAAIVNYF FWVIFTAFTP MWRDFDGGFD QFMIGSSFLL 
IFLPTERAFS LDNLRVRLKF LKSELHHDPV STVSVLSYYL PLAISLGLIY FDSAVHKLFA 
EHWRNGLGAW LPLTMPYYIS AIDMTWFLNQ EFLQKFIGYL IIVFEFIFIF TFYLRSFRVP 
LMITGISLHS GIILSLNIYP FGFGMLVYYF LMVPFSWWQG LKKTLQFKSP QLVVFYDQQC 
PLCNRTRIII EHFDIFKAIN FEGLQKRAKK YPELNNISEE QLLKDIYALD QKGHLYVGID 
AYLQILLKMK YPALAGIFIR IPGVYHFGKK IYRRIADQRA RLTCDESCFV SSENSLQEAY 
SFKRSYEYYA GTKKQRSNRI TKFLVLIMLL QLNSTIHYGI FYRLNEDGAE SEIGQILSPI 
SNAVLFLSHA FLGITPHALY MHDHFHGYNH ILALTYKNSQ GQEQWLPFVN EEGRLVAPNW 
GRVQSMWANV AVTPHIEQRR LYKFIKKMTA FWGKKIDLDL QDTEFIIKMK RIDVPVHWER 
NLRNKNINRP WVNIGRVIWH KGLARIEIQD INLESL