Gene Noc_1357 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1357
Symbol
ID	3706121
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1503452
End bp	1504654
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	46%
IMG OID	637737852
Product	hypothetical protein
Protein accession	YP_343381
Protein GI	77164856
COG category	[S] Function unknown
COG ID	[COG3016] Uncharacterized iron-regulated protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.690238
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAATC GAGTAATCAC CCCCTTTTTC CTTCTATTAT TGTTTATCGT TTTCTTCTCT 
GTATGGGTGC GGCCTTTGAC GGCGGCAACC GTTGTAAGTG GACAAGCACA TGGAAAGGCT 
AACGAGCTGG AAGCGCAACA GGCCCTTGAA ATGGATGCCT CCACCAAGGC GGTTAATTTG 
AGGCAGTTGC TAGATTTGGA GGCAATTATT CCTAAGTTAG CGCGCCACCA GGTTATCTTT 
GTTGGGGAAC AGCATCCCCG TTTTGATCAC CATTTGAATC AGCTTGCCAT AATTCGTGGC 
CTTCACGGGA TACACCCAAA ATTAGTGATC GGCGTTGAAT TTTTTCAACA ACCGTTTCAG 
CAGTATCTGG AGCAATTTGT CGCGGATCAA CTCACCGTAG AAGAATTTTT AAAAAAAACG 
GAATATTATG ATCGTTGGCG CTACGACTTC CGGCTGTATG CACCGATACT TGAATTTGCC 
CGGAAAAATA GTATTCCTAT ATTAGCCCTC AATGTGCCTA CCGAACTTAT ACAGAAAGTG 
GGCCGGGAGG GTTTGGAGGG GCTTTCTGAG AAGGAAAGAG CTCAACTTCC CTCCGAAATT 
GACCGTTCCA GTGTGGCCTA CCGCGAGCGA TTGCAAGAGG TGTTCGAAAA CCATCCTCAG 
CATTTTGGAA AGTTCGAGAC TTTTTATGAG GCTCAATTAG TATGGGATGA GGCAATGGCG 
GAGAGCGCTA GCCGCTATCT TAAGGATCAC TCTGATTCCC ATATGATTGT TCTGGCCGGC 
AATGGCCATT TGGCTTATGG CGTAGGTATT CCAGAGCGCC TTAATCGGCG TCTTGATACG 
ACGGCTAGCG TGGCTATTGT GTTGAACGAT TGGGAGGGGC TTGTTGAGCC AGACATAGCG 
GATTATTTAT TACTCTCTGA GAAAAAAGAA CTGCCAAAGG CCGGCTTTTT AGGGGTTATG 
CTCAAGCAAT CTAGCGGAAA GCTTGAAGTC AATGCTTTTT CCGAGATCAG CGCGGCCAAA 
ACTGCTGGAA TTGAGGAAAA GGACGAGCTC CTTTCTTTGA ATGGGCGCCT TGTTTCTGAT 
ATGTCGGATG TAAAGGAAGT AATGTGGGAT AAAAAACCCG GTGAGGAAGT TCTCGTTAAG 
GTGCGCCGTG GGGCTTTTAT GGGTAAGGAT GAAGAATTGG AATTTGAGAT AAAATTAAAA 
TAA

Protein sequence

MQNRVITPFF LLLLFIVFFS VWVRPLTAAT VVSGQAHGKA NELEAQQALE MDASTKAVNL 
RQLLDLEAII PKLARHQVIF VGEQHPRFDH HLNQLAIIRG LHGIHPKLVI GVEFFQQPFQ 
QYLEQFVADQ LTVEEFLKKT EYYDRWRYDF RLYAPILEFA RKNSIPILAL NVPTELIQKV 
GREGLEGLSE KERAQLPSEI DRSSVAYRER LQEVFENHPQ HFGKFETFYE AQLVWDEAMA 
ESASRYLKDH SDSHMIVLAG NGHLAYGVGI PERLNRRLDT TASVAIVLND WEGLVEPDIA 
DYLLLSEKKE LPKAGFLGVM LKQSSGKLEV NAFSEISAAK TAGIEEKDEL LSLNGRLVSD 
MSDVKEVMWD KKPGEEVLVK VRRGAFMGKD EELEFEIKLK