Gene Noc_1083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1083
Symbol
ID	3707208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1187678
End bp	1189174
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	50%
IMG OID	637737585
Product	hypothetical protein
Protein accession	YP_343118
Protein GI	77164593
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0137712
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGGCT TAGGCTTGGC TTATTATAAG GTGACGCGGC TTGGTTTGCC GGTATTGCCA 
GCCGAGCAAA CCGAAGTTTG GATGGTAGAG GCCCGCCTCG CCTTTGAAGC TAAAGGCGGT 
CCGGTGAAGG CGCGCTTCTA TATTCCAAAC GCTCCCCCCG GTTTTACTGT TGTGGGAGAA 
GACTTCATCT CTAGTAAATA TGGTTTAACC ATGGATGAGG GGGACATTAA TCGTACCGCC 
CAATGGGCGG TACGCCGGGC CGAGGGGAAG CAGGTGTTGT ACTACCGGAT TGAATTGGCA 
CCTGAGATTG CCCATATAAA ACCACAGAAG GGGAATATCC CCCCCTTTCC GGCCGCCCCC 
GATTATCCTG AGCCCATGGG CTCGGTGGTG CAGGCGTTAT TAGAAGAGGT GCGCCGTAAA 
TCAGCTGACG TAGCTTCCTT TTCCGGGGAA CTCCTGGCCC GCCTCAATGC TTCTAATCCT 
ACTGAAAATG TTCAGATTTT GCGCAAAGGC ATTGAAAGTG CGCACGCCTG GGTAAAACAA 
GTGATTTATA TTTTGGCCGG CGCCCGGATT CCTGCCCGTA TGGTTTATAT CTTGCCATTA 
AAAGGCGATG TGAGTCATAG TAAGTTGCTT CCTTGGCTAG AAGTCCATAA TGGACGGGAA 
TGGCTAGCTT TTAACCCTAA AACGGGAAGC CGGGGATTCC CTGCGAACGC ATTGATTTGG 
CATGTGGGCG ATGAGCCCTT GCTCGAGCTG GAGGGAGGCG AATCACCTAA GGTGGAATAC 
TCTGTCTCGA GTCGTTTTCA AGAATTGGTT TTGGTCGCGG AGCAGCGAGC GCGGCAAATT 
AACTCTCTGA TAATGGATTT TTCCCTATTT AGCCTCCCCG TGCAGACCCA GAATGTCTAC 
CGGGTGTTAC TGTTAATTCC TATTGGGACT TTTTTGATTG TCGTGCTGCG AAACGTTATT 
GGCATTAAAA CGTTTGGTAC ATTTATGCCT ATTTTGATAG CCCTGGCATT CCGAGAAACC 
GATCTTTTGT GGGGAGTCGC GATGTTCACT GGGATCGTGG CTGTTGGTTT GATACTGCGT 
TTTTATTTGG AATACCTTAA ACTGCTGCTA GTGCCACGCC TAGCCTCGGT GCTGGTGATG 
GTGATTCTTT TAATGGCGGT TATCAGTGTG CTGACTCATA AAATGGGGCT AGAACGGGGC 
CTGTCTGTGG CCCTCTTCCC GATGGTGATT TTGACCATGA CCATTGAGCG CATGTCCCTG 
GTTTGGGAGG AGCATGGCCC TGGAGAAGCG CTGCAACAAG GGCTTGGAAG CTTGCTGGTG 
GCTATATTGG GTTATTTATT AATGGCCAAT AAGCTATTGG AGCATCTGGT TTTTGTTTTT 
CCTGAATTGT TGTTGGTGGT GTTAGCCATG ACCTTGTTGT TGGGCCGTTA TACGGGCTAT 
CGGTTAACGG AGATTTGGCG TTTCAAGGAG TTTTTGCGGA AAACGGAACT TCCATGA

Protein sequence

MIGLGLAYYK VTRLGLPVLP AEQTEVWMVE ARLAFEAKGG PVKARFYIPN APPGFTVVGE 
DFISSKYGLT MDEGDINRTA QWAVRRAEGK QVLYYRIELA PEIAHIKPQK GNIPPFPAAP 
DYPEPMGSVV QALLEEVRRK SADVASFSGE LLARLNASNP TENVQILRKG IESAHAWVKQ 
VIYILAGARI PARMVYILPL KGDVSHSKLL PWLEVHNGRE WLAFNPKTGS RGFPANALIW 
HVGDEPLLEL EGGESPKVEY SVSSRFQELV LVAEQRARQI NSLIMDFSLF SLPVQTQNVY 
RVLLLIPIGT FLIVVLRNVI GIKTFGTFMP ILIALAFRET DLLWGVAMFT GIVAVGLILR 
FYLEYLKLLL VPRLASVLVM VILLMAVISV LTHKMGLERG LSVALFPMVI LTMTIERMSL 
VWEEHGPGEA LQQGLGSLLV AILGYLLMAN KLLEHLVFVF PELLLVVLAM TLLLGRYTGY 
RLTEIWRFKE FLRKTELP