Gene Noc_1958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1958
Symbol
ID	3704972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2244251
End bp	2245510
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	53%
IMG OID	637738434
Product	hypothetical protein
Protein accession	YP_343950
Protein GI	77165425
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.441917
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAAAGC GAGTATTGAT GATCGCTTAT CATTTTCCGC CCGCCAGCGG CAGCAGCGGT 
ATGCAGCGCA CTCTCTCTTT CTCCCGCGAT CTTCCCGAAC ATGATTGGCA GCCCATCATT 
CTGAGCATCT ACCCTCGTGC CTATGAACGG CGCTGTGACG ACCAATTGGC TGACATTGGC 
TCTGAAACTA TCGTGTATCG TGCTTTTGGG CTTGATACTG CGCGCCATTT GGCATTGGGA 
GGTCGCTATA GTCGATTCCT GGCGCTTCCG GATCGCTGGG TAAGTTGGTG GCTCGGAGCT 
GTGCCCGCGG GACTGAGGCT TATTCGTCGT TATCGTCCCC AGGTTCTTTG GTCTACTTAT 
CCGATTGCTA CGGCCCATCT CATTGGTTTA ACTTTACATC GGCTGAGCGG GATTCCTTGG 
ATTGCCGATT TCCGAGATTC CATGACGGAG GATAATTATC CGTCTAATCC ACGGGTACGA 
CGCGCTTATC GTGCGGTTGA AGCGGCTACA GTGCACCGCT GCACGCGAGC GATATTCACC 
GCGCCTGGGG CGGTGCGTAT GTACGCCGAG CGTTACCCAG AGCGTTCCGA TAAAACATGG 
GTTCTTATTG AGAATGGTTA CGAAGATTCT ATTTTTGATA CGGTTTCTTT GCCTTCATTG 
AGGGATTCTC CGAGGCCGTT TCGGCTTGTA CACAGTGGGG TAGTGTATCC TAACGAACGG 
GATCCCCGTG CATTTTTCGA GGCACTGGCA AGCCTGAAGC GATCAGGCCA GATCACCGCT 
CAAAGCCTAC AGGTGGTGTT CCGGGCCAGT GGTTCGGAGG ATTACTTCAG GCAGCTTTTG 
CGCGAATGGG GCATTGATGA CATTGTGCAC TTTGAACCCC ATATCCCTTA TCGTGGGGCA 
CTTGCTGAGA TGCTTACAGC TGATGGACTT TTGATTTTAC AGGCAAGCAA TTGCAACCAT 
CAAATTCCAG CAAAGCTTTA TGAATACCTG CGCGCACGGC GGCCGATTTT GGGGCTTACG 
GATTCTGAGG GAGACACTGC GAGGGTGTTG CGGCAGGCGG GTATTGAAAC CGTTGCCCCC 
CTTGATTCGG CTGCGGCTAT CACGGCAACA CTGCAAGATT TCCTTAAGCA ACTTCAGGAT 
GGCACAGCCC CCGTGGCAAG CGAAGCAGAG ATCGCTCGTA GCTCAAGGCG TAGCCGTGTA 
GCATCCCTAG CTGAATGCTT GGAGGAGACG ATTGCCACGG ATCTCAACTT TGAGAGGTAA

Protein sequence

MVKRVLMIAY HFPPASGSSG MQRTLSFSRD LPEHDWQPII LSIYPRAYER RCDDQLADIG 
SETIVYRAFG LDTARHLALG GRYSRFLALP DRWVSWWLGA VPAGLRLIRR YRPQVLWSTY 
PIATAHLIGL TLHRLSGIPW IADFRDSMTE DNYPSNPRVR RAYRAVEAAT VHRCTRAIFT 
APGAVRMYAE RYPERSDKTW VLIENGYEDS IFDTVSLPSL RDSPRPFRLV HSGVVYPNER 
DPRAFFEALA SLKRSGQITA QSLQVVFRAS GSEDYFRQLL REWGIDDIVH FEPHIPYRGA 
LAEMLTADGL LILQASNCNH QIPAKLYEYL RARRPILGLT DSEGDTARVL RQAGIETVAP 
LDSAAAITAT LQDFLKQLQD GTAPVASEAE IARSSRRSRV ASLAECLEET IATDLNFER