Gene Noc_1303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1303
Symbol
ID	3706318
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1446114
End bp	1448411
Gene Length	2298 bp
Protein Length	765 aa
Translation table	11
GC content	50%
IMG OID	637737803
Product	RNA binding S1
Protein accession	YP_343332
Protein GI	77164807
COG category	[K] Transcription
COG ID	[COG2183] Transcriptional accessory protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.493241
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATCGG CAGAGATAAT TGCTCAGGAG CTCGAAATCC AGCGTGAGCA GGCAAGTGCG 
GCTATATGCC TATTAGATGA AGGCGCCACG GTGCCTTTTG TGGCCCGTTA TCGAAAAGAA 
GCTACGGGTG GGATGGATGA TACTCAGCTG CGTTATTTAG AAAGCCGTTT AGTTTATTTA 
CGCGAGCTTG AAGAACGCAG GGAGACGATT GCATGTTCCA TCGAAAAACA AGATAAGCTA 
ACTGCGGAAT TAGAACAGCA GCTTCTAGCG GCAATGACCA AGACCGAGTT GGAAGATTTA 
TATCTGCCCT ATAAGCCAAA GCGGCGCACT AAAGCGCAAA TGGCTCGTGA GGCAGGTCTT 
GAACCGCTCG CATTACAGCT GTTGGAAAAT CCGGAACTCG ATCCAGAAAC AATAGCGGCG 
GATTATTTAA ATCCGGATAA GGGTATTGAA GAGGTATCAG CAGCCTTAGA AGGTGCGCGG 
CGGATTTTAA TGGAGCATTT TGCTGAGGAG GCTGGTTTGT TGGGCCAGCT CAGGGAATAC 
CTATGGAAAC AGGGTGAGCT GAGGGCTAAA GTTCAGGATG GGAAAGGGGA ACAAGGCTGT 
AAGTTCGCGG ATTATTTTGA TTACCAAGAA GCCATTTGCA AAATTCCCTC CCATCGGGCC 
TTGGCGCTTT TTCGTGGTCA GAATGAAGGA GTGCTTAAAT TAACCCTAGA TACGCCCGCT 
AGGGAGGGGA GAGAAGAACA TCCCTGTGAA TTCATGATGG CTAAACATTT CGGGGTTAGA 
GAGCAAGGAC GGCCTGCTGA TGCTTGGTTG CTGCAAGCTG TACGGTGGGC TTGGAAAATA 
AAGCTTTACC CCCGCCTAGA GGCGGATCTC AAACTACGCC TGCGTGAGCA GGCAGAGGAA 
ACAGCTATCG ACGTCTTTTC CCGGAATTTG CGTAGTCTGC TATTAGCTGC TCCGGCAGGT 
CCCCGTCCAA TTTTAGGACT CGATCCTGGT TTCCGTACGG GTGTGAAAGT TGCCGTCATC 
GATGAGACAG GGAAGCTACT AGAAACCGCC ACGATCTATC CCCATCCACC CCAAAAACAG 
TGGGATGCTG CGATTGATAT TCTCTCTAGT TTGTTAAAGA AGCATAGGGT TGAATTGGTT 
GGTATTGGCA ACGGTACGGC ATCCCGGGAA ACTGAGCAGT TGGTGGTGGA ACTTTTAAAG 
AAATTCCCGC AGTTCGAGCT ACAAAAGCTA CTGATAAGCG AAGCGGGTGC CTCTGTATAC 
TCTGCTTCTG CTGGTGCAGC CCAAGAATTT CCGGATCTTG ATGTCTCCTT ACGAGGCGCT 
GTTTCCATTG CTCGCCGTTT GCAAGATCCT CTAGCGGAAC TAGTTAAAAT CGATCCCAAA 
TCTATCGGTG TTGGCCAGTA TCAGCATGAT GTCAATCAGT CCCAGCTAGG TCGGGCGCTG 
GTGGGCGCCG TGGAAGATTG TGTTAATGCA GTGGGGGTTG ATATCAATAC GGCTTCTCCA 
GCCCTGCTGT CCTATGTATC CGGCTTTACT TCCACGGTAG CCCGCAACAC TGTGGAGTAC 
CGCGATACTC ATGGCCCCTT TGCCTCCCGC GAGGGCCTCA AGCAGATTCC CCGTTTTGGA 
GTGAAGACGT TTGAGCAAGC AGCCGGCTTC CTGCGCATCA GAGGAGGGGA TAATCCGCTT 
GATGCCTCAG CAGTCCACCC AGAAACTTAT CCTGTCGTGC AAAAAATCAT GGCTGCGACC 
GGGCGTGATA TACACCGTTT GATTGGTCAT AGTGATTTTC TGAATTCCCT TGACCCGGCC 
TTATTCATCG ATGAGCAATT TGGTCTGCCT ACGTTTCAAG ATATCCTCAG GGAACTCGAG 
AAACCAGGGC GGGATCCTCG GCCTGCCTTT AAAACCGCAG CATTTAAGGA AGAGATCCAA 
ACTTTGGAGG ATCTTAAGCC AGGAATGATC CTAGAAGGTG TGGCCACCAA TGTCACTGCC 
TTTGGTGCTT TCGTGGATGT AGGGGTGCAT CAAGATGGGT TAGTGCATAT TTCCGCCTTG 
GCAGACCGGT TTGTAAAAGA TCCTCATGAG ATCGTTTCAG CAGGGGATAT TGTGAAAGTA 
AAAGTCCTGG AGGTTGATAA CGTTCGTCAG CGAATTGGCT TAACCATGCG ATTAGGCGAG 
ATGGAAGAAA AACAGTCATC CCAGCTTGCA GCTAAAGGGC ACATGAAAAA AACTCGGCGT 
AGTAAAGCTA AGTTGCCGCC AACTGTTCAA GGAGGGGCAA TGGCAGAAGC CTTTTCGCGG 
GCAAAAAAAA GCACTTAG

Protein sequence

MKSAEIIAQE LEIQREQASA AICLLDEGAT VPFVARYRKE ATGGMDDTQL RYLESRLVYL 
RELEERRETI ACSIEKQDKL TAELEQQLLA AMTKTELEDL YLPYKPKRRT KAQMAREAGL 
EPLALQLLEN PELDPETIAA DYLNPDKGIE EVSAALEGAR RILMEHFAEE AGLLGQLREY 
LWKQGELRAK VQDGKGEQGC KFADYFDYQE AICKIPSHRA LALFRGQNEG VLKLTLDTPA 
REGREEHPCE FMMAKHFGVR EQGRPADAWL LQAVRWAWKI KLYPRLEADL KLRLREQAEE 
TAIDVFSRNL RSLLLAAPAG PRPILGLDPG FRTGVKVAVI DETGKLLETA TIYPHPPQKQ 
WDAAIDILSS LLKKHRVELV GIGNGTASRE TEQLVVELLK KFPQFELQKL LISEAGASVY 
SASAGAAQEF PDLDVSLRGA VSIARRLQDP LAELVKIDPK SIGVGQYQHD VNQSQLGRAL 
VGAVEDCVNA VGVDINTASP ALLSYVSGFT STVARNTVEY RDTHGPFASR EGLKQIPRFG 
VKTFEQAAGF LRIRGGDNPL DASAVHPETY PVVQKIMAAT GRDIHRLIGH SDFLNSLDPA 
LFIDEQFGLP TFQDILRELE KPGRDPRPAF KTAAFKEEIQ TLEDLKPGMI LEGVATNVTA 
FGAFVDVGVH QDGLVHISAL ADRFVKDPHE IVSAGDIVKV KVLEVDNVRQ RIGLTMRLGE 
MEEKQSSQLA AKGHMKKTRR SKAKLPPTVQ GGAMAEAFSR AKKST