Gene Noc_1038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1038
Symbol
ID	3707260
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1147182
End bp	1148399
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	52%
IMG OID	637737543
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_343076
Protein GI	77164551
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.548207
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTATGA GTTCCCTACA ATCCCAGCGC GTGCTTTCCG GAATGCGTCC AACCGGGCAG 
CTGCATCTGG GCCACTATCA TGGCGTACTG AAAAACTGGG CCCGGTTGCA ACACGAATAC 
AACTGTTTTT TCTTTGTGGC CGACTGGCAT GCTTTGACGA CGGAGTACGA AAATCCCCAG 
GTAATTACCG ACAGCGTCTG GGATATGGTC ATCGACTGGC TGGCTGCGGG AATTGAGCCT 
TCGGCAGCGA CTTTATTTAT TCAGTCGAAG GTGCCTGAGC ATGCGGAGTT GCATCTTCTA 
TTATCCATGA TAACTCCCCT TGGTTGGTTG GAACGGGTGC CGACTTACAA GGACCAGCAG 
GAAAAATTAA AAGAGAAGGA TCTGGCGACT TATGGTTTTT TGGGCTACCC GCTACTGCAA 
AGCGCCGATA TTCTCGTTTA TAAAGCAACT CGGGTTCCAG TGGGAGAAGA TCAGGTTCCT 
CACGTGGAGA TGAGCCGGGA AATTACCCGG CGTTTTAATC ATCTCTATGG CCGTGAACCA 
GGCTTTGAAG AGCTGGTGGA AGCGGCTATA AAAAAAATGG GTAAGAAAAA TGCCCAGCTT 
TACCGGGAAT TGCGCCGTCG TTTCCAGGAG CAGGGAGATG TGGAAGCCTT GGATAAAGCT 
CGTGCTTTTC TAGAAACGCA GCAGAATCTT ACCCTTGGTG ATCGGGAACG TTTATTCGGC 
CATCTGGAAG GGGAAGGTAA AGTCATTCTG CCGGAACCGC AGGCCTTGCT GACCCCAGCC 
GCTCGTATGC CAGGGCTCGA TGGACAAAAA ATGTCTAAAT CCTACGGCAA TACGATTGCC 
TTGCGTGAGC CACCTGAGCA AGTGGAACGG AAGCTCCGCA CCATGCCTAC GGATCCAGCC 
CGCGTGCGGC GCACCGATCC CGGCGATCCC GAAAAATGTC CGGTCTGGCA ATTCCATAGG 
GTTTACTCTG ACGATGAGGT GAAGGAGTGG GTTCAGAAAG GATGCAGAAC AGCAGGTATT 
GGTTGCTTGG ACTGCAAGCA GCCAATTATT GATGCTATTC AGTCTGAACT AAAGCCTATT 
CGAGAGCGGG CGCAAGAATA TGCTCACCAT CCCGAGGAGA TCCAACGGAT TATCAAAGAG 
GGTAACGAGG CGGCCCGCGA AGTGGCCCGC GAGACGATGG CGGAGGTGCG CCAAGCAATG 
GGATTGTCCT ATCGTTAA

Protein sequence

MAMSSLQSQR VLSGMRPTGQ LHLGHYHGVL KNWARLQHEY NCFFFVADWH ALTTEYENPQ 
VITDSVWDMV IDWLAAGIEP SAATLFIQSK VPEHAELHLL LSMITPLGWL ERVPTYKDQQ 
EKLKEKDLAT YGFLGYPLLQ SADILVYKAT RVPVGEDQVP HVEMSREITR RFNHLYGREP 
GFEELVEAAI KKMGKKNAQL YRELRRRFQE QGDVEALDKA RAFLETQQNL TLGDRERLFG 
HLEGEGKVIL PEPQALLTPA ARMPGLDGQK MSKSYGNTIA LREPPEQVER KLRTMPTDPA 
RVRRTDPGDP EKCPVWQFHR VYSDDEVKEW VQKGCRTAGI GCLDCKQPII DAIQSELKPI 
RERAQEYAHH PEEIQRIIKE GNEAAREVAR ETMAEVRQAM GLSYR