Gene Noc_1385 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1385
Symbol
ID	3706110
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1533903
End bp	1535630
Gene Length	1728 bp
Protein Length	575 aa
Translation table	11
GC content	48%
IMG OID	637737879
Product	hypothetical protein
Protein accession	YP_343408
Protein GI	77164883
COG category	[S] Function unknown
COG ID	[COG4805] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAAAA ATTTTTCTCC TTTTTTAGGG AGTGCAGTCC TTTTATTTTT GACTTTATTG 
TTATTATTCC CAGGCATTCC AGAGACACGA GCAGCAGAAA ATAATACTCA TTGGGATGCG 
TTTGTTCACA ATTTTGTCGA AAAATATTTT GCTGCCAATC CTGACTTTGC GGTACGTGCC 
GGTCGACATG AATTTGATGG CAAGTTGCCT GATTGGAGCC CCGAAGCGCT TGCTAAAGAA 
GTAGCGCGAC TGCGGTCGGA GCGCCAGCGG GCGCTTGCTT TCGAGGTTGC TTCCTTAACA 
GCAAGCCAGC GTTTTGAACG TGATTATTTG GTTGCCTGGA TTGATAAGGA TCTCTTCTGG 
TTGGAAACAG CGGAGTGGCC CTATAGAAAT CCGGCATTTT ATACCCAAGA ACTTGATCCT 
AATGTTTACC TAAGCCGTCC TTATGCCCCC TTAGAAGAGC GTATGCGTGC TTATATTGCT 
TATGCTGAAG CTATTCCTGC CGCAGCCAAG CAAATTCGCC ATAACTTGAG AACCCCACTG 
CCCCGAACCT ATGTGGATAT TGGCGAGAAG GTGTTTGGGG GACTTGCCGC CTACTATGAA 
CGAGATGCGC CCGCCATTTT CAGCACTGTG GAGAATGAAC GGCTACAAAG AAAATTTCGG 
GCAGCCAACC GGCATGCCAT TCGCGCGATG AAGGAATTGC AGCAATGGCT GCAGACCCAG 
CGGACCAATG CCACTAGTGA CTTTGCCTTA GGCGCGCCTC TTTTTCGTGC TCTATTGCGC 
GAGGCTGAGG GCGTGAAGAT TTCCCTTGAG CGGCTAGAAC AAATAGGGCG CCAAGATCTT 
AAGCGTAATC TTGTCGCTTT ACAGAAAGCA TGCGGTAATT ATGCTCCTAG CAAAACCGTA 
TCGGAATGCA TTGAAAAAGC ACGAGCCGTA AAACCTGAGA AAGGTCCTGT CGAAGAAGCT 
CGCCGCCAGC TCCAGAAACT TAAGGAGTTT GTGATTGCTA AAGATTTAGT GACTATTCCT 
AGTGCCGAGC AAGCCCAGGT GGCCGCCTCT CCCCCTTATA TGCAATGGAA TTTTGCTTAT 
ATTGACATTC CTGGCCCTTT TGATAAAGGG CTGCCTGCTA TTTATTATGT GGCGCCTCCT 
GATCCGGCCT GGTCAAAAGC GGAACGGGAG GACTACCTTG CGGATAAGGC GGACTTACTA 
TTTGTATCGG TGCATGAAGT TTGGCCAGGC CATTTTCTAC AATTTTTGCA TTCCAATCGG 
GTTGCCTCCC CCTTAGGAAA ACTTTTTGTG GGTTATGGTT TTGCTGAGGG CTGGGCCCAC 
TATGTGGAAG AGATGATGTG GAAAGCTGGA CTAGGTCATG GCGACCCGGA AATCCATATC 
GGCCAATTGC TTAATGCCCT ATTGCGGAAT GTGCGTTATT TGTCCGCGAT AGGATTGCAC 
ACTCAAAGGA TGACTTTGGA AGAGTCGGAG CGCATGTTCC AGGAATTTGC TCATCAGGAT 
GTAGGTACGG CAAGGCAACA GGCAGCGCGG GGAACGTTTG ATCCAGCTTA CATCACCTAC 
ACCCTAGGGA AATTGATGAT TAAGAAGTTA CGGGAAGAAT GGACCGCTAC CCGAGGAGAA 
CGCGAGGGAT GGAGGGTATT TCATGATAAA TTTCTTTCCT ATGGTGGGCC GCCTATCCCC 
TTAATTCGGA AAGAGATGCT TGGAGAAAAT GCGGGTCCTG CTCTTTAA

Protein sequence

MRKNFSPFLG SAVLLFLTLL LLFPGIPETR AAENNTHWDA FVHNFVEKYF AANPDFAVRA 
GRHEFDGKLP DWSPEALAKE VARLRSERQR ALAFEVASLT ASQRFERDYL VAWIDKDLFW 
LETAEWPYRN PAFYTQELDP NVYLSRPYAP LEERMRAYIA YAEAIPAAAK QIRHNLRTPL 
PRTYVDIGEK VFGGLAAYYE RDAPAIFSTV ENERLQRKFR AANRHAIRAM KELQQWLQTQ 
RTNATSDFAL GAPLFRALLR EAEGVKISLE RLEQIGRQDL KRNLVALQKA CGNYAPSKTV 
SECIEKARAV KPEKGPVEEA RRQLQKLKEF VIAKDLVTIP SAEQAQVAAS PPYMQWNFAY 
IDIPGPFDKG LPAIYYVAPP DPAWSKAERE DYLADKADLL FVSVHEVWPG HFLQFLHSNR 
VASPLGKLFV GYGFAEGWAH YVEEMMWKAG LGHGDPEIHI GQLLNALLRN VRYLSAIGLH 
TQRMTLEESE RMFQEFAHQD VGTARQQAAR GTFDPAYITY TLGKLMIKKL REEWTATRGE 
REGWRVFHDK FLSYGGPPIP LIRKEMLGEN AGPAL