Gene Noc_1188 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1188
Symbol
ID	3706762
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1295348
End bp	1296403
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	53%
IMG OID	637737691
Product	signal peptide protein
Protein accession	YP_343220
Protein GI	77164695
COG category	[S] Function unknown
COG ID	[COG4255] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTTGTTTC GAACCCCACC TCTGCGTTTA ACGCTTCTTG TGCCAGGACT TGCTCAGGCG 
CTAGAAGCAA GAGCCATAGA GGGGGAGGGG GCGCGGCTAC CTTTTCTGGA ATGCATCATA 
GGACAGGCAG ACGTAGAGGC GCTTACCACA CCACTGTATG AAACTTTGCT CTTTGCTTTA 
TTTGGCATTT CTCAATCAGG AACGATGGAT GTTCCCTTGG CGCCACTAAT GTATTCCTGG 
GATAAGGGGG GTGGCTCCCC TGAGCCGGGG TGGTGGTTAC GGGCAGATCC CGTCTGTTTG 
CACCCTGATC GGGATCGGCT CGTGCTTTTT GGACCCTCTC ACCTACAGTT GAGCAGAACT 
GAGTCCCAGT CCTTAGCAAA GAGGGTGGCG CCCTTATTTA CTGAATATGG TTGGCAATTT 
CAGGCCCTAG AGCCAGATCG CTGGTATCTT CGGTTGCCCC AGCCGGAGCA GGTTACTTTT 
ACCGCTTTGA CTGCGCTCGA GGGAAAGTAT ATTGAGCCAG GACTTCCCTC GGGCCCCAAT 
AGTTCCCGTT GGCGGACTCT GCTCAATGAA ATCCAGATGC TCCTCCATGA TTGCCCTATC 
AATCTCGAGC GAGAGAAGCA GGGGCTTCCG TTGGCGAATA GTGTATGGTT TTGGGGGGCG 
GGGGAAGCGC CATCATACCC CATTCCGCCT CTGTGGCGGC AGATTGGTTG GGACCACAAT 
CCCCTTCTTC AAGCCTTGGC TGCTTATTGC GAGATTCCAG GCAGACCTGT GCCGGAAGGG 
GCTACAGTCT GGTTGGCACA AAATTCAACC ATACCGGGTG ACTATTTGGT GGGATTGGAT 
TCTTTATTGC ACACACCAGA CTCTTTCCCT TGTGCTGGAG CTTTGCAAGC ATTGGAAGAG 
AACTGGTTTA GCATTTTATA CGCGGCCTTA CGCAACAGAC AGTTAGCCAG CTTAACCTTC 
TATCCGATGA ATGGGTATCG CTATCATTTA ACTTGGCAGC GAAGCTGGCG TTTATGGCGG 
CGTCCGCGCT CTCTTATAAA AAGCGTGGGG GGTTAA

Protein sequence

MLFRTPPLRL TLLVPGLAQA LEARAIEGEG ARLPFLECII GQADVEALTT PLYETLLFAL 
FGISQSGTMD VPLAPLMYSW DKGGGSPEPG WWLRADPVCL HPDRDRLVLF GPSHLQLSRT 
ESQSLAKRVA PLFTEYGWQF QALEPDRWYL RLPQPEQVTF TALTALEGKY IEPGLPSGPN 
SSRWRTLLNE IQMLLHDCPI NLEREKQGLP LANSVWFWGA GEAPSYPIPP LWRQIGWDHN 
PLLQALAAYC EIPGRPVPEG ATVWLAQNST IPGDYLVGLD SLLHTPDSFP CAGALQALEE 
NWFSILYAAL RNRQLASLTF YPMNGYRYHL TWQRSWRLWR RPRSLIKSVG G