Gene Noc_2754 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2754
Symbol
ID	3705292
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	3126233
End bp	3127306
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	49%
IMG OID	637739232
Product	hypothetical protein
Protein accession	YP_344733
Protein GI	77166208
COG category
COG ID
TIGRFAM ID	[TIGR02566] CRISPR-associated protein, Csy3 family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.180685
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGACTG TTCAGCTTCC CTCATTACTC AACTATACCC GCAGCATTGT TCCCAGCGAA 
GGCACCTTCT GGGTGGCCAA TGCCGATAAC CGGCCATTGC TTATCCAGGA TAAAACCTTA 
TTAGGCACCA TCGCCAACTA CAGCTCAGTC TACAAAAAAG ATAAACAGCG TGATGAAGGC 
GCTATTGAAA AGGAAATGAT GGCCGGCGAC AACAATATTC AACGAGTGGA TAGCTGTCAT 
CTGCCCGCCG ATGCGGATAC TTTTGAGCTT CGTTTTACGC TTAAATTTTT GGCGAATGCC 
AACGGCCCTG AAGCCTGCGA AGGTGCTGAA TTTCGAGAAG ACCTGGAAAG CATAGCGCAA 
GCGTACGCTG AAAAAGGCGG TTTTACCCTA CTGGCCGAGC GTTATTTGGC TAATCTTCTA 
AATGGGCGGT TTTTATGGCG CAATCGTTAT GGCGTCCAGC GTCAAATCAC CCTGCGTGCG 
CCCTATAACG AGCTCAAAGA AAAAACCTTT GAGATTATTG ACCGTGCGGA ACCCACTCTG 
CCGCAAGTAC GGATGGATGA GCTCAAACCT TGGATTGATC ATATTGCCAG CGCACTCAGC 
GGTAAAACCT CTTTTTTCCT TATGGAAGTC AGCGCTAGGG TAACCATTGG CCTCGGGCAA 
GAAGTGTACC CCAGTCAGGA ATTTGTTGAT AAGGATTCGC GGGGGCAAGG GAAAAAGTCC 
AAGACCCTAT TTTTTGTGCA AGTCGCCGAT CAACAGGTCG CTGCCATGCA TAGTCAAAAA 
ATCGGTAACG CTATCCGTAC CATTGATAAT TGGTATCCGG ACGCCAATGC GGATCGTCCG 
CTGGCGGTTG ATCCCTTTAC CGTCGATAAG CGCCGAGCCC GTGCCGTGCG GTTGCCGGAT 
CATGGAAAAT CGGACTTCTA TAGTCTTTTA AAAAATTTAC CCGCTCTAAA AGATGATATC 
GAGCATGCGC CGAACGCTGA AGCCATACCC GGTCAAGCCC ATTATTTTAT GGCCGTGTTA 
ATACGCGGGG GGGTGTTTAG CGGAGAGAAA AAAGCAGAGA AGAAAGCCAA GTAG

Protein sequence

MATVQLPSLL NYTRSIVPSE GTFWVANADN RPLLIQDKTL LGTIANYSSV YKKDKQRDEG 
AIEKEMMAGD NNIQRVDSCH LPADADTFEL RFTLKFLANA NGPEACEGAE FREDLESIAQ 
AYAEKGGFTL LAERYLANLL NGRFLWRNRY GVQRQITLRA PYNELKEKTF EIIDRAEPTL 
PQVRMDELKP WIDHIASALS GKTSFFLMEV SARVTIGLGQ EVYPSQEFVD KDSRGQGKKS 
KTLFFVQVAD QQVAAMHSQK IGNAIRTIDN WYPDANADRP LAVDPFTVDK RRARAVRLPD 
HGKSDFYSLL KNLPALKDDI EHAPNAEAIP GQAHYFMAVL IRGGVFSGEK KAEKKAK