Gene Noc_2370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2370
Symbol
ID	3704810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2718002
End bp	2718979
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	55%
IMG OID	637738853
Product	mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
Protein accession	YP_344358
Protein GI	77165833
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1705] Muramidase (flagellum-specific)
TIGRFAM ID	[TIGR02541] flagellar rod assembly protein/muramidase FlgJ

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTCAAT CGTCTGCGCT TTTGCCCTTT TATGGCTATT CCAAGAATGG CTTTGCCGAG 
CTTCGTCAAA CCGCCCGGCA AGACCCCACG GACCCGGACA CCCTGCGCCG GGTTGGGACT 
CAGTTTGAGT CCTTTTTGAT CCAGACCATG CTAAAGAGCA TGCGGGAAGC GGGCCAGGGA 
GGTGGGGTGC TGGATAATAA GCAAGTCGAT TTCTACCAGG GACTTTTTGA TCAGCAAATT 
GCTTTTGAAA TCGCCCGTCA TGGGCGTTTG GGGCTGGCGG ATAGAATTGC CGCCCAATTA 
GGCAATGGGA CAGCCACTGA GAAGTTGCCT GTCACCACCC AGAATTTTGC GCCTCCCCGC 
CGTCAGATGG AACAGCCATC GTCCATCGAT CCCAATGCGT TGCCGGCATT CTCCCGTTTT 
GAAAAAATAG AAAAACCATC CGCCGTTGAG GCTGAGGCGT TGCCGACGCT TCCCCATTTT 
GAAACAGCCG AGGATTTTGT CCGAATCCTT TGGCCCCATG CCCAGCGAGC TGCCCAATCT 
CTGGGATTGG ATCCTCGACT GCTGCTGGCC CAGGCCGCAT TGGAAACAGG TTGGGGCAAG 
CAAATTATCC GCACCGAGGC ACAAGGAAGC AGCCATAACT TATTTAATAT CAAAGCAGAC 
AGCCGCTGGC AGGGTCCAGC AACCCAGATC AGCACCCTCG AATACCGGCA AGGGGTGGCG 
GTGCGGGAGC AGGCTCCTTT TCGGGCTTAT GAGTCCTTTG ACCAGAGTTT TAACGATTAT 
GTTGCTTTTC TGCGGCAACA GCCCCGCTAT CATCACGCCC TCACTCAAAC CCATAGCGCG 
ATAGACTTTA TGCACTCCCT AGCCGAGGCG GGCTATGCTA CCGATCCGGC CTATGCGGAC 
AAAGTGCTGC GGGTTTTCAA GGGCGGGACT CTAAGTCAGG CTTTGGAGAA GTCAAGGATA 
GCGGTAGAAG ACCGTTAA

Protein sequence

MVQSSALLPF YGYSKNGFAE LRQTARQDPT DPDTLRRVGT QFESFLIQTM LKSMREAGQG 
GGVLDNKQVD FYQGLFDQQI AFEIARHGRL GLADRIAAQL GNGTATEKLP VTTQNFAPPR 
RQMEQPSSID PNALPAFSRF EKIEKPSAVE AEALPTLPHF ETAEDFVRIL WPHAQRAAQS 
LGLDPRLLLA QAALETGWGK QIIRTEAQGS SHNLFNIKAD SRWQGPATQI STLEYRQGVA 
VREQAPFRAY ESFDQSFNDY VAFLRQQPRY HHALTQTHSA IDFMHSLAEA GYATDPAYAD 
KVLRVFKGGT LSQALEKSRI AVEDR