Gene Noc_1967 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1967
Symbol
ID	3705426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2253828
End bp	2254847
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	50%
IMG OID	637738443
Product	polysaccharide deacetylase
Protein accession	YP_343959
Protein GI	77165434
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0726] Predicted xylanase/chitin deacetylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCAGAAG AAATTCTATC TGGTTTTGAC AAGGTGGTAT TGGGTGGACT ACGTCCCTTA 
GCTTCATTAC TTGCCTCCAG CGGCAAACGG GCACGCCTTT CGGTGCTGAT TTATCATCGT 
GTGCTAGCGG CGCCAGACGC CCTGCTTCCG GGTGAGCCAG ATGCCGTGCA ATTTCGTTGG 
CAGATGGAAC TCTTGGCGCG TTATTTCAAT CCACTCCCTC TATCAGAAGC CGTTAGGCGC 
TTACGGGAAG AAACTCTACC TCCGCGGGCA GTTAGCGTAA CTTTTGATGA TGGTTACGCG 
GATAACGTGG AGGTTGCATT GCCTATTTTG CAGCAAGTGA AGGTGCCAGC AACATTTTTT 
ATCGCTACCG GCTATTTAGA TGGCGGGTGG ATGTGGAACG ATAAGGTCAT TGAAACGCTG 
CGCCATATGC CTAATGGAGA TTTTGATCTA ACAGATATGG GGCTAGACAT CTACCCTTTA 
GTAAGTACTG TAGATCGTTT GGCGGCGATT GAACAAATCC TTGTCCGACT AAAATATCTT 
CCCAGCGAGG AGCGGGAGGA GCAGGTTCAA GCGCTCACTC AGCGTTGCCA AAAATCACTT 
TCCCATAGCT TGATGATGAC TTCTATCCAA GTGCGCCAGC TTCACCAGGC AGGGATGGAG 
ATTGGAGCCC ACACTCATAC CCATCCTATT TTAGCATCAC TGGGACGGGC ATCCGCAGAA 
CAAGAAATGG CGACAAGCAA GGCTCGACTA GAAGATCTGC TGGGCGAATC GGTGCGTTTA 
TTTGCCTATC CTAACGGTAA ACCTGGAAAA GACTACCTTC AGGAACATGC GGATATTGCT 
CAAAATCTAA ATTTTGAAGC TGCGGTTTCT ACCGCCTGGG GCGTTGCTTC GGCTCAAAGT 
GATATTTGGC AATTACCACG CTTCACGCCT TGGGATCGCA CCCCAAGCCG ATTTATGTTG 
CGTCTCTTGT GGAACTACCG CAGTGCTGGT ACGCCGTTTG CTTATTCCGA AGCGGAATGA

Protein sequence

MPEEILSGFD KVVLGGLRPL ASLLASSGKR ARLSVLIYHR VLAAPDALLP GEPDAVQFRW 
QMELLARYFN PLPLSEAVRR LREETLPPRA VSVTFDDGYA DNVEVALPIL QQVKVPATFF 
IATGYLDGGW MWNDKVIETL RHMPNGDFDL TDMGLDIYPL VSTVDRLAAI EQILVRLKYL 
PSEEREEQVQ ALTQRCQKSL SHSLMMTSIQ VRQLHQAGME IGAHTHTHPI LASLGRASAE 
QEMATSKARL EDLLGESVRL FAYPNGKPGK DYLQEHADIA QNLNFEAAVS TAWGVASAQS 
DIWQLPRFTP WDRTPSRFML RLLWNYRSAG TPFAYSEAE