Gene Noc_2889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2889
Symbol
ID	3707443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	3267209
End bp	3268378
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	56%
IMG OID	637739365
Product	glycosyl transferase, group 1
Protein accession	YP_344865
Protein GI	77166340
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.228881
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTACGGG CTCTCCACAT TGGCAAATTT TTCCCGCCTT TCGCTGGTGG GATGGAGTAT 
TTTCTGCGGG ATTTGTTAGG AGCTTTATCC CGGCAAGGTA TTGAGGTGGC GGCGTTGGTT 
CACGATCATC TTATGCCCCG GCAACGGCGC TGTTCCCATC ATCCCGATCC CGCCGAATGG 
CCCTTTCCCG TTTATCGCGC CCCCTGCCAT GGCCGTTTTC TCTATGCCCC GGTCAGCCCT 
CAGTTTCCTT TCTGGCTGCA AAAAACTATC CGGGATTTTA AACCAGACCT TTTGCATCTG 
CACCTTCCCA ATACCTCCGC TTTTTGGGCC ATGGTGGTGC CGGTAGCCCG GCGGCTGCCC 
TGGATCATCC ACTGGCATGC CGATGTTGTT GCATCCCGTC ACGACAAGTT CCTTGCTCCC 
GCTTATCTTT TTTACCGCCC TTTTGAACAA AGTCTTCTGG GGGGCGCTTC GGCTATCATC 
GCCACTTCGC CTCCCTACCT TAATAGCAGC CTGGCGCTAA GGCTCTGGCG AGAGAAGTGC 
CACACCATTC CCCTTGGCCT CGATCCGTCC CGCTTGCCGG GACCTAGTGA AACCGAGCAA 
GCAGACGCCC ATCGGCTCTG GGGAGATGGA ACGTCCTTGC GAGTACTTAC TATTGGCCGT 
CTGACCTACT ACAAAGGGCA TGAGGTACTC TTACATGCCA TTAAAGCTTT GCCAGAAGCC 
CGTTTGGTGG TGGTTGGCGC CGGCGCTGGC GAAGGGAAAC TGCGGGCGCT GATTGCAAAG 
CTAGCCTTGG AAGGGCGGGT CAGCTTGCAG GGTGGCTGCA CGGAGGCGCA GCGCAATGCG 
CTATTGGCAA CCTGCGATGT CTTTTGCTTG CCTTCCATCG AGCGGACCGA AGCCTTTGGA 
GTCGTGCTTT TGGAAGCCAT GAAGTTTGCA AAGCCGGTAG TCGCCAGCAG GATAGAGGGC 
TCTGGCGTGG GCTGGGTTGT CGCCGATGGA GAAACAGGAA TATTGTGCCC CCCTCAAGAC 
CCGGCTAGCT TAACCCAAGC CCTCGGAGAT TTATTGCACA CTCCCGAAAA ACGGGAATCA 
CTTGGTAAGG CGGGGGAGCA GCGTTTTCGT CAGTATTTTC AAATCGATCG CATTGCGGAA 
AGAACAGCCG TGCTTTATCC TCGCGTGTGA

Protein sequence

MLRALHIGKF FPPFAGGMEY FLRDLLGALS RQGIEVAALV HDHLMPRQRR CSHHPDPAEW 
PFPVYRAPCH GRFLYAPVSP QFPFWLQKTI RDFKPDLLHL HLPNTSAFWA MVVPVARRLP 
WIIHWHADVV ASRHDKFLAP AYLFYRPFEQ SLLGGASAII ATSPPYLNSS LALRLWREKC 
HTIPLGLDPS RLPGPSETEQ ADAHRLWGDG TSLRVLTIGR LTYYKGHEVL LHAIKALPEA 
RLVVVGAGAG EGKLRALIAK LALEGRVSLQ GGCTEAQRNA LLATCDVFCL PSIERTEAFG 
VVLLEAMKFA KPVVASRIEG SGVGWVVADG ETGILCPPQD PASLTQALGD LLHTPEKRES 
LGKAGEQRFR QYFQIDRIAE RTAVLYPRV