Gene Noc_1554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1554
Symbol
ID	3705812
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1726597
End bp	1727646
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	46%
IMG OID	637738038
Product	glycosyl transferase, group 1
Protein accession	YP_343567
Protein GI	77165042
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATTG CACAGATTGC CCCCCTTTAC GAAAGCGTTC CACCAAAATA TTATGGTGGA 
ACAGAACGAA TTGTTTCCTA CCTGACCGAA GAATTAGTAA ACCAAGGCCA TGATGTCACT 
CTCTTTGCTA GTGGTGATTC TCTCACTAAA GCCAAACTCC ATCCCATTGG GGAATCCGCT 
TTACGGCTTA ATTGTCATTA CCTGGACCCT TTTGCACACC ACGCCCTCTT GCTGGGTCAG 
GTGTCTCGCT TAGCGCCCAG CTTTGACATC CTCCATTTTC ATATTGATTA TTTGCACTTT 
CCGATGAGCC GGATATTACA AATCCCCCAT CTCACCACCT TACATGGACG GCTTGATCTT 
CCTGACTTAC CACTCCTCTA TCAGGAATTC TCGGAGATGC CAGTAGTCTC GATTTCCAAT 
GCTCAACGGC ATCCTTTATT GTTTGTGAAT TGGCAAGCCA CTATCTATCA TGGCTTACCC 
GAAAACCTTT ACGCCTTTAA TTCTCAGCCC GAAAATTATC TTGCTTTTCT CGGCCGCATC 
TCACCAGAAA AACGGCTCGA CCGTGCCATC GAAATCGCTA TCCGCGCTGG GATGGAAATC 
CGTATTGCAG CAAAAGTGGA CCCGGCTGAT GAAAAGTATT TTCAAAAACA AATTAAACCG 
CTGCTCGCCC ATCCTCTAGT GAACTATATT GGAGAGATTG GTGAAAAGGA AAAAAATGAT 
TTTCTTGGCA AGGCTTACGC ATTATTGTTT CCCATTGATT GGCCTGAGCC TTTTGGGCTG 
GTCATGATTG AAGCCATGGC CTGTGGCACA CCCGTCATCG CCTATCGGCA AGGTTCTGTC 
CCTGAAGTGA TGCAAGAGGG TAAAACGGGT TTTATCGTTG AAAATTTAGA GCAGGCAGTA 
ATAACGGTAG AGAGAATAAG TCAGGTAAGC CGCCTGGGTT GTCGTCAAGT ATTTGAAGAG 
CAATTCTCTG CCAAACGCAT GGCCAAAAAC TACCTGCGGC TATACCGGAC CCTTACCAAG 
ACAAGGGTTA GACCTCGGCT GGTAAGTTGA

Protein sequence

MKIAQIAPLY ESVPPKYYGG TERIVSYLTE ELVNQGHDVT LFASGDSLTK AKLHPIGESA 
LRLNCHYLDP FAHHALLLGQ VSRLAPSFDI LHFHIDYLHF PMSRILQIPH LTTLHGRLDL 
PDLPLLYQEF SEMPVVSISN AQRHPLLFVN WQATIYHGLP ENLYAFNSQP ENYLAFLGRI 
SPEKRLDRAI EIAIRAGMEI RIAAKVDPAD EKYFQKQIKP LLAHPLVNYI GEIGEKEKND 
FLGKAYALLF PIDWPEPFGL VMIEAMACGT PVIAYRQGSV PEVMQEGKTG FIVENLEQAV 
ITVERISQVS RLGCRQVFEE QFSAKRMAKN YLRLYRTLTK TRVRPRLVS