Gene Noc_1508 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1508
Symbol
ID	3705844
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1672305
End bp	1673813
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	59%
IMG OID	637737994
Product	undecaprenyl-phosphate galactosephosphotransferase
Protein accession	YP_343523
Protein GI	77164998
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2148] Sugar transferases involved in lipopolysaccharide synthesis
TIGRFAM ID	[TIGR03022] Undecaprenyl-phosphate galactose phosphotransferase, WbaP [TIGR03025] exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.2856
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCTTAG TACCGTTAGT ATTAAAAGAA AGAATAATAG AACCAGAAGG AGAAAGGCCA 
AAAAATGGCA ACTTTACTCC AGCGGTATAT GAGGTACTTT CATGCGAAAA CAAGACACGG 
CCCTATCTAA CGGGCGCCGT ACTGCTAGCT GTGGACGTAG GCGCCGTGGG GGTGGCCTTT 
GCGGCCGCCG TGGCCCTGCG CTACAGCTTC GGGTCTGGTT TGAATTTCTC CACTTATTGG 
GAATTGTCGC CGCTTCTGCT GCTATTTTCG ATCTTCTATG CTGGCGCCAA GCTCTATTCC 
GGCACAATGT TTCCCCCGCC AGAAGAACTG CGGCGGCTCA CCTATGCAAC CAGCGCGGTG 
TTTCTGACGC TGGCTGTCTT CGCACTGCTG ACCCAAACCG GTATGCGGTA CTCCCGGGGG 
GTATTTTTTC TGGCCTGGGG CTTGGCGCTG GTCGCGGTGC CGCTGGCCCG GGCGGCGATA 
CGTGCCCTTT ATGTCAGCCG TCCCTGGTGG GGTAGAGGGG TGTTGATTCT AGGGGCGGGA 
TATACCTGCG CGCACCTGGT CCGCACGCTC CAGGAGAACC CTCAACTGGG ATTGAAACCC 
ATAGCTCTGC TCGACGACGA TCCGGTGAAA CAGAAGCGTG AGCTGCATGG GGTTCCGGTC 
GTCGGTGCCT GCGCCTTGGC GCCGAAGCTT GCCCGACGTC TACGCCTCAG CTACGCGGCT 
GTGGCCATGC CCGGTGTGTC ACGCGCCCGG CTTGTAGAAT TACTGGGACA GCACGGCTGG 
CCGTTCCGGC GCACGCTATT AATTCCCGAC CTATTCGGCT TTTCCTCCCT GTGGGTTACC 
TCCCGTGACC TGGGCGGAAT TCTGGGCCTG GAGCTGCGCG AACAGCTCCT GCTGCCAATC 
CCCATGCTGG TCAAACGGAC CTTGGACTTG GTTCTCGCCC TGGTGGGTGG GCTGTTCATC 
CTGCCGCTCC TTGGGTTGAT CGCTCTTGCC ATCAAGCTAG ATTCCAGGGG ACCGGTGTTC 
TACCGCTCGG AGCGCATGGG CCGTGATGGC CACCGCTTCG TGGCACTCAA ATTTCGTTCC 
ATGCGCGGTG ATGGTGAAGC GCTGTTGCGG GAATTATTAC AGCGTGATCC GGAAAAGCGG 
AAAGAATACG AGCAGTATCA CAAGCTCACC AGCGACCCCC GCGTAACGCC AGTGGGACGC 
CTGCTCCGCG CCTGGAGCCT CGATGAACTC CCTCAGCTTT GGAATGTATT GAAGGGCGAT 
ATGAGCCTTG TTGGCCCGCG CGCCTATTTG GAGCGCGAGC GGCCAGACAT GGGAGAAAAA 
TCGAATCTCA TCTTGAAGGT GAGACCCGGT ATCACGGGCC TGTGGCAAGT CAGCGGCCGC 
AACGAGCGCA CCTTCGGCGA GCGGGTGGAT ATGGACGTCT ACTACGCCCG CAACTGGTCC 
GTTTGGCTCG ACTTTTGGAT TCTTGCCCGG ACAGCCACGG CGGTTTTGCA GGGGAAGGGG 
GCGTACTGA

Protein sequence

MRLVPLVLKE RIIEPEGERP KNGNFTPAVY EVLSCENKTR PYLTGAVLLA VDVGAVGVAF 
AAAVALRYSF GSGLNFSTYW ELSPLLLLFS IFYAGAKLYS GTMFPPPEEL RRLTYATSAV 
FLTLAVFALL TQTGMRYSRG VFFLAWGLAL VAVPLARAAI RALYVSRPWW GRGVLILGAG 
YTCAHLVRTL QENPQLGLKP IALLDDDPVK QKRELHGVPV VGACALAPKL ARRLRLSYAA 
VAMPGVSRAR LVELLGQHGW PFRRTLLIPD LFGFSSLWVT SRDLGGILGL ELREQLLLPI 
PMLVKRTLDL VLALVGGLFI LPLLGLIALA IKLDSRGPVF YRSERMGRDG HRFVALKFRS 
MRGDGEALLR ELLQRDPEKR KEYEQYHKLT SDPRVTPVGR LLRAWSLDEL PQLWNVLKGD 
MSLVGPRAYL ERERPDMGEK SNLILKVRPG ITGLWQVSGR NERTFGERVD MDVYYARNWS 
VWLDFWILAR TATAVLQGKG AY