Gene Noc_1972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1972
Symbol
ID	3705431
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2262172
End bp	2263419
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	52%
IMG OID	637738448
Product	glycosyl transferase, group 1
Protein accession	YP_343964
Protein GI	77165439
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAAAAA ACCAGCCCCA ATTACTCGTT ATTAGCACTC TCTTCCCTCA TGAGGGACAG 
CCAAGTGCTG GGCTTTTTAT CCGCGAGAGG ATGTTCCGGG TAGGAAGGCA CTTACCTTTG 
GTCGTGGTCG CGCCCACCCC GTGGTTTCCT GGTCAGAGTT TTTTACGTCG CCTGCGACCC 
CACTTCCGCC CGCCAGCACC GCGGCGAGAA ATTCAGGACG GAGTAGAAAT TTACCGGCCC 
CGGTTTCTTT CGGTTCCTGG TTTTTTTAAA TGGCTCGACG GATGGTCCCT AGCGTTTGCT 
GTCGTCCCCA CTTTATGGCA ATTGCGTCAT CGTTTCAGTC TCATTGATGC CCATTTTGCC 
TACCCTGAGG GGTACGCTGC GACACTCCTT GGACGCTGGT TTGGGGTGCC AGTGACTATC 
ACTCTCCGGG GCACGGAGGT ACCCATTGCC CGATTCCCTT TTCGTCGCCG TTTGATGCTC 
AAAGGACTTG CAGGCGCGAC ACGCGTATTT GCTGTCGCTG CTTCTTTGAA GTGCCATGTG 
ATCGGCTTAG GGGCCGATTC TCAAAAAATA CGGGTTGTGG GTAATGGAGT AGATACAGAA 
AAATTTACCC CTGTATCCAG AGTAGAAGCT CGCCGCCGTT TTAAATTACC TTCAGAGGGA 
CCGGTTCTTA TTTCTGTGGG TGGACTTGTT GAGCGCAAAG GTTTCCATCG AGTTATTGAG 
GTATTACCAG CGCTTAGAGA GCAATTTCCG GATCTGCATT ATCTCATTAT TGGTGGATCT 
GGGCCCGAGG GAGATATGAG TGAACAGCTT CGGCGTCAGG TTCAGAGCCT TGGGTTGGGG 
GAATCCGTGC ATTTTCTTGG GGCTTTGCCT TCCCAGCAGC TTAAGTGGCC TCTTTCAGCT 
GCGGATGTTT TTGTACTAGC GACCCGTAAC GAAGGCTGGG CCAATGTATT TCTAGAAGCA 
ATGGCATGCG GGCTTCCGGT AATTACCACT GAGGTGGGTG GAAACCGCGA GGTTGTTTCC 
GATATCCAGC TGGGTACAGT GGTACCTTTT GGTGATCCAA AAGCTTTAGA AGCGGCTTTG 
CGCGAGGCGC TTTCTCATTC TTGGGATCGG GCGGCAATAC GGAAGCATGC CTGTGAGAAC 
CATTGGGATT ACCGGGTTGA AGTATTGGTT CAGGAATTTG AGGCACTTGT TGATGGGAAC 
AAGATAGGAA CAAGGGTAAA GCCGGTGTCC AAGGAGTTTC GTTCGTGA

Protein sequence

MKKNQPQLLV ISTLFPHEGQ PSAGLFIRER MFRVGRHLPL VVVAPTPWFP GQSFLRRLRP 
HFRPPAPRRE IQDGVEIYRP RFLSVPGFFK WLDGWSLAFA VVPTLWQLRH RFSLIDAHFA 
YPEGYAATLL GRWFGVPVTI TLRGTEVPIA RFPFRRRLML KGLAGATRVF AVAASLKCHV 
IGLGADSQKI RVVGNGVDTE KFTPVSRVEA RRRFKLPSEG PVLISVGGLV ERKGFHRVIE 
VLPALREQFP DLHYLIIGGS GPEGDMSEQL RRQVQSLGLG ESVHFLGALP SQQLKWPLSA 
ADVFVLATRN EGWANVFLEA MACGLPVITT EVGGNREVVS DIQLGTVVPF GDPKALEAAL 
REALSHSWDR AAIRKHACEN HWDYRVEVLV QEFEALVDGN KIGTRVKPVS KEFRS