Gene Noc_1979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1979
Symbol
ID	3705438
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2273335
End bp	2274624
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	51%
IMG OID	637738455
Product	glycosyl transferase group 1
Protein accession	YP_343971
Protein GI	77165446
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID	[TIGR03087] sugar transferase, PEP-CTERM/EpsH1 system associated

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTGATC TTCTATTCCT TGCGCACCGG ATACCTTTTC CCCCCAATAA AGGCGATAAA 
ATACGTTCTT ATCATTTGTT GCGCTTTCTT GCCAGCCGTT ATCGTGTCCA TGTAGGCGCT 
TTCGTGGACG ATCCAGTAGA CTGGAAATAT GCTTCAGACC TTCATCGGTT AGGGGTAGAT 
GAGCTTTGCC TGCGGCCGCT ACCGCGGGCT CTCGCATTGG CCCGATCCCT GACAGCGTTG 
GTAGCCGGTA AGCCGCTTGG TTTAGCTTAC TATAAAGATC GTTGCATGAG CCGCTGGGTG 
CAAGACATCG CTGCTCGGCC TTCCTTGGAA GGCGTTGTGG TGTTTTCCTC TGTGATGGCT 
CAGTATATAA CTATGCTTCC CCGGCAAGTG CCAGCTATTG TCGATTTTGT GGATGTGGAT 
TCAGAGAAAT GGCATGCTTA TAGTCAGACA TCGAGTCCTC CTTTGTCTTG GGTTTATCAG 
CGTGAAGCCC GTACTCTTTT GGCCTTCGAG CGAAAAATAG CTGCGCAAGC AAAAGCTGCA 
ACATTTGTTT CCTCGGTGGA GGCTGAGTTA TTCCGCCGTT TAGCTCCAGA AGTGGCGAAA 
CAAGTATTTG CTGCGCCTAA TGGGGTCGAT ACGGATTTTT TCTCCCCGGA TCGGCATTAT 
CCTTCTCCGT ATCCTCCGGA GCAGCGGGTG TTGGTTTTTA CTGGTGCCAT GAATTACCGT 
CCTAATATAG ATGCGGTAAT TTGGTTTACT AAAACTATTT TTCCGAAGAT TCTAGCGGTG 
GTTCCTGCGG CCTGTTTCTA TATTGTGGGT ACGCAACCGG CTGAAGCTGT ACGGCGTCTC 
TCGGCAGAGC GGCAAGTATA TGTGACAGGT ACTGTGGCGG ATATGCGTCC TTATTTAGCC 
CATGCCCGAG CTGCGGTAGC GCCTCTGAGG ATTGCCCGTG GAGTTCAAAA CAAGTTGTTG 
GAGGCGATGG CCATGGCCCG GCCTGTGATA GCTACTCCAG AGGCCGCCGA GGGTATTGTT 
TTGCCTCCGG TATGTGAGAA TCTAGTGAGT GCAACGCCGA ATCAATTTGC AGCAAAAACT 
ATTGCCGTAT TGCTGCAGGG AAAGGGAAAG GAGGCAGGTA GGAAGGGCCG GGAGCATGTC 
TTACAAAATT ACCATTGGGA TAATCACCTA GAACGTTTCT CGGAGTTGCT TACTCATCCC 
TCCCTCGCGC CTATAATTAG TGTGGCAAAA GAGGCCACTG GTGGAGAAAA AAATGCAGAT 
GAACCCGACC GAACAGCGGT ACCTAGATAG

Protein sequence

MGDLLFLAHR IPFPPNKGDK IRSYHLLRFL ASRYRVHVGA FVDDPVDWKY ASDLHRLGVD 
ELCLRPLPRA LALARSLTAL VAGKPLGLAY YKDRCMSRWV QDIAARPSLE GVVVFSSVMA 
QYITMLPRQV PAIVDFVDVD SEKWHAYSQT SSPPLSWVYQ REARTLLAFE RKIAAQAKAA 
TFVSSVEAEL FRRLAPEVAK QVFAAPNGVD TDFFSPDRHY PSPYPPEQRV LVFTGAMNYR 
PNIDAVIWFT KTIFPKILAV VPAACFYIVG TQPAEAVRRL SAERQVYVTG TVADMRPYLA 
HARAAVAPLR IARGVQNKLL EAMAMARPVI ATPEAAEGIV LPPVCENLVS ATPNQFAAKT 
IAVLLQGKGK EAGRKGREHV LQNYHWDNHL ERFSELLTHP SLAPIISVAK EATGGEKNAD 
EPDRTAVPR