Gene Noc_0742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0742
Symbol
ID	3707008
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	804276
End bp	805385
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	54%
IMG OID	637737244
Product	glycosyl transferase, group 1
Protein accession	YP_342785
Protein GI	77164260
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.377387
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATTG GATTTATCAG TAACTGGTGC AATCGTGGGC AAGGGATTGT GACCCGCCAG 
ATTCGAGCTA TTTTCGCCGA GGCGGGACAT GACACCTACG TACTGGCCCG GCCCACCCGG 
GCCAGGGCGG CCATGCCCAA TCTCATTGAT AGCCGGCAGG AGTGGCAGGT GCCCCATCTG 
ACTCACGGCT CGGCTTATGA TATGCCTGTC GGGGAATATA TGGCTTGGGC CAAGGAGTCC 
GCCCTGGATG TGCTTTTTTG CGATATGAAT ATGCAATTCG AGGCCATTGT CGCCATTCGA 
AAGTTGGGGG TGCGAACCAT TGGGCGTTTC GTGTGGGAGG CTTTCCATCC GGATTATGTG 
GCAGCGGTCA AACAAGCCTA TGATATTGTT TATTCTTTGA CCCGCTGCGA GCAGGAGAAC 
TACCGGAAAA TGGGAATTTC CTCCCCCTAT GTCCGGTTTG GTTTGGCGCC CTCATTTACC 
GCTTTTTCTC CCATCAAGCG CCCCGATGAT GCCCTTTACT TTTTCTTCCA CGGAGGCACC 
CAGGGAACCC GCAAGCCCAT CCAGGCCACG CTCAAGGCGT TCAAGCAGGT AAAGAACCCC 
CATATTCGGC TGATTATTAA GAGCCAGTGC ATTGATAAAG CCTCCGAGCC TGTGACCATC 
GAGGATGATC CCAGAATCAC CCATATAGTG GCGGATTTGC CCTTCGAGGA GCACCGGCGG 
TTATTTTCAA GTTGCCACGT TTGCCTCTGC CCGAGCCGCT GGGAAGGGTT GGGGGTCCAT 
TTGTTCGAGG CCCTGGCCTA TGGGATGCCG GTAATTTCCA ATGATATCGC CCCCATCAAT 
GAAGTGATCC GCCACGGGCG GAGCGGTTTG CTGGTGCGCA GTTTCTCCAA GCGCAAGAAT 
CGTTGTGGCC TTCCCATTTT CGAGCCTGAC GAAGGGCATT TACGGGAATG TATCGAGGAA 
CTCAGCAATC CAGTCCGGTT GGCGGCCCTG ATGGCGAGCA CCCGGGAGGA AGCAAAGCAA 
TTTGATTGGG CATTGACCCG GCAAGACTAT CTTGAATTAG CCACTTGCAC TAGGGAAAAT 
CTTAGCCGGA AACAAAAGAA TGACGGGTAA

Protein sequence

MNIGFISNWC NRGQGIVTRQ IRAIFAEAGH DTYVLARPTR ARAAMPNLID SRQEWQVPHL 
THGSAYDMPV GEYMAWAKES ALDVLFCDMN MQFEAIVAIR KLGVRTIGRF VWEAFHPDYV 
AAVKQAYDIV YSLTRCEQEN YRKMGISSPY VRFGLAPSFT AFSPIKRPDD ALYFFFHGGT 
QGTRKPIQAT LKAFKQVKNP HIRLIIKSQC IDKASEPVTI EDDPRITHIV ADLPFEEHRR 
LFSSCHVCLC PSRWEGLGVH LFEALAYGMP VISNDIAPIN EVIRHGRSGL LVRSFSKRKN 
RCGLPIFEPD EGHLRECIEE LSNPVRLAAL MASTREEAKQ FDWALTRQDY LELATCTREN 
LSRKQKNDG