Gene Noc_2027 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2027
Symbol
ID	3705178
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2338734
End bp	2339987
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	50%
IMG OID	637738503
Product	glycine hydroxymethyltransferase
Protein accession	YP_344018
Protein GI	77165493
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0112] Glycine/serine hydroxymethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATAGCA AAGAGATGCG TATTGCCAGT TATGATGAGG AACTCGAGAC CGCTCTTACC 
AATGAAGCAC GGCGGCAAGA GGAACATATT GAATTAATTG CTTCGGAGAA TTATGTCAGT 
CCTCGGGTTT TAGAAGCCCA AGGGTCCGTG CTCACTAACA AGTACGCCGA AGGCTATCCT 
GGCAAGCGTT ATTATGGGGG CTGTGAGTAC GTGGATGTGG CGGAGCGGTT AGCTATCGAA 
CGGGCTAAAA TATTGTTCGA GGCTGATTAT GCTAATGTCC AACCCCACTC TGGCTCTCAG 
GCGAATGCCG CTGCCTGTCT AGCTTTGCTA GCGCCGGGCG ATACCCTCAT GGGGTTGAGT 
CTTGCCCATG GCGGGCATCT CACCCATGGC GCCAAGGTCA ATTTTTCAGG TCAAATTTTT 
AACGCAGTTC AGTTTGGGGT AAATGCAGAT ACGGGACTTA TTGACTATGA TGAGGTGGAG 
CAGCTAGCAA AGGCACATCG CCCCAAACTG ATTATCGCCG GATTTACCGC TTATTCCCGT 
ATAGTTGATT GGCAGCGTTT CCGAGCGATC GCGGATGGAG TAGGCGCCTA TTTGCTAGCG 
GATATCGCCC ATCTGGCCGG GATGATCGCC GCAGGAATTT ATCCTAATCC AGTGCAAATC 
GCCGATGTCA CGACTAGCAC AACCCATAAA ACTTTACGGG GTCCCCGTTC AGGACTGATT 
TTGGCTAAAG CCAACCCTGA GATTGAGAAA AAACTCAATT CCAAGGTCTT TCCCGGTATT 
CAAGGGGGGC CTTTAATGCA TGTTGTCGCG GCCAAGGCGG TAGCCTTTAA AGAGGCTATG 
GAGCCGGCGT TTAAGGATTA TCAACGGCAA GTGATTCGCA ATGCCCAGGC GATGGCAGAG 
GCTATTCAGT CTCGAGGCTA TAAAATTGTT TCCGGTGGGA CCGATAGTCA TCTGTTTTTA 
GTGGATCTCG TTGCCAAGGG TTTGACCGGC AAGGCTGCAG ATGCCGCGTT GGGTCGAGCA 
AATATCACCG TAAATAAAAA TACGGTGCCT AATGATCCTC AATCTCCGTT TGTAACCAGT 
GGTATTCGCA TTGGTAGCCC CGCCATGACT ACGCGTGGTT TTAAGGAAGC GGAGATTTGC 
GAATTAGCGG GATGGGTTTG TGATGTGCTG GACGATATTG AAAATGAGAC TGTAATTGCG 
GACACTAAGG AGAAAGTATT GGCTCTCTGC GCCCGCTTCC CGGTCTATGG TTAG

Protein sequence

MYSKEMRIAS YDEELETALT NEARRQEEHI ELIASENYVS PRVLEAQGSV LTNKYAEGYP 
GKRYYGGCEY VDVAERLAIE RAKILFEADY ANVQPHSGSQ ANAAACLALL APGDTLMGLS 
LAHGGHLTHG AKVNFSGQIF NAVQFGVNAD TGLIDYDEVE QLAKAHRPKL IIAGFTAYSR 
IVDWQRFRAI ADGVGAYLLA DIAHLAGMIA AGIYPNPVQI ADVTTSTTHK TLRGPRSGLI 
LAKANPEIEK KLNSKVFPGI QGGPLMHVVA AKAVAFKEAM EPAFKDYQRQ VIRNAQAMAE 
AIQSRGYKIV SGGTDSHLFL VDLVAKGLTG KAADAALGRA NITVNKNTVP NDPQSPFVTS 
GIRIGSPAMT TRGFKEAEIC ELAGWVCDVL DDIENETVIA DTKEKVLALC ARFPVYG