Gene Noc_1151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1151
Symbol
ID	3706916
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1258904
End bp	1260103
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	50%
IMG OID	637737655
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_343185
Protein GI	77164660
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTAACCA ATGATCAAAG CAAGTACGAT TTTGCTACGC TGGCAGTGCG AGCGGGGCAG 
CAACGTACTG GTGAGGGTGA ACATGCCGAG CCTATATTTC CTACTTCCAG CTTTGTGTTT 
GAAAGTGCTA CAGAAGCTGC TGCTTGTTTC GCAGGAGAAA TAGCAGGAAA TATTTATTCC 
CGATTTACTA ACCCTACGGT CCGGACTTTT GAGCAACGCC TTGCAGCTTT AGAAGGGGGT 
GAGCGTTGCG TGGCGACTTC ATCGGGGATG GCGGCTATCC TTGCGACTTG TATGGCGCTG 
TTGAAGGCAG GAGATCATAT CGTTTCCTCG GAGAATATTT TTGGAACGAC GCGGGTTCTC 
TTCAATAAAT ATCTGGCCCG CTTTGGCGTA GAGACCACCT TTGTTCCTCT CATTCAGTTG 
GAAGCCTGGG AAAACGCCTT GCGTCCCAAT ACTCGCTTAC TATTTCTGGA AACGCCTTCC 
AACCCTCTGA ATGAAATAGC AGATATCGTT CAACTATCCA GTCTGGCGCA GGCCCATGGT 
TGCTTATTAG TGGTGGATAA TTGTTTTTGT ACTCCTGCTT TGCAGCGCCC TTTCGAGCTA 
GGGGCGGATC TTGTTATTCA CTCTGCCACC AAGTACCTCG ATGGCCAAGG GCGGTGCGTG 
GGGGGCGCCG TAGTGGGTGA TGGGCAACGG GTAGGAGAGG AAATCTTTGG CTTTTTGCGT 
ACTGCGGGTC CAACAATGAG TCCCTTCAAT GCCTGGGTTT TTCTTAAAGG TTTAGAAACC 
TTGCAATTGC GGATGGAAGC GCTGAGTCGA CAGGCTCAGG CTTTGGCCGA ATGGTTGGAA 
GCGGAGCCAA AAGTTTCAAG GGTATATTAT GCAGGTTTGC CTTCCCATCC TCAACACACG 
CTGGCCTCGA AGCAACAGTC GGGCTTTGGT GGCCTGGTCG CATTCGAGCT AAAAGGAGGG 
AAGGCGGCCG CCTGGAAACT TATCGATTCT CTCAAGTTTA TCTCTATTAC TGCTAATCTT 
GGGGATGTGA AAACCACCAT TACTCACCCG GCTACCACGA CCCATGGTCG TTTAACGGAG 
GAGGAGCGAT TGGCAGCAGG TATCAGCGAT GGTTTGGTAC GAATCTCCGT GGGTTTAGAG 
TCCCTTGAGG ATATTAAAAA AGATTTACAG CGGGGTTTGG ATAGGATGGC CCAAGGTTGA

Protein sequence

MLTNDQSKYD FATLAVRAGQ QRTGEGEHAE PIFPTSSFVF ESATEAAACF AGEIAGNIYS 
RFTNPTVRTF EQRLAALEGG ERCVATSSGM AAILATCMAL LKAGDHIVSS ENIFGTTRVL 
FNKYLARFGV ETTFVPLIQL EAWENALRPN TRLLFLETPS NPLNEIADIV QLSSLAQAHG 
CLLVVDNCFC TPALQRPFEL GADLVIHSAT KYLDGQGRCV GGAVVGDGQR VGEEIFGFLR 
TAGPTMSPFN AWVFLKGLET LQLRMEALSR QAQALAEWLE AEPKVSRVYY AGLPSHPQHT 
LASKQQSGFG GLVAFELKGG KAAAWKLIDS LKFISITANL GDVKTTITHP ATTTHGRLTE 
EERLAAGISD GLVRISVGLE SLEDIKKDLQ RGLDRMAQG