Gene Noc_2487 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2487
Symbol
ID	3704372
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2832448
End bp	2833710
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	49%
IMG OID	637738966
Product	cysteine desulphurases, SufS
Protein accession	YP_344470
Protein GI	77165945
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01552] prevent-host-death family protein [TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCATTG CAAACATCGC AGCTGAAGTA CCTATAGCAA GTGTCCCTTT TGAGATTGAG 
CGGGCCCGCG CTGACTTCCC TGTTTTGCAA CAGGAAGTAC ATGGGAAGCC TTTGGTGTAT 
CTAGATAATG CGGCGACTAT GCAAAAACCT AGACAAGTTA CTGAGGCGAT TGATCACTAT 
TACCGTTGGG ATAATGCCAA TATCCACCGT GCTGTGCATC AACTTAGCGA ACGGGCGACC 
CAAGCATACG AGGCGGCGAG GAATAAAGTG CAACACTTTA TTAACGCTGC TCGGCGGGAA 
GAAATTGTGT TTGTACGGGG CACTACCGAA GCAATCAATT TAGTCGCCCA AAGCTTCGGC 
CGAAGCCGGT TGCAAGCGGG TGATGAAATT CTGCTCTCCC ATATGGAGCA TCACTCTAAC 
ATTGTGCCGT GGCAGCTCCT ATGCGAGCAG ACGGGGGCAG TGCTTAAAGT CGTTCCTATC 
GATGATACCG GGGAATTGCT TTTAGATGAG TACGAGAGGT GTTTGTCACC TCGCACCCGG 
CTGGTAGCCA TGGTGCATGC TTCTAATGTT TTGGGAACTA TCAATCCAGC ACAAAAAATC 
ATTGAGCTAG CCCATGCCCG TGGGATTCCG GTGTTGCTAG ATGGGGCCCA GACTGTTCCC 
CACATGCCCG TGGATGTCCA GGAGCTGGAC TGTGATTTTT ACGCTTTTTC AGCTCATAAA 
ATGGTAGGAC CCACAGGTAT TGGCGTGCTC TATGGCAAGC GCGAATGGCT AGAAGCTATG 
CCTCCTTATC AGGGCGGCGG AGATATGATT CTGTCGGTAA GTTTTGATAA AACGCTTTAT 
AGCGATCTCC CCTATAAGTT CGAGGCGGGA ACTCCTCATA TCGCTGGAGC CATTGGCCTG 
GGTGTAGCGA TAGATTATCT AGAGACCCTA GGGATGGAAA ACATTGCGGC CTATGAGCAG 
GAATTGCTTA ACTATGGGAC AGAGGTTCTG GCTCAAGTTC CCGGACTGCG TTTTATTGGC 
ACAGCCCAAG AAAAAGTAGG GGTATTATCC TTTGTCTTGG AGGGCGTCCA TCCTCATGAT 
ATCGGTACCA TTCTTGATCA TGAAGGTATT GCCATTCGCA CAGGACATCA TTGCGCCCAG 
CCGGTAATGG AACGTTTTAA TATTCCCGCA ACGGCAAGAG CCTCCCTAGC ATTTTACAAT 
ACTAAGGCTG AAATGGATGT TCTGGCAGCT GGAATTAAGC GGGTAGGAGA GTTATTGGGA 
TAA

Protein sequence

MTIANIAAEV PIASVPFEIE RARADFPVLQ QEVHGKPLVY LDNAATMQKP RQVTEAIDHY 
YRWDNANIHR AVHQLSERAT QAYEAARNKV QHFINAARRE EIVFVRGTTE AINLVAQSFG 
RSRLQAGDEI LLSHMEHHSN IVPWQLLCEQ TGAVLKVVPI DDTGELLLDE YERCLSPRTR 
LVAMVHASNV LGTINPAQKI IELAHARGIP VLLDGAQTVP HMPVDVQELD CDFYAFSAHK 
MVGPTGIGVL YGKREWLEAM PPYQGGGDMI LSVSFDKTLY SDLPYKFEAG TPHIAGAIGL 
GVAIDYLETL GMENIAAYEQ ELLNYGTEVL AQVPGLRFIG TAQEKVGVLS FVLEGVHPHD 
IGTILDHEGI AIRTGHHCAQ PVMERFNIPA TARASLAFYN TKAEMDVLAA GIKRVGELLG