Gene Noc_2126 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2126
Symbol
ID	3704930
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	2449090
End bp	2450220
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	51%
IMG OID	637738602
Product	succinyl-diaminopimelate desuccinylase
Protein accession	YP_344116
Protein GI	77165591
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01246] succinyl-diaminopimelate desuccinylase, proteobacterial clade

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.521922
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGGCTA CCCTAGAATT AGCAAAAAGG CTGATCGCTT GCGCCTCGAT CACCCCCCGT 
GATGCCGGCT GCCAGGGACT ACTAGCCCAA CGTCTCCTAG CCCTTGGTTT CCAGGGTGAG 
CAGATGAATT TCGGGGAAGT GGATAATATC TGGCTGCGGC GAGGCCAAAA ACCACCGCTT 
TTTGTTTTCG CCGGTCATAC CGATGTCGTC CCCCCAGGAC CACCCGACAA ATGGCTGACT 
GATCCCTTTA CGCCTGAGGT TCGTAATGGC CTGCTTTATG GCCGCGGCGC CGCTGATATG 
AAAGGTAGCC TTGCTGCCAT GGTGACCGCC TGTGAGCACT TTATTAACGT CCATTCAGAC 
CACGCCGGGT CCATCGCTTT TCTACTCACC AGTGATGAAG AAGGTCCGGC AATCAATGGC 
ACTATTAAAG TAGTAGAAAC GCTACAAGCC CGAGGCGAAA AAATCGATTA CTGCCTGGTA 
GGAGAACCCA CTAGCCAGAA ACAAGTTGGA GATATGATCA AAAATGGCCG CCGGGGTTCG 
CTGGGTGGCC GTCTAATTGT ACGTGGAATT CAAGGGCATG TGGCTTACCC TCACTTGGCC 
GATAACCCCA TACATAGTCT AGCACCGGCG CTAGCCGTTC TATGCGCTCA AACATGGGAT 
CAGGGCAATA AAGATTTTCC CCCCACTACC TTTCAAATCT CAAATATTCA AGGGGGAACG 
GGAGCAACGA ATGTCATTCC AGGGGAGGTG GAAATCCTGT TTAATTTCCG CTATTCCACG 
GAAGTTACCC ACCAGCAGCT ACAACAGCAG ATGGAGGAAA TATTATCCCA ACAACGCTTG 
AACTATGAAT TAGAGTGGAC CCTCTCTGGC AAACCTTTCC TCACCGCGCC AGGAAGTTTG 
ATGACGGCGG TTTCTCAAGC AGTACGGGGC ATCACCGGGA TTGATGCAGA ATTTTCTACA 
ACTGGCGGTA CCTCGGATGG AAGGTTTATC GCTCCCACCG GGGCCCAGGT CGTGGAACTT 
GGCCCTGTCA ACGCCACCAT TCACAAAGTC AACGAATGCG TTGCTGTAGC AGATCTGGAG 
ATACTATCCC GAATCTACAG CCGCATATTA GAAATATTAC TTACAGAATA G

Protein sequence

MSATLELAKR LIACASITPR DAGCQGLLAQ RLLALGFQGE QMNFGEVDNI WLRRGQKPPL 
FVFAGHTDVV PPGPPDKWLT DPFTPEVRNG LLYGRGAADM KGSLAAMVTA CEHFINVHSD 
HAGSIAFLLT SDEEGPAING TIKVVETLQA RGEKIDYCLV GEPTSQKQVG DMIKNGRRGS 
LGGRLIVRGI QGHVAYPHLA DNPIHSLAPA LAVLCAQTWD QGNKDFPPTT FQISNIQGGT 
GATNVIPGEV EILFNFRYST EVTHQQLQQQ MEEILSQQRL NYELEWTLSG KPFLTAPGSL 
MTAVSQAVRG ITGIDAEFST TGGTSDGRFI APTGAQVVEL GPVNATIHKV NECVAVADLE 
ILSRIYSRIL EILLTE