Gene Nmul_A1079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1079
Symbol	sucC
ID	3784693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1245277
End bp	1246467
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	55%
IMG OID	637811163
Product	malate--CoA ligase subunit beta
Protein accession	YP_411774
Protein GI	82702208
COG category	[C] Energy production and conversion
COG ID	[COG0045] Succinyl-CoA synthetase, beta subunit
TIGRFAM ID	[TIGR01016] succinyl-CoA synthetase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00492419
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGATATAC ATGAGTATCA GGCAAAAGAA ATTTTAATGA GGTATGGGGT CAAGATAGCG 
GAAGGGGGGT TGGCATATAC GATAGAAGAA AGTGTGCAGC GTGCCAGGGA AATCGACGGC 
AATGTATGGG TGGTGAAGGC GCAGATCCAT TCGGGGGGGC GGGGCAAGGC GGGCGGCATC 
AAGGTATGCA GGACTCATGA CGAAGTCCGG GCAGCCTCTG AGGAGTTGCT GGGAAAGATT 
CTGGTGACCC GTCAGACCGG AGCCGTGGGG AAGGTGTGTA CACGGGTATA TGTGGAAGCG 
GGCACGCACA TTGCCAGGGA GATGTATCTC TGCTTTCTGA TAGACAGGAG TTCGGAGCGC 
ATCGTCATGA TAGGCTCGGG GCAGGGTGGA ATGGAAATCG AGGAACTGGC TCACACAAAT 
CCTCAGGCCA TCAAGAAGAT TTTTATCGAA CCCGCAGTTG GGTTGCAGGA TTTTCAAGCG 
AGAGAGATGG CTTTTGCACT AGGGGTGGAA GCGGCACAAC TGCCTCATGC CGTTAAAACC 
ATTCGGGGGT GTTACCGCGC CTTGCGTGAT CTGGATGCGA ACATGGTGGA AATCAACCCC 
CTCGTGATCA CTGGGAGCGG CGAACTTCTT GCTCTTGACG CAAAAATGAG CTTCGACGAA 
AACGCCTTGT TTCGCCGGCA CGAGGTTGCC GAATTGCGTG ATAAAACACA AGCCGATCCT 
CGGGAGGTGG CAGCCTCCGA TCATGGCTTG AGCTACATCG GATTGAACGG TGACATCGGA 
TGCATGATAA ACGGCGCCGG GCTTGCCATG GCAACGATGG ATATGATCAA GCTCGCGGGC 
GGCGAGCCGG CAAATTTCCT TGATGTGGGA GGAGGGGCGT CCGCGGAGCG TACGGAAAAG 
GCGTTTCGCC TGGTTTTGGC TGATAAAGGA GTCAAGGCGA TGCTGGTCAA TATTTTTGCA 
GGTATTAATC GCTGCGACTG GATTGCGCAA GGCGTCGTGC AGGCGGTAAG AAATATCGAT 
ATGAAAATCC CGCTGGTCGT GCGCTTGTCC GGTACAAATG TCGAGGAGGG CCAGCGGATC 
ATTGCCGAAA GCGGTTTGCC GATCATCACA GCGGGAACGC TGGCGGAAGC AGCGGAGAAG 
GTTGTCCAGG CGCGCAATGG CGCGGTTGCG GAAGAGTGCA AAGGGATATA A

Protein sequence

MDIHEYQAKE ILMRYGVKIA EGGLAYTIEE SVQRAREIDG NVWVVKAQIH SGGRGKAGGI 
KVCRTHDEVR AASEELLGKI LVTRQTGAVG KVCTRVYVEA GTHIAREMYL CFLIDRSSER 
IVMIGSGQGG MEIEELAHTN PQAIKKIFIE PAVGLQDFQA REMAFALGVE AAQLPHAVKT 
IRGCYRALRD LDANMVEINP LVITGSGELL ALDAKMSFDE NALFRRHEVA ELRDKTQADP 
REVAASDHGL SYIGLNGDIG CMINGAGLAM ATMDMIKLAG GEPANFLDVG GGASAERTEK 
AFRLVLADKG VKAMLVNIFA GINRCDWIAQ GVVQAVRNID MKIPLVVRLS GTNVEEGQRI 
IAESGLPIIT AGTLAEAAEK VVQARNGAVA EECKGI