Gene Ndas_4117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4117
Symbol
ID	9247991
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4916757
End bp	4917944
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	73%
IMG OID
Product	succinyl-CoA synthetase, beta subunit
Protein accession	YP_003682018
Protein GI	297563044
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATCTGT ACGAGTACGA GGCCAAACAG CTCTTCGGGG AGTACGGCGT CCCCCTCGTC 
GAGGGCGAGA TCGCGGACAC CCCCGAACAG GCCCGGCTGG CGGCCGGACG GATCGGCCAC 
CGGGTGGTGG TCAAGGCGCA GGTCAAGACC GGTGGTCGCG GCAAGGCCGG CGGCGTCAAG 
GTCGCCGAGG GCCCCGAGGA CGCCGGGGCC AGGGCCGAGC AGATCCTCGG CATGGACATC 
AAGGGCCACA CCGTCCGCCG CGTCCTCATC GAGGAGGCCT CCGACATCGC GGAGGAGTAC 
TACTTCTCCT TCCTGCTGGA CCGCGCGAAC CGCACCTTCC TCTCGATCTG CTCCGCCGAG 
GGCGGCATGG ACATCGAGGA GGTCGCCCGG ACCCGGCCCG AGGCGGTCGT GCGCACCCCG 
GTCGGCCCCG GGGGCGTGGA CCACGGGGCC GCCCTCGCGA TCTGCCGCGC GGCCGGGCTG 
CCCGAGGAGG TGCGCGACTG CGCGGCCCAG GTGGTCACCC GGCTCTGGCA GGTCGCCGTC 
GGGGAGGACG CCACCCTCGT CGAGGTCAAC CCCCTGGTCC GCACGGCCGA CGGGCGGATC 
ATCGCCCTGG ACGGCAAGGT CACCCTGGAC GGCAACGCCG CCTTCCGCCA CCCCGAGCGG 
ACCCCGTTCG CCGACGGCGC CGACACCGAC GAGCGCGAGC GCATGGCCAG GGCCAGGGGC 
CTGAACTACG TCAGGCTCGA CGGCGAGGTC GGCGTCATCG GCAACGGCGC GGGTCTGGTC 
ATGTCCACCC TGGACGTGGT CGCCCACGCG GGCGGGGCGC ACGGCGGGGT GCGACCGGCC 
AACTTCCTGG ACATCGGCGG CGGGGCCTCG GCCGAGGTCA TGGCCAACGG CCTGGAGATC 
GTCCTGGGCG ACCCCTCGGT CAGGAGCGTC CTGGTCAACG TCTTCGGCGG CATCACCGCC 
TGCGACGCGG TGGCCGAAGG CATCGTCCGG GCCCTGGACA TGCTGGAGGG CCGCAGCGGC 
GACGAGGGCT TCGATCAGCT CGGCAAGCCG CTGGTCGTGC GCCTGGACGG CAACAACGCC 
GAGCTGGGCC GCGAGATCCT CACCAAGCGG GCCCACCCGG CCGTGCAGCA GGTGGACACC 
ATGGACGGCG CCGCCGCCCG GGCCGCCGAG CTCGCGGCCG CCAACTGA

Protein sequence

MDLYEYEAKQ LFGEYGVPLV EGEIADTPEQ ARLAAGRIGH RVVVKAQVKT GGRGKAGGVK 
VAEGPEDAGA RAEQILGMDI KGHTVRRVLI EEASDIAEEY YFSFLLDRAN RTFLSICSAE 
GGMDIEEVAR TRPEAVVRTP VGPGGVDHGA ALAICRAAGL PEEVRDCAAQ VVTRLWQVAV 
GEDATLVEVN PLVRTADGRI IALDGKVTLD GNAAFRHPER TPFADGADTD ERERMARARG 
LNYVRLDGEV GVIGNGAGLV MSTLDVVAHA GGAHGGVRPA NFLDIGGGAS AEVMANGLEI 
VLGDPSVRSV LVNVFGGITA CDAVAEGIVR ALDMLEGRSG DEGFDQLGKP LVVRLDGNNA 
ELGREILTKR AHPAVQQVDT MDGAAARAAE LAAAN