Gene Namu_4703 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4703
Symbol
ID	8450333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5231604
End bp	5232995
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	67%
IMG OID	645043743
Product	citrate synthase I
Protein accession	YP_003203968
Protein GI	258654812
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID	[TIGR01798] citrate synthase I (hexameric type)

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAGG CCACCGACGC CGCCCCGACC CCGGCGAACC CGCCCGGATC CGCCGAGGCG 
ACGGGCACCA TCCAGTTCAT GCCGCCGACC GAGGCCACGC TCGAGGCGCC GGCCACCGGC 
TCCCTGGAGT ACGGCGGGCA GAAGCTGGAC CTGAAGGTGA TCCCGGCCAC CGAGGGCGCC 
TCCGGCATGG AGATCTCCAA GCTGCTGACC ACCCTGGGTG TCATCACCCT GGATCCGGGG 
TTCACCAACA CCGGATCGAC CACGTCCAAG ATCACCTACA TCGACGGTGA CGTCGGCATC 
CTGCGCTACC GCGGGTACCC GATCGAGCAG CTGGCCGAGC ACTCCACGTT CCTGGAGACC 
AGCTACCTGC TCATCCACGG TGAGCTGCCC ACGACCGCGG AGCTGGACTC GTTCACCAAG 
CGGATCAGCC GGCACACCAT GCTGCACGAG GATCTCAAGC GGTTCTTCGA CGGCTTCCCC 
CGGGACGCGC ACCCGATGCC GGTGCTTTCC AGCGCGGTCA GCGCGCTGTC GACGTTCTAC 
CAGGACTCGC TGGACCCGTT CAATCCCGAG CAGGTCGAGC TGTCCACCGT GCGGCTGCTG 
GCCAAGCTGC CCACCATCGC CGCGTACGCC TACCGCAAGT CGGTCGGCCA CCCGTTCCTG 
TACCCGGACA ACTCGTTGAG CCTGGTCGAG AACTTCCTGC GGATGTCGTT CGGCTTCCCG 
GCCGAGCCGT ACGAGGTCGA TCCCAAGCTG ACCAAGGCGC TCGACCAGCT GCTGATCCTG 
CACGCAGACC ACGAGCAGAA CTGCTCCACC TCGACCGTGC GGCTGGTCGG CTCGTCCAAC 
GCCAACCTGT TCGCCTCCGT CTCGGCCGGC ATCAACGCCC TGTTCGGCCC GCTGCACGGC 
GGCGCCAACC AGGCCGTGCT GGAGATGCTG GAGGGCATCA AGAAGGACGG CGGTGACGTC 
GGCCACTTCG TCAAGCGGGT CAAGGATCGC GAGCCCGGCG TCAAGCTGAT GGGCTTCGGG 
CACCGGGTCT ACAAGAACTA CGACCCGCGT GCGGCCCTGG TCAAGGCCAC CGCCGACGAG 
GTGCTGGCCT CCCTGGGCGC CCAGGACCAG CTGCTCGACC TGGCCAAGCA GCTGGAAGAG 
GTGGCGTTGT CCGACGACTA CTTCATCTCC CGCAAGCTGT ACCCGAACGT GGACTTCTAC 
ACCGGCCTGA TCTACAAGGC GATGGGCTTC CCGACCCGGA TGTTCACCGT GCTGTTCGCG 
CTGGGCCGGC TGCCCGGCTG GATCGCCCAG TGGCGCGAGA TGATCAACGA CCCGGCCACC 
AAGATCGGCC GCCCGCGGCA GGTCTACACC GGGTACACCG AGCGGGACTA CATCCCCACC 
GAGCAGCGCT GA

Protein sequence

MTKATDAAPT PANPPGSAEA TGTIQFMPPT EATLEAPATG SLEYGGQKLD LKVIPATEGA 
SGMEISKLLT TLGVITLDPG FTNTGSTTSK ITYIDGDVGI LRYRGYPIEQ LAEHSTFLET 
SYLLIHGELP TTAELDSFTK RISRHTMLHE DLKRFFDGFP RDAHPMPVLS SAVSALSTFY 
QDSLDPFNPE QVELSTVRLL AKLPTIAAYA YRKSVGHPFL YPDNSLSLVE NFLRMSFGFP 
AEPYEVDPKL TKALDQLLIL HADHEQNCST STVRLVGSSN ANLFASVSAG INALFGPLHG 
GANQAVLEML EGIKKDGGDV GHFVKRVKDR EPGVKLMGFG HRVYKNYDPR AALVKATADE 
VLASLGAQDQ LLDLAKQLEE VALSDDYFIS RKLYPNVDFY TGLIYKAMGF PTRMFTVLFA 
LGRLPGWIAQ WREMINDPAT KIGRPRQVYT GYTERDYIPT EQR