Gene Ndas_2195 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2195
Symbol
ID	9246045
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2622302
End bp	2623378
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	72%
IMG OID
Product	acetate kinase
Protein accession	YP_003680123
Protein GI	297561149
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000385567
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000228017
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGTGTTC TGGTGGTCAA CGCGGGGTCC TCCAGCCTGA AGCTGGGGGT GGTGGACGGT 
GACGGCGCGG TGCTGGCCTC GGAGTCGCTC GCGGCGCGTG GGGGGCACTG GGACCCGCGG 
GAACTGAGCC GGGCGCTGGA GGGTGTGCCC GAGGTGGACG CGGTGGGTCA CCGTGTGGTG 
CACGGGGGCG GTGAGTTCGT CGATCCGGTG CGGTTGGACG CCTCGGTGGT GGAGCGGTTG 
CGGGCGTGGG GTTCGTTGGC GCCGCTGCAC CAGCCCAAGG CGTTGGAGGC GATCGAGGCG 
GTGGGGCGGG TGTTGCCGGG GTGTGCGGCG GTGGCGTGTT TCGACACCGC CTTCCACTCC 
GGTCTGCCGG AGGTGGCGTC GACGTACGCG GTGCCCGAGC GGTGGCGACG GGAGTGGGGG 
GTGCGCCGGT ACGGGTTCCA CGGGCTCTCG CACGCCTATG TGTCGCGGCG GGCGGCGGAG 
TTGACCGGTG GTGAGCGTGT GGTGAGCGCG CATCTGGGGT CGGGTGCGTC GTTGGCGGCG 
GTGGCGGGCG GCCGGTGTGT GGACACCACG ATGGGGTTCA CCCCGTTGGA GGGGGTGGTG 
ATGGCCACGC GTTCGGGGAG TGTGGATCCG GGGTTGGTGG TGTGGTTGGT GCGCCATGGC 
GGGTTGTCGG TGGAGGAGGT CCAGCGGGGG TTGGAGCGCG AGTCGGGGTT GTTGGGGCTT 
GCGGGGACCG AGGACATGCG TGAGGTGTTG GAGCGCGACG ACGCGCGGGC GCGGTTGGCG 
CTGGGGGTGT ACGTGCACCG GTTGTGTGCG GGTGTGGCGT CGATGGCGGC GGCGCTGGGC 
GGGGTGGACA CGTTGGTGTT CACCGGTGGT GTGGGCGAGG CGGCGGCTCC GGTGCGTGAG 
CGTGTGGCGC GGGGGCTGGG TTTCTTGGGT GTGGGTGTGG ATGGTGCGGT GAATGCGGCT 
GTGGAGGGTG AGGCGGAGGT GACGGGTGTG GGTGCGCGGG TGCGCACGTT GGTGGTGCCC 
TCGCGTGAGG ACGTGGAGAT CGCGGCGGGG GTGCGGCGGG TGCTGGGCGG GGGGTGA

Protein sequence

MRVLVVNAGS SSLKLGVVDG DGAVLASESL AARGGHWDPR ELSRALEGVP EVDAVGHRVV 
HGGGEFVDPV RLDASVVERL RAWGSLAPLH QPKALEAIEA VGRVLPGCAA VACFDTAFHS 
GLPEVASTYA VPERWRREWG VRRYGFHGLS HAYVSRRAAE LTGGERVVSA HLGSGASLAA 
VAGGRCVDTT MGFTPLEGVV MATRSGSVDP GLVVWLVRHG GLSVEEVQRG LERESGLLGL 
AGTEDMREVL ERDDARARLA LGVYVHRLCA GVASMAAALG GVDTLVFTGG VGEAAAPVRE 
RVARGLGFLG VGVDGAVNAA VEGEAEVTGV GARVRTLVVP SREDVEIAAG VRRVLGGG