Gene Sare_4073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4073
Symbol
ID	5705368
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4633973
End bp	4635100
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	71%
IMG OID	641273499
Product	acetate kinase
Protein accession	YP_001538854
Protein GI	159039601
COG category	[C] Energy production and conversion
COG ID	[COG0282] Acetate kinase
TIGRFAM ID	[TIGR00016] acetate kinase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0369038
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCGGG TACTGGTACT CAACTGCGGA TCGTCATCGG TCAAGTGGCG GTGGTATGAC 
GGCGACGAAC TCCTCGACCG GGGCGCCGTC GAGCGAATCG GCGAGTCCGG TGGTGGGCCG 
GCCGACCATG GCACGGCGGT CCGGGAGATC CTCACCGGGC TCGACCTGGC CGGGCTCACC 
GCCGTCGGAC ACCGGGTGGT GCACGGTGGA CGCCGCTTCG GCGAACCGGT CCTGATCGAC 
GACGCGGTGC TCACCGCGAT CCGGGGCCTG ATACCGCTCG CCCCGCTACA CAATCCCGCC 
AACCTGGCCG GCATCGAGGT CGCCAGGGCG GCGCTACCCG GCATCCCACA GGTTGCCGTC 
TTCGACACCG CCTTCCACAC CACGCTGCCC GAGTCCGCGG CCACCTACGC GATCGACCGT 
GCGACGGCGG ACCGGTACGG CATTCGACGG TACGGTTTCC ACGGCACCTC CCACGCGTAC 
GTCTCGCGGC GCACGGCGGA GTTGATCGGT CGCCCGTACG CCGAGACCAA CACCATCACC 
CTGCACCTGG GCAACGGCGC GAGCGCCGCC GCTGTCGCCG GCGGACGGAG CGTGGCCACC 
TCGATGGGCA TGTCCCCGCT CGAAGGACTG GTCATGGGCA CCCGCAGCGG CGACCTGGAC 
CCGACGGTGA TCTTCCACCT GCGGCGGGAA GGCGGGTTGA GCGTCGACGA AATCGACGAC 
CTGCTGAACC ATCGCAGCGG CCTGTACGGG CTCACCGGCG CCAACGACAT GCGTGAGGTG 
CTTACGCGAC GGGCGGACGG CGACCCGGCC GCCGCGCTCG CCTTCGACGT GTACTGCCGC 
CGCATCACCG GCTACGTCGG GGCGTACTAC GCGCTGCTCG GCCGGGTGGA CGCGGTGACC 
TTCACCGCGG GCGTCGGCGA GCACGCCGCC CCGGTCCGGG CGGCAGCGTT GGCCGGACTG 
GAGCGACTTG GTATCACCGT CGATCCGGAA CGTAACGCGG GCCATGGTGA CCGCGTCATC 
TCACCCGACG GCGGCGAGGT GGCGGTCTGC GTCATCGGCA CCGACGAGGA ACGGGAGATT 
GCCCGCGCCG CCCGCGAGGT GGCGGGCGGG GCTCAGGTCG ACCGGTAG

Protein sequence

MSRVLVLNCG SSSVKWRWYD GDELLDRGAV ERIGESGGGP ADHGTAVREI LTGLDLAGLT 
AVGHRVVHGG RRFGEPVLID DAVLTAIRGL IPLAPLHNPA NLAGIEVARA ALPGIPQVAV 
FDTAFHTTLP ESAATYAIDR ATADRYGIRR YGFHGTSHAY VSRRTAELIG RPYAETNTIT 
LHLGNGASAA AVAGGRSVAT SMGMSPLEGL VMGTRSGDLD PTVIFHLRRE GGLSVDEIDD 
LLNHRSGLYG LTGANDMREV LTRRADGDPA AALAFDVYCR RITGYVGAYY ALLGRVDAVT 
FTAGVGEHAA PVRAAALAGL ERLGITVDPE RNAGHGDRVI SPDGGEVAVC VIGTDEEREI 
ARAAREVAGG AQVDR