Gene Sare_4547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4547
Symbol
ID	5705809
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5140169
End bp	5141329
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	72%
IMG OID	641273959
Product	pyruvate phosphate dikinase PEP/pyruvate-binding
Protein accession	YP_001539306
Protein GI	159040053
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0574] Phosphoenolpyruvate synthase/pyruvate phosphate dikinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.529657
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0228656
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGGAC ACCGAGGGGA GTGGCTGTTG CTGATCGACC TGGCCGACGC CGAAGCCGCG 
ACGTCCGGAG GCAAGGCGGC AGTGCTCGCC CGGCTCCTCG AAGCAGGTCT GCCGGTCCCG 
CCTGGTTTTG TGGTGCCGGC CTCCGCCTAC GAACAGGCAG CCGACGGCCC CTCCGCCGAG 
CTCGCCGCCG CGATCGCCCA GGCGCTGCCG CGGCTCGGCG ACGGTCATGT CGCCGTACGC 
TCCTCGGCGA CCAACGAGGA CACCGCCCAG GCCACCGCCG CAGGGCAGCA CGACACCTTC 
CTCGGCGTCC GCGGGCCCGA CGAGGTGGTC GACGCCGTGA GCAGATGTTG GGCCTCGCTG 
TGGTCCGAGC GCGCCGTGGA ATACCGGCGC CGGCGGGGAG ACACGGAGTC ACCGACGATC 
GCCGTCCTGG TGCAGCGTCT AGTGGACGCG GACGTCGCTG GGGTGATGTT CACCGGCGAT 
GACATCCGGC TGGAGGCGTC CTGGGGGTTG GGCGAGAGCG TCGTCAGCGG CCACGTAACA 
CCGGACTCCT GGATGGTGTC CGGCGGCGAC ATCACCCATC GGGCGCTCGG CACGAAGAAG 
ACCCGGATCG ACCGCACGAT CTGCCGCGAG GTGGAACCGG CCGACCGGGA TCGCTTCTGC 
CTCACCGACG ACGAGGTCAC CCGGCTCGCA CAGCTCGGTC GGCAGATAGC CGCTCTGCTG 
GGCGGCCCAC AGGACATCGA GTGGGCAATC GCCGATTCCC GGATCTGGAT ACTTCAGTCC 
CGCCCGGTGA CCACCGCCCT CCCCGCCACA CCCCCGGCCG CCGCGGCCGC CGAGGGCAAG 
GCCCTCACCG GTACGCCCGG AAGCCCGGGC ATCGCCACCG GACCGGCGCG CGTGGTGCGC 
GGCCCCGCCG ACTTCGCCCG AGTCCGGCCC GGTGACGTAC TCGTCTGCCG CACCACGGAT 
CCGTCGTGGA CCCCGCTGTT CGGCGTGGTC GCCGCCGTCG TCACCGAAGT CGGCGGCCTG 
CTCTCGCACG CCGCGATCGT CGCCCGCGAG CAGGGCGTCC CTGCCGTCCT GGCCGTCCCG 
GACGCGACGA CAGCCCTGCC CGACGGCGCG CCGGTGGAGG TGGACGGAAA CTCCGGCTCG 
GTGGCACGCC GTGGTTCCTA A

Protein sequence

MHGHRGEWLL LIDLADAEAA TSGGKAAVLA RLLEAGLPVP PGFVVPASAY EQAADGPSAE 
LAAAIAQALP RLGDGHVAVR SSATNEDTAQ ATAAGQHDTF LGVRGPDEVV DAVSRCWASL 
WSERAVEYRR RRGDTESPTI AVLVQRLVDA DVAGVMFTGD DIRLEASWGL GESVVSGHVT 
PDSWMVSGGD ITHRALGTKK TRIDRTICRE VEPADRDRFC LTDDEVTRLA QLGRQIAALL 
GGPQDIEWAI ADSRIWILQS RPVTTALPAT PPAAAAAEGK ALTGTPGSPG IATGPARVVR 
GPADFARVRP GDVLVCRTTD PSWTPLFGVV AAVVTEVGGL LSHAAIVARE QGVPAVLAVP 
DATTALPDGA PVEVDGNSGS VARRGS