Gene Sare_4567 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4567
Symbol
ID	5705350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5184806
End bp	5185852
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	70%
IMG OID	641273979
Product	pyruvate carboxyltransferase
Protein accession	YP_001539326
Protein GI	159040073
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000479779
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCGTGA AACTGCAGAT CTGTGACTCG ACGTTGCGCG ACGGCAACCA CGCCGTCGCT 
CACCAGCTCG GCCGGGCGGA CATCAGCGCG TACGCTCGGG CGGCCGAGGA GGCCGGGGTG 
GACGTCCTCG AGGTCGGGCA CGGCAACGGG CTCGGCGCCT CGTCCATTCA GGTCGGCATT 
GCCGCCGTCA GCGACGCGGA GATGCTGCGC GCCGCGAAGG CCGAGCTGCG CAACTCGCGG 
CTGGGTGTGC TCTCCATCCC CGGCTTCGCC AGCGTCGAAC GTGACCTCAA GCCCGCCCTC 
GACTGCGGCG TCGACGAGGT CCGGGTGGGC GCGCACTGCA CCGAGGCCGA CGTCACCCGC 
CAGCAAATCA CGATGCTGCG GTCGATGGGC GTACGCGTGA AGGGCCTGCT GCTGATGAGC 
CACATGGCGT CGGCCGGGAA GCTGGTCGAG CAGGCGGGGC TCATGCAGGA GTACGGCGCC 
GAGGCGGTCG TGCTGATGGA CTCGGCCGGC GCGTACACCC CGGAGATGGT CCGGGAAAAG 
GTCGGCGAGC TGGTCGAGAA GCTCGACATC GCGATCGGTT TCCACGCGCA CAACAACCTG 
GGTCTCTCGG TGATCAACAG CATCACCGCG GTCCGCGCGG GTGCATCTAT CGTGGACGTG 
ACGGCACGTG GATTCGGCGC CGGGGCGGGG AACGCGCCGA TCGAACTGGT CGCCGCCAAC 
CTGCACGTCG AGCAGATCGA GGCGCGGATC AAGCTGTTCG ACGCGCTGGA CGCGGCGGAC 
ACCGCGGAGG AACGGTTCGT GAAACACGTG CCGACCAACG ACGGCGTCAC CATCGCCAGC 
GGCATCGCCG GGGTCTTCTC CGGGTTCGCG GCGCCGGTGC GGCGTGCCAG CCGGCGCTTC 
GGCGTCGACC CCCGCGAGAT CCTGCTCGAG TTGGGCAGGC GGCGGGTGGT GGCCGGCCAG 
GAGGACACCA TCATCGAGGT CGCCATGGCC CTGGCCGCCG AGGCGGCGTC CGCGGACCTG 
ACGCACGCCT TTGTTGACCA CATCTGA

Protein sequence

MSVKLQICDS TLRDGNHAVA HQLGRADISA YARAAEEAGV DVLEVGHGNG LGASSIQVGI 
AAVSDAEMLR AAKAELRNSR LGVLSIPGFA SVERDLKPAL DCGVDEVRVG AHCTEADVTR 
QQITMLRSMG VRVKGLLLMS HMASAGKLVE QAGLMQEYGA EAVVLMDSAG AYTPEMVREK 
VGELVEKLDI AIGFHAHNNL GLSVINSITA VRAGASIVDV TARGFGAGAG NAPIELVAAN 
LHVEQIEARI KLFDALDAAD TAEERFVKHV PTNDGVTIAS GIAGVFSGFA APVRRASRRF 
GVDPREILLE LGRRRVVAGQ EDTIIEVAMA LAAEAASADL THAFVDHI