Gene Caul_1954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1954
Symbol
ID	5899409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2095785
End bp	2096987
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	68%
IMG OID	641562444
Product	acetate kinase
Protein accession	YP_001683581
Protein GI	167645918
COG category	[C] Energy production and conversion
COG ID	[COG0282] Acetate kinase
TIGRFAM ID	[TIGR00016] acetate kinase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.151784
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.354384
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGCG CCATCGTCAG CCTCAATGCC GGCTCGTCGA GCATCAAGTT CGCCCTGTTC 
GTCCTGGCGG GCGATGGCCC AAGCCGCGTG GCGGCGGGCA AGCTGGAGGG CATCGGCACG 
GCGCCCCATC TGGCAGCCCG CGATCTGAAC GGCGACGTCC TGGTCGATCG CACCTGGGAC 
GGTGGCGCGG ACCTCGATCA TGAGGCCCTG CTGCAAGATC TCTTCGCCTG GGCCGGCGCA 
CACTTGGAAG GCCGCGAGAT CGTCGGGCTC GGACACCGGG TCGTGCATGG CGGCGGACGG 
TTTACCGCTC CCGTGCGGGT CGATGATCAG GTCCTGACCG CACTGGACGC CTTCTGCCCC 
CTGGCGCCGC TGCACCAGCC GCACAACCTG GCCGCCATCC GCGCCATCCA GACCCTGGCG 
CCGGAACTGC CGCAGGTGGC CTGCTTCGAC ACCGCCTTTC ACCATCAGAT GCCCGAGATC 
GCCACGCGGT TCGCCCTGCC CCGCGCGCTG CATGACAAGG GGGTGCGCCG CTACGGCTTC 
CACGGCCTGT CCTACGACTA TCTCGCCCGC ACGCTTGGCC AGGTCGATCC GGACCTCGCC 
CGCAGCCGGG TGATCATGGC CCATCTTGGC AATGGCGCCA GCCTGTGCGC GATGCACGAC 
GGCAAAAGCC TAGACACCAC GATGGGCTTT ACAGCGCTGG ATGGTCTGGT GATGGGCACG 
CGCTGCGGCG CGATCGACCC GGGCGTGGTG CTGCATCTGC TGTCGCAAGA GGGCATGAGC 
ATCGCCGAGG TCGAACGGCT GCTCTACACC CAGAGTGGTC TGCTGGGCGT TTCGGGCGTT 
TCGAGCGACA TGCGCACGCT TCACCAGAGC CAGGATTCGC GCGCCGCCGA GGCCATCGAC 
CTCTTCGCCT GGCGCGTGGC GCGGGAGATC GGCGGCCTGA TGTCCTCGCT GGCCGGGCTC 
GACGGCCTGG TGTTCACGGC CGGCATCGGC GAGAACGACC CGGTCATCCG CGCGCTGATC 
TGCCAACGAC TGGCCTGGGC GGGGATCGTG ATCGAGCCCG CGGCCAATCA AGCCAACGCC 
CCGTTGATCA GCGCGCCCGC CAGCAAGGTC GCCGTGCGGG TTATGGCAAC CGACGAGGAA 
CGCATGATCG CCCTCCAGAC GATCAGCACC TTGGGTTTGA GCGCGCAAGG CCGAGCGCCT 
TAG

Protein sequence

MSRAIVSLNA GSSSIKFALF VLAGDGPSRV AAGKLEGIGT APHLAARDLN GDVLVDRTWD 
GGADLDHEAL LQDLFAWAGA HLEGREIVGL GHRVVHGGGR FTAPVRVDDQ VLTALDAFCP 
LAPLHQPHNL AAIRAIQTLA PELPQVACFD TAFHHQMPEI ATRFALPRAL HDKGVRRYGF 
HGLSYDYLAR TLGQVDPDLA RSRVIMAHLG NGASLCAMHD GKSLDTTMGF TALDGLVMGT 
RCGAIDPGVV LHLLSQEGMS IAEVERLLYT QSGLLGVSGV SSDMRTLHQS QDSRAAEAID 
LFAWRVAREI GGLMSSLAGL DGLVFTAGIG ENDPVIRALI CQRLAWAGIV IEPAANQANA 
PLISAPASKV AVRVMATDEE RMIALQTIST LGLSAQGRAP