Gene Caul_1443 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1443
Symbol
ID	5898898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1533967
End bp	1535397
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	71%
IMG OID	641561930
Product	pyruvate kinase
Protein accession	YP_001683071
Protein GI	167645408
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0469] Pyruvate kinase
TIGRFAM ID	[TIGR01064] pyruvate kinase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.434005
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCGCG CGCGCCGCTC CCGCATTGTC GCCACCATCG GCCCCGCCAG CAGCTCGCAT 
GAGATGATCG TGAAGCTGGC CAAGGCCGGG GCCGACGTCT TCCGCCTGAA CTTCAGCCAC 
GGCAGCCACG ACAACCACGC CGCCGCCTAC GCCGCCATCC GCGCGGCCGA GGCGGTGGTC 
GGCCGTCCGC TGGGCATCCT GGCCGACCTC CAGGGGCCGA AGCTGCGTGT GGGCAAGTTC 
GCCAACGGCC CGGTGACGCT GAACGCCGGC CAGGCCTTCC GCTTCGACAA CGATCCGACA 
CCGGGCGATG AAACCCGCGT GCACCTGCCG CATCCGGAAA TCCTGGTGGC CATGCGCCCC 
GGCGCGACCC TGCTGCTAGA CGACGGCAAG CTGCGGATGA CCGTCACGGA CGCCGGCCCT 
GGCTACGCCA ACACCAAGGT GGTCAATGGC GGCAAGCTGT CGGAGCGCAA GGGCGTGGCC 
GTGCCCGACG TCGTGATCCC GATGTCGCCG CTTACCCCGA AGGACCGCGA GGACCTGGCC 
TTCGCCCTGC GCCTGGGCGT GGACTGGATC GCCCTGTCGT TCGTGCAGGC TCCCGAGGAC 
ATGGCCGAGC TGCGCCGCAT CGTCGAGGGC CGCGCCGCCG TGCTGGCCAA GATCGAGAAG 
CCCCAGGCCC TGGAAGTGCT GGGTCCGATC CTCGACCTCT GCGACGGCGT GATGGTGGCC 
CGGGGCGACC TGGGCGTCGA GATGGCCCCG GAAGAGGTGC CGGTGGCCCA GAAGGTCATC 
CTGCGCGCCG CTCGCGAGCG CGGCATTCCG GTGATCGTCG CCACCCAGAT GCTGGAGTCC 
ATGACCAGTT CGCCGACCCC GACCCGAGCC GAGGCCTCGG ACGTGGCCAA CGCCGTCTAC 
GAGGGCGCCG ACGCGGTGAT GCTGTCGGCC GAAAGCGCGG CCGGAGATTA TCCTGAAGAA 
TCCGTGGCGA TGATGAGCCG GATCATCGAG CGGGTGGAGC GCGATCCGCG CTGGCCCGAG 
CTGATGCAGG CCGAGCAGCC GCACGACGAC GACGACGCCG ACGTTCTGGT GGTCGCCGCC 
GCCCAGGCCG CCAAGGCCGG CTCGACCAAG TGCCTGGTAG CCTTCACGAC GACCGGCGCC 
ACCGCCCGTC GCCTGGCGCG CGAGCGGCCG CTGCAGCCGG TTCTGGCCCT GTCGCCGCAG 
ATCGACGCCG TGCGCCGCAT GTGCCTGGTC TGGGGAGTCG AGGCTCGCGT CAGCGGCCAG 
CCCGACAGCC TGGAGGTCGT CACCTCCGAC GCCGTGGCCA AGGCGGTGGA CCTGGGCTTG 
GTCGGTCCGG GCGAGCGCGT GCTGATCGTC GCCGGAACGC CGTTCGGCGC CCCCGGCGCG 
GCCAACCTGC TGCGCCTGGC CCACGCGCCG TTCCCGACGC GCAAGCGGTA G

Protein sequence

MIRARRSRIV ATIGPASSSH EMIVKLAKAG ADVFRLNFSH GSHDNHAAAY AAIRAAEAVV 
GRPLGILADL QGPKLRVGKF ANGPVTLNAG QAFRFDNDPT PGDETRVHLP HPEILVAMRP 
GATLLLDDGK LRMTVTDAGP GYANTKVVNG GKLSERKGVA VPDVVIPMSP LTPKDREDLA 
FALRLGVDWI ALSFVQAPED MAELRRIVEG RAAVLAKIEK PQALEVLGPI LDLCDGVMVA 
RGDLGVEMAP EEVPVAQKVI LRAARERGIP VIVATQMLES MTSSPTPTRA EASDVANAVY 
EGADAVMLSA ESAAGDYPEE SVAMMSRIIE RVERDPRWPE LMQAEQPHDD DDADVLVVAA 
AQAAKAGSTK CLVAFTTTGA TARRLARERP LQPVLALSPQ IDAVRRMCLV WGVEARVSGQ 
PDSLEVVTSD AVAKAVDLGL VGPGERVLIV AGTPFGAPGA ANLLRLAHAP FPTRKR