Gene Caul_2545 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2545
Symbol
ID	5900000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2761651
End bp	2762676
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	70%
IMG OID	641563036
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_001684170
Protein GI	167646507
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACC AGCAGAACGG CCTCACCTAC GCCCAGGCTG GTGTCGATAT CGACGCCGGG 
AACGCCCTGG TCGAGGCGAT CAAACCCTTG GCCAAGGCCA CGCGGCGCCC CGGCGCGGAC 
GGCGGCCTGG GCGGCTTCGG CGCCCTGTTC GACCTGAAGG CGGCGGGTTA CGACGACCCG 
CTTCTGGTCT CCACCACCGA CGGCGTCGGC ACCAAACTGC GCATCGCCAT CGACGCCAAG 
ATGCACGCCA CGGTCGGCAT CGACCTGGTG GCCATGTGCG TCAACGATCT GCTGGCCCAG 
GGCGCCGAGC CGCTGCTGTT CCTCGACTAT TTCGCCACCG GCAAGCTGGA CCTGGAGGTC 
GCCAAGAGCG TGGTGGCCGG CATCGCCGAC GGCTGCAAGC TGGCCGGCGC GGCCTTGGTG 
GGCGGCGAGA CGGCGGAAAT GCCGGGCATG TACGGCGACG GCGAATACGA CCTGGCCGGC 
TTCTCGGTCG GCGCGGTCGA GCGCGACGGC GTGCTGCCCA AGCTGGACAA GCAGCGGGCC 
GGCGATCTGA TCATCGGCGT CGGCTCGTCG GGCCCGCACT CCAACGGCTA CAGCCTGGTG 
CGCCGCGTGG TCGAGCGCTC GGGCCTGACC TGGGACGCCC CCTGCCCGTT TGAGGACGGC 
AAGACCCTGG CCGAGGCCCT GATGGCCCCG ACCCGCATCT ATGTGAAGTC GATCCTGCCC 
CTGCTGCAGT CGGGCCGGGT CAAGGGCGGC GCCCACATCA CCGGCGGCGG CCTGATCGAG 
AACCCGCCGC GCTGCATCGC CGATGGTCTC AAGCCCGAAT TCGACTGGAA CGCCTGGCCC 
CTGCCGCCGG TCTTCGACTG GCTGCAGCGC GAAGGCGGCA TCACCGACCA CGAACTGCGC 
CGCACCTTCA ACTGCGGCGT CGGCTTCATC CTGGTGGTCG CCGCCAGCGA CGCCGAGCCG 
GTGCTGGCGG CGCTGCTGAA CGCGGGCGAG GACGCGTTTG TTTGTGGGCA GTTGGTGGCG 
GGCTGA

Protein sequence

MSDQQNGLTY AQAGVDIDAG NALVEAIKPL AKATRRPGAD GGLGGFGALF DLKAAGYDDP 
LLVSTTDGVG TKLRIAIDAK MHATVGIDLV AMCVNDLLAQ GAEPLLFLDY FATGKLDLEV 
AKSVVAGIAD GCKLAGAALV GGETAEMPGM YGDGEYDLAG FSVGAVERDG VLPKLDKQRA 
GDLIIGVGSS GPHSNGYSLV RRVVERSGLT WDAPCPFEDG KTLAEALMAP TRIYVKSILP 
LLQSGRVKGG AHITGGGLIE NPPRCIADGL KPEFDWNAWP LPPVFDWLQR EGGITDHELR 
RTFNCGVGFI LVVAASDAEP VLAALLNAGE DAFVCGQLVA G