Gene Caul_5140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5140
Symbol
ID	5897374
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010335
Strand	+
Start bp	59740
End bp	60822
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	68%
IMG OID	641555243
Product	hypothetical protein
Protein accession	YP_001676574
Protein GI	167621789
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAACC AGACTTCCAG TCCTCGTCGG CTGCTTGTGC TCGGCGGCTA CGGGGTGGCC 
ACAGGCGGGC TCATCGAGGC CGCCGTGCAG GATCCGACCT GGTCGGTCGT CACGGCGGGC 
CGCCGCGCCG CGCCCAAGAC CCTGTTCAGC GGCGCGCCGA CGCCCCATCA CCTTCGCGTC 
GACCTGCTCG ACCGTGACGC GGTCCGCGCC GCCTTCGACG GGCTGATCGA CATCACCGAC 
GTGGTGTTCG GCGCCTATCT GGAGCGCGCC GACCCCATCG AGTCCGTGAC CGTCAACACC 
ACCCTGCTGC GCAACGCCCT GGAGGGTCTT ATCGAGGCGG GCGCACGGCC CGGCCATGTG 
ACCCTGATCA CCGGCGCCAA GTCCTATGGC CCCCATCTGG GGGCCTACAA GACGCCGGCC 
AAGGAGAGCG ATCCCAGGAT CATGGGTCCG CTTTTCTACT CGGACCAGGA GGACCTGCTG 
GCCGACTGGG CCCGGCGGAC CAACGCCGCC TGGACGGTCT TGCGACCCGA CGGCGTCTTC 
GGTCCGAGCC TGGGCTCGCC GATGAACCTG GTCAATGGCC TTGGGGTGTT CGCCGCCATC 
AGCAAGGAAC TGGGCCTGCC GCTGCGCTTC CCGGGTTCGG CGGCGACATG GTCGAGCCTG 
GTCCAGGCCA CCGACACCGA CATCCTGGGC CGCGCGGCGC TGTGGTCGCT TCGCGCCCCG 
GACGCCCGCG GCCAAATCTT CAATGTCGTC AACGGCGACC AATTTCGGTG GAAGCACATC 
TGGGCCGACC TGGCCGAGGC GTTCGACATG ACGACCGCCG AGCCCCAGCC GATGTCGCTG 
AGCGTCCAGA TGGCCGACAA GGGTCCTGTC TGGGACCGCA TCGTCAAGCG CCACGGCCTG 
GCGTCCACGC CCTATGAACA GATCGCCTCC TGGCCATTCC TCGACGCGGT GCTGAACCTG 
CCGTTCGATA TGGTTCAGAG CACGATCAAG ATTCGTCAGG CCGGGTTTGC CGACTGCATC 
GACAGCCACC AGAGCCTGAC GCGCCAACTC TCGCGTCTGC GCGCCGCCAA GCTCCTGCCC 
TAA

Protein sequence

MTNQTSSPRR LLVLGGYGVA TGGLIEAAVQ DPTWSVVTAG RRAAPKTLFS GAPTPHHLRV 
DLLDRDAVRA AFDGLIDITD VVFGAYLERA DPIESVTVNT TLLRNALEGL IEAGARPGHV 
TLITGAKSYG PHLGAYKTPA KESDPRIMGP LFYSDQEDLL ADWARRTNAA WTVLRPDGVF 
GPSLGSPMNL VNGLGVFAAI SKELGLPLRF PGSAATWSSL VQATDTDILG RAALWSLRAP 
DARGQIFNVV NGDQFRWKHI WADLAEAFDM TTAEPQPMSL SVQMADKGPV WDRIVKRHGL 
ASTPYEQIAS WPFLDAVLNL PFDMVQSTIK IRQAGFADCI DSHQSLTRQL SRLRAAKLLP