Gene Caul_3602 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3602
Symbol
ID	5901057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3884925
End bp	3886223
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	70%
IMG OID	641564112
Product	UDP-N-acetylglucosamine 1-carboxyvinyltransferase
Protein accession	YP_001685227
Protein GI	167647564
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0766] UDP-N-acetylglucosamine enolpyruvyl transferase
TIGRFAM ID	[TIGR01072] UDP-N-acetylglucosamine 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGATCGTA TCGCCATCAC CGGCGGCGCG CAGCTGAACG GGATCATCCC GGTGAGCGGC 
GCCAAGAACT CGGCCATCAA GCTGATGGCG GCCAGCCTGC TGACCGACCA GCCGCTGCGC 
CTGACCAACA TGCCGCGCCT GGCCGACACC AAGTTCCTGG GCAAGCTGCT CACCCGCCTG 
GGCGCCCAGG TCGATGAGCG CGAGGGGCTG GATGGTTCGG AGACGGTGCT GCACGCCGCC 
GAGATCACCA GCGGCTTCGC GCCCTACGAC CTAGTCCGCC AGATGCGCGC CTCGTTCAAC 
GTGCTGGGTC CGCTGATCGC CCGCACCGGC CAGGCCAAGG TCAGCCTACC CGGCGGCTGC 
ACCATCGGCG CGCGTCCCGT GGACCTGCAC CTGCAGGCCC TGGAAGCCCT GGGCGCCAAG 
ATCGACCTGC ACGAGGGCTA TGTCTACGCC CAGGCCCCGC GCGGCCTGAA GGGCGCGGAG 
ATCACCTTCC CGTTCGTCTC GGTGGGCGCC ACCGAGCACG CCATGCTGGC GGCCGTGCTG 
GCCGATGGCG TCACCCACAT CCACAACGCC GCCTGCGAGC CCGAGCTGCT GGACCTGCAG 
ATCTGCCTGA ACGCCATGGG CGCCAAGGTG GAAGGGGCGG GCACCCCGAC CATCACCATC 
ACCGGCGTCG CCAAGCTGCA CGGCGCGACC CATTCGGTGA TCCCCGACCG CATCGAGATG 
GGCACCTACG CCGTGGCCGC GGCCATGGCC GGCGGCGAGG TCCAGCTGAC CCGCGCCCGC 
CCGGAACTGA TCGACAGCCT GCTGGTCAAG CTGGAAGAGG CCGGGGCCGG CGTGGTCCGC 
ACCGAGGATG GGGTGATCAT CAAGCGCGAC GGTACGCGTC TGAACGCCGT CGACGTCGAG 
ACCCAGCCCT ATCCGGGCTT CGCCACCGAC CTGCAGGCCC AGTTCATGGC CCTGATGACC 
ACGGCCAAGG GCGAGAGCCG GATCCGCGAG ACGATCTTCG AGAACCGCTT CATGCACGCC 
CCCGAGCTGA TGCGCCTGGG CGCCGACATC TCGGTGTCGG GCGGCGAGGC CATTGTGCGC 
GGCGTCGACA GGCTGGAAGG CGCCGAGGTG ATGGCCACCG ACCTACGCGC CTCGGTCAGC 
CTAGTGATCG CCGGCCTGGT GGCGCGCGGC GAGACCACGG TCAGCCGCAT CTATCACCTG 
GACCGCGGCT TCGAGCGGTT GGAAGAAAAG CTGGGCGCCT GCGGAGCCCA GGTGCGCCGG 
ATCAAGGGCG ACGCGGAAGG CGGCCCGGAT CATGACTGA

Protein sequence

MDRIAITGGA QLNGIIPVSG AKNSAIKLMA ASLLTDQPLR LTNMPRLADT KFLGKLLTRL 
GAQVDEREGL DGSETVLHAA EITSGFAPYD LVRQMRASFN VLGPLIARTG QAKVSLPGGC 
TIGARPVDLH LQALEALGAK IDLHEGYVYA QAPRGLKGAE ITFPFVSVGA TEHAMLAAVL 
ADGVTHIHNA ACEPELLDLQ ICLNAMGAKV EGAGTPTITI TGVAKLHGAT HSVIPDRIEM 
GTYAVAAAMA GGEVQLTRAR PELIDSLLVK LEEAGAGVVR TEDGVIIKRD GTRLNAVDVE 
TQPYPGFATD LQAQFMALMT TAKGESRIRE TIFENRFMHA PELMRLGADI SVSGGEAIVR 
GVDRLEGAEV MATDLRASVS LVIAGLVARG ETTVSRIYHL DRGFERLEEK LGACGAQVRR 
IKGDAEGGPD HD