Gene Caul_1595 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1595
Symbol
ID	5899050
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1684548
End bp	1685951
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	70%
IMG OID	641562083
Product	O-antigen polymerase
Protein accession	YP_001683223
Protein GI	167645560
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAAGCAC AACAACACGA AGACCGGCCC GACCTCCCGC GCAAGCTGGA AGCGCTGGCC 
TGCGGCTTCG TGCTGTTCAT GCTGTCCAAC GCCTTCATCG GCCCGCTGCT CGACCCGCTA 
CAGGCTGGCG GCGAGAACAT TCCGGTGCTG CGGCTCATGT GGCTGCCGGT CTACGCCCTG 
ATCCTGGGCC TGGTCGCCTG GCGCGCCCCC CGGCTGATGC GCTTCTGGCT GCCGGCCGCC 
ATGCTCAGCC TGCTGGTCTT CTGGGTGTTC GCCTCGGCCT CGTGGTCGCT GAACCCCGGC 
GCCACCAACC GCCGGGCCTT GGCGGCGGCC TTCACCACCC TGTTCGGCTT CTATTTCGCC 
GCCAGCTTCG ACGGCAGGCG GATGGCCGAG ATCATCGCCG CCACCTTCCT GCTGCTGGCG 
ATCGGCGGGG CGCTGACGGC CGTGGCCTAT CCGACCATGG GCGTCCACCA CGACATCAAC 
GCCGGCGACT GGCGCGGCCT CTGGTACGAG AAGAACCAGA TGGGCGCGAT GATGGTCTAC 
GGCGCCCTGG CGGCGATGGC CGCCATCCTG GCCGGCTCGA CCCGGCGCAA ACAGCTTGTC 
TTCACCATCG TGCTGTGCGC GGCCCTGATC GTCATGACCA AGTCCAAGAC CTCGCTGGTG 
GTCCTGATGA TCGGCCTCCT GGGCTCGATG CTGCTGGCGG CCATGCGGCG CGGACCGGCC 
ACGGCGGTGA TCGTCGTCTG GCTGGGCGTC ACGGTGATCG CCACCACCGT GATGGTCCTG 
TGGCTGGCCC CCGACCTGGT GTTCAAGGCC CTGGGCAAGG ACCCCACCCT GACCGGCCGC 
ACCGACATCT GGGCCGCCGT GCTGCGTCAG TCGGCCAAGG CCCCGCTGAC CGGCTACGGC 
TACGCGGTGT TCTGGACGCT GGAGTCCCAG CCCGCCCAAT GGATCCGCAA GGAGACTGGT 
TGGCTGGTGC CCACCGCTCA CAACGGCTGG CTCGACATCC TGGCCCAGCT GGGCTGGATC 
GGCGTGGGCC TGTGCGCCCT GGTGCTAGGC GGGTCCCTGC TGGTCGCCCT GGTCCGCTTT 
CGCAGGGTGC GGGACGGCTA TTGGGCCACC CTGTTCCTGG CCATCTTCCT GATGACCACC 
TTTTCCGAGA GCTTCATCCT GGAGCGCAAC GGCATCGCCT GGGCCCTGGC CTGCGCGGCG 
GTGACGCGGC TGCTGGGACC AGTGCTGGCG CTGGGCGCGC CGCGCGAGAA GGTCGTCCGC 
GCGCCGCTGT TCGCCGAGCC GCCCCTGGCC TGGTCCCTGG CCCCGCCGGA CTCCGCGCCG 
GAGATCTGGA CGCCCACGCC CGCCCGTCGG CCGGCCTTCA CGCCCACATT TGGCAAGCGC 
GCGGTCTCGC CTTTCGCCGC TTAG

Protein sequence

MEAQQHEDRP DLPRKLEALA CGFVLFMLSN AFIGPLLDPL QAGGENIPVL RLMWLPVYAL 
ILGLVAWRAP RLMRFWLPAA MLSLLVFWVF ASASWSLNPG ATNRRALAAA FTTLFGFYFA 
ASFDGRRMAE IIAATFLLLA IGGALTAVAY PTMGVHHDIN AGDWRGLWYE KNQMGAMMVY 
GALAAMAAIL AGSTRRKQLV FTIVLCAALI VMTKSKTSLV VLMIGLLGSM LLAAMRRGPA 
TAVIVVWLGV TVIATTVMVL WLAPDLVFKA LGKDPTLTGR TDIWAAVLRQ SAKAPLTGYG 
YAVFWTLESQ PAQWIRKETG WLVPTAHNGW LDILAQLGWI GVGLCALVLG GSLLVALVRF 
RRVRDGYWAT LFLAIFLMTT FSESFILERN GIAWALACAA VTRLLGPVLA LGAPREKVVR 
APLFAEPPLA WSLAPPDSAP EIWTPTPARR PAFTPTFGKR AVSPFAA