Gene Caul_3543 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3543
Symbol
ID	5900998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3820981
End bp	3822237
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	71%
IMG OID	641564050
Product	O-antigen polymerase
Protein accession	YP_001685168
Protein GI	167647505
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.981417
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGCGA CCGCTCAGCT CTCGGACCGC CCGGCGCGAC ACACCCGCTG GCTGAGCGGG 
GTCGCGATCT TCGTCGTCGT GATGACGCCC TTGCTCGCCT ATCTGGCGCC GCTGGGCTTC 
GCGCCGCTGA TGGCCCTGGC GGGGCTGCTG GCGCTGCCCG CCCTGAGGCT GAGCCGCGCG 
GCCGCCCCGC CTCTGCTGAT CCTGGTGATC CTGGCCCTGT GGGCGGCGGT CAGCCTCGCC 
TGGAGTCCCG CCGCGATCGA TCCCTCGACG CTCAAGGGCT ATGGCGACAT CGAGACCCTG 
ACGGGCCTGA AGCTGTTCCT GCAACTGGCG ACCTATGGCG CGGCTGTGGT GGCCCTGCGT 
GGCCTGTCCG AGCCTGGCGC GCGCCGGGCC GGGGCGGTGC TGGCTTGGGG CATGGTCGCC 
CTGGCCGTCC TGACGGCGAT CGACTCGCTG GCCGGGGCGG CGATCTACCA GCAACTGCAC 
GCCGTGACCG GCGAGGCGAT CCGGCCGGAC GTCGCCCTGG TCAAGGTCTC GCTATCGACC 
TACGCGATGG TCCTGCTGTT CTGGCCCGTG TCGTTGATCC TCTGGCGACG GTCCGGCGCG 
CGGCCGATCT TGGCGCTCGC CGCGGGGATG ATCATCACCT CGGTGATCGG CAGCTCGGAC 
GCCTGCCTCG TCGCCCTGGC GGCGGGGGGC GCCGCCTGGC TGCTGGTGCG CTACCTGGGC 
CGGAACGGCG CCAAGGTGCT GGTCGCCCTG GTGGCCGCGC CGTTCGTGCT GGCGCCCCTG 
GCCGTTCTGA TCGGGGTCGA GACCGGCTTT GTCGCCTGGC TCCACAAGCT GGTCCCGCCC 
TCCTGGGACG CGCGGCTGAA CATCTGGACC TTCGCGGCGG ACCATATCCA GAACCACCCC 
TTCCGAGGCT GGGGCCTGGA CGCCAGCCGC ACCTTCGGCC CGGCCATTCC GCTGCACACC 
CACAACGCCC AGCTTCAGCT GTGGCTGGAA CTGGGCGCGA TCGGGGCGGC CCTGGCGGGG 
GTGTTCTTCT GCTGGCTGGC CTATGGCGTG GTGAGGATCA GCGAACGCTC GCGGGGCGAG 
GCGGCGATGG CCGCCGGCGC CTTGGTCAGC TACCTGGTGA TCGGGGCCTT GAGCTTCGGC 
GTCTGGCAGG AATGGTGGCT GGGCCTGGGC GCCCTGACGC TGATCGCCTG CGGCTTGGCG 
CGGGCGACCG CGGAGCCTGA CTGGGGTTTG CGGGACGAAC TTACCCTAAT CGAGTGA

Protein sequence

MIATAQLSDR PARHTRWLSG VAIFVVVMTP LLAYLAPLGF APLMALAGLL ALPALRLSRA 
AAPPLLILVI LALWAAVSLA WSPAAIDPST LKGYGDIETL TGLKLFLQLA TYGAAVVALR 
GLSEPGARRA GAVLAWGMVA LAVLTAIDSL AGAAIYQQLH AVTGEAIRPD VALVKVSLST 
YAMVLLFWPV SLILWRRSGA RPILALAAGM IITSVIGSSD ACLVALAAGG AAWLLVRYLG 
RNGAKVLVAL VAAPFVLAPL AVLIGVETGF VAWLHKLVPP SWDARLNIWT FAADHIQNHP 
FRGWGLDASR TFGPAIPLHT HNAQLQLWLE LGAIGAALAG VFFCWLAYGV VRISERSRGE 
AAMAAGALVS YLVIGALSFG VWQEWWLGLG ALTLIACGLA RATAEPDWGL RDELTLIE