Gene Caul_4801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4801
Symbol
ID	5902263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	5191709
End bp	5193031
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	65%
IMG OID	641565321
Product	O-antigen polymerase
Protein accession	YP_001686419
Protein GI	167648756
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.141517
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACTTT CGGCCAATTC GCGTGAAGAC CGGCGGGCCG CTTCGGCCGG CATCCCCGAC 
GACGACGGAT CGCGGGTGGA TTGGTGGCTG CTGTTTCTGC TGCAATGCAT CACCATCCCC 
CAGACCTTCT ACACGCCCGG CCTGATCGCC AGTACGGCGG TGTCCCTGAT CATGGTGGCT 
CGTCGTCCAG CGCAGTCCTT GAGCGCGATC GGCCGCTACT GGCCCACCTA TGCCCTGGTC 
CTGCTGGCCT TGGCCTCGGT GTTCTGGTCC GAACAGCCCG ACAAGACCTT GCGCACCGGC 
ATATCCGCGC TGTTGTTCGC GTTCAGCGCG ATCGTGTTCG CGACAAGGGT CGGAATTACC 
CGCGCGGTCA GCGCCCTGTT TCTCGCCAGC TTCGTGATGG CGATCATTCA GTTGGCCGTC 
CACCGCACCG GCAACGCCGT CGAGGGCCTG GTCCCCATCG GCCTGATGGG CGCCAAGAAC 
GGCTTCTCGT TCTTCGGCCA GCAGTTGCTG CTGCTGTGCC TGGCGATGGC GCTGGACGGC 
AATCAGCCAA AGCCCTTGCG GCTGCTGAGC CTGCCAGCGA CGCTGATCGC TCTCTATATA 
CTGGCCGCCA CCCATTCTGC CGGCGGCATG GTCTCGGCGG CCATCGGTTC GGCGATCTTG 
ATCGCCATGG TGGTGATCGG CAAGGCGCCG CCCCGGATGC GCGCGCTGTG CCTGGTCGCC 
TTGGTCGTTG TCTGCGCCCC GCTGGCGGCG TCCCATCAGG AAGTGGAAAC TGCCGCCAGC 
GACTTCAGCC AGGACGTGCT GAAGAAGGAC ACCACCCTGA CCGGCCGCGC CTATCTATGG 
TATCGCGCCC AGCCGATCAT CGGCCAGAAG CCCGTGCTAG GCCATGGCTT CCAGGCCTTC 
TGGACCCAAG GCAACGAGGA CGCCGAAGGG CTGTGGAACT GGGCCAAGAA CAAGTCCCGG 
GCCGGGTTCA ACTTCCACAA CACCTATATC GAGATGCAGG TCGATCTCGG CATGGTCGGC 
CTGATCGGCC TGATCGGCAT GCTGGCGATC ACCGTCCTGC TGTCCGCCGC GGCCTGGCTG 
ACCGCGCCGA ACGTCAGCCT GGCCTGGATG TTCGCTGCGA TGGTCGCCCT GCTTTCACGA 
ACGCCGACAG AGAGCATGAT CAGCAGCATC CTGCCGCAGA TCGCCACCTG GCTGGTCTAT 
GCCTGGGTGG GACTGAAGCA TCACAGCCCG GCTCCGCTCG CGACCGAGCG GACCGCGACC 
CGGGAACGGC GACAACATCA ACGAGGGGCC ACGCGTGGCC CTGTCCCCGG ACGGACCAGG 
TAG

Protein sequence

MRLSANSRED RRAASAGIPD DDGSRVDWWL LFLLQCITIP QTFYTPGLIA STAVSLIMVA 
RRPAQSLSAI GRYWPTYALV LLALASVFWS EQPDKTLRTG ISALLFAFSA IVFATRVGIT 
RAVSALFLAS FVMAIIQLAV HRTGNAVEGL VPIGLMGAKN GFSFFGQQLL LLCLAMALDG 
NQPKPLRLLS LPATLIALYI LAATHSAGGM VSAAIGSAIL IAMVVIGKAP PRMRALCLVA 
LVVVCAPLAA SHQEVETAAS DFSQDVLKKD TTLTGRAYLW YRAQPIIGQK PVLGHGFQAF 
WTQGNEDAEG LWNWAKNKSR AGFNFHNTYI EMQVDLGMVG LIGLIGMLAI TVLLSAAAWL 
TAPNVSLAWM FAAMVALLSR TPTESMISSI LPQIATWLVY AWVGLKHHSP APLATERTAT 
RERRQHQRGA TRGPVPGRTR