Gene Caul_4807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4807
Symbol
ID	5902269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	5200739
End bp	5202169
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	69%
IMG OID	641565327
Product	polysaccharide biosynthesis protein
Protein accession	YP_001686425
Protein GI	167648762
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGGC GCTATCTTGC CGGTTACCTC TGGTCCGCGG CGAACGCCTT GGCGTCGGTG 
GTGATCCCGC TCGGCGTCTT CGTCTATTTC GCGCGCGCCT TGCCGCCCTG GCAGGTGGGC 
GTCGTCGCCC ACAGCCTGGC CTGGGTGGAG ATCATCAAGA TCTTCGCGCC CATGGGCCTC 
TACGAGGCGC TGGTCTCCAC CGACGACTAT GACGAGGTCG CCGCCCCCGC TGGCACGCTG 
CTGGGCTGCG CAGGCCTGGC GGCCTTCGTC GCCTATGCCG GGGTGATGAC CGCCGCCCCG 
CTGTGGATGC CCGCCGCCAA GACCCTGTTG CCGATCGCCC TGGCGCTCGG CGTACGGATC 
ATCTTCGACC TGATGGCGAT CCAGCCCCAG GCCGCCATTG CCCGGCGAAT GGACTTCAAG 
CGGCTGGGCA TACGCAGCCT GGTGGCCAAT GTGGGCGCGG CCGCCGGCGG CGGCGCCGTC 
GGCATGATCG TCAGCCCCCT GTACGGACTG ATCGCCTACT ACATCCTGCA GTCCATGATC 
CTGTGGCTGA CCACCGTGGC CGGCACCTCG GCCGTCGCCC CCCTCAGCTT CGCCTGGGGC 
AAGCTCGGCG AAATCGCCCG CACCAGTTTC GTGGCCACCC AGGTGCGGTC GCTGGCGACG 
ATCAACAACT TCGCCGACCA GGCCATCTCG GCCGTCTTCG TCGGCCCGGC GCTGATCGCC 
CACTACAACC TCGGCAAGCG GGTGGAGATC GCTCAGATCA CCGCCGCCAG CTCGTTCGCG 
TCAATCCTGT TCCAGCCGCT GTTCGCGCGC CGCGATGACG ACAGCGCGAT CGCCCCGGCC 
TTCCAGCAGA GCCTGAGAAT GATGGCCCTG CTCTGCGGCC TGCCCACCGC CCTCTTCGTC 
GCCAACGCCC ACGCCCTGAT CCTGCAGGTG TTCGGACCGC ACTGGCAGGA AGCCGCGCCC 
GTCGCCATGG CCCTGGCCCT GGGCGGCCTG GCGCGGGCGA TCGGTGGGGT CAGCGGCGCC 
TACATGTCGG TCAACAACCA AAATTCGATG TTGCGCAACC GGTCGATCGT CTCGGCCGCG 
GCCGGCGTCT CCATTGTCTG CTTGACCGGA TGGATCGGCT TGGCGGCGAT GGCCTGGTTG 
CTGGCGATCA AGAATGGCCT GATCACGGTC TGGCTGGGTT GGGGCACGCG GAAATTGGCG 
CCGACACCGG TGTTCCTGTG GACGTCGATC GGCTTGCCGA GCGTGTTCCT GGCGTCGGCC 
TGGGCGGGGT CCGCCGTCGC CCAGGCGCTG GTCCCCATCC ACACCATGCT GGACCTGGCC 
ATCGTCATGA CGTGCTCAGG CGTCGCCTGC GCTCTCGGCG CGGCCGTTGC CTACCGGCGA 
GAACTGGCCT CGGCCGTGCG GCTGGTGCGC ACCCGCGCGC GGTCGGTCTG A

Protein sequence

MSRRYLAGYL WSAANALASV VIPLGVFVYF ARALPPWQVG VVAHSLAWVE IIKIFAPMGL 
YEALVSTDDY DEVAAPAGTL LGCAGLAAFV AYAGVMTAAP LWMPAAKTLL PIALALGVRI 
IFDLMAIQPQ AAIARRMDFK RLGIRSLVAN VGAAAGGGAV GMIVSPLYGL IAYYILQSMI 
LWLTTVAGTS AVAPLSFAWG KLGEIARTSF VATQVRSLAT INNFADQAIS AVFVGPALIA 
HYNLGKRVEI AQITAASSFA SILFQPLFAR RDDDSAIAPA FQQSLRMMAL LCGLPTALFV 
ANAHALILQV FGPHWQEAAP VAMALALGGL ARAIGGVSGA YMSVNNQNSM LRNRSIVSAA 
AGVSIVCLTG WIGLAAMAWL LAIKNGLITV WLGWGTRKLA PTPVFLWTSI GLPSVFLASA 
WAGSAVAQAL VPIHTMLDLA IVMTCSGVAC ALGAAVAYRR ELASAVRLVR TRARSV