Gene Caul_0266 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0266
Symbol
ID	5897540
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	293624
End bp	294715
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	69%
IMG OID	641560750
Product	glycosyl transferase group 1
Protein accession	YP_001681901
Protein GI	167644238
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.585337
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGATAC TACTCGCCAC AGATGCTTGG GAACCGCAGG TCAATGGCGT GGTTCGGACC 
CTCACCAAGG TGATGGCCGA GCTGAAAGCC ATGGGCCATG AGGTCGATGT CGTCAGCCCC 
GACCAGTTCC CCACCTTCCC GCTTCCGACC TATCCGGAGA TCAAGCTGGC CATCGGCGCC 
TACGAGCCGG TGATGGAGCG CTTCAAGTCG TTCGAGCCCG AGGCGATCCA CATCGCCACC 
GAGGGTCCGA TCGGCCTGGC CGCCCGCCGG ATCTGCCTGG AGTGGAAGCT GCCGTTCACG 
ACCAGCTACC ACACGCGCTT TCCCGAATAC GTCTCGGCCC GCCTGCCGCT GCCGCTATCG 
GCCGGCTACA CCTACATGCG CTGGTTCCAC AAGCCGTCGG GCCGGCTGAT GGTGGCCACG 
CCCACCATGC GCGACGAGCT GATCCGCCAC GGGTTCCGCA ACATCTCGCC CTGGACGCGC 
GGCGTCGACA CCGACGTGTT CAAGCCCCGC GCCGAGGGCG ATCCCGACGT GTTCGAGGGG 
ATGGCCCGGC CGATCTTCCT CAATGTGGGC CGCGTGGCCG TCGAGAAGAA CATCGAGGCC 
TTCGCCGGCC TGGACCTGCC CGGCACCACG GTGATCGTCG GCGACGGCCC GCAACGCGAG 
GAGCTGGCCG AGAAATATCC GAACGTGGTG TTCGCCGGCG CCAAGTTCGG CGAGGAGCTG 
GCCCGCTACT TCGCCTGCGC CGACGTGTTC TGCTTCCCGT CGCTGACCGA CACCTTCGGC 
CTGGTGATTC TCGAGGCCAT GGCCGCCGGC GTGCCGGTGG CGGCGTTCTC GGCCCCCGGT 
CCGATCGACA TCATCCCCGG TTCGGGCGCC GGCGCCCTGG CCCCGGGCCA GACCGAAGGC 
CTGCGCGAGG CGTGCCTGGC CTGTCTCGAC ATCGACCACA CCGTGGTGCG CAAGTTCGCC 
GAGGGCTTCT CGTGGCGCGC CTGCGCCGAG GAGTTCTACA AGAACCTGCA GCCCTATCCG 
GAGCCGGAGA AGACCCGGTT CTGGCGGCGG CTGCGGCGGC TGGCGCGGCT GCGGCGCAGG 
CCGGCGGCTT AG

Protein sequence

MRILLATDAW EPQVNGVVRT LTKVMAELKA MGHEVDVVSP DQFPTFPLPT YPEIKLAIGA 
YEPVMERFKS FEPEAIHIAT EGPIGLAARR ICLEWKLPFT TSYHTRFPEY VSARLPLPLS 
AGYTYMRWFH KPSGRLMVAT PTMRDELIRH GFRNISPWTR GVDTDVFKPR AEGDPDVFEG 
MARPIFLNVG RVAVEKNIEA FAGLDLPGTT VIVGDGPQRE ELAEKYPNVV FAGAKFGEEL 
ARYFACADVF CFPSLTDTFG LVILEAMAAG VPVAAFSAPG PIDIIPGSGA GALAPGQTEG 
LREACLACLD IDHTVVRKFA EGFSWRACAE EFYKNLQPYP EPEKTRFWRR LRRLARLRRR 
PAA