Gene Caul_4850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4850
Symbol
ID	5902312
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	5245466
End bp	5246557
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	72%
IMG OID	641565370
Product	aminoglycoside phosphotransferase
Protein accession	YP_001686468
Protein GI	167648805
COG category	[R] General function prediction only
COG ID	[COG3178] Predicted phosphotransferase related to Ser/Thr protein kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.191997
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGCTCTG ATCGCGAAAC CCTCAAGACG GCCTTTCTGA CGGCCAACGG CTTCGGCGAC 
GCCCGCCGCG AAGCCCTGAG CGGCGACGCC TCGACCCGGA GCTACGAGCG CCTATATCGC 
GGCGACGAAC GCTTCATCTT CATGGACCAG CCGCCGGCCC TGGAGAGCGT GGTCTGTCCG 
CCGGGCGCCA GCGACGCCGA GCGCCTGGCC CTGGGCTACA ACGCCGCCGC CCGCCTGGCC 
GCCGGCTCGG TCGCCGCCTT CGTGGCCACG GCCGCCTATC TGCGCGGGCG CGGCCTGTCG 
GCCCCAGCCA TCCTGGCCCG TGACATCGCG GCGGGCCTGG CGGTGCTGGA AGACCTGGGC 
GACGGCCTCT ACGCCACGCT GATCGCCGAC GGCCAGGACG AGACCCCGCT CTACGAGGCC 
GCCGTCGACG TCCAGGTGGC CCTGCACGGC GAGACCCCGC CGGACGTCCT CACCGCCGAA 
GGCGGCGTGG CCTGGCCGCT GCTGACCTAT GATGCGCTGG CCCTGAAGAT CGCCACCGAC 
ACCTTCCTGG AGTTCTGGCC GAAGTTCTCG GGCCTGGCGC CATTCAGCGA CGCCGCCGTG 
GCCGACTGGG ACGCCCTGTG GGCGCCGGTC TGGGTGCGCG GCGAGGCCGG CGCCAGCGTC 
TTCACCCACC GCGACTATCA CGCCCAGAAC CTGCTGTGGC TGCCCGAGCG CGACGGCGTG 
GCCCGCGTGG GCCTGCTGGA CTTCCAGGAT GCCCTGCGCG CCCACCCGGC CTGGGATCTG 
ACCCACCTGC TGCAGGACGC CCGCCGCGAC GTCTCGCCGG AGTTGGAACA GGCCATGCTC 
GACCGCTACC TGACCGCACG GCCCTTGATG GACCGCGAAG CCTTCATCGC CGACTACCGC 
GCCCTGGCCG CCTCCAACGC CGCGCGGATC CTAGGCCGGG TGTTCGCCCG CCAGGCCCTG 
CTGGGTCGGC CGCAGTACGA GGCCTACATG CCGCGCACCT GGCGCTATCT GGAGCGCAAT 
CTCCAGGACC CGGCGATGGC GGGGCTGAAG GCCTGGTTCG ACCGGTACGT GCCGTCGGCG 
TTCCGCCGAT GA

Protein sequence

MSSDRETLKT AFLTANGFGD ARREALSGDA STRSYERLYR GDERFIFMDQ PPALESVVCP 
PGASDAERLA LGYNAAARLA AGSVAAFVAT AAYLRGRGLS APAILARDIA AGLAVLEDLG 
DGLYATLIAD GQDETPLYEA AVDVQVALHG ETPPDVLTAE GGVAWPLLTY DALALKIATD 
TFLEFWPKFS GLAPFSDAAV ADWDALWAPV WVRGEAGASV FTHRDYHAQN LLWLPERDGV 
ARVGLLDFQD ALRAHPAWDL THLLQDARRD VSPELEQAML DRYLTARPLM DREAFIADYR 
ALAASNAARI LGRVFARQAL LGRPQYEAYM PRTWRYLERN LQDPAMAGLK AWFDRYVPSA 
FRR