Gene Caul_5051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5051
Symbol
ID	5902513
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	5450508
End bp	5451581
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	70%
IMG OID	641565572
Product	hypothetical protein
Protein accession	YP_001686669
Protein GI	167649006
COG category	[S] Function unknown
COG ID	[COG4320] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.684708
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0897321
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCT CGATCAAGGC GTCGGTGAAA GCTTACGAGG CTTGGCTAGA GGCGGCGCTC 
GGCGGCGACC TCGTCGAGAC CGATCTTCGC GACAAGCACA AGAAGATGCG GGACGGCGCG 
TTCCCGTTCC TGCGGGCGAC CTACTGGCGG TGGGCCGAGA CCATCCTGGA GATTTGCCCC 
GATCTGGCGA CCGCGCCGCC GGTGCTGGCG ATCGGCGACA CCCATGTCGA GAATTTCGGC 
TGCTGGCGCG ACGCCGAAGG CCGGCTGGTC TGGGGGGCCA ACGACTTCGA CGACGCGGCG 
GTCATGCCCT ATCCGCTCGA CCTGGTGCGC CTGGCGGCCA GCGCCCTGCT GGCGCGGAAG 
GGCGGCGCCC TGGACTTTCG CCAGGTCTGC AACAGCATCC TGGCCGGCTA TGTTGCCGGC 
CTGGCTGATC CTCGGCCGTT CATTCTGGAG CGCGCGCATG GCTGGCTGCG CGAGGCGGTG 
ATGCTGTCGG AGCAAGAGCG CGCCGCGTAC TGGCCAAAGT ACGACAAGCC GGACGACCCG 
TCGATCCAGC CGCGCTACCT GCGCCTCCTG CGCGAGGCCA TGCCGGATCC GACCGCCGCC 
TTCGCCGCCT TTCCACGATC GGCGGGGCTG GGCAGCCTGG GCCGGCCGCG CTTCGTCGCC 
CGGACGGCAT GGCGCGGCGG ACCGGTGCTG CGCGAGGCCA AGGCGGTGGT CGTCTCGGCC 
TGGGTGCTGC GTCATGGCGG CGACGCGACG GTTCGGATCG CCGACATCGC CGGGGGTCGC 
TTTCGGGCGC CCGATCCGCA CTACCGTGTC GCCGACGGCG TCGTGGTCCG TCGCCTGTCG 
CCCAGCAGCC GAAAGATCGA GGCCAAGGAC TCGAAGGACC GGGCGCTGCT GCTGTCGCTC 
GACATGCTGA CCGCCATGGG CCGTGAGATC GCCGCTTGCC ACGCCGGCGA CCGTGATCGC 
GCCCCGGCGC TGGGCGAGCA CCTGCGGAGC CTGACGCCAG GCTGGCTGCA GGACCACGCC 
AGGGTCGCGG CGAGTCAGGT CGAGGCGGAC CAGGCGGCCT TCTCTAAAGA ATGA

Protein sequence

MTTSIKASVK AYEAWLEAAL GGDLVETDLR DKHKKMRDGA FPFLRATYWR WAETILEICP 
DLATAPPVLA IGDTHVENFG CWRDAEGRLV WGANDFDDAA VMPYPLDLVR LAASALLARK 
GGALDFRQVC NSILAGYVAG LADPRPFILE RAHGWLREAV MLSEQERAAY WPKYDKPDDP 
SIQPRYLRLL REAMPDPTAA FAAFPRSAGL GSLGRPRFVA RTAWRGGPVL REAKAVVVSA 
WVLRHGGDAT VRIADIAGGR FRAPDPHYRV ADGVVVRRLS PSSRKIEAKD SKDRALLLSL 
DMLTAMGREI AACHAGDRDR APALGEHLRS LTPGWLQDHA RVAASQVEAD QAAFSKE