Gene Caul_3967 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3967
Symbol
ID	5901429
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4295366
End bp	4296529
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	55%
IMG OID	641564488
Product	hypothetical protein
Protein accession	YP_001685590
Protein GI	167647927
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0370004
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.937965
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACC ACGACGACCA CGAGTTCTTC AAGCTGCGGA AGGATGGGAA AACCTACCTG 
TCCAAGGTCT TCCAATGGTC GGGTCAGACC GCAGAGCGGA TCCGGCACGT CCGAATGGTC 
TTCGAAGGCA GCGACGAACA ACACCTGGGC GAGATCGAAG GCGCGTTGTG CCTTCGGTTG 
ACGGGCGAGA CACGGAAGAC CCAGGTCACA GCATTGGTCA GTCAGGACGC CAATGAGATT 
AAGCGGCTCA CACTGCAGAC CTTTAAAGCG AGGCCGGGAT TTACGCAGAG CTTCGTGAAA 
GAGGAATTTA CCTTCCGCGG TGATGAGTTT GAACGACTTC TGGGCTTTCT GAATCAGATC 
AAGTTTGTTG ACCTGACCAA TGAAGAGAAC TTCCAGATTG AAGATATCTC GAAAAAAGCA 
GGACCGAAGG CCGTCATTGA TGCTTCGGAT CGGGGCATAA TCGACGCGAT CCAAGGCCTC 
TCAGGAAATC AGCGCGCCGG CCTGCTGCGC AATCTCCAAG GCTCGCTCAC CTCAGATGAA 
ATCAATACGC TCCTGGGCCG CAAAGAGGGC CTCGCCGAGT TCGAACAACA GCTCTCTTCT 
GGAAATTGGA GCGAGGCTTC CTGGCAGGAT TTCTTTGAGC GCGAGCAGTG GGTGTTCGGC 
TACGGCCTTG ATTATCGGAT TATGCGGCAC TTCGATCGTG AAATGGTCGT CGGAGGCGCG 
GGAACAGACA ATCAGAATAA GCCCACCGTG GACTTCCTCA CCACGTTCAC GGACTACACC 
GTGCTGGTCG AGATCAAGAA ACCGGCCACA CCCATCTTTA AACGTCGGGC TGGCGGTAGA 
GCCGGAACGT GGGATTTTAG TTCCGAATTC ATGTCGGCGG TGTCGCAGAT TCTTGAACAG 
AAGGCTGAAT GGCTGGCCTT CTCGCAGCAA GGCGATCACT ACAACAAGGA CGGCACAGAA 
CGCCTCGAAG CTCGTACCCG AAGTCCCAAA GCGATTCTCG TCATTGGATC ACGAGCAGAG 
TTTGATCCCG TCCACGGAGT TCGGGATGCT CGTGTGAAGC AGGACACATT CGAGCTGTTC 
CGGCGAGAGA CCCGGAGCAT CGACATCATC ACGTTCGATG AGCTGGTGGA TCGCGCTCGC 
TTCATCACGA AGAACACGCG TTAG

Protein sequence

MSDHDDHEFF KLRKDGKTYL SKVFQWSGQT AERIRHVRMV FEGSDEQHLG EIEGALCLRL 
TGETRKTQVT ALVSQDANEI KRLTLQTFKA RPGFTQSFVK EEFTFRGDEF ERLLGFLNQI 
KFVDLTNEEN FQIEDISKKA GPKAVIDASD RGIIDAIQGL SGNQRAGLLR NLQGSLTSDE 
INTLLGRKEG LAEFEQQLSS GNWSEASWQD FFEREQWVFG YGLDYRIMRH FDREMVVGGA 
GTDNQNKPTV DFLTTFTDYT VLVEIKKPAT PIFKRRAGGR AGTWDFSSEF MSAVSQILEQ 
KAEWLAFSQQ GDHYNKDGTE RLEARTRSPK AILVIGSRAE FDPVHGVRDA RVKQDTFELF 
RRETRSIDII TFDELVDRAR FITKNTR