Gene Caul_1560 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1560
Symbol
ID	5899015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1649205
End bp	1650422
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	70%
IMG OID	641562048
Product	tail sheath protein
Protein accession	YP_001683188
Protein GI	167645525
COG category	[R] General function prediction only
COG ID	[COG3497] Phage tail sheath protein FI
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0705385
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGTCCT ATTTGAGCCC CGGCGTCTAC GTCGAGGAAA TCGACTCTGG ATCCCACTCC 
ATCGAAGGGG TGGGTACATC GGTGGCCGGG TTTGTGGGGG CCGCGCCCGA TCCTGACGCG 
CTGCTCGACG AGGCGGTGGC GATCAACAAC TGGAGCGAAT TCCGGCGCAA ATACGTGCGC 
GACGGCGACA AGGGCACCGA CCTGGCCAAC GCCGTCTACG GCTTTTTCCT CAACGGCGGG 
TCACGCTGCT ACGTCGTCAA TACCAAGGCC GACGGGGCGA TCGCCGGCAA GGGGCGAGGG 
CTGGACGCCC TGGCGGCCAT CGACGAGATC GCCATCATCG CCGCGCCTGG ACGCACCGAC 
GCGGCGTCCC ACGGGGCGCT GCTCGACTCG GCGGAATCGC TGAAGGACCG CGTGGCGATC 
CTGGACGCCC CGCCCCGTGT CGACGATGTC GAGGTCCTGA CCCGCGCGGC CGACGGCAGC 
GCGCCGCCGA CGCCGCCCAC AGCCGAGGGT GACGCCCCGC CGCCGCCGCG TTCGCGCGGC 
CCCAAGCCGG GCCAGCGTCC CCGGGATTCC GATGGCGGCT ACGGCGCCTG CTATTTCCCT 
TGGCTGAAGG GGCGCGACGC CATCGATCCC GACACCCAGG CGCAGATCCC GCCATCGGGA 
CACATGGCTG GGATCTACGC CCGTACCGAC AGCGAGCGCG GCGTGCACAA GGCGCCGGCC 
AACGTCACGA TCCGCGGGGC CGAGGGCCTT ACCCAGGTGT TGTCGCGGGC CGAGCAGGAC 
GTGCTCAATC CGGTCGGCGT CAACTGCATC CGCTTCTTCA CCCGGGAGGG CGTGCGGGTC 
TGGGGCGCCC GGACGCTCGC GCCAAGCTCC AGCAACTGGC GCTACCTGAA CGTCCGCCGG 
CTGTTCAACA TGATCGAGGA GTCTATCGCC ATCAGCACGC GCTGGGTGGT GTTCGAGCCC 
AATGCCGGTC CGCTGTGGAA GGACATCCAG CGCGACGTCG GGGCCTTCCT GACCCTGTTG 
TGGCGCCAGG GCGCCCTGGC CGGGGCGCGG CCCGAGGACG CCTTCTTCGT CAAGTGCGAC 
GCGGAGACCA ATCCGCCGGA GGTGGTCGAC GCCGGCCAGG TGGTGGTGGT GATCGGCATC 
GCGCCGGTGA AGCCCGCCGA GTTCGTCATC TTCCGGATCG GCCAGAGCGC GGTCGGATCC 
ACGGTCGAGG CCGCCTGA

Protein sequence

MPSYLSPGVY VEEIDSGSHS IEGVGTSVAG FVGAAPDPDA LLDEAVAINN WSEFRRKYVR 
DGDKGTDLAN AVYGFFLNGG SRCYVVNTKA DGAIAGKGRG LDALAAIDEI AIIAAPGRTD 
AASHGALLDS AESLKDRVAI LDAPPRVDDV EVLTRAADGS APPTPPTAEG DAPPPPRSRG 
PKPGQRPRDS DGGYGACYFP WLKGRDAIDP DTQAQIPPSG HMAGIYARTD SERGVHKAPA 
NVTIRGAEGL TQVLSRAEQD VLNPVGVNCI RFFTREGVRV WGARTLAPSS SNWRYLNVRR 
LFNMIEESIA ISTRWVVFEP NAGPLWKDIQ RDVGAFLTLL WRQGALAGAR PEDAFFVKCD 
AETNPPEVVD AGQVVVVIGI APVKPAEFVI FRIGQSAVGS TVEAA