Gene Caul_5355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5355
Symbol
ID	5897124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010333
Strand	-
Start bp	66798
End bp	68855
Gene Length	2058 bp
Protein Length	685 aa
Translation table	11
GC content	69%
IMG OID	641550647
Product	hypothetical protein
Protein accession	YP_001672133
Protein GI	167621625
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.323781
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACA CCCAGACCGT CTCCCCAACC CGGATGGACG AGATCACCGT CCGCCTCGGC 
GACCTTGGCC TCGCGCCCGA GAACCTTCGC TTCCAGGAGC CGGCGGACGA CGGCGTGCCC 
CAGCTCGCCG AAACCGTGCT GGCCGCCGGC GTCCTGATCC CGCCGATCGT GCGGGCGGGC 
CTCAAGAGCG AGCAGGCCTT CATGACGCTG GACGGCCGCC GCCGCCGGTT CAGCTTGCTG 
GTCCTGCGCG ACCGCGGCGA CATCGACGAC GACTATCCCG TCGTCTGCAA GCTGGCGGCG 
AGCAAGGCCC AGCAGGCCGC CGCGATCATC CTGCCCAACG CCGAGGTCGC CCCGGTCCAC 
ATCGCCGACA TCATCGGCGC CATCGGTAAG CTGCGCAAAG CCAAGATGGA CACCGCCGGC 
ATCGCCCGCG CCCTGGGCTA CGCCGAGCTG GAGATCAAGC GCCTGGAGGC CCTGTCAGCT 
GTCCACCCGA GCGTGCTGAA GGCCCTGCGC CTGGGCAAGC TGAACCTCAA GCAGGTCCGC 
CTGTTCGCGC GGATGCCCGA CAAGAAGCAG CAGGGCGAGT TGGCGGAGAC CGCGCTCGAC 
GGTCACTTCC ATGACTACCA GCTGCACCAG GTGATCAACG GCTCGCGCCT GACCATCGAG 
GACGACCGCT TCGGCCTGGT CGGGATGGCC CGCTACACCG CCGCCGGCGG GCGGGTCGAG 
TCCGACCTGT TCGCCGAACT GGCCGATGTC CTTCTCGATC CCGGCAAGCT GCAGGATCTG 
TGGCGGGAGC GCGCCGCCCC CTTCGTCGAG GGGTTCAAGC AGCTTGGGCT CGCCGTCTAC 
ATCGGGCGAG ACGCCGGCTT CCGGGCCCCG GAAGGCTTCG AGACCCTGCC CTACGTCTAC 
CCCGGCGACC TGACCGATGA GACCAAGGCG GTGCTAGCGG CCGCGCGGCA GCGGGTGGCC 
CAGGCCGCGC GTGACCTCGG CGGTGTCGAT CTCGCCGCCG ACGATGCGGC GCTGACGATC 
TTCCCCCTGC TGCAGGCGAA GATGGAGGTG GCCTCGGCTC CGCTGAAGCG GCTGGCGCTC 
GGCGCCGTCA TCTTGTCGCC GGACGGGGCG ACGGGGATCT CGGCCGAGTT CTTCGCCGCG 
CCGGTGTCGG AGGAGCTGCT GGATGGGGCT GGGGATGACT TGGCTGGGGA GAATGGGGCC 
GACGAGGACG ATGCGAGCGG CGGCCAGGGC AACGGCGCGC GCTACGGTCG CTCCGCCAGC 
GACGTGGAAG TGCCCAAGGC CGACGTTGAT GTCGAGGGCT CCAGCCACGT CCTGCACGAG 
ACCCGCACCG ACGTGGCTAC GCGCGGGCTG ATCCGTGATC TTGCCGACAA TCCGGCCGCC 
GCCCTGACAG CCTTGGTCGC CCAGCTGTTC AAGCAGCTGG CGCTGCAAGG CGGGCCTGGC 
CATGAGGAGT CGGCGCTGGC CATCAATGCC ACCGGCTACC GCCGTGGCCA GACGCCGGCG 
ATCGGCGCTC TGGACGGTGA TATTCGAGCC CGGCTGGAGG CGCGGCGTGT GGTCTACAAG 
GCCTCGGGAC TTCGTCCCAT CGCCTGGGTC GACGGCCTCG CCCACGGCGA CAAGATGGCC 
TTGCTGGCGG AACTTACCGC CATCACCCTG AACCTTCGGG AAGCCCGCAC CAGCAACATC 
CGCGACTCCG CACGGGCCGA AGCCATCGAG CTGGCGCAAC TTTGCGCCGC CGACATCTCG 
GCGCACTGGA CGCCTGACCC CGACTACCTG GCTGTCCACT CCAAGAGGCA GCTGCTGGTG 
CTGCTGGACG AGATGCAGTT AGACGATCCT CGGGCCAAGA CCCTAAAGAA GGACGAGCTA 
GTCGTCCTGG TGGCTGACGC CGCGGCCGAG CGCCAGTGGG CGCCGCAGGT GCTGTCCTGG 
GAGAGCACCA CGGTTGAGAC GCAGCCGCCG GCCGATGAGG ACCAGGACCA GGACGACGGT 
GATGAGGCCC TGGCTGACGA CCTGACACCA GGCCCGGCCG CACCTTCCCC GGAGGTCTCG 
GTTCAACACG CGGCCTGA

Protein sequence

MTDTQTVSPT RMDEITVRLG DLGLAPENLR FQEPADDGVP QLAETVLAAG VLIPPIVRAG 
LKSEQAFMTL DGRRRRFSLL VLRDRGDIDD DYPVVCKLAA SKAQQAAAII LPNAEVAPVH 
IADIIGAIGK LRKAKMDTAG IARALGYAEL EIKRLEALSA VHPSVLKALR LGKLNLKQVR 
LFARMPDKKQ QGELAETALD GHFHDYQLHQ VINGSRLTIE DDRFGLVGMA RYTAAGGRVE 
SDLFAELADV LLDPGKLQDL WRERAAPFVE GFKQLGLAVY IGRDAGFRAP EGFETLPYVY 
PGDLTDETKA VLAAARQRVA QAARDLGGVD LAADDAALTI FPLLQAKMEV ASAPLKRLAL 
GAVILSPDGA TGISAEFFAA PVSEELLDGA GDDLAGENGA DEDDASGGQG NGARYGRSAS 
DVEVPKADVD VEGSSHVLHE TRTDVATRGL IRDLADNPAA ALTALVAQLF KQLALQGGPG 
HEESALAINA TGYRRGQTPA IGALDGDIRA RLEARRVVYK ASGLRPIAWV DGLAHGDKMA 
LLAELTAITL NLREARTSNI RDSARAEAIE LAQLCAADIS AHWTPDPDYL AVHSKRQLLV 
LLDEMQLDDP RAKTLKKDEL VVLVADAAAE RQWAPQVLSW ESTTVETQPP ADEDQDQDDG 
DEALADDLTP GPAAPSPEVS VQHAA