Gene Caul_3611 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3611
Symbol
ID	5901066
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3894635
End bp	3896641
Gene Length	2007 bp
Protein Length	668 aa
Translation table	11
GC content	68%
IMG OID	641564122
Product	hypothetical protein
Protein accession	YP_001685236
Protein GI	167647573
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.431512
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCCCTGG CGCTATGGGC GACGTCGGCC CTGACCTCGT CGCCGGCGCT CGCGGCCTCT 
CCGAGGCTCG ACGCCCACGC CATAGCCGCC GCCCGGTTCG GCAACGACGC GCCCTGGTAC 
GAGGACAATA TCCCGCTGTT CGAGTCCTCC GATCGCAAGC TCGACGAGAT CTACTATTAC 
CGTTGGAGCG TGTTTCGGGC CCACCAGCGC GACCTTGGAC CGCGCGGCTA CATCACCACC 
GAGTTCCTGG ACGACGTCGG CTGGCAGCGC GAGCCCTATG CCAGCCTGAA CGACGCCACC 
GGCTTCCACA TCCAGGAGGG CCGCTGGCTG CGCGACCGGC GCTATGCCGG CGACTATGTC 
GACTTCATGT ACGAGGGCGG CGGCAACGAC CGCCACTTCG CCGAGGCCAT AGCCGACGCC 
ACCTTCGCCC GCTTCCTGGT CGATGGCGAC CAGGACGCCG CCACCCGGCA TCTCGGCGCG 
ATGAAGCATA TCTACGCCCT GTGGGACGAC CGCTACGACT TCGACAAGGA GCTCTACTGG 
ATCGAGCCGC TGCTGGACGC CACCGAATAT ACCATCAGCT CGATCGACGC CTCGGGGGGC 
ACGGACGGCT TCAGGGGCGG CCACGCCTTC CGGCCCTCGA TCAACAGCTA CATGTACGCC 
AACGCCCGGG CGATCAGCCG GCTGGCGGCC CTGACCGGCG ACACGGCCAC CGCCGCCGAC 
TACGCCGCCC GGGCCGACGA CCTGAAGGCC CAGGTGCAGA AAAGCCTGTG GAGCCAGGAC 
TTCGCCCACT TCATCGACCG CTACCAGGTC AACAACGAGC ATGTGAAATA CTGGGACCCG 
ATCCGCGGCC GCGAACTGGT CGGCTACCTG CCTTGGACCT TCGGCCTGCC CGACGACACG 
CCGGCCTACG CCCAGGCCTG GAAGCACGCG GTCGATCCGA ACCAACTGGC CGGCCCGGCG 
GGCCTGCGCA CGGTCGAGCC GTCATATGAG CACTACATGC GCCAGTACCG CTACATCAAG 
GAAACGGGCG AGCCCGAGTG CCAATGGAAC GGCCCGGTGT GGCCGTTCCA GACGACCCAG 
GTGCTGACGG GCCTCGCCAA TCTGCTCAAC GACTATCGCC AGGACGTGGT CACCCGCTCG 
GACTACGCCC GGATGCTGGC CCAGTACACG CGGCTGCACT TCAAGGACGG TAGGCCGGAC 
CTGCAGGAAG ACTACGACCC GGCGACCGGC AAGGCCATCG TCGGCCTGGC CCGCAGCCAC 
CACTACAATC ACTCCGGCTA TGTCGATCTG GTGATCAGCG GCCTGGTCGG CCTGCGCCCG 
CGCGCCGACG ACGTGCTGGA GGTCAACCCC CTGGCGCCCA GCGCCCCGGC GGACCCGAAT 
TTCCTGAAAT ATTTCCGCCT GCAGGACGCG CCCTATCACG GCCATCTGGT CGGGATTTCC 
TGGGACGCCG ACGGTTCGCG CTACGGCCGC CAGGGGCTGG TGGTGACGGT GGATGGCCAG 
GAAGTCACCG CCTCGCCGAC CCTAGCCAGA CTGACCATCC CGCTAGCCCG CAAGACGCCC 
GCGCCGATCG CCCGGCCGAT CGATCTGGCG GTCAACCTAG TGCGCTCGGA CTATCCGCGC 
GGCTCGGCCT CGACGGGGGC CGACGCCAAC ACCGTGCACC AGGCGCTGGA CGGGCGCGTG 
TGGTTCTTCC CCGAGATGGC CAACGGCTGG TCGCCGGGCG CCGGGCAGAA GCAACCCTGG 
TTCGCCGTGG ATTTCGGCAA GGCGACGTCG GTGCGTTCGG CCGAACTCAG CTTCTTCGCC 
GACGACCAGA CGCTGGCCGC GCCGGCGCGC TATCGACTGG AGGCGTGGAA GGACGGCAAG 
TGGGTCGAGG TCGCCAAGGT TCCCTCCCCA CTGGCCAACG GCGTCGACCG CGCGGCCTGG 
GCGCCGGTTG TGACCATGAA GCTGCGGGCG GTGTTTGAGC TGCCGCCCGG CAAGGACATG 
CGGCTGGTCG AGATGAAGGT GTTCTAG

Protein sequence

MALALWATSA LTSSPALAAS PRLDAHAIAA ARFGNDAPWY EDNIPLFESS DRKLDEIYYY 
RWSVFRAHQR DLGPRGYITT EFLDDVGWQR EPYASLNDAT GFHIQEGRWL RDRRYAGDYV 
DFMYEGGGND RHFAEAIADA TFARFLVDGD QDAATRHLGA MKHIYALWDD RYDFDKELYW 
IEPLLDATEY TISSIDASGG TDGFRGGHAF RPSINSYMYA NARAISRLAA LTGDTATAAD 
YAARADDLKA QVQKSLWSQD FAHFIDRYQV NNEHVKYWDP IRGRELVGYL PWTFGLPDDT 
PAYAQAWKHA VDPNQLAGPA GLRTVEPSYE HYMRQYRYIK ETGEPECQWN GPVWPFQTTQ 
VLTGLANLLN DYRQDVVTRS DYARMLAQYT RLHFKDGRPD LQEDYDPATG KAIVGLARSH 
HYNHSGYVDL VISGLVGLRP RADDVLEVNP LAPSAPADPN FLKYFRLQDA PYHGHLVGIS 
WDADGSRYGR QGLVVTVDGQ EVTASPTLAR LTIPLARKTP APIARPIDLA VNLVRSDYPR 
GSASTGADAN TVHQALDGRV WFFPEMANGW SPGAGQKQPW FAVDFGKATS VRSAELSFFA 
DDQTLAAPAR YRLEAWKDGK WVEVAKVPSP LANGVDRAAW APVVTMKLRA VFELPPGKDM 
RLVEMKVF