Gene Caul_0303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0303
Symbol
ID	5897577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	339215
End bp	340888
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	68%
IMG OID	641560787
Product	alpha amylase catalytic region
Protein accession	YP_001681938
Protein GI	167644275
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGCCG ACCGCAAGCC GTCCAGTCCC GACGCCCGAC GCCCCTGGTG GAAGGACGCG 
GTCGTCTACC AGATCTATCC GCGCTCATTC CTCGACACCA ATGGCGACGG GGTGGGCGAC 
CTGCCGGGGA TCACGGCGAA GCTCGACTAT CTGAAGGACC TCGGCGTCGA CGTGGTCTGG 
CTGTCCCCGC ACTTCGACAG TCCCAACGCC GACAACGGCT ACGACATCCG CGACTACCGC 
AAGGTGATGA CGCAGTTCGG GACCATGGCC GATTTCGACG CCATGCTGGC CGGCATGACG 
GCGCGCGGCA TGCGGCTGAT CATCGACCTG GTGGTCAATC ACAGCAGCGA CGAACACGCC 
TGGTTCGTCA AGAGCCGCAA GGGTCGCGAG AACCCCTATC GCGACTACTA CATCTGGCGC 
GACGGCAAGG ATGGCGGACC GCCCAACAAC TACAGCGCCT TCTTCGGCGG GCCGGCCTGG 
ACCTTCGACG CGGTCACGGA CCAGTACTAC CTCCACTATT TCGCCGCCAA GCAGCCGGAC 
CTGAACTGGG AAAACCCCAA GGTCCGGGCC GAGGTGCATG ACCTGATGCG CTTCTGGCTC 
GACAAGGGCG TGTCGGGGTT CCGGATGGAC GTGATCCCCT TCATCTCCAA GCCGCCGGGC 
CTGCCGGACC TGACGCCGCA GGAGCGCCGC GCGCCGCAGT TCGTCTATGC CGCCGACCCC 
AAGCTGCACG ACTACCTGCG CGAGATGCGC CGCGAGGTGT TGGACCACTA TGACACCATG 
ACGGTCGGCG AGGCGTTCGG GGTCACGCCC GATGCGGCCC GCGACCTGAT CGACAGCCGG 
CGCGGCGAGC TGGACCTGGT GTTCAATTTC GACATCGTCC GCATGGACAT CGACGGCTGG 
CGCAAGACCT CCTGGACCCT GCCCCGGCTG AAGGCGCTCT ATACCCAGCT GGACCAGGCG 
GCGGGGCCGT TCGGCTGGAA CACCCAGTTC CTGTCCAACC ACGACAATCC GCGCTCGGTC 
TCGCACTTCG GCGACGACGA TCCCGCATGG GTCGAGCGTT CGGCCAAGGT CCTGGCGACC 
CTGATCCTGA CCCAACGCGG CACGCCGTTC CTCTATCAGG GCGAGGAGCT GGGCATGACC 
AACTACCCGT TCCAGACGCT GGACGACTTC GACGACCTGG AGGTGGCCGG CCGCTGGCGC 
GACGTGAAGC ACCGGGTGTC GGAGGAAGAG TACCTGGCCA ACGCCCGAGC CATGGGCCGC 
GACAACAGCC GCACGCCGAT GCAGTGGACG GGCGACCCGC ACGGCGGCTT CACCACGGGC 
AAGCCCTGGC TGGCGGTCAA TCCGAACGCC GCGACGATCA ACGCCCAGGA CCAGGCGGCG 
CGGCCGGACT CGGTGCTGAC CCACTGCCGC GCCCTGATCG CCTGGCGGCG CGGCTCGGTC 
GACCTGCGGG AGGGCGACTA CCGCGACATC GACCCTGACC ATCCACAGGT CTTCGCCTAT 
CGCCGGGGCG AGGGGCTGCT GGTGCTGCTG AACTTCGGGC GGGAAACGGT GCGGTACGCG 
CTGCCGGAGG GCCTGGCGAT CGAGAGCGCG GCGTTCGGCG CGGTCGAGAT CGCGGGGCGG 
GTCGTGGCCT TGACGGGCTG GAGCTTCGTG ATCTTGACCG TCAGAGACCG CTAG

Protein sequence

MSADRKPSSP DARRPWWKDA VVYQIYPRSF LDTNGDGVGD LPGITAKLDY LKDLGVDVVW 
LSPHFDSPNA DNGYDIRDYR KVMTQFGTMA DFDAMLAGMT ARGMRLIIDL VVNHSSDEHA 
WFVKSRKGRE NPYRDYYIWR DGKDGGPPNN YSAFFGGPAW TFDAVTDQYY LHYFAAKQPD 
LNWENPKVRA EVHDLMRFWL DKGVSGFRMD VIPFISKPPG LPDLTPQERR APQFVYAADP 
KLHDYLREMR REVLDHYDTM TVGEAFGVTP DAARDLIDSR RGELDLVFNF DIVRMDIDGW 
RKTSWTLPRL KALYTQLDQA AGPFGWNTQF LSNHDNPRSV SHFGDDDPAW VERSAKVLAT 
LILTQRGTPF LYQGEELGMT NYPFQTLDDF DDLEVAGRWR DVKHRVSEEE YLANARAMGR 
DNSRTPMQWT GDPHGGFTTG KPWLAVNPNA ATINAQDQAA RPDSVLTHCR ALIAWRRGSV 
DLREGDYRDI DPDHPQVFAY RRGEGLLVLL NFGRETVRYA LPEGLAIESA AFGAVEIAGR 
VVALTGWSFV ILTVRDR