Gene Caul_5003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5003
Symbol
ID	5902465
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	5403891
End bp	5404940
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	68%
IMG OID	641565524
Product	dehydratase
Protein accession	YP_001686621
Protein GI	167648958
COG category	[I] Lipid transport and metabolism
COG ID	[COG2030] Acyl dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGA CCGATCCAGG GAACTATTTC GAGGACTTCC GCCTGGGCCA GGTGATCGTC 
CACGCCACTC CGCGGACGAT CACGGCGGGC GACGTGGCGC TGTACACGGC GTTGTACGGA 
CCGCGCTTTT CGCTGTTCTC GTCGGACGCC TTCGCGCGCG ATTGCGGGCT GGAGACCGCG 
CCGGTCGATC CGTTGGTCGC CTTCCACGTG GTGTTCGGCA AGACCGTGCC CGACATCAGC 
CTGAACGCCG TGGCCAATCT CGGCTACGCC GAGGGCCGGT TCCTGGCCCC CGTGCATCCG 
GGCGACACCC TGGCGGCCAA GTCCGAGGTG ATCGGGCTGA AGGAGAACTC CAACGGCAAG 
ACGGGCGTGG TCTATGTGCG CACCACCGGG ACCAACCAGC GGGGCGTGGC CGTGCTCAGC 
TATGTGCGGT GGGTGATGGT GCGCAAGCGC GATCCGGGCG CGGTGGTCGA GGGGCAGAGC 
ATCCCGGCGC TGGCCGGGGC CGTGGCCGCC GAGCACCTGA CCCCGCCGCC GGGCCTGAGC 
TTTTCCAAGT ACGACTTCGC CCATGCCGGC GCGCCGCACG CCTTCGAGGA CTATGCGGTC 
GGCGAGAAGA TCGACCATGT CGACGGCATG GTGGTCGAGG AGGCCGAGGC CCAGATGGCC 
ACGCGGCTGT GGCAGAACAC CGCCAAGGTT CATTTCAACC AGTTCGAGCG CGCCAAGGAC 
CCCTCGAGCC GGCGGCTGGT CTATGGCGGG GTGGTGATCT CGACGGCCAA GGCCCTGTCG 
TTCAACGGGC TGCAGAACGC GGGCCTGATC CTGGCGATCA ATGGCGGCCG CCATGTCAGC 
CCCTATTTCG CCGGCGGCAC GGTGTTCGCC TGGTCGGAAG TCCTGGACAA GGCCGACCTG 
GGTCACGGGA TCGGCGCCTT GCGCCTGCGG CTGGTGGCGA CGGTCGATCG GCCTTGCGCC 
GACTTCCCCG ACAAGGACGA GGCCGGGGCC TACGCGCCCG GCGTCATCCT CGACTTCGAC 
TACTGGGCGG CGGTTCCCAA GCGTGGCTGA

Protein sequence

MSKTDPGNYF EDFRLGQVIV HATPRTITAG DVALYTALYG PRFSLFSSDA FARDCGLETA 
PVDPLVAFHV VFGKTVPDIS LNAVANLGYA EGRFLAPVHP GDTLAAKSEV IGLKENSNGK 
TGVVYVRTTG TNQRGVAVLS YVRWVMVRKR DPGAVVEGQS IPALAGAVAA EHLTPPPGLS 
FSKYDFAHAG APHAFEDYAV GEKIDHVDGM VVEEAEAQMA TRLWQNTAKV HFNQFERAKD 
PSSRRLVYGG VVISTAKALS FNGLQNAGLI LAINGGRHVS PYFAGGTVFA WSEVLDKADL 
GHGIGALRLR LVATVDRPCA DFPDKDEAGA YAPGVILDFD YWAAVPKRG