Gene Caul_4795 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4795
Symbol
ID	5902257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	5184781
End bp	5186040
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	66%
IMG OID	641565315
Product	hypothetical protein
Protein accession	YP_001686413
Protein GI	167648750
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1232] Protoporphyrinogen oxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.173425
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.558478
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCTTGG CGGCCGGCTA CTACGCCGTC CGCGCCGGAC ACGAGGTCGA AGTCGTCGAG 
GCCGACGACC GGCCGGGCGG CATGGCGGCC CATTTCGACT TCGACGGCTT GTCGCTCGAG 
CGGTTCTACC ACTTCTGCTG CCTCAGCGAC GTCGACACCA TTGGGCTGCT CGCCGAGCTA 
GGCCTGGACC CCATCGTCTG GCGCGAGACC AAGATGGGCT ACTTCATCGG CGGCAAGCTG 
CACCCGTTCG GCGACCCGAT CTCGCTGCTG ACCTTCCCAG CCCTGGGTCC GATCGAAAAG 
CTCCGCTACG GGCTGATGGC GTTCATCTCG ACCAAGCGCG GCGACTGGCA GCGGCTGGAC 
AAGATCAGCG CCAAGGACTG GTTCATCGGC TGGTGCGGCC AGAGCGTCTA TGACCGCCTC 
TGGAAACCCT TGTTCGAACT GAAGTTCTTC GAATATTCCG ACCGCATCTC CGCCGCCTGG 
ATCTGGCAGC GGATCAAGCG CATTGGCAAT TCGCGCAAGT CCCTGTTCCA GGAACAGCTG 
GGCTATATCC CGGGCGGCAC CGAGACCCTG ATGAACGCCT TGGCCCAAGC CATCGAGGCG 
GCTGGGGGCA AGGTCCGGCT CAAGGATGCG GTCAAGCGCA TCCGCATCGC CGACGGCGTG 
GTGAGCGGCG TCGAGACCGC CTCCGGCGCC AGCCTTCCCG CCGATTTCGT CATCTCCACC 
GCGCCCCTTC CCTACATTCC GGGCTTGGTC GAGCAGGACG CCCCGGCTCT GGCCGAGACC 
TACAAGGGCT TCGACAACGT CGGCTGCGTC TGCGTGGTGC ACAAGCTCAA GCGGTCGGTG 
ACGCCGAACT TCTGGCTGAA CATCTCCGAC CCGACGATCG ATATTCCGGG CATCGTCGAA 
TTCTCGAACC TTCGGCCCAC CGGCGACACC ATCGTCTACG TGCCCTACTA CATGCCGGCC 
ACGCACGAGA AGTTCGGCTG GACCGACGAG GCCCTGGCCG ACGAGAGCTT CCGCTATATG 
CAGAAGGTCA ATCCGGCCCT GACGGCGGAT GACCGGCTGG CGGTGCATGT CGGCCGCCTG 
CGCTACGCCC AGCCCGTTTG CGACGTTGGC TTCGCGGCCC GCGTTCCAGC GGCTCAGACA 
CCGATCCGCG GCCTGCAGAT CGCCGACACC TGCTTCTATT ATCCGGAGGA CCGCGGCGTG 
TCGGAGAGCA TCGGCTTCGC CCGCCGCATG GTCGAGGCCC TCCCCGGGGG CGCGCGATGA

Protein sequence

MGLAAGYYAV RAGHEVEVVE ADDRPGGMAA HFDFDGLSLE RFYHFCCLSD VDTIGLLAEL 
GLDPIVWRET KMGYFIGGKL HPFGDPISLL TFPALGPIEK LRYGLMAFIS TKRGDWQRLD 
KISAKDWFIG WCGQSVYDRL WKPLFELKFF EYSDRISAAW IWQRIKRIGN SRKSLFQEQL 
GYIPGGTETL MNALAQAIEA AGGKVRLKDA VKRIRIADGV VSGVETASGA SLPADFVIST 
APLPYIPGLV EQDAPALAET YKGFDNVGCV CVVHKLKRSV TPNFWLNISD PTIDIPGIVE 
FSNLRPTGDT IVYVPYYMPA THEKFGWTDE ALADESFRYM QKVNPALTAD DRLAVHVGRL 
RYAQPVCDVG FAARVPAAQT PIRGLQIADT CFYYPEDRGV SESIGFARRM VEALPGGAR