Gene Caul_3869 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3869
Symbol
ID	5901331
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	4188935
End bp	4190122
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	69%
IMG OID	641564391
Product	hypothetical protein
Protein accession	YP_001685493
Protein GI	167647830
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTATTC TCTGGCTGCT GCCCCTGGCC GTGGCCCTCC CCACCCTGGC CCAGGCCGCC 
GAGCCGGCCC TGGGCCAGTT CCTGCTGGAC GCCCGCCTGC GCTATGAAAC CGTTTCGCAA 
GACGGCCTGG CCAAGGACGC CCGCGCCCTG ACCCTTCGCA CTCGGCTGGG CTACGAGACC 
GCCGCCGTTC ACGGCGTCAA GTTGCTGGTC GAGGGCGAGA ACGTCACAGC CCTGGATGGA 
GACTATAACA GTCAGGTCAA CGGCAAGACC GCCTATCCGG TGATCGCCGA TCCGGAGACC 
ACCCAGCTCA ACCGCCTGCA GTTGTCCTGG GCCGGCCCGC TCGGCGGCGG CGCGACGGTG 
GGCCGCCAGC GCCTGATCCT CGACAACGCC CGCTTCATCG GCAATGTCGG TTTCCGCCAG 
ACGGAACAGA CCTTCGATGC GGTCACCCTG GTCTATCGGC CCTCGCCCAA GCTCAGCCTG 
ACCTACGCCT ATCTGGACAA GGTGCATCGC ATCCTTGGCG ACGACCACGC CCAGGGAAGC 
TGGCGCAGCG ACTCCCATAT CGTCCAGATC GCCGCCAAGA CCGCGGTCGG CCAGGTTTCA 
GCCAGCGCCT ATCTGCTCGA CTTCGCCAAC GCCCCGGCCC AGTCCAGCGC CACCTATGAC 
ATCCGGCTGA GCGGCTCGCG CCCCTTGTCC TCCGGCCTGG CCGTCACCTA CGAAGCCCAG 
TACGCCCGGC AGAGCGACTA CGGAAACAGC CCGACCCGGT TCACCCTCGA CTATCTCGAC 
CTGGCCGTGG GCCTGAAGAC CAAGACTAGC GCCGTGGCCC TCGGGGTCGA GCGCCTCGAC 
GGGGATGGTC GCCGGGGCTT CCAGACGCCG CTGGCCACGC TGCACGCCTT CCAGGGCTGG 
GCCGACGTCT TCCTGACCAC GCCGGCCAGC GGCGTGCGCG ATCTGCAGCT GACCGCCTCG 
ACCAGCGTCA CCGCCTCCAA GGCCCACCCC GTCAAGCTGC AGGCGGCCGT GCATCGGTTC 
GACGCCGCCG ATGGCGACAC CCGGCTGGGC GACGAACTGG ATCTGGCCGT CTCGGCGCCG 
CTGACGCCCA GGCTGTCGGC GGAACTGGCG GCGGCGGCGT TCGACGGCGA CCAACCGGCC 
TTTCGCGACC GCACCAAGGT GTGGCTGACG CTCGCCTACA AGCTCTGA

Protein sequence

MRILWLLPLA VALPTLAQAA EPALGQFLLD ARLRYETVSQ DGLAKDARAL TLRTRLGYET 
AAVHGVKLLV EGENVTALDG DYNSQVNGKT AYPVIADPET TQLNRLQLSW AGPLGGGATV 
GRQRLILDNA RFIGNVGFRQ TEQTFDAVTL VYRPSPKLSL TYAYLDKVHR ILGDDHAQGS 
WRSDSHIVQI AAKTAVGQVS ASAYLLDFAN APAQSSATYD IRLSGSRPLS SGLAVTYEAQ 
YARQSDYGNS PTRFTLDYLD LAVGLKTKTS AVALGVERLD GDGRRGFQTP LATLHAFQGW 
ADVFLTTPAS GVRDLQLTAS TSVTASKAHP VKLQAAVHRF DAADGDTRLG DELDLAVSAP 
LTPRLSAELA AAAFDGDQPA FRDRTKVWLT LAYKL