Gene Caul_3152 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3152
Symbol
ID	5900607
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3416082
End bp	3417482
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	65%
IMG OID	641563655
Product	hypothetical protein
Protein accession	YP_001684777
Protein GI	167647114
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.416399
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCGG ACATGGAAGC AGCGGCGGCG GACTCGTTCG CCGACCTGTT CAAGCGACGG 
AAGAAGCACC CGTTCACGGG TGTGGGCCAG CCTTGCGCCA ACTGCGGCGC GGCGCTGGAA 
GGTCCGTACT GCCATGAGTG CGGCCAGAAC GCCGACAACC ACAAGCGCTC GATCTTCCAT 
CTGATCATCG AGGCCATCGA GGGGATGTTC CACCTCGACG GACGCCTGGC CCTGACCTTG 
CCGGCCCTGT TCTTTCAGCC CGGCAAGCTG GCCAAGGATT ACATGGAGGG GCGTATCGTG 
CGGCACGTTC CGCCGTTCCG CACCTTCCTG GTCGCCCTGC TGCTGTTCAT CTTCGCGGCC 
GAGCACGCCA TACATTCATT CAAGCACCAC GCCGAGGAAG AGACCCACAA GCGCGCCGAG 
GCCCTGGCCA CGCCGCAGGG CCGGGCCGCC GAGGCGGGCA GGATGCGCGT CGAGGCCGCC 
AAGGACCGCG CTTCACGGCT GAAGGGAGCC GCCGAGGATC GCGACGCGGC CCTGGCCGAG 
GCGGCCAAGG ATCGCGACGA GGCGTTGAAG GATCCCGATC AGGACAAGGC CAAGACCCTG 
CAGGCCTACC AGGAAGCCGT CGCCAAGGCT CCGGTCGACT ATCAGGAAGA GGCTGACGAG 
GCCCAAGCCC GCTATGCCAA GAGCATCGCC GACGCCGATC ACCTTCAGAA CAACCCGCTG 
GCCGCCAAGG AAATCCTCGA GGCCGACGAG AAGATGCGCA AGAAGACGGC CGACGCGATC 
CGTGGGGCTA AGGTCACGAG CGTGTTCGAC GGCGACGAGG TCGAGTCCCA GGCCACCAAG 
TTCGCCGATG ACGCGACCGA CACCATGACG GTCGGCGGCG TCAACATAAA GACGCCCAAG 
ACCGAGGTCG GTCCCGCTGA AGCCGACCAC GGCGGCATCG CGGTCCCGGT CACGGGCGGC 
GCGCACGGCA AGGAGCACTG GCTCAAGGCC GGCCTGATCA AGGCGCTGGA GAATCCCGAA 
TACTACATGC TGGTGATGTT CGGCTGGGGC CACCGCCTGG CGGTGCTGCT GCTGCCGATG 
CTGGGACTCA GCCTGGCCCT GGTCTACGTC AACAAGCGGC AGTTCTTCAT CTACGACCAT 
CTGATCGTGG CCACCAACCT GCTGTCGTTC GCGTTCCTGA CCAATGCGCT GGGCCTGGTG 
CTGCCCGATC CGGTCCGCAA GTGGTGGTTC CTGCTGCTCA TGGTCTGGAC GCCGATCAAC 
CTGTTCCAGA CCCTGCGCGG GGCCTACGGT TCCAGCATTC CCGGGGCCAT CATCAAGACG 
CTGATCGTCT GGTGGTCGAC CATGTTCTCG TTCGTTTTGC TGCTCAGCGT TCTACTGGTT 
TTCGCCTTGG CCCAGATTTA G

Protein sequence

MTADMEAAAA DSFADLFKRR KKHPFTGVGQ PCANCGAALE GPYCHECGQN ADNHKRSIFH 
LIIEAIEGMF HLDGRLALTL PALFFQPGKL AKDYMEGRIV RHVPPFRTFL VALLLFIFAA 
EHAIHSFKHH AEEETHKRAE ALATPQGRAA EAGRMRVEAA KDRASRLKGA AEDRDAALAE 
AAKDRDEALK DPDQDKAKTL QAYQEAVAKA PVDYQEEADE AQARYAKSIA DADHLQNNPL 
AAKEILEADE KMRKKTADAI RGAKVTSVFD GDEVESQATK FADDATDTMT VGGVNIKTPK 
TEVGPAEADH GGIAVPVTGG AHGKEHWLKA GLIKALENPE YYMLVMFGWG HRLAVLLLPM 
LGLSLALVYV NKRQFFIYDH LIVATNLLSF AFLTNALGLV LPDPVRKWWF LLLMVWTPIN 
LFQTLRGAYG SSIPGAIIKT LIVWWSTMFS FVLLLSVLLV FALAQI