Gene Caul_4076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4076
Symbol
ID	5901538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4416223
End bp	4417683
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	70%
IMG OID	641564597
Product	phosphotransferase domain-containing protein
Protein accession	YP_001685699
Protein GI	167648036
COG category	[R] General function prediction only
COG ID	[COG0613] Predicted metal-dependent phosphoesterases (PHP family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCGCT GGCTGGCCCT GATCCTCGTC CTGCTGACCA CGCCCGCCTG GGCCGCCGAC 
GGCAAGCCCG ACCTCGTCCT GACCGGCCAG GTGCTGGGCG CCGACCACCA GACCTACAAG 
CCCGTCACCT TCGAGGTGCC GCCGGGCGTC ACCCGCGTGA CCGTCGATTT CGACTACGTC 
CGCGACCAGA AGACCGTCGT CGACCTGGGC CTGATGGATC CGGTGCGGTT CCGCGGTTGG 
AGCGGCGGAA ACAAGAAGCA TTTCACGGTG TCGACGGAGG ACGCCACCCC CAGCTACCTG 
CCCGGTCCGC TGCCGCCCGG CCGCTGGACC CTGCTGCTGG GCGTGCCCAA CGCGCGTTCG 
GGCTCCAGCG CAGCCTATGA GGCTCGGATC ACCTTCGAGC GCGGACCGGC GCCGACCCGT 
TTCGCGCCCG CGCCGCTGAA GGCTGCGCCC GGCTGGTATC GCGGCGACCT GCACATGCAC 
ACCGCCCACA GCGACGGCTC CTGCCTGACC CAGTCCGGCG CCCGCGCCCC GTGCCCGGTC 
TATCGCACGG TGCAGGCGGC CCAGGCCCAG GGCCTGGATT TCATCGCCAT CACCGACCAC 
AACACCACCA GCCACTACGA GGCCATGGCC GAGTTGCAGC CGGCCTTCGA CCAACTGCTG 
CTGATCCCCG GACGCGAGGT GACGACCTTC CAGGGTCACG CCAACGTCTT CGGCCCCACG 
GCCTTCATCG ACTTCCGGCT GGGCGATCCG GCCGTGCCGA CCCTCAAGGC GCTGCAGGAT 
GCGGTGGCGG CGGCCGGCGG GGTGTTCTCG ATCAACCACC CCAGCGCCCC ATCGGGCGAG 
CAGTGCATGG GTTGCGGCTG GACCGTTCAG GGCACGGACT ATGACCAGGT GCAGTCCATC 
GAGGTGGCCA ACGGCGGCTC GCAGCGCGCC CAGGGCGGCG CCGAGGGGCC GCTGTCGGGC 
GTGGCCTTTT GGGAGGCCCA GCTGAACGCC GGCCATCACA TCACCGCCGT CGGCGGCAGC 
GACAATCACG ACGCCGGCCT GCCCTTCGAC ACCCCCGGCG CGATCGGCCG CCCGACCACG 
GTGATCCACG CCGCCGAACT GTCGACCTCG GGCATACTGG CGGGCGTCCG CGAGGGGCGG 
GTGTTCATCG ACCTGGACGG CGCGAAGGAC CGGATGCTGG ACCTCAGCGC CCGTTCGAAG 
TTCGGCCAGG CGGTCATGGG CGGCGTCCTG ACCGCGCGGC CGGGCGAGGC GGTGGCGTTC 
ACCGCCTCGC TGACCGGCGG CGAAATGTCT GGGCTGGAAG TGATCCGCGA CGGGATGAAG 
GTGGCGGTGG CCGTGGAGGC CGACGGCGCC TTCACGGTGA AGATGGGCGA CAGGGCGAGC 
TGGGTGCGGC TGAACCTGCG GGACGCTCAA GGGCGGCTGC TTCTGATCGG CAACCCGATT 
TACCTGAAGC CCAACCACTA A

Protein sequence

MIRWLALILV LLTTPAWAAD GKPDLVLTGQ VLGADHQTYK PVTFEVPPGV TRVTVDFDYV 
RDQKTVVDLG LMDPVRFRGW SGGNKKHFTV STEDATPSYL PGPLPPGRWT LLLGVPNARS 
GSSAAYEARI TFERGPAPTR FAPAPLKAAP GWYRGDLHMH TAHSDGSCLT QSGARAPCPV 
YRTVQAAQAQ GLDFIAITDH NTTSHYEAMA ELQPAFDQLL LIPGREVTTF QGHANVFGPT 
AFIDFRLGDP AVPTLKALQD AVAAAGGVFS INHPSAPSGE QCMGCGWTVQ GTDYDQVQSI 
EVANGGSQRA QGGAEGPLSG VAFWEAQLNA GHHITAVGGS DNHDAGLPFD TPGAIGRPTT 
VIHAAELSTS GILAGVREGR VFIDLDGAKD RMLDLSARSK FGQAVMGGVL TARPGEAVAF 
TASLTGGEMS GLEVIRDGMK VAVAVEADGA FTVKMGDRAS WVRLNLRDAQ GRLLLIGNPI 
YLKPNH