Gene Caul_0139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0139
Symbol
ID	5897851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	153547
End bp	154671
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	63%
IMG OID	641560624
Product	hypothetical protein
Protein accession	YP_001681775
Protein GI	167644112
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.0837482
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGACA AGAACATCAC CAAGGACGCC ATGTACGACG CGGTGGCGCC GGACGACTTC 
GAGGCGATGC TCGAACTCGA CCGCTACAAC AACCGCTCCA CGGCTTTCGA CAAGATCATT 
TCCGCGACCC ACGACCACTT CTGGGATCCG CTGGACAAGG CCTATATCGA TTTCGACGAG 
CCGTTCGACA TGGAGAACCA GGCGCTGGTT CCCGAGGAGC TCGTGATCGC CCTGTCGACC 
GACTACGTCT CCGATCATCT CAGCGATCCC AAGCAGCGCA TCCGCTTCAT CAACCAGTCG 
GTGCTGCGCA GCTTCTCGTC GATCCTGCAC GGGGAGCAGG GCGCGCTGAA CCTGTCGGCC 
AGCCTGTGCC ATGTGCTCAA GGACCAGGGC GCCCAGGAAT ACGCCGCCAA CCAGACCCGC 
GAAGAGGCCC GCCACGTGAC GGCCTTCGCC AAGTACATCA AGGCCCGCTG GGGCAAGCCG 
GTCGAGTGCG GCCCGGCCTT GAAGACCCTG CTGGTCGAGA TCATCGGCGC GCCGGAGGTC 
TACAAGAAGA TCATCGGCAT GCAGATGCTG GTCGAGGGCC TGGCCATGGG CGCCTTCGCC 
ACCTTCTACA CCCAGATCCA CGACCCGCTG GGCAAGAAGC TGCTGCAGCT GGTGATGACC 
GACGAGGCCT TCCACCACAA GTTCGGCAAG ATCTGGGCCG ACCGCACGGT GCCCAAGCTG 
AGCCCCGAGG AGCACGCGAT CATTGAGGAC TGGGCGGCGC ACTGCTTCCA GACCCTGCTG 
TTCAACCTGG TTTCCCCGCA CCAGCAGCTG GATCTCTACG CCGAGTTTGG CCTGGATCCC 
GACAAGGTGG TCGAGGAGTA CGGGAAGATC ATGACCGACG ACGTGCGTCG CGAGGGCATG 
AAGGAACAGA CCAACATCTT CCGGGTGCTG GTCAAGACGC TGCTGAACGC CGGCATCATC 
ACTGACCGTA CCAAGGCCTT CTACGCCATG TACGTGGACA TCGAGGAGCT GCGCGGCGAG 
GGCGACCGGA TGATCGGCGA CGACATCGCC GAGGAGGGCA TCCGCCACCT GCAGGCCATC 
AACTTCAAGG ACCGCGTCCA TCCGGTGACC ATCGCCGCCG AATAG

Protein sequence

MTDKNITKDA MYDAVAPDDF EAMLELDRYN NRSTAFDKII SATHDHFWDP LDKAYIDFDE 
PFDMENQALV PEELVIALST DYVSDHLSDP KQRIRFINQS VLRSFSSILH GEQGALNLSA 
SLCHVLKDQG AQEYAANQTR EEARHVTAFA KYIKARWGKP VECGPALKTL LVEIIGAPEV 
YKKIIGMQML VEGLAMGAFA TFYTQIHDPL GKKLLQLVMT DEAFHHKFGK IWADRTVPKL 
SPEEHAIIED WAAHCFQTLL FNLVSPHQQL DLYAEFGLDP DKVVEEYGKI MTDDVRREGM 
KEQTNIFRVL VKTLLNAGII TDRTKAFYAM YVDIEELRGE GDRMIGDDIA EEGIRHLQAI 
NFKDRVHPVT IAAE