Gene Caul_2571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2571
Symbol
ID	5900026
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2791427
End bp	2792848
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	66%
IMG OID	641563062
Product	peptidase M48 Ste24p
Protein accession	YP_001684196
Protein GI	167646533
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCCC GCAGTTGGGC GGCTTCCGGA AAGTTGGGCG CAAAGACCCT GTCGGCGCTG 
GCCTTGGTCG CGACGATGCT GGCGCCCGTC GCCCCGGCGC GCGCTCAGGA CGGCCCCTCG 
CTGATCCGCG ACACCGAGAT CGAGGAGATC CTGCACCGCG ACGCCGACCC CATCTACGCG 
GCGGCTGGGT TGGATCCCAA AACCGTCCGC ATCCTGCTGG TCGGCGACAA GGAGTTGAAC 
GCCTTCGCCA CCCAGGGGTT GATGATGGGT CTCAACACCG GCCTGATCCT TCAGACCGAG 
ACGCCCAACC AACTGAAGGG CGTCATCGCC CACGAAACCG GGCATTTGGC CGGCGCGCAC 
CCGCTGCGTT CCGACGAGCT GATGAAGGCC GGCCTCAAGC CGATGATCCT GACCATGGGC 
CTGGGCGTGC TCGCCGCCCT GGCCGGAGCT CCGGACGCCG GCGCCGTGCT GTTGGGCAAC 
GCCTCCTATT TCGGGACCCT GGGCGCGCTG GGCTACAGCC GCGACCAGGA ATCGCGGGCC 
GACCAGGCCG GCGCCGGTTT CCTGGAGGCC ACCGGCCAGT CGGGCCGCGG CCTGGTCGAG 
TTCTTCGACA ACTTCCGCTA TCAGGAGGTC TTCGACCAGT CGCGGCGCTT CGCCTATTTC 
CGCAGCCACC CGCTGTCGGG CGACCGGATC GACGCCCTGC GCAGCCGCGT CGAGAAACTG 
CCCCACTATA ACAGCGTCGA CGACCCCACC TCGCTAGCCG AGCACGAGAT CATGAAGGCC 
AAGCTGGAGG GCTTCATCAA TCCCGGCGTG GCGATCGTGA AATACAAGGA AGCCGACAGG 
GGATTCCCGG CCCGTTACGC CCGCGCCATC GCCTATTACC AGCTCAAGGA ACCCGATCGG 
GCTCTCAAGA TCCTCGATGG TCTGATCGCC GAGAACGCAG ACAACCCCTA TCTCTGGGAG 
CTCAAGGGGC AGATTCTGTT CGAGTTCAAT CGCGTCAAGG AAGCCGAGGA GCCGCAGCGT 
CGCTCTGTGG CCCTCAAGCC CGATGCGGCC CTGCTGCGGG TCAATCTGGG CCAGACCCTG 
ATCGGCCAGG ACGATCCCAA GAAGGTCGAG GAAGGCATCA GCGAGCTGAA GCGCTCGCTG 
ATCGACGAAA GCGACAATTC CGTCGCCTGG CGCCTGCTAG CCCAGGCCTA TGACAAGCGC 
GGCGAGGATG GTCAGGCCCG CCTGGCCACC GCCGAGCAAT ATTTCAACAT GGGCGCCGCC 
CAGGAGGCTC GCGTATTCGC CATGCGAGCC CGCGAGTTGC TCAAGAAGGA CAGCGTCGAA 
TGGCGCCGCG CCACCGACAT CGTCCTGACT TCCAATCCTT CCAACCAGGA CCTCAAGGAC 
CTGGCCAAGG AAGGCGCCGT CACCTCGGGC CTGCGCCGCT AG

Protein sequence

MTSRSWAASG KLGAKTLSAL ALVATMLAPV APARAQDGPS LIRDTEIEEI LHRDADPIYA 
AAGLDPKTVR ILLVGDKELN AFATQGLMMG LNTGLILQTE TPNQLKGVIA HETGHLAGAH 
PLRSDELMKA GLKPMILTMG LGVLAALAGA PDAGAVLLGN ASYFGTLGAL GYSRDQESRA 
DQAGAGFLEA TGQSGRGLVE FFDNFRYQEV FDQSRRFAYF RSHPLSGDRI DALRSRVEKL 
PHYNSVDDPT SLAEHEIMKA KLEGFINPGV AIVKYKEADR GFPARYARAI AYYQLKEPDR 
ALKILDGLIA ENADNPYLWE LKGQILFEFN RVKEAEEPQR RSVALKPDAA LLRVNLGQTL 
IGQDDPKKVE EGISELKRSL IDESDNSVAW RLLAQAYDKR GEDGQARLAT AEQYFNMGAA 
QEARVFAMRA RELLKKDSVE WRRATDIVLT SNPSNQDLKD LAKEGAVTSG LRR