Gene Caul_3986 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3986
Symbol
ID	5901448
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4315946
End bp	4317880
Gene Length	1935 bp
Protein Length	644 aa
Translation table	11
GC content	67%
IMG OID	641564507
Product	peptidase M61 domain-containing protein
Protein accession	YP_001685609
Protein GI	167647946
COG category	[R] General function prediction only
COG ID	[COG3975] Predicted protease with the C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAAACGC TGTTCTTTAC CGCCTCCGCC CTCGCCCTTT CCCTCAGCTT CAGCAGCGCC 
TTCGCCCAGG AGCGCGTTCC GGTCCAGGCC CCGCCGACCC CGCCGATCGC CGCCGCCCAG 
GACATCGCCT ATCCCGGCGT GCTGAAGCTG TCGGTCGACG CCACCGACCT GGACCGCAAG 
ATCTTCCAGG TTCGCGAGAC GATTCCCGTG GCCAAGGCCG GCCCGATGAC CATCCTGTAT 
CCGCAGTGGG TTCCCGGCGG CCACTCGCCG CGCAACGACC TGGACAAGAT GGCCGGGCTG 
GTGATCACCG CCGGCGGCAA GACCCTGGCC TGGACCCGCG ACCCGGTCGC CGTCCACGCC 
TTCCACTTCG ACGTGCCGGC CGGCGCGACC GAGATCCAGG TCAGCTTCCA GTTCCTGACC 
CCGGTGAAGG CCGACGTCGG CCGGATCCTG GTGACCGACG ACATGCTGAA CGTGCAGTGG 
CTGCAACTGG GCTTCTACCC GGCCGGCTAC TACACGCGCC GCATCCAGAT CGAGCCGACC 
GTCAAGCTGC CGGAGGGATG GGGCTTCGGC ACCGCGCTCG AGAAGGCCTC GACCAACGGG 
CAGAGCACCA CCTTCAAGAC CACCACCTTC GAGACCCTGG TCGACTCGCC GATGTTCGCC 
GGCCGCTACT ACAAGCAGGT GGACCTGGAC CCCGGCGCGG CCACGCCGGT GCGCCTGAAC 
ATCGTCGCCG ACAAGCCCGA GCTGCTGGAA ATCAAGCCCG AGGCCCTGCA GATCCACCGC 
AACCTGGTGC AGCAGGCCTA CAAGCTGTAT GGCGCGCACC ACTACGATCA CTACGACTTC 
CTGCTGGCCC TGACCGACAA GATGGGCGGC ATCGGGCTTG AGCATCACCG CTCCAGCGAG 
AACGGCGTCA CCCCCAAATA CTTCACCGAC TGGGAAAAGA CCTTCGTCGG CCGCGACCTG 
CTGGCCCACG AATACACCCA CTCGTGGAAC GGCAAGTTCC GCCGCGCGGC CGACCTCTAC 
ACCCCGACGC TGAACGAGCC GATGCGCGAC AGCCTGATGT GGGTCTATGA GGGCCAGACC 
CAGTACTGGG GCAATGTGCT GGCCTCGCGC TCGGGCCTGC AGACCAAGCA GCAGGGCCTG 
GACAGCCTGG CCATGACCGC CGCCCTCTAC GACACCCGGG CCGGCCGCAA CTGGCGCAAC 
GTGCTGGACA CCACCAACGA CCCGATCATC GCCAACCGCA AGCCGGCCTC GTGGACCAGC 
TGGCAGCGCA GCGAGGACTA CTATTCGGAA GGCCAGCTGG TCTGGCTCGA CGCCGACACC 
CTGATCCGCG AGAAGACCGG CGGCAAGAAG TCGCTGGACG ACTTCGCCAA GGCCTTCTTC 
GGTGTCGAGA ACGGCTCGTA CGTGCCGCTG ACCTACGACT TCGACACGGT CGTGAAGACC 
CTGAACGGCG TCGTGGAGAA CGACTGGGCC ACCTTCCTGA AGACCCGCAT CGAGGGCCTG 
TCCGAGCACG CCCCGCTCGA TGGCCTGACG CGCGGCGGCT ACAAGCTAGT CTATACCGAC 
ACGCCCACCG AGTTCTTCAA GGCGGCCGAG ACGCGCGGCA AGATCGTCAA TCTCAGCTAC 
TCGCTGGGGA TCACGATCGG CAAGGACGGC CTGCTGTCGG CGGTCAACTG GGACACCCCG 
GCCTTCAAGG CGGGCCTGAC GGCCGGCGAG ACCATCGTCG CGGTCAACGG CACCGCCTAT 
GGCGACGACC TGATCAAGGA CGCGGTCAAG GCCACGGCCA AGGCCGACGC CCCGGTGGTC 
GAACTGCTGG TCAAGGACGG CGAGCGCTAT CGCACCGTCA AGATCGACTA CCACGGCGGC 
CTGAAGTACC CGCGCCTGGA GCGGATCGAG GGCACGCCGG CGCGGCTGGA CGAGATCTAC 
ACGGCGCGCA AGTAG

Protein sequence

MKTLFFTASA LALSLSFSSA FAQERVPVQA PPTPPIAAAQ DIAYPGVLKL SVDATDLDRK 
IFQVRETIPV AKAGPMTILY PQWVPGGHSP RNDLDKMAGL VITAGGKTLA WTRDPVAVHA 
FHFDVPAGAT EIQVSFQFLT PVKADVGRIL VTDDMLNVQW LQLGFYPAGY YTRRIQIEPT 
VKLPEGWGFG TALEKASTNG QSTTFKTTTF ETLVDSPMFA GRYYKQVDLD PGAATPVRLN 
IVADKPELLE IKPEALQIHR NLVQQAYKLY GAHHYDHYDF LLALTDKMGG IGLEHHRSSE 
NGVTPKYFTD WEKTFVGRDL LAHEYTHSWN GKFRRAADLY TPTLNEPMRD SLMWVYEGQT 
QYWGNVLASR SGLQTKQQGL DSLAMTAALY DTRAGRNWRN VLDTTNDPII ANRKPASWTS 
WQRSEDYYSE GQLVWLDADT LIREKTGGKK SLDDFAKAFF GVENGSYVPL TYDFDTVVKT 
LNGVVENDWA TFLKTRIEGL SEHAPLDGLT RGGYKLVYTD TPTEFFKAAE TRGKIVNLSY 
SLGITIGKDG LLSAVNWDTP AFKAGLTAGE TIVAVNGTAY GDDLIKDAVK ATAKADAPVV 
ELLVKDGERY RTVKIDYHGG LKYPRLERIE GTPARLDEIY TARK