Gene Cag_0729 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0729
Symbol
ID	3747425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	1005202
End bp	1007253
Gene Length	2052 bp
Protein Length	683 aa
Translation table	11
GC content	47%
IMG OID	637773263
Product	peptidase S41A, C-terminal protease
Protein accession	YP_379043
Protein GI	78188705
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCACCCT GCCGCGTTGA AGCGTTTTGG CCACTTGCCA CCTCGCGTGC AGCTTCAGCA 
ACCACGCTTC AGCCAACTGC CCTGCACGAT GAAACGGGCA AATATATTAG CCAAACGCTG 
TTGCAGTACC ATTACCGTAA ACCAGCAACA AACGATTCGC TGTCACTGCA AATTTTTAAC 
CGTTACTTGG AGCAGCTTGA TGGTAGCAAA AGCTACTTTG TGGCTTCGGA GGTGGAAAGT 
TTGCGCAAAG TGTATGGCAC TCGCTTTGAT GATGAATTAC TTGCAGGGAA GTCGAAAAGC 
GGCTTTGGCA TGTACAACTT TTTTTTAAAG CGTGCAAAAG AGAAAATGCG CTTTATGAAA 
GCAACTGCCG ATACCGCTCG CTTTAGCTTT ATGCAACCTG AGGAATTTGA GCTTGACAGA 
AAGCGCACTC CATTTCTTCC CGATAGGCGC CAACTTACCG CGCTTTGGCG ACGAGAGTTA 
AAATATCAGT GGCTTACCCT AAAGCATAGT GGCGAAAAAA ACAGTTCTAT TCGTGCCGAG 
CTTTCTAAAA GCTATGCAAG CCGTTTAAGC TTGTTGCAAC GCCAAACGCC AAACGATGCT 
TTTCAAAGTT ACATGGCAGC CGTTACCACT TCGTTTGACC CGCATACTAG CTATTTATCG 
CCCGACGACT ATACCAATTT TCAAATTGAT ATGAGCCGTT CGCTTGAAGG TATTGGTGCG 
AAGCTCCAAA CCGAAGGGCA ATACACGGTA GTGGGTGAAA TTATTCCGGG TGGACCTGCC 
TTTAAAACAG GTTTTGTTAA AAAGGGTGAT AAAATAATTG CCGTAGGGCA GGGAAGTAGT 
GCGCCTATGG TGGATGTTAC GGGCTGGCGC ATTAACGATG TGGTCAAGCA AATTCGTGGA 
CCAAAAAACA GCATAGTACG TTTAAAAATA TTGCCAGCAA GTCAAGGTGG AGTAGCTTCC 
ACTAAGGTGG TGCAGTTAGT TCGCGAAAAA ATTGATTTGC AAGAACAAGC TGCCCGCAAA 
AGCATTATTC AGCAAAATGG ATTGAAAATT GGCGTTATCA CCATTCCCTC ATTTTATCTT 
GATTTTGAAG GGCAACAAAA GCAAGCCACC AACTATGCTA GCACAAGTCG CGATGTTGCC 
CGCATTGTGG AGGAACTGCA ACGTGAGGAA TTAAGCGGCA TTATTCTTGA TTTGCGCGAT 
AATGGTGGAG GCTCGCTTGA AGAGGCAGTG AACGTTACGG GGCTTTTTAT TACAAGCGGT 
CCTGTGGTGC AGGTGAGCAA TGCTTCAGGC GGCAAAAGCG TTGTGCGCGA TGACGACCGC 
CGCATTTTTT ACAGCGGTCC ACTTGCCGTG TTGGTGAATC GTTATAGCGC TTCAGCTTCT 
GAAATTGTAG CGGCGGCTAT GCAAGATTAT AAACGAGGCA TTGTTATTGG TGAACGCACC 
TTTGGTAAAG GCACCGTGCA AAGCATTGTT AAGCTTACAC GTCCCTTTCA CTTTTTTGGC 
AAAGCGCCAG AGTTTGGTCA GCTTAAGCTT ACCGTAGCAA AATTTTACCG CATTTCAGGC 
GGTAGTACCC AGCACAAAGG TGTAGTGCCC GATATTACCA TGCCGTCACT GATTGATACC 
TCAAGCGTTG GTGAGGATAC TTATAGCAGC AGTTTGCCAT GGAGCACCAT TTCACCTGCC 
CTATTCCGTC CTATTGCCGA TGTTACGCCC GAGCATGTTA CCCAGTTGCG CCAAAAGCAG 
CAAGTGCGTA TTGATACCTC ACGTCTGTAC AAAACCTACA TGCGTGATCT TGCAACGCTT 
AACCGCATTC GCAAGAAAAA AAGCATCACC TTACAAGACT CCTCCTTTAA GTCGGATGTA 
GAAACGCTCC GCCAAATTGA AAAAAATTGG GGTGAAAGTA ATGAGCTGGA TTCAACGCAC 
ACGAAAAGTG GTGGTAAAGC TTTAGAGCGC GATGTGTTGT TGCAACAATC CTCAGCGGTT 
ATGGCGGATT TTGTGGAACT TAAAACTACC GAACGCCAAA CGGTTATTCG TGCGGTGCCC 
GCGTTGAATT AA

Protein sequence

MPPCRVEAFW PLATSRAASA TTLQPTALHD ETGKYISQTL LQYHYRKPAT NDSLSLQIFN 
RYLEQLDGSK SYFVASEVES LRKVYGTRFD DELLAGKSKS GFGMYNFFLK RAKEKMRFMK 
ATADTARFSF MQPEEFELDR KRTPFLPDRR QLTALWRREL KYQWLTLKHS GEKNSSIRAE 
LSKSYASRLS LLQRQTPNDA FQSYMAAVTT SFDPHTSYLS PDDYTNFQID MSRSLEGIGA 
KLQTEGQYTV VGEIIPGGPA FKTGFVKKGD KIIAVGQGSS APMVDVTGWR INDVVKQIRG 
PKNSIVRLKI LPASQGGVAS TKVVQLVREK IDLQEQAARK SIIQQNGLKI GVITIPSFYL 
DFEGQQKQAT NYASTSRDVA RIVEELQREE LSGIILDLRD NGGGSLEEAV NVTGLFITSG 
PVVQVSNASG GKSVVRDDDR RIFYSGPLAV LVNRYSASAS EIVAAAMQDY KRGIVIGERT 
FGKGTVQSIV KLTRPFHFFG KAPEFGQLKL TVAKFYRISG GSTQHKGVVP DITMPSLIDT 
SSVGEDTYSS SLPWSTISPA LFRPIADVTP EHVTQLRQKQ QVRIDTSRLY KTYMRDLATL 
NRIRKKKSIT LQDSSFKSDV ETLRQIEKNW GESNELDSTH TKSGGKALER DVLLQQSSAV 
MADFVELKTT ERQTVIRAVP ALN