Gene Cagg_0037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0037
Symbol
ID	7269034
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	59555
End bp	60853
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	57%
IMG OID	643564910
Product	peptidase M14 carboxypeptidase A
Protein accession	YP_002461426
Protein GI	219846993
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2866] Predicted carboxypeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTACACG TGTTGTTAAC GTTTCTCCTG ATCATAGCAA CCGGGCTACA TTGGTTATCC 
CCGGCCCAAG CTGCTCCTGT TCGCACCGTT GAAATTGGGC GTTCTGCGGA GGGTCGTCCG 
ATCGAAGCGG TGATCTTCGG TGATGGGCCT CGCAAGCTGG TGGTTATCGG GGCTACCCAT 
GGTGAACCTG AAGCGAATAC CTACCGCCTG GCCCTTGCCT TGATCGAATA CTTCCGGACC 
AATCCTACTG CAGTACCACC CGATGTGCGG CTCGTCATTA TCCCGGTCAT TAATCCAGAC 
GGTTTGGCCC GTGGATGGCG CTTTGATGCT GCCGGTGTCG ATCTCAACCG CAATATGGAT 
ACCAGCCTCG ATGCTTGTCC CGACAATGAT TGGCAGCAAC GGGTACAAGG CGCGCGTGGT 
ATTGTCTCAG ATACCGGTGG CCCCTATCCA GACTCGCAAA TCGAGAGTCG CTTGTTGCGC 
GCCTTCTTAC TCGATGCCGC CGGCGCAATT TTTCTTCATT CCAATGCCGG TGTCGTCTTT 
CCGGCCAGTT GTGAACACCA GTCATCCATT GCGATGGCCC AAACGTATGC TGCGGCTGCC 
GGCTACGAAT ATACCCGGTT TTGGGATCGC TACACGATTA CCGGTGGAAT GCACGATTGG 
GCTGCCGGCT TGGGCATTGC CGCCATTACC CCCGAACTTG TCACCGGTAA CCAGCCTGAA 
GTGGCCGAGA ATCTAGCCGG ATTGCAGGCA GTACTGGCGA ATGCCGATGA ACTGTTACCC 
TTGCCTACAC CAGGGGTGCT CAACGACATC GAAGTGCCGG CTGTTATATA TCGCTTTTGG 
CGCGCACTCG GTGGCGAGAC ACGGTTTGGC CTGCCATTAG CGCCGGCGGA AGTCACACCT 
CGTGGGATGC GTCAAGCATT TACTCGCACG GTGATCGAAG TCGATGAGGC GCAACGTGAT 
ACGACTGCTT ACGTCCGCAT GGCATCACTC GGTGCGGAAG CTGCCACGGC CCGTGCGTAT 
GGTGGCGAAA CGGCAATGGG AATGCCGGAG AGTTGGCCAT CCGGCCCTTT CGCTGCTTAC 
TGGCAGCGCG GTGGGGCGCA GATGGTCTTC GGGCTGCCGC TCAGTGTCCC TTTCACCACC 
CAGTTAGCCG ATGGTAGTCG GCGTACTGCG CAATATTTCG AGCGCGCCGT ATTGTTGCTC 
GACCCTACCG ATGGTCATAT CGAACTAGCC CCGTTAGGTA GTTGGGATAT AGCACGTCAC 
CGGCTAACTG TTCCACTTAC CCCTCACACG ATTCGCTGA

Protein sequence

MLHVLLTFLL IIATGLHWLS PAQAAPVRTV EIGRSAEGRP IEAVIFGDGP RKLVVIGATH 
GEPEANTYRL ALALIEYFRT NPTAVPPDVR LVIIPVINPD GLARGWRFDA AGVDLNRNMD 
TSLDACPDND WQQRVQGARG IVSDTGGPYP DSQIESRLLR AFLLDAAGAI FLHSNAGVVF 
PASCEHQSSI AMAQTYAAAA GYEYTRFWDR YTITGGMHDW AAGLGIAAIT PELVTGNQPE 
VAENLAGLQA VLANADELLP LPTPGVLNDI EVPAVIYRFW RALGGETRFG LPLAPAEVTP 
RGMRQAFTRT VIEVDEAQRD TTAYVRMASL GAEAATARAY GGETAMGMPE SWPSGPFAAY 
WQRGGAQMVF GLPLSVPFTT QLADGSRRTA QYFERAVLLL DPTDGHIELA PLGSWDIARH 
RLTVPLTPHT IR