Gene Cagg_1394 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1394
Symbol
ID	7267246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1719538
End bp	1721049
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	56%
IMG OID	643566237
Product	Carboxypeptidase Taq
Protein accession	YP_002462737
Protein GI	219848304
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2317] Zn-dependent carboxypeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.272507
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGTCCA GGTTACAAGA ACTTCGTGCC CGTCTCCTCG AGATCGACGA TATTAACAGT 
GCTGCCGCAG TGTTGGGGTG GGATCAGAGT ACGTATATGC CGCCCGGTGG TGCTGCGGCC 
CGCGCACGCC AACTGGCGAC CCTCTCGCGG TTGGCTCATG TGCGGAGCAC CGATCCGGCG 
TTGGGTGCTC TGTTGGCGGA ATTGATGCCG TATGCTGAAC AATTGCCCTA CGACCATCCC 
GATGCCGCAC TGATTAGGGT AGCCCATCGC AACTACGAGC GCATGACCCG AATTCCGGTG 
GAGCTGGCAA GTGAGATCGC TTCGCATACT GCTGCGAGCT ATCAGGCATG GACGCAGGCG 
CGACCGGCGA ATGATTTTGC TACGATGTTG CCCTATCTCG AGCGAACGCT TGAGCTGAGT 
CGCCGGGTGG CCGATTGTTT CCCCGGCTAT GATCATCCCG CCGATCCGCT GATCGACTTT 
AGCGACTACG GGATGCGGGC ATCTGAGATT CGCGATCTCT TTGCCCGACT GCGTGCCGGG 
CTGACCCCGA TCATTCGCGC GATTGTGGCC CAGCCGCCAA TTGACGATTC GTGTCTGCGC 
AAGTATTACC CGCGCAACGA TCAATTGGCT TTTGGTGAGC AGATCATTCG TCGTTTTGGG 
TACGATTTCG AGCGCGGTCG GCAGGATTTA ACCCATCATC CGTTTGCTAC GAAGTTTTCG 
ATTGGCGATG TGCGGATTAC CACCCGTATC AACGAGCACG ATCTCGGAGA TGGTTTGTTT 
AGCACTCTGC ACGAGTCGGG TCATGCGATG TATGAGCAGG GGATCGACCC GGCGTTTGAA 
GGGACACCGC TCTGTAACGG TGTTTCGGCG GGTGTTCACG AGAGTCAATC GCGTTTGTGG 
GAAAATCTGA TCGGTCGTTC TCGGCCATTC TGGGAACATT TTTACCCTGA ATTACAACAG 
ACCTTCCCGC AGCAGTTAGG GAATGTTTCG CTCGACGAGT TCTATCGAGC GATTAACCGT 
GTGCAACCGT CGCTCATCCG TACCGATGCC GATGAGGTGA CGTACAACCT CCACGTGATG 
ATCCGGTTTG ATCTCGAGTT AGCGTTGCTC GAAGGCAGTC TGAAGATCAC CGATCTGCCT 
GAAGCGTGGA ATGCTCGCTA TGCAGAGGAT TTGGGGGTTG TCGTCCCCGA TTACCGTGAT 
GGCGTGTTGC AGGATGTGCA TTGGTTTGGT GGATTGATCG GTGGTGCGTT TCAGGGCTAT 
ACCATCGGTA ATATCCTGAG CGCGCAATTT CTGGCCGCGG CGCGGTCTGC TCACCCCGAA 
ATCGATGCTG AGATCGGACA GGGTGAGTTT GCGACGTTGC ATGGATGGTT GCGGGAGCAT 
ATCTACCGTC ACGGTAGTGT CTTTACGCCT GCGGAGTTGA TCGAGCGGGC AACCGGTCGG 
TCAATGCAGA TCGAGCCGTA CCTCCAATAC CTACGGCAGA AGTATTCGGC AATTTACGGG 
ATCGAGTTAT AG

Protein sequence

MESRLQELRA RLLEIDDINS AAAVLGWDQS TYMPPGGAAA RARQLATLSR LAHVRSTDPA 
LGALLAELMP YAEQLPYDHP DAALIRVAHR NYERMTRIPV ELASEIASHT AASYQAWTQA 
RPANDFATML PYLERTLELS RRVADCFPGY DHPADPLIDF SDYGMRASEI RDLFARLRAG 
LTPIIRAIVA QPPIDDSCLR KYYPRNDQLA FGEQIIRRFG YDFERGRQDL THHPFATKFS 
IGDVRITTRI NEHDLGDGLF STLHESGHAM YEQGIDPAFE GTPLCNGVSA GVHESQSRLW 
ENLIGRSRPF WEHFYPELQQ TFPQQLGNVS LDEFYRAINR VQPSLIRTDA DEVTYNLHVM 
IRFDLELALL EGSLKITDLP EAWNARYAED LGVVVPDYRD GVLQDVHWFG GLIGGAFQGY 
TIGNILSAQF LAAARSAHPE IDAEIGQGEF ATLHGWLREH IYRHGSVFTP AELIERATGR 
SMQIEPYLQY LRQKYSAIYG IEL