Gene Cagg_2224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2224
Symbol
ID	7266797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2722041
End bp	2723231
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	58%
IMG OID	643567055
Product	amidohydrolase
Protein accession	YP_002463543
Protein GI	219849110
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.355102
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.809475
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCTTG AACGCGCCCA GGCACTCGCC GATGAGCTTA TCCGCATCCG TCGTGATATT 
CACGCCCATC CCGAACTTGG GTTTCAGGAA CACCGTACCG CTGCCCTTGT TGCTGAAACG 
TTGCAAGAGA TCGGAGGGAT CAAGATTACC ACCGGCGTAG CCAAGACTGG TGTGATCGGT 
GAACTCGGTG ATGGCGATGG GCCGGTTATC GCGATCCGGG CCGATATGGA TGCGCTGCCC 
ATTCTGGAAG AGAACAACGT GGAGTATGCC TCAACGAACC CCGGGGTGAT GCATGCTTGT 
GGTCACGACG CGCATACGGC GATGCTGCTC GGCGCTGCCC ATCTCTTACG CGAACGTTTT 
GCCGCCGAAC ATTTGCGCGG GCGTGTGCGT TTTCTCTTTC AACCTTCTGA AGAAGGGTGG 
GACGATGAGG CGAAGAGCGG TGCCCTCCGT ATGGTTGAAG AAGGCGCATT GCAAGGGGTC 
GATGCCGTCA TTGCGCTGCA CGTCGATTCA ACCCTGCCGG TTGGGCAAGT CACGATTCGC 
GGTGGTTGGT CGTCGGCAGC CGTTGATGAT TTTAAGGGGT ATATTCGCGG GACAGGTGGT 
CACGGGGCGT ACCCACATCT CGGCACCGAT CCGGTCTTTA TGCTGTCGCA TGTGCTGAAC 
GCTCTGTTTG GCATTCGCTC ACGCCTGATC AACCCGATGG AGCCGGCGAT CCTCAGTGTG 
GGGACGGTGC GTGGTGGTCA TGCTTCAAAT GTGATTCCTA GTGAGATTTT TGTGCAGGGA 
ACACTGCGTA GTTTTAGCGA AGAGGTACGG GCGAAACTTG CCAAAGAGGT TGAGCGTGCG 
TTTGCCGTGG CCGAAGCGTT CGGTGGTAGC GCCGAGGTGA AGATCACCCG TGGCTATCCC 
GCTGGCTGGA ACGACGAACG GGTGGCTGAG TGGATGAGTC AGGTCGCCGG TGAATTCCTT 
GGAGCTAACG CGATTGATCG CTCGCGCACC GGTATGGGCG CGGAAGATTT TGCCTATATG 
ACCCAGCAAG CGCCCGGCGC GATGTTGATG CTCGGTGCTG CGATTGACGA CGGTAAAGTA 
CGTGCTCACC ATACACCCAT CTTCGATATC GACGAGCGAG CACTCCCGAT CGGTACTGCT 
ATCTTGGCCG AAACGGCATT GCGTTTCTTG CGCGGTGAGG TGTCGTTGTA G

Protein sequence

MLLERAQALA DELIRIRRDI HAHPELGFQE HRTAALVAET LQEIGGIKIT TGVAKTGVIG 
ELGDGDGPVI AIRADMDALP ILEENNVEYA STNPGVMHAC GHDAHTAMLL GAAHLLRERF 
AAEHLRGRVR FLFQPSEEGW DDEAKSGALR MVEEGALQGV DAVIALHVDS TLPVGQVTIR 
GGWSSAAVDD FKGYIRGTGG HGAYPHLGTD PVFMLSHVLN ALFGIRSRLI NPMEPAILSV 
GTVRGGHASN VIPSEIFVQG TLRSFSEEVR AKLAKEVERA FAVAEAFGGS AEVKITRGYP 
AGWNDERVAE WMSQVAGEFL GANAIDRSRT GMGAEDFAYM TQQAPGAMLM LGAAIDDGKV 
RAHHTPIFDI DERALPIGTA ILAETALRFL RGEVSL