Gene Cagg_1611 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1611
Symbol
ID	7268177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1964658
End bp	1965995
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	58%
IMG OID	643566452
Product	amidohydrolase
Protein accession	YP_002462948
Protein GI	219848515
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0170905
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00285374
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTACGATC TTCTCATTCA GCACGTTGAT GTTCTCCAGA TCGCCAATGG CGCTCCTACC 
ATTCTGCCTC GCCACGACCT TGCCATCACC GATCGACGCA TTAGCGCAAT CGCTCCGGCG 
ATTAGTCCCG GCCTCGCCCG TGAGGTGATT GACGGTGAGG GGCATCTAGC CATCCCCGGT 
CTGATCAATA GCCATGCCCA TACCGCAATG AGCCTCTTTC GGGGGGTAGC TGAAGATGTA 
CCGATTGAAG AGTGGTTTAA CCGCTTTATC TGGCCACTCG AAACGAATCT GACCCCGGAA 
GATGTGTATT GGGGTACGTT ACTCGGTCTG GCCGAGATGA TCGAAGCCGG GGTGACATGC 
GTCGCCGATC ACTATTTTGC GACGGATGCT ATCGCTCAGG CGGTGCAGGA ATCGGGAATG 
CGTGCATTGT TGGCGTGGAC GCTCTTTTCC GGCGCCGATG AGGATACCCA GCTTAACAGC 
GCACGCCGAT TTACCGAGCA GTGGCATGGT ACTGCCGGTG ATCGCATTCG GGTTTGGATG 
GGACCACACT CGCCTTATAC CTGTACTCCT TCGTTCTTGA GCCGTATCGC GCGAACCGCG 
CGTGAACTGG GAGTAGGAAT TCACATTCAT TTAGCCGAGA CGGCCGGTCA AGTGTCACAG 
AGTATCGCGA CCTATGGTCG TTCGCCGGTG ATGGTAGCGT ATGATGCGGG ATTGTTTGCC 
GGGCCGGCCC TGGCTGCCCA CGTTGCTCAT GTCTCACCAG AAGATATTGC CGTCCTTGCG 
ACGCATGGGG TGGCGGTTGC GGTCACGCCG AAGACCGAGA TGAAGCTGGG GATCGGTGTT 
GCACCGGTGA CAACCATGCG GGCAGCAGGG GTAACGGTTG CCTTGGGGAG TGATGGGGCG 
GCGAGTAACA ATACCTACGA TGTGCTCGAA TCGGCGCGGT TACTCGCACT GCTCGAAAAA 
CTGCGCACCG GCGATGCCCG AGTTATGCCG ATTGGAACGG TGCTCGAGTT GGCGACTGTT 
GCCGGTGCGC AGGCTTTGCA CTGGGAAGGG ATTGGTGTTT TACAACCCGG TGCGCGTGCC 
GATCTAGCTT TGATACAGTA TGCTACCGCG CATACCCAGC CGGTACACGA TCCGGCGGCA 
GCGCTCCTCT ACAGTAGTCA GCCCGCCGAT GTGCGTACCG TGATTGTGGA TGGTCGCGTC 
TTGATGCGTG ATCGCGTTTT GCTCACCATC GATAAGCCGC GAGTGCTGCG TGAGGTGGTT 
GCACGGATAG AGCGCCTCAC GCAGTATCAG CTCGATAAGC GGATAGCAGT GTATCCTGAA 
GCCAGAACCG ATGCGTAG

Protein sequence

MYDLLIQHVD VLQIANGAPT ILPRHDLAIT DRRISAIAPA ISPGLAREVI DGEGHLAIPG 
LINSHAHTAM SLFRGVAEDV PIEEWFNRFI WPLETNLTPE DVYWGTLLGL AEMIEAGVTC 
VADHYFATDA IAQAVQESGM RALLAWTLFS GADEDTQLNS ARRFTEQWHG TAGDRIRVWM 
GPHSPYTCTP SFLSRIARTA RELGVGIHIH LAETAGQVSQ SIATYGRSPV MVAYDAGLFA 
GPALAAHVAH VSPEDIAVLA THGVAVAVTP KTEMKLGIGV APVTTMRAAG VTVALGSDGA 
ASNNTYDVLE SARLLALLEK LRTGDARVMP IGTVLELATV AGAQALHWEG IGVLQPGARA 
DLALIQYATA HTQPVHDPAA ALLYSSQPAD VRTVIVDGRV LMRDRVLLTI DKPRVLREVV 
ARIERLTQYQ LDKRIAVYPE ARTDA