Gene Cagg_1955 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1955
Symbol
ID	7268871
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2388516
End bp	2389502
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	62%
IMG OID	643566793
Product	urea amidolyase related protein
Protein accession	YP_002463286
Protein GI	219848853
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1984] Allophanate hydrolase subunit 2
TIGRFAM ID	[TIGR00724] biotin-dependent carboxylase uncharacterized domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00247054
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGCTACGT TTCTCGACAT CATCGCGGCC GGGTCGCTAT TGACAATCCA AGACGGTGGA 
CGAACGACCG CGCGACGCTA TGGGGTGCCG GTAGGAGGAG CGATGGATCG GTTTGCGTTA 
GCTGTAGCTA ACCGCTTAGC CGGTAATCAG CCTTACGTAC CGGCGTTCGA GATCACTGCT 
GGTGGAACCC AGATCCGTTG CAGCACAACT ATCACCATCG GTCTGGCCGG CGCCGATTTG 
CAAGCGCGGC TCAACGATAC ACCGCTTGTC CCGTGGCATA GCGCCGTCGC TCCGGCCGGC 
AGTACCATCA CCTTTGGCGG ACGACGTGGC GGCTGGGGCG GCCGTGCGTA TCTGGCGGTC 
GCCGGTGAAC CGGTCGTCGA GTGGGCGATC GGTGGTGCGG GTACCTGTTT GGCCGGTGGC 
TTTGGTGGTT ATCAGGGACG AGCATTACGA GCCGGTGATC GGATCGCCGT TCAAGCTCGA 
CCGGCGATGG CAGTTGATGG AATGCGTTGG TGGCCGGTGG ACCGGCGTCC ACCCTACGGC 
CCTCAACCAC GCTTGCGCGT CATTCCCGGT CCTCATGCGG ATCAATTACC GATGGCGTGG 
ACCGGGCTAC TATCCGCGAC ATGGCAGATC GACCAGGCGG CCAGCCGGCA AGGCTACCGA 
CTGACCGGTG CCATCCTACC TTCGTTTACC CACTCGCTAA CCTCATTCGG AATCGTACCG 
GGCGCGATCC AGTTACCACC CGATGGCCGA CCGATCCTGT TAATGGCCGA TGCCCAAACG 
ACCGGCGGCT ATCCGGTGAT TGCCGTCGTC ATCGGTGCCG ATCTCCCGCT AGCCGCACAA 
CTCTTACCCG GCGACCGGCT CACATTTGTC GCAAGCGATC TGGCTACTGC CAAAGAATCA 
TTAGCCCAGC AGTCGGTATG GCTGACTGCC GGGCCTGAAG ATGATGAGAA CGGATGGTTG 
CTGGCCCAAG CGGGCGCAAT ACGGTGA

Protein sequence

MATFLDIIAA GSLLTIQDGG RTTARRYGVP VGGAMDRFAL AVANRLAGNQ PYVPAFEITA 
GGTQIRCSTT ITIGLAGADL QARLNDTPLV PWHSAVAPAG STITFGGRRG GWGGRAYLAV 
AGEPVVEWAI GGAGTCLAGG FGGYQGRALR AGDRIAVQAR PAMAVDGMRW WPVDRRPPYG 
PQPRLRVIPG PHADQLPMAW TGLLSATWQI DQAASRQGYR LTGAILPSFT HSLTSFGIVP 
GAIQLPPDGR PILLMADAQT TGGYPVIAVV IGADLPLAAQ LLPGDRLTFV ASDLATAKES 
LAQQSVWLTA GPEDDENGWL LAQAGAIR