Gene Cagg_3360 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3360
Symbol
ID	7267100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	4073050
End bp	4074516
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	60%
IMG OID	643568169
Product	dihydroorotase, multifunctional complex type
Protein accession	YP_002464640
Protein GI	219850207
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.321157
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000187525
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGGTATC TCATAAAAAA CGGCACAATT ATCGATCCGG CCAACCGAGT GGCAACTATC 
GGTGATATTT TGGTCGCCGA CGGCAAAGTT GAGCGATTGT ACGATCTGGC CGATCTCCAC 
AGCGATCGCG AACCCATCGG GCCGGACGTG GAAGTGATTA ATGCTCGTGG CTGTGTCGTC 
GCACCGGGTT TTACCGATCT CCACACCCAC CTGCGACAGC CGGGTGAAGA ACATCGAGAG 
ACGATTACCA GCGTGAGCGC GGCAGCAGCC GTTGGCGGCT TTACCACGCT GTGCGCCCGT 
CCCACAACGC ACCCCACCCC GGATAACGCG GCGGCAATTC GGCAGTTGCG TGAATTGGTC 
GCGCACTTTG GGAGTGTGCG GATCGATGTG ATCGGCGCGT TGACGTTGGG GAACGAAGGG 
CGGATCTTGA GTGAGATGCG CGAACTGGCC GAAGCCGGCT GTATTGCGTT TAGTGACGGT 
GGACGGACCA TCGCCGACGC GGCGCTGATG CGGCATGCGT TATCGTATGC GGCAGCGCTC 
AATTTGCCGG TGATGGTGAC GTGTCAAGAC CCGTCGTTGG CTGCCGGTGG TGTTGCCCAT 
GAAGGGGCAG TGAGTGTACG TTTAGGTCTG CCGGGCATCC CTGCAGCCGC CGAAGAAGCC 
ATTGTAGCCC GCGATATTGC CCTCGCCGAA GCGACCGGTG CTCATTTGCA CATCAGCCGA 
GTAAGTACGG CCGGCAGCGT CGCGCTGATC CGAGCTGCAC GAGCGCGTGG GGTGCGGGTG 
ACGGCAGAAG TGACGCCGCA CCACCTGACA CTGACCGACC GCTGGCTGCT GGGCTGGCTG 
GAAGAGCGAA ACGAGATCGA AACCGGCCGC GCCGGTGCCC ATCCCGATCT GAGCTTACCA 
TCGTGGCTTG AGCCAAGCCT ATTACCGCCA TACGACAGTT CAACGCGGGT TGAACCGCCC 
TTACGCAGCA TCGAACATGT TGAAGCGTTG GTGGCCGGCT TGCGTGATGG CGTGATCGAT 
GCGATTGCAG TTGATCACGC GCCGCTGGCA CTTGTTGACC GTGAGTGTGA GTACGGGATT 
GCCCCACCCG GCATCAGCGG TCTGGAGACG GCACTTGCCC TTACGCTGAC TCTCGTCCAT 
CGCGGTGAGA TGGATATTGT CAACCTGATT GCGAAACTCA CCGAGGGGCC GGCGCAGGTA 
CTCAACCGGT CGCCGGCGAA CTTGCGGCCC GGGGCAACCG CCGACATCGT GATCTTCGAT 
CCTGAGCGGA GCTGGGTGGT AGACCCCGAT CACTTCCGGT CACGTGGGCG TAACACGCCG 
CTACGCGGCC AACGGTTGAA GGGACAGGTG ATGTTGACGA TGGCTGCCGG CAAGATTGTG 
TTCCGTCGCG ACAATTTTGG CCGGCAAGGA CAAGCAGCAC CACAACCCTC ACGACTCGAA 
GGTATTTTGG AGAGTGAAGA GACATAA

Protein sequence

MRYLIKNGTI IDPANRVATI GDILVADGKV ERLYDLADLH SDREPIGPDV EVINARGCVV 
APGFTDLHTH LRQPGEEHRE TITSVSAAAA VGGFTTLCAR PTTHPTPDNA AAIRQLRELV 
AHFGSVRIDV IGALTLGNEG RILSEMRELA EAGCIAFSDG GRTIADAALM RHALSYAAAL 
NLPVMVTCQD PSLAAGGVAH EGAVSVRLGL PGIPAAAEEA IVARDIALAE ATGAHLHISR 
VSTAGSVALI RAARARGVRV TAEVTPHHLT LTDRWLLGWL EERNEIETGR AGAHPDLSLP 
SWLEPSLLPP YDSSTRVEPP LRSIEHVEAL VAGLRDGVID AIAVDHAPLA LVDRECEYGI 
APPGISGLET ALALTLTLVH RGEMDIVNLI AKLTEGPAQV LNRSPANLRP GATADIVIFD 
PERSWVVDPD HFRSRGRNTP LRGQRLKGQV MLTMAAGKIV FRRDNFGRQG QAAPQPSRLE 
GILESEET