Gene Cagg_3837 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3837
Symbol
ID	7266317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4675611
End bp	4676681
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	59%
IMG OID	643568648
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_002465108
Protein GI	219850675
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000541635
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTACCGTG TGTTGTTGCG CCCGATCTTG TTTCGGTTGG GTGGAGGTGA TGCCGAGACG 
GCTCACGAAC GTACCTTGCA TCTGTTGGCG CTGCTGAGCC GTTCACGTCC GTTGTACCGC 
ACGCTGGAGC TGCTGACGAC CATTCGAGAT CAACGACTGT CGCGTACCGT CTTCGGGGTT 
CAGTTTCCCA ATCCGGTCGG TTTGGCTGCC GGTATGGATA AAGACGGTGT GGCGTTGCCG 
GCATGGGCAG CCCTTGGCTT TGGTTTTGTC GAGGTGGGGA CTGTGACGCA CCTTCCGCAG 
CCCGGTAACC CCCGCCCGCG TCTGTTTCGG TTACCGACCC ACGAGGCATT GATCAACCGG 
ATGGGGTTCA ATAATGCCGG TGCAGCCGCC CTGGCCCATC GGTTGGCGTC CTTACAGCCG 
GCCCCTGTTC CGGTTGGTGT CTCGATTGGT AAGTCGAAGG TGACACCACT CGAACACGCC 
ATTGACGATT ATTGCGCTTC GTTTCGCGTG CTGTTTCCCT ATGCCGCATA TGTGGCGATT 
AACGTAAGCT CGCCGAATAC GCCCGGTCTC CGCCAATTGC AAGATGCCGA TCATTTGCGC 
GCATTGTTGG CAGCTCTGCA ACGTGTCAAC ACCGAGTTGG GGCGTACCCA TTCGCGTGGA 
CCGCTTCCGC TATTGGTCAA GATTGCTCCC GATCTCAGTG AACCGGCGTT GGATGAACTC 
TTGACCGTTT GTGCCGACCA TGCCGTTGCC GGCATTATTG CGACCAATAC GACAATTAGT 
CGTCACGGTT TGGCCGGTGC TGACCCGGCG TTGGTTGTCG AGACCGGTGG CCTCAGTGGT 
CGACCACTGA CATTACGTGC CCGGCAGCTA GTGCAGTATG TTGCCCGTGC AACCGGTGGT 
CGGTTGCCGA TTATCGGGGT CGGTGGAATT CATTCACCGG ACGATGCACT GCGGATGTTC 
GAGGCCGGGG CGGCGTTGAT CCAACTCTAC ACCGGGTTGG TGTATCACGG GCCGCTACTG 
CCGCGGCGAA TCAACCATGC TCTGCTGTCG TATCGTAAGG GAGCTGCATG A

Protein sequence

MYRVLLRPIL FRLGGGDAET AHERTLHLLA LLSRSRPLYR TLELLTTIRD QRLSRTVFGV 
QFPNPVGLAA GMDKDGVALP AWAALGFGFV EVGTVTHLPQ PGNPRPRLFR LPTHEALINR 
MGFNNAGAAA LAHRLASLQP APVPVGVSIG KSKVTPLEHA IDDYCASFRV LFPYAAYVAI 
NVSSPNTPGL RQLQDADHLR ALLAALQRVN TELGRTHSRG PLPLLVKIAP DLSEPALDEL 
LTVCADHAVA GIIATNTTIS RHGLAGADPA LVVETGGLSG RPLTLRARQL VQYVARATGG 
RLPIIGVGGI HSPDDALRMF EAGAALIQLY TGLVYHGPLL PRRINHALLS YRKGAA