Gene Cagg_2635 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2635
Symbol
ID	7267226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	3229496
End bp	3230563
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	56%
IMG OID	643567461
Product	dihydroorotate dehydrogenase
Protein accession	YP_002463940
Protein GI	219849507
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGACC TTAGTACCAC CTATCTGGGC ATGAAGCTGC GCACACCAAT CGTGGCCGCA 
GCCTCACCCA TCAGCCGCAA TGTCGAACTT GTCCGCCAAC TGGAAGAGGC CGGACTAGGG 
GCAGTGGTGA TGTACTCGCT CTTCGAAGAG CAGATCATCC AGCAGAGCCT CGAGCTGGAC 
CGTATGCTGA GCCATGGAGC CGAGAGCTTC GCCGAAGCCC TCAGCTATCT GCCCGAACAC 
GGAGCATATA GCACCGGCCC CGAACGCTAC CTCGAGCAGG TAGCCGCCCT AAAACAGGGC 
CTGAGCATTC CGGTCATCGG TAGCCTCAAC GGCGTCTCGA AGGGAGGTTG GGTGCATTAC 
GCACGCTTGA TCCAGGAAGC CGGTGCTGAT GCGCTCGAAC TCAACATCTA CTTTGTGCCA 
ATCGATACCA ACATCACCAG CTCCGAACTT GAAGACATTT ATGTCGATTT GGTTAAAGCA 
GTGCGTGCTG AGATCAGTAT CCCACTGGCG GTGAAGATCG GCCCCTACTT CACCGCCCTC 
CCCAACTTCG CATGGCGACT GATGGAAGCG GGAGCAAATG CGTTGGTATT GTTCAACCGC 
TTCTACCAAC CTGATTTCGA TCTCGAACAG CTCTCGGTGC GCCCCAATTT GCAACTGAGC 
ACTTCAGCAG AATTGCGGCT ATCACTGCGC TGGATCGCTT TACTCTACGG ACGCATCCCG 
TTAGAGTTTG CCCTGAGCAG CGGTGTTCAC AATGCCATCG ACGTACTCAA AGGCCTGATG 
GCCGGGGCCA ACGTAACGAT GATCGCATCG GCGTTCCTGC GAGGACGCGC TACCGATGTC 
CTACGCACGA TTTTGCACGA CATGGAGTTG TGGCTCACCG AACACGAATA TGAATCGATA 
GCACAACTGC ACGGCAGCAT GAGCCAGCGC GCCGTCGCCG AACCGGCCGC CTTTGAGCGC 
GCAAACTACA TTCGCGTCCT CGATGATTAT CGTCCGCCTT ACGCCCTTGG GAGCCATACC 
GATCTGACCG GACGGATGTT GTATCCGTTC CTCGGTGATG AAGTATAA

Protein sequence

MIDLSTTYLG MKLRTPIVAA ASPISRNVEL VRQLEEAGLG AVVMYSLFEE QIIQQSLELD 
RMLSHGAESF AEALSYLPEH GAYSTGPERY LEQVAALKQG LSIPVIGSLN GVSKGGWVHY 
ARLIQEAGAD ALELNIYFVP IDTNITSSEL EDIYVDLVKA VRAEISIPLA VKIGPYFTAL 
PNFAWRLMEA GANALVLFNR FYQPDFDLEQ LSVRPNLQLS TSAELRLSLR WIALLYGRIP 
LEFALSSGVH NAIDVLKGLM AGANVTMIAS AFLRGRATDV LRTILHDMEL WLTEHEYESI 
AQLHGSMSQR AVAEPAAFER ANYIRVLDDY RPPYALGSHT DLTGRMLYPF LGDEV