Gene Athe_1376 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1376
Symbol
ID	7409119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1460196
End bp	1461488
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	36%
IMG OID	643715741
Product	dihydroorotase, multifunctional complex type
Protein accession	YP_002573249
Protein GI	222529367
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATATTGA TAAAAAACGC ACAGATTGTA AATAGTATTG ACAACAAACT TGAAAAGGCT 
GATATACTGA TAGTTGATGA CAAGATAGAA AAGATTGGTA AAAACATAGA AGAAAATCCA 
GATAAGATGA TTATAATAGA TACAAGCGGC AAGTATGTAA TGCCAAGCTT TACCGATATT 
CACTGTCATT TGCGGGAACC TGGTTTTGAG TACAAAGAAG ACATAAAGAG CGGAAGTAGA 
GCTGCTTTAG CAGGAGGATT TACAACCATC TGTTGTATGC CAAACACAAA CCCTCCTGTA 
GACAACAGAG CAATGATTGC GTATATAAAA TACCGTGCAA AAGAGGTCTC ACCAATTGAG 
GTTTTACCTG TTGGGGCTAT AACAAAAGGA CTTTCAGGAG AAGAGCTTGC AGAGATAGGA 
TTTATTAAAG AAGAAGGGGC CATTGCTATA TCAGACGATG GAAAGTGTGT TATGAACGCA 
AACATTATGA GAAATGCTCT TTTGTACTCA AAAGATTTTT CAATACCTGT CATTTCACAC 
TGTGAGGATA CAAACTTATC TGAAGGAGGA CAGATAAATT TAGGATATGT GTCAACAATC 
ACGGGACTTA GAGGAATTCC ACGCGAGGCA GAATCAATTA TTGTTGCAAG AGATATTCTT 
CTTGCAAAAG AGACAAAAGC ACATCTTCAT ATAACCCATG TGTCCACCAA AGAATCTGTT 
AGACTTATAA AAATGGCAAA AGAGTGGGGT GTAAATGTCA CGGCTGACAC ATGCCCGCAT 
TATATAAGTC TTACAGAAGA AGAGGTACTT GGATTTAACA CAAATGCAAA AGTAAACCCT 
CCTTTGAGAA CACAAGAGGA TATTGAAGCT TTAATTGAAG GATTAAAAGA AGGTGTAATT 
GACTGTATAT CAACAGACCA TGCCCCGCAT CATAAAGATG AAAAGAATGT CGAATTTAAC 
CTTGCTGCAA GCGGTACAAT TGGGTTTGAG ACTGCATTTT CTGTGCTGTT CACATATCTT 
GTCGAGAAAA ATGGGTTTGA TATTGGGAAA ATAGTAGAAC TTTTGAATTA CAATCCCAGA 
AAAATAATTG GACTTTCTCC AAATATTATA AAAGAAGGTG AAAAAGCCAA CCTTGTAATT 
GTGGATTTAA AGAAAAAGTG GGAAGTAAAA GAGGAAAACA TTGTGTCAAA ATCAAAAAAT 
AGTGTGTTTT TGGGAAAACT TTTGACTTCT TATGTTGAGA CAGTAATATA CAATGGGAAG 
ATATTAAAAA AGGACGGTGT TTTAAGTTGT TGA

Protein sequence

MILIKNAQIV NSIDNKLEKA DILIVDDKIE KIGKNIEENP DKMIIIDTSG KYVMPSFTDI 
HCHLREPGFE YKEDIKSGSR AALAGGFTTI CCMPNTNPPV DNRAMIAYIK YRAKEVSPIE 
VLPVGAITKG LSGEELAEIG FIKEEGAIAI SDDGKCVMNA NIMRNALLYS KDFSIPVISH 
CEDTNLSEGG QINLGYVSTI TGLRGIPREA ESIIVARDIL LAKETKAHLH ITHVSTKESV 
RLIKMAKEWG VNVTADTCPH YISLTEEEVL GFNTNAKVNP PLRTQEDIEA LIEGLKEGVI 
DCISTDHAPH HKDEKNVEFN LAASGTIGFE TAFSVLFTYL VEKNGFDIGK IVELLNYNPR 
KIIGLSPNII KEGEKANLVI VDLKKKWEVK EENIVSKSKN SVFLGKLLTS YVETVIYNGK 
ILKKDGVLSC