Gene Acid345_4149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4149
Symbol
ID	4072340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4908078
End bp	4909367
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	62%
IMG OID	637986180
Product	dihydroorotase
Protein accession	YP_593223
Protein GI	94971175
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.171454
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCTA CATCTGTTTT GATCCGGCGC GGGCATGTAA TTGACCCGGC GAACAACATT 
GACCGTCCCA TGGACGTACT CCTGCGCGAA GGACGCGTGG CGGCGATTAC CGAACCCGGG 
GGCATCAAGT CCGAATACGA AGAAGAGTTT GACGCGAACC ACCTGGTGGT GGCGCCGGGC 
TTTATTGACC TGCATGTGCA CCTGCGCGAG CCGGGGCAGG CGCACAAGGA AACCATTGCG 
AGCGGCACGC GCTCGGCGGC GGCGGGCGGC TTTACGTCCG TCTGCGCGAT GCCCAACACT 
TCGCCGGTGA ATGACACTCC GGAGACCACC ACGTGGATGC TGCAGCCGGA CCGTGGCGCG 
GTAGTGAACG TCTTCCCGAT TGCCGCGGCC ACCATCGGAA GCAACGGTGA AAAGCTCACC 
AACTTCCGCG ATTTACAGCG CGCGGGTGCG GTGGCGATCA GCGATGACGG CAAGCCGATC 
CTGGACGACA ACCTGATGCG GGAGGCGCTG CGCACCGCGG CGCGGCTGGA GATGCCAGTG 
GTGCAGCACG CGGAAGATCC TCGGATGCAT CCGGGCGGCT GCATGAATTA CGGTGTGACT 
TCGTTGCGGC TGGGACTGCG CGGCATCCCG AATGCGAGCG AAGCCAGCGT GGTGCTGCGC 
GATATCCGGC TCACGCGCGA GTCGCGCGCG CACTTGCACG TGGCGCATAT CTCCACGGCC 
GAGGCGCTTG ACGCCGTGCG CCGGGCGAAG AAAGAAAACT TGCGTGTGAC CGCCGAGGTT 
ACGCCGCACC ACTTCACGCT GCTCGACGAA AACATTGGCC ACTACGACAC GGCATACAAG 
ATGAATCCGC CGCTACGCGC GAACCCGGAC CGCGACGCGA TGATTGCCGG CCTGAAAGAC 
GGCACGCTCG ATTGCATTGC CACCGACCAT GCACCGCACG CGTATCACGA GAAAGAACAG 
GAATTCGACC GCGCGCCCTT CGGCATTATC GGCCTCGAGA CGGCGCTGCC GCTGGCGATT 
ACCGTGTTGC ACAAGCACTT CGAAATTCCG CTCACGCGGA TCGTGCAACT GATGAGCACC 
AGTCCGGCGC GGCTTTTCCA ACTCATGCAT CGCGGCTCGC TGGCGGTTGG TTCGCATGCC 
GACGTCGTGG TCTTCGATCC GAAGATGAAG TGGAAGTTCG AGGCGGCGAA GGGCCACTCG 
AAATCGAAGA ACACACCGTT CGACGGCTGG GACTTCATGG GCAAGGTGAT GGCGACGATT 
GTGGGCGGAA GACCGGTTTA TCTGGCGTAA

Protein sequence

MTSTSVLIRR GHVIDPANNI DRPMDVLLRE GRVAAITEPG GIKSEYEEEF DANHLVVAPG 
FIDLHVHLRE PGQAHKETIA SGTRSAAAGG FTSVCAMPNT SPVNDTPETT TWMLQPDRGA 
VVNVFPIAAA TIGSNGEKLT NFRDLQRAGA VAISDDGKPI LDDNLMREAL RTAARLEMPV 
VQHAEDPRMH PGGCMNYGVT SLRLGLRGIP NASEASVVLR DIRLTRESRA HLHVAHISTA 
EALDAVRRAK KENLRVTAEV TPHHFTLLDE NIGHYDTAYK MNPPLRANPD RDAMIAGLKD 
GTLDCIATDH APHAYHEKEQ EFDRAPFGII GLETALPLAI TVLHKHFEIP LTRIVQLMST 
SPARLFQLMH RGSLAVGSHA DVVVFDPKMK WKFEAAKGHS KSKNTPFDGW DFMGKVMATI 
VGGRPVYLA