Gene Gdia_3102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3102
Symbol
ID	6976536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	3396897
End bp	3398216
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	69%
IMG OID	643392610
Product	dihydroorotase
Protein accession	YP_002277447
Protein GI	209545218
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	0.544962
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATTACG ACCTGATCAT CCGCAATGGC GTCTGCCTTC TGCCCTGGGG CGAGGCCCGT 
ACCGACATCG GCGTGCGCTC GGGCCGGATC GCCAGCCTGA CGGCGGGTGT GGCGGACGAG 
GCCGATACGG TCATCGACGC GTCCGGCCTG CATGTGCTGC CCGGGCTGAT CGACCCGCAC 
GTGCATCTGC GCGACCCGGG CGACGCCGCG GTCGAGAGCA TTCCCACCGG CACGCGCGCG 
GCGGCCCTGG GCGGGGTGAC GACGGTGTTC GACATGCCCA ACACCGCGCC ATCGGTGACC 
GACGCCGAGA TGCTGCGCTG GAAGCAGGAA TACGCGTCGC GCGAAAGCTG GGTGGATTTC 
GCGCTGTATG TCGGCGCCAC GCGCGGCAAT ACGCCGCGCC TGGGCGAGTA CGAGTGTTTC 
GACGGGGTCT GCGCCATCAA GGTCTTTGCC GGATCGTCGA CCGGCGACCT GATGATCGAG 
GATGACGAGG GCATCCGGCA GGTGCTGGAG AACGGCCACC GCCGCGTCGC CTTCCATTCC 
GAGGACGAAT ACCGCCTGCA GGACCGCAAG AAGCTGCTGA CCGAGGGCAT GTCCTACGAC 
AGCCATCCCT TCTGGCGGGA CGAGGAATGC GCCTTCCTGG GCACGCGGCG TATCGTGGAT 
CTGGCGCGGC GGGCGGGGCG GCCGGTCCAT ATCCTGCATA CCTCGACCGC CGAGGAACTG 
GACTGGCTGC CGGCGCATCG CGACGTCGCG ACCGTCGAGG TGCTGGTGAA CCATCTGACC 
CAGGTCGCCC CCGAATGCTA TGAGACGCTG GGCCCGCTTG CGATCATGAA CCCGCCGATC 
CGCGACCGCC GGCATTACGA GGCCAGTTGG GAGGCCGTGC GCAACGGCAC CGTGGACACG 
ATCGGGTCGG ACCACGCGCC CCATTCCCTG GCGGCGAAGG CGCGGCCCTG GCCCGCCACC 
CCGGCGGGGC TGACGGGGGT GCAGACGCTG GTTCCCGTCA TGCTGGACCA CGTCAATGCC 
GGGCGTCTGT CGCTGGGCCG GATGGTGGAC CTGATGGCGG CAGGGCCGGC GCGGGTCTAT 
GGCCTGCAGG CCAAGGGGCG GATCGCCATG GGCTATGACG CCGATTTCAC CCTGGTGGAC 
ATGAAGGCGC GGCGCCGTAT CACCAATGAC TGGATCGCCA CCCCGGCGGG CTGGACGCCG 
TTCGACGGGA TGGAGGTGAC GGGCTGGCCG ATGGCGACGA TCGTGCGGGG CCACGCCGTC 
ATGCGCGAGG ATACGATCCT GGGCGCGCCG GCCGGCAGGC TTGCGCATTT CGCACCCTGA

Protein sequence

MHYDLIIRNG VCLLPWGEAR TDIGVRSGRI ASLTAGVADE ADTVIDASGL HVLPGLIDPH 
VHLRDPGDAA VESIPTGTRA AALGGVTTVF DMPNTAPSVT DAEMLRWKQE YASRESWVDF 
ALYVGATRGN TPRLGEYECF DGVCAIKVFA GSSTGDLMIE DDEGIRQVLE NGHRRVAFHS 
EDEYRLQDRK KLLTEGMSYD SHPFWRDEEC AFLGTRRIVD LARRAGRPVH ILHTSTAEEL 
DWLPAHRDVA TVEVLVNHLT QVAPECYETL GPLAIMNPPI RDRRHYEASW EAVRNGTVDT 
IGSDHAPHSL AAKARPWPAT PAGLTGVQTL VPVMLDHVNA GRLSLGRMVD LMAAGPARVY 
GLQAKGRIAM GYDADFTLVD MKARRRITND WIATPAGWTP FDGMEVTGWP MATIVRGHAV 
MREDTILGAP AGRLAHFAP