Gene Daro_3889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3889
Symbol
ID	3567734
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	4180548
End bp	4181795
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	64%
IMG OID	637682363
Product	dihydroorotase
Protein accession	YP_287087
Protein GI	71909500
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	0.238894
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATCG TTATTGAAAA TGGCCGTGTC ATCGATCCGA AAAACGGTGT CGACCGCAGA 
GCCTCGCTCT ATGTCGCCGA TGGTAAGGTA GCCGGCATCG GTCAGGTACC TGCCGGGTTT 
GTCGCCGACC GGAGCATCGA TGCCGCCGGC TGTGTCGTCT GCCCCGGCTT TATCGACCTT 
GGCGCCCGCC TGAACTCAAT CGAAGCGGAA CTAGCCGCTG CAGTTGCTGG TGGTGTGACC 
ACCGTCGTCG TGCCGCCGGA TGCCGACCCC CCGCTCGACG AGCCGGAACT GGCCGATCGC 
CTGGTTCATC GCGGTGAGGA AATCGGCAAG GCCCGCGTCC TGCCGCTCGG TGCGCTGACC 
CTCGGCCTCA AGGGCGAGCG CCTGGCCGAA CTGGCCGGCT TGAAGAAAGC CGGCTGCGTT 
GCCTTCTCGC AGGCTAACAA GACGGTGGTC GATACCGAGG CGCTGCTGCG TGCCTTGGAA 
TACGCGGCGA CCTTCGATTT CGCCGTCTGG TTGCAGCCGC AGGACTACTG GCTGTCACGC 
AATGGCATTG CGCACGAAGG GGAAGTGGCC AGTCGCCTCG GTCTGGCTGG TATTCCCGTC 
GCGGCCGAAA CCATCGCCAT CGGTACCATC ATCCAGTTGG TGCGCGACAC CGGTTGCCGC 
ATCCATCTGA CCCGCATCTC GTCCGCGGCC GGCATGGCCC TAGTGCACCG TGCCCAGCAC 
GATGGCCTGC CAATTTCCTG CGATGTCGGC GTGCATCATT TATTGCTCAC CGAGAACGAC 
ATCGGCTTCT TCAATCCGCA TGCCCGTTTC TGCCCACCAT TGCGGGCCCA GACCGACCGC 
CAGGCCCTGT CCGACGCCGT CGTTGCCGGC TGGGCGGCCA TCTGTTCCGA CCATACCCCG 
GTTGGCGCCG ACGACAAGCT GCTGCCCTTC GGCGAAGCCA AGCCAGGCGC CACCGGCCTT 
GAAGTGCTGC TCCCGCTGAC CCTGAAGTGG GCCGACGCCG CCAAGGTCGA TCTGCCGACG 
GCTCTGGCCC GTATTACGTC TGCGCCGGCA GCAGTGCTCG GTCTGGCCAG CGGTCAACTG 
GCGATCGGTA CAACGGCGGA CATCTGTATT TTCGACCCGG AAGCGAACTG GCAGCTGACA 
CCGGACGCCC TGAAGAGCCG CGGTAAAAAT TCGCCTTGGC TGGGCTACGT GATGACAGGG 
AAGGTCAAGG CGACGCTGGT TGGTGGCCGC CCGGTCTATC AAGCGTGA

Protein sequence

MNIVIENGRV IDPKNGVDRR ASLYVADGKV AGIGQVPAGF VADRSIDAAG CVVCPGFIDL 
GARLNSIEAE LAAAVAGGVT TVVVPPDADP PLDEPELADR LVHRGEEIGK ARVLPLGALT 
LGLKGERLAE LAGLKKAGCV AFSQANKTVV DTEALLRALE YAATFDFAVW LQPQDYWLSR 
NGIAHEGEVA SRLGLAGIPV AAETIAIGTI IQLVRDTGCR IHLTRISSAA GMALVHRAQH 
DGLPISCDVG VHHLLLTEND IGFFNPHARF CPPLRAQTDR QALSDAVVAG WAAICSDHTP 
VGADDKLLPF GEAKPGATGL EVLLPLTLKW ADAAKVDLPT ALARITSAPA AVLGLASGQL 
AIGTTADICI FDPEANWQLT PDALKSRGKN SPWLGYVMTG KVKATLVGGR PVYQA