Gene VC0395_A1098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A1098
Symbol	pyrD
ID	5137343
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	1150183
End bp	1151193
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	45%
IMG OID	640532556
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_001217044
Protein GI	147675557
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.730125
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTTACC GCTTAGCCAG AGCTGGCTTT TTCCAATTGG ATGCCGAAAA GGCACACGAT 
CTGGCCATCT CTAATTTCAA ACGTTTCACT GGCACTCCTT TCGATCTCTT CTATCGTCAA 
CAACTTCCTC ATCGTCCAGT TCAATGCATG GGCTTAACCT TTAAAAATCC AGTCGGTTTA 
GCAGCAGGGC TCGACAAAAA CGGCGAGTGC ATCGAAGCGT TTGGCGCGAT GGGCTTCGGA 
TTTGTTGAAG TAGGCACGGT CACACCAAGA CCACAAGCAG GTAACGACAA ACCACGCCTG 
TTTCGTTTAG TGCATGCTGA AGGCATCATC AATCGAATGG GCTTTAACAA TCTGGGTGTT 
GATCACTTGG TTGAGAATGT TAAGCGAGCC AAATACGATG GGATCATCGG GATCAACATC 
GGTAAAAACA AAGATACTCC GATTGAGAAA GGGGCAGAGG ACTATTTGAT CTGTATGGAT 
AAAGTTTATC CTTACGCAGG TTACATCGCC GTAAATATCT CTTCTCCGAA CACACCAGGA 
CTTCGTTCTC TACAATACGG TGAAGCGCTG GATGAACTGC TTGCTGCATT GAAAACTCGC 
CAAGCTGAAT TAGCAGCGAA ACATGATAAA TATGTCCCGC TTGCACTTAA GATTGCACCA 
GATTTAAGTG ACGATGAAAT TCAGCAAATC TGCCAATCAC TTTTGAAAAA CAAAATCGAT 
AGTGTCATCG CGACAAACAC CACCTTAGAT CGTTCATTGG TTGAAGGGAT GAAGTTTGCC 
AACGAAGCTG GCGGCCTCAG TGGACGACCT TTGCAAAACC GCAGTACAGA AGTTATTAAG 
TGTCTGTATA AAGAACTCGG TGAAGAAATT CCGATCATCG GGGTCGGTGG TATCGATTCC 
TACATCTCCG CCAAAGAAAA GCTCTTAGCA GGAGCAAAAT TAGTTCAGGT CTATAGCGGC 
TTTATTTATC AAGGACCAGG GCTGGTCGCC GATATCGTCA AGAACCTGTA A

Protein sequence

MLYRLARAGF FQLDAEKAHD LAISNFKRFT GTPFDLFYRQ QLPHRPVQCM GLTFKNPVGL 
AAGLDKNGEC IEAFGAMGFG FVEVGTVTPR PQAGNDKPRL FRLVHAEGII NRMGFNNLGV 
DHLVENVKRA KYDGIIGINI GKNKDTPIEK GAEDYLICMD KVYPYAGYIA VNISSPNTPG 
LRSLQYGEAL DELLAALKTR QAELAAKHDK YVPLALKIAP DLSDDEIQQI CQSLLKNKID 
SVIATNTTLD RSLVEGMKFA NEAGGLSGRP LQNRSTEVIK CLYKELGEEI PIIGVGGIDS 
YISAKEKLLA GAKLVQVYSG FIYQGPGLVA DIVKNL