Gene HMPREF0424_0923 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HMPREF0424_0923
Symbol
ID	8709427
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gardnerella vaginalis 409-05
Kingdom	Bacteria
Replicon accession	NC_013721
Strand	-
Start bp	1054306
End bp	1055307
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	46%
IMG OID	646483021
Product	dihydroorotate dehydrogenase 1B
Protein accession	YP_003374137
Protein GI	283783383
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01037] dihydroorotate dehydrogenase (subfamily 1) family protein

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCTG TAAATAATGA CGAAAATAAT TCTGTAAATA ACGCAAATTC CGCAACAAAT 
TCCGCTGAAA CTTTTGGCTT TGACACTAGC CACGTTTGGA AACATCCAAC TCAAGTTGCA 
GGCGTTAAGT GGAAAAACAT GGTTGGTACA GCTTCTGGAA CTTTCCAGCT TGCAGCTTGC 
CGACGTTTTT ACGACGTAAG CCAACTCGGC GCAATTTGCA CAAAAGGCGT TTCACCTGTT 
CCGTGGGAAG GAAATCCTTC TCCGCGCACT GCAGAATCTC CTTCTGGCAT GGTAAACGCA 
GTTGGATTGC AAAATCCTGG CGTCGACCAC TACTTAGTAG ACGAGCTTCC GAAACTAAAG 
AAAATGGGAG CGCTTGTTAT TACTAATGTT GCAGGGCACA GTGACGACGA TTATGCGCAA 
GTTGTTGAAA AGCTTGCAGA TTCTGCTGCA GACATGCTTG AAATTAACGT AAGCTGCCCA 
AACGTAACTC ACGGCGGAAT GAGCGTTGGC ACGGATCCGG TGGCATTACA CCGCTTAATT 
AAGCGACTTC GCGCAATGAC AGATAAGCCA ATGATTGTAA AAATGACGCC AAATGTGACG 
GATATTGTCT CGATTTGCAA AGCTGCAGTT GATGCTGGAG CAGATGCTTT AAGCATGATT 
AATACGCTTG TTGGTTTGCG AATTGATATT CGAACAGGCG AGCCTATTAT TGCAAACCGC 
ACAGGCGGTG TTTCCGGTCC TGCAATCTTC CCGATTGGTC TTGGATTTGT GTGGCGAGTT 
CGTCAAGCTA TGCCAGATAT TCCAATTATT GGCATTGGTG GCATTGATTC CGGCGAAAAA 
GCTTTGGAAT ACTTGTATGC TGGCGCTAAT GCTGTAGAAG TTGGTGCTGC CGCTTTGGTG 
GATCCTACTG CTCCTATTCG CATTGCTCGC GAGCTTGATG ATTTGCTTGA TTCTCGTCCA 
AAGCTTGCGT CTTTACTTGC CGAAGGAAAG ACTTGGCGCT GA

Protein sequence

MNAVNNDENN SVNNANSATN SAETFGFDTS HVWKHPTQVA GVKWKNMVGT ASGTFQLAAC 
RRFYDVSQLG AICTKGVSPV PWEGNPSPRT AESPSGMVNA VGLQNPGVDH YLVDELPKLK 
KMGALVITNV AGHSDDDYAQ VVEKLADSAA DMLEINVSCP NVTHGGMSVG TDPVALHRLI 
KRLRAMTDKP MIVKMTPNVT DIVSICKAAV DAGADALSMI NTLVGLRIDI RTGEPIIANR 
TGGVSGPAIF PIGLGFVWRV RQAMPDIPII GIGGIDSGEK ALEYLYAGAN AVEVGAAALV 
DPTAPIRIAR ELDDLLDSRP KLASLLAEGK TWR