Gene Anae109_2471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_2471
Symbol
ID	5377763
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	2863226
End bp	2864317
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	75%
IMG OID	640843990
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_001379656
Protein GI	153005331
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.325849
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTGGC CCGCCCTGCG CTGGACCCTG TTCCACCTCG ACCCCGAGCG CGCCCACCGC 
CTCGCGCACG GCGCGCTGCA CCGCGTGCCG CCGGGGCTGG CGCGGCTGCG CCGTCCCGCG 
GTGCCGCCGG AGCTCCGCGT CTCCTGCCTC GGGCTCGACT TCGACGGCCC CATCGGCCTC 
GCCGCCGGCT TCGACAAGGG CGACGCCTCG ATCGCGGGGC TCTTCGCCCT CGGCTTCTCG 
CACGTGGAGA TCGGGACCAT CACCCCGCGG CCGCAGGCCG GCAACGAGCC GCCGCGGCTG 
TTCCGCCTCG TCGAGCACCG CGCCCTCGTC AACCGGATGG GCTTCAACAA CGCCGGGGCC 
GAGGTGTGCG CGCGCCGCCT CGCCGGCGTC CCCGCCACGG CGCGGATGGG CCCGGTGGGC 
GTCAACGTCG GGAAGAACAA GACGACGCCC AACGAGGACG CGGCGGCGGA CTACCTCGCC 
TGCATCGACC GGCTCCACCC GTACGCCGAT TACCTCGTCG TGAACATCTC GTCGCCGAAC 
ACCCCGGGGC TGCGCCAGCT CCAGGAGCGC GACCAGCTCG ACGCGCTGCT GCGCGCCTGC 
GCGGGGAGGC TCCGCGAGCG GGCGCCGGGC AAGCCGCTCC TCGTGAAGCT CGCCCCCGAC 
CTCTCCCCGA CCGCGCTCGA CGAGGCGGTG GACGTGGCGA TCGACGCCGG GGTGTCCGGC 
ATCGTCGCGA CGAACACGAC CCTTTCGCGG GCGGGGGTCG AGCGTCACCC ACGCGCCCGT 
GAGGCCGGCG GGCTCTCGGG AGCGCCGCTC GAGGCACTCG CCACGAGCGT GGTGCGGCGC 
TGCTACATCC GCGCGGCGGG TCGGGTGCCC ATCGTCGGGT GCGGCGGCGT GATGAACGCG 
GAGGGCGCCT ACGCCAAGAT CCGCGCTGGC GCGACGCTCG TGCAGGTCTA CACCGGCCTC 
GTCTACGGCG GGCCGGGGTT CGTGCGGCGC CTGAACGACG GCCTCGCGAG GCTGCTCGCC 
CGCGACGGCT TCCGCACCGT CGCCGAGGCG GTGGGCGCCG ACGTCGAGAC GGCCGAGCGG 
GCAGGCGTCT GA

Protein sequence

MIWPALRWTL FHLDPERAHR LAHGALHRVP PGLARLRRPA VPPELRVSCL GLDFDGPIGL 
AAGFDKGDAS IAGLFALGFS HVEIGTITPR PQAGNEPPRL FRLVEHRALV NRMGFNNAGA 
EVCARRLAGV PATARMGPVG VNVGKNKTTP NEDAAADYLA CIDRLHPYAD YLVVNISSPN 
TPGLRQLQER DQLDALLRAC AGRLRERAPG KPLLVKLAPD LSPTALDEAV DVAIDAGVSG 
IVATNTTLSR AGVERHPRAR EAGGLSGAPL EALATSVVRR CYIRAAGRVP IVGCGGVMNA 
EGAYAKIRAG ATLVQVYTGL VYGGPGFVRR LNDGLARLLA RDGFRTVAEA VGADVETAER 
AGV