Gene Lferr_1911 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lferr_1911
Symbol
ID	6877896
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 53993
Kingdom	Bacteria
Replicon accession	NC_011206
Strand	+
Start bp	1902088
End bp	1903179
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	63%
IMG OID	642789781
Product	Dihydroorotate oxidase
Protein accession	YP_002220339
Protein GI	198284018
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTACG GCCTGCTGCG CCCTCTGCTT TTTACGCTGG ACCCGGAGCG CGCCCACACC 
CTGAGTATCG CGGCGCTGGA AGCACTGGGA CACATGCCAC GTGGCCTCGC CCGTGTGGCC 
CGGCGCTACA CCGCCCACGA CCCGCGTCTG GCGCAGGACT TTTGGGGCCT GCATTTTGCC 
AATCCCGTCG GCCTCGCCGC CGGCTATGAC AAGGATGCCC GCGCCACCGC CGCGCTCCCC 
GCTCTCGGCT TCGGCTTCAT CGAAATCGGC ACAGTGACCC CGCGCCCGCA GCCTGGTAAT 
CCGCGCCCCC GGGTCTTTCG TTATCCGGCG CAGCAGGCGG TCATCAACCG CATGGGTTTC 
CCCGGTGAAG GGGCTGCGGC GGTTGCCCGA AGACTGGCAG CATTACCTGG CCATCCGGTG 
CCTATCGGCA TCAATCTCGG CAAAAACAAG GACACCCCGC TGGAGCGGGC GCAGGACGAC 
TATGTCGCCG CGCTGGAGTT GCTCTTTCAC TATGGCGACT ATCTCTGCAT CAATGTCAGT 
TCACCCAACA CGCCGGGTTT GCGCTTGCTG CAGGGTGAAG AAGCCTTACG GGGACTGCTC 
AAGGCCGTCG CCGCAGCCAA CCAGCGTCTG GCCCTACAGC ATCAGCGCCC GCCCCTGCCT 
CTGCTCCTCA AGATCGCACC GGATCTGGAC AACGATGATC TCAACGCCAT CGGTAGTCTG 
GCCTTAGGCA CGGCACCTCT GGTGAATGGT TTCATCGCCA CCAATACCAC CATAGAACGC 
CCGGCCTCTC AACCCGGACT CTCCGAAAGC GGGGGCCTGA GCGGTGCACC ATTGCTGCAG 
CAATCCAATG CCGTCATCGC GCAACTCTAT CGTGCGACCC AGGGACAGGT GCCCATCATT 
GGCGTCGGCG GCATTCTGAG CGCGGCAGAC GCTTATGCCA AAATTCTGGC CGGGGCCAGC 
CTGGTACAAG TCTACAGCGG CCTGATTTTC CGCGGACCCG GGCTGGTACG GGAGATTCTG 
GAAGAACTGC CGGGGCTTTG GTTAAAGGAT GGTTATCCCG ATCTTGCTCA TGCGCGGGGT 
AGTACCGCCT GA

Protein sequence

MSYGLLRPLL FTLDPERAHT LSIAALEALG HMPRGLARVA RRYTAHDPRL AQDFWGLHFA 
NPVGLAAGYD KDARATAALP ALGFGFIEIG TVTPRPQPGN PRPRVFRYPA QQAVINRMGF 
PGEGAAAVAR RLAALPGHPV PIGINLGKNK DTPLERAQDD YVAALELLFH YGDYLCINVS 
SPNTPGLRLL QGEEALRGLL KAVAAANQRL ALQHQRPPLP LLLKIAPDLD NDDLNAIGSL 
ALGTAPLVNG FIATNTTIER PASQPGLSES GGLSGAPLLQ QSNAVIAQLY RATQGQVPII 
GVGGILSAAD AYAKILAGAS LVQVYSGLIF RGPGLVREIL EELPGLWLKD GYPDLAHARG 
STA