Gene Lferr_1980 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lferr_1980
Symbol
ID	6877968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 53993
Kingdom	Bacteria
Replicon accession	NC_011206
Strand	+
Start bp	1976846
End bp	1978003
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	62%
IMG OID	642789849
Product	oxygen-independent coproporphyrinogen III oxidase
Protein accession	YP_002220404
Protein GI	198284083
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0635] Coproporphyrinogen III oxidase and related Fe-S oxidoreductases
TIGRFAM ID	[TIGR00539] putative oxygen-independent coproporphyrinogen III oxidase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.958254
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCCCA CCCTGAAACC ACCGTCGTCG TATTCGCTCT ACGTGCATCT GCCTTGGTGC 
AAGGCCAAGT GCCCCTATTG CGATTTCAAT TCCCATGCAG CCGACCGCAT CCCGGCAGAA 
CGTTATCTGG ATGCATTGAT CGCCGATCTG GACCGCGAAC TGCCGCGCAT CTGGGGACGC 
AGTGTGCGGA CTGTTTTTAT CGGTGGCGGC ACCCCCAGCC TCTTCCCGCC AGAAATCATC 
GACCGCCTGA TCTCCACGAT CCGCGCCCGC CTGCGGCCGC ACTCCCGTAT GGAAATCACC 
CTGGAGGCCA ATCCGGGAGC GATAGAGGCG GCCTATTTCC GCGCCTTCCG GGAGGTGGGC 
ATCACCCGAC TCTCCTTAGG CATCCAGTCT TTCAACGACG ATTCTCTGCA ACGCCTCGGG 
CGTATCCATG ATGCCGCCGC AGCCCACCGG GCCGTGGAAC TCGCCATCGC GGCTGAATTC 
GAGAGCTATA ATCTCGATCT CATCTTTGCC CTGCCGGGGC AGGATCTCGC CGCAGCGCGG 
GCCGATCTGC GCACGGCGTT GGAGTATGCA CCCCCTCATC TGTCCCTCTA TCAACTCACG 
CTGGAAGCCG GAACCCCATT CTCGACCCAT CCACCCGCCG ATCTGCCGGA CAGCGACCAA 
GCCGCCGACA TGGAAGATAT CCTGCGCCGG CAACTCCAGG AGGCCGGCAT GGAGCGCTAC 
GAAATATCCG CCCATGCCCG GCCCGGTCAT CGCTGCCAGC ACAACCGCAA CTACTGGCTT 
TATGGTGACT ATATCGGCAT CGGCGCCGGA GCGCACGGCA AAATCACCCT TCCCGAAGGC 
ATCTGGCGCA GCCGCAAACC CAGCCGCCCC GAAAGTTATA TGGACGATGC GCTCAGTGTT 
CTCGACATCC TCGGCGACCG GGAGCCGATT TTACCCGCCG ACAGGCCCTT CGAGTTCATG 
CTCAACGCGT TGCGCCTGAC CGACGGCTTC CCGGTGGCGC TCTTCCCTGA ACGGACCGGC 
CTGTCTTTGC AGATCATTCA ACCGCAGCTC CGCCAAGCCG AACGCGACGG GCTGGTGATC 
ATGGAAGATG GCATCCTGCG ACCCACCGCG CTCGGGCTCA ACTTCTATAA TGACCTCTGC 
GTGCGTTTCG TACCGTGA

Protein sequence

MNPTLKPPSS YSLYVHLPWC KAKCPYCDFN SHAADRIPAE RYLDALIADL DRELPRIWGR 
SVRTVFIGGG TPSLFPPEII DRLISTIRAR LRPHSRMEIT LEANPGAIEA AYFRAFREVG 
ITRLSLGIQS FNDDSLQRLG RIHDAAAAHR AVELAIAAEF ESYNLDLIFA LPGQDLAAAR 
ADLRTALEYA PPHLSLYQLT LEAGTPFSTH PPADLPDSDQ AADMEDILRR QLQEAGMERY 
EISAHARPGH RCQHNRNYWL YGDYIGIGAG AHGKITLPEG IWRSRKPSRP ESYMDDALSV 
LDILGDREPI LPADRPFEFM LNALRLTDGF PVALFPERTG LSLQIIQPQL RQAERDGLVI 
MEDGILRPTA LGLNFYNDLC VRFVP