Gene Lferr_2184 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lferr_2184
Symbol
ID	6878175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 53993
Kingdom	Bacteria
Replicon accession	NC_011206
Strand	-
Start bp	2165797
End bp	2167140
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	58%
IMG OID	642790042
Product	protein of unknown function DUF224 cysteine-rich region domain protein
Protein accession	YP_002220594
Protein GI	198284273
COG category	[C] Energy production and conversion
COG ID	[COG2048] Heterodisulfide reductase, subunit B
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0444039
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000000677612
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCGACA ACAGCACACA GCAAGGCGTG GCGGGGCACG GCGCCTTCTT TCAGGACACG 
AATCTTTCGG CGAACGAAGC CGAAGCGGCA ACGGCCTGGG TGCGCAGCCA TGTCGACCGG 
CGTACGATGG ACCTGGGCGA GCGGATGGAT GACGTCCGTG ATCACATGTG GCAGTTGGAG 
AAGGAAGGCG AAATCATCGT CCACCGCCTT ACGGACCAGC ACAAGCCCGT TGAAGTAGAT 
ACTCTGTATG GCTGGAAAAA GCGGATTCCT ACGAATCAGT TCTGGCATCA TAAGAGTTGC 
GGGCAGTGCG GCAACATCCC CGGCTATCCC ACCAGTATCC TCTGGTTCAT GAACAAGTTT 
GGCATGGACT ATCTGGACGA GACCGACCAG ACTTCCTGCA CCGCCTGGAA CTACCATGGC 
TCCGGCATCG GCAATGTGGA GTCCCTGGCC GCCGTCTTCC TGCGCAACTT CCATCAGGCC 
TACGTCTCCG GCAAGCAGCA CGGCTTCGAG AACGGCCACT TCTACCCTCT GGTGCACTGC 
GGCACCTCCT TCGGCAACTA CAAGGAGATC CGCAAATACC TCATCGAGTC CGCCGAACTG 
CGGGAGAAGG TCAAGAAGAT CCTCGGCAAA CTGGGCCGTC TGGTGGACGG CAAGATCGTC 
ATCCCCGAGG AAGTGGTCCA CTACAGCGAA TGGCTGCACG TCATGCGCAA CCGTATCGCC 
AGCGAATTGC AGACCATCGA CATGAGCAAC ATCCGGGTCA CCAACCACGC CGCCTGTCAC 
TATTACAAGA TGGTGGCGGA AGACGCCGTC TACGACAACA CGGTGCTGGG CGGTAATCGT 
ACCGCTGTCG GCACCTCCGT CGCCCAGGCG CTGGGTGCCC AGGTCATCGA CTACTCCACC 
TGGTATGACT GCTGTGGCTT CGGGTTTCGG CACATCATCT CGGAGCGCGA GTTCACCCGC 
AGTTTTACGA TGAATCGCAA GATCAAGGTC GCCCGGGAAG AAGCCAACGC CGATGTGATG 
GTCGGCATCG ACACCGGCTG CATCACCACC ATGGACAAGA ACCAGTGGAT CGGCAAGGCC 
CACGACATGA ACTACAGCAT TCCCATTGTC GCCGACGTCC AGCTCGCGGC CCTGGCCTGT 
GGTGCCGATC CCTTCAAGAT CGTGCAGTTG CAGTGGCATG CTTCGCCCTG TGAAGATCTG 
GTGGAAAAGA TGGGCATCAG CTGGGACAAG GCCAAGGCCG ATTTCCAGGA TTATCTCAAG 
CAGGTGGAAC AGGGCAATGT GGAATACCTC TACAACCCCG AACTGGCCAC CAATCAAAAC 
ATCAATATGA AAGCGGGCGC TTAA

Protein sequence

MSDNSTQQGV AGHGAFFQDT NLSANEAEAA TAWVRSHVDR RTMDLGERMD DVRDHMWQLE 
KEGEIIVHRL TDQHKPVEVD TLYGWKKRIP TNQFWHHKSC GQCGNIPGYP TSILWFMNKF 
GMDYLDETDQ TSCTAWNYHG SGIGNVESLA AVFLRNFHQA YVSGKQHGFE NGHFYPLVHC 
GTSFGNYKEI RKYLIESAEL REKVKKILGK LGRLVDGKIV IPEEVVHYSE WLHVMRNRIA 
SELQTIDMSN IRVTNHAACH YYKMVAEDAV YDNTVLGGNR TAVGTSVAQA LGAQVIDYST 
WYDCCGFGFR HIISEREFTR SFTMNRKIKV AREEANADVM VGIDTGCITT MDKNQWIGKA 
HDMNYSIPIV ADVQLAALAC GADPFKIVQL QWHASPCEDL VEKMGISWDK AKADFQDYLK 
QVEQGNVEYL YNPELATNQN INMKAGA