Gene Lferr_0859 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lferr_0859
Symbol
ID	6876824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 53993
Kingdom	Bacteria
Replicon accession	NC_011206
Strand	+
Start bp	815676
End bp	816872
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	63%
IMG OID	642788741
Product	NHL repeat containing protein
Protein accession	YP_002219316
Protein GI	198282995
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGAAT ATACCCATCC CCTGAGTGCC GCTATCCGGA ACCGGCCAGC CGCCATCCCT 
TCGGAGCAGT TGCTGGTTGG GGCGGGGGCA AGGGTCATCC TGGGGGAGCA GGTACGGCCC 
AGGGGGGTCG TCGTACCTGT CGTTCCTTCC GCGCAGACGC TTTTCGGCCC GCGTGGTGCC 
AGCCTCATGG CTGACGGATC CCTTTGGGTG GCTGATACCG GCCATCATCG CTTGCTGGGG 
TGGCCCACGC TACCCGAAGC CGATGGCCAA CCTGCCACCT GGCTCATTGG TCAGCCAGAT 
TTTGAACGGG ACGGGGGGCG CAACGCCCAC GGCCCTGTCG GCGCGGCATC ACTGAATGTT 
CCCACCGGGA TCTGTCCGGT TGGCAATGGG ATGGCGGTGG CGGACGTCTG GAACCATCGG 
GTGCTGATCT GGTATGAAGT ACCTCATGAA AGCCATGTTC CGGCGGATCT GGTTCTCGGC 
CAAACCGATT TTGTGTCGGC GGAAATCAAT CGCGGTGCGC CCCAACCATC CGCGTCCACC 
TTATACTGGC CTTATGGGGT CTTTTGGGAT GGTGCCCGGC TCTATGTCGC GGATTCGGGT 
AACCGCCGCG TCCTCTGGTG GGAGGGCATT CCCACGGAAA AAGGACAACC CGCGGACGGG 
GTCCTGGGCC AGGCGGATTT TCATTGCCGG GACGAGAACG GAGGTCACGA AGCCGACGCC 
ATGAGCATGC GCTGGCCCCA TGCGGTAACC CATTTCTGGG ATTGGCTGGT CGTGGGGGAT 
GCGGGGAACA ACCGGGTGCT GCTCTGGCGT GGGGCGCCAC AGCGCAATGG TCAGGCGGCC 
GATATGGTTC TCGGACAGCC TGATTTTGCT CAGAACGCCC ACAATCGCGG TAATTATTTC 
CCCAATGCGG CCTGCTTCAA TATGCCCTAT GGGGTGACCG CCACGGGAAA CTGGCTGATC 
GTGGCGGATA CGGCCAACAG CCGGCTGCTG GGCTGGCAGG CGGACGATCT ATTGACGGGC 
GCTTCGGCAC GCACCCTCGC CGGTCAGGAT GGTTTCCAGC ACAAGGGGGA CAACCGCTGG 
GGCGTGGTGG GGCGCAATAC GCTGTGCTGG CCTTATGGGA TTTCTGCTGC GGGAAGGAGC 
GTGATCATCG CCGACTCGGG TAACAACCGC GTGCTGCTTT GGGACAGGCG GCCATGA

Protein sequence

MTEYTHPLSA AIRNRPAAIP SEQLLVGAGA RVILGEQVRP RGVVVPVVPS AQTLFGPRGA 
SLMADGSLWV ADTGHHRLLG WPTLPEADGQ PATWLIGQPD FERDGGRNAH GPVGAASLNV 
PTGICPVGNG MAVADVWNHR VLIWYEVPHE SHVPADLVLG QTDFVSAEIN RGAPQPSAST 
LYWPYGVFWD GARLYVADSG NRRVLWWEGI PTEKGQPADG VLGQADFHCR DENGGHEADA 
MSMRWPHAVT HFWDWLVVGD AGNNRVLLWR GAPQRNGQAA DMVLGQPDFA QNAHNRGNYF 
PNAACFNMPY GVTATGNWLI VADTANSRLL GWQADDLLTG ASARTLAGQD GFQHKGDNRW 
GVVGRNTLCW PYGISAAGRS VIIADSGNNR VLLWDRRP