Gene AFE_1023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	AFE_1023
Symbol
ID	7135528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 23270
Kingdom	Bacteria
Replicon accession	NC_011761
Strand	+
Start bp	926062
End bp	927426
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	62%
IMG OID	643529421
Product	HNH endonuclease domain protein
Protein accession	YP_002425496
Protein GI	218667415
COG category	[V] Defense mechanisms
COG ID	[COG1403] Restriction endonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGTAT TGGTACTCGA TAAAAGAAAG AAGCCGTTGA TGCCGTGCTC GGAGAAACGG 
GCGCGGCTGC TGCTGGAGCG TGGCCGGGCG CGGGTGCATC GCATGGTGCC GTTTACCATC 
CGGCTGGTGG ATCGCTTGCA GGAAGATTCC ACCTTGCAAC CCGTCCGGCT CAAGCTCGAC 
CCAGGTAGTA AAACAACCGG CATGGCTCTG GTTCGGGAAC AGGAGTCTGT GGACGAAGAT 
ACCGGCGAAA TCCAGCGCAA GGCCATAGTG TTGATGCTGC TGGAGTTGCA GCATCGGGGC 
TATGCCATTC GCGACGCGCT CACCCAGAGG CGGGCTTTTC GGCGGCGGCG GCGCGGGAAT 
CTGCGCTACC GTCCGGCCCG CTTCGACAAT CGCGCCAAAC CAGAAGGCCG TTTGGCTCCG 
AGCTTGCAGC ACCGGGTCGA TACGACGATG GCTTGGGTGC AGAGGCTGTT GCGCTGGGCG 
CCGGTATCTG CCCTGTCCAC CATGCTGCAC CGCTTCGATA CCCAGGCACT CCAGAATCCC 
GAGATCAGCG GGATCGAGTA CCAGCGCGGC GAACTGTTTG GCTACGAGGT CCGCGAGTAC 
CTATTGGAGA AGTGGGGCCG CAAGTGCGCC TACTGCGATG CCCAGAATAC CCCATTGACC 
ATCGATCATA TCCACCCCAG GAGCGCGGGC GGCTCGGATC GGGTATCGAA TCTCACCCTG 
GCCTGTTTCC CCTGCAACCA GCGCAAGAGC AACCGGGACG TGCGGGAGTT TCTGGCGCAC 
GACCCGAAAC GTCTGACCCG CATCGAGGCA AGCCGCAAGG CACCCCTCAA GGACACCGCT 
GCCGTCAACA GTACCCGTTG GGCGCTTTGG CGGCAACTGG TGGCTACCGG TCTCGATGTC 
GAGGTCGGCA CCGGCGGCAG GACGAAGTGG AATCGCAGTC GGCTACAAAT CCCCAAAGAA 
CATTGTCTGG ACGCTGCCTG CGTGGGGCAT GTCGATGGTC TCGAACACTG GCAGCAGCCG 
GTACTCGGTA TCAAAGCGAC GGGGCGCGGA AGCTACCAGC GCACGCGGCT GACAAAGCAC 
GGCTTCCCGC GTGGCTATCT CACCCGCAGC AAGAGTGCTT TCGGGTTCCA GACGGGCGAT 
ATGGTCAAGG CGGTAGTGAC GAAAGGCAAG AAGGTAGGCA CCTATCTGGG CCGCGTTGCC 
ATCCGGGCCA GCGGCAGCTT CAACATCCAG ACCGGGAACG GACTGGTGCA ACACATCCAT 
TACCGATTCT GCAAACTGGT TCAGCGCGGC GATGGTTACG GATACCACTG GTCGCTTCTC 
CACCCCGCGC TGAACCACGG GATTGCCGAA GCTGGGAGGA ACTGA

Protein sequence

MAVLVLDKRK KPLMPCSEKR ARLLLERGRA RVHRMVPFTI RLVDRLQEDS TLQPVRLKLD 
PGSKTTGMAL VREQESVDED TGEIQRKAIV LMLLELQHRG YAIRDALTQR RAFRRRRRGN 
LRYRPARFDN RAKPEGRLAP SLQHRVDTTM AWVQRLLRWA PVSALSTMLH RFDTQALQNP 
EISGIEYQRG ELFGYEVREY LLEKWGRKCA YCDAQNTPLT IDHIHPRSAG GSDRVSNLTL 
ACFPCNQRKS NRDVREFLAH DPKRLTRIEA SRKAPLKDTA AVNSTRWALW RQLVATGLDV 
EVGTGGRTKW NRSRLQIPKE HCLDAACVGH VDGLEHWQQP VLGIKATGRG SYQRTRLTKH 
GFPRGYLTRS KSAFGFQTGD MVKAVVTKGK KVGTYLGRVA IRASGSFNIQ TGNGLVQHIH 
YRFCKLVQRG DGYGYHWSLL HPALNHGIAE AGRN