Gene Ava_4196 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4196
Symbol
ID	3680999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	5255246
End bp	5256655
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	37%
IMG OID	637719543
Product	peroxidase
Protein accession	YP_324690
Protein GI	75910394
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2837] Predicted iron-dependent peroxidase
TIGRFAM ID	[TIGR01413] Dyp-type peroxidase family

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.738897
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00759418
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCACTGA CTGAAAAAGA TTTGAAACAC CTACCAGAAG ATGGCATTGA TTCAGAAAAT 
CCTGGTAAAT ACCGAAATCT ATTAAATGAT TTACAAGGCA ACATTCTCAA AGGACATGGA 
CGAGATCATA GTGTTCATCT ATTTTTACAA TTCAAGCCTG AGCAAGTAGA AGTAGTTAAG 
CAGTGGATTC AGAATTTTGC CCAAACTTAT ATAACTTCTG CCAAAAAGCA GTCAGACGAA 
GCATTTAAAT ATAGACAAAA AGGCATACCA GGACAGGTAT TTGGTAACTT TTTCTTGTCG 
CGTCATGGAT ATGAATATTT AGAAATTGAG CCGTTTCAAA TACCCGGAGA TAAACCATTT 
AGGATGGGTA TGAAAAACGA AGAAATTAGA ACTTCTTTGG GCGATCCTAA AATTGAAACC 
TGGGATATAG GATTTCAAAA CGAAATTCAT GCCTTAATTT TGCTCGCAGA TGATGACATC 
ATAGACTTAT TGCAAATTGT CAATCAAATG ACGCAAGAAC TGCGTCTAAT AGCAGAAATT 
GTTCACCGAG AAGATGGATT TATCCTGAGA AATCAGTCCG GACAAATTAT CGAACACTTT 
GGCTTTGTGG ATGGTGTAAG TCAACCGTTG TTTATGAAAC GGGACGTTGT GAAGGAGAGG 
GTAAACAACT GCGATTTTGA TAAATGGGAC CCAAAAGCTC CTCTTGATAG TATTTTAGTC 
GAAGATCCTA ACGGGAATAC AAAAGATAGC TATGGCAGTT ATTTAGTCTA CCGAAAACTC 
GAACAGAATG TGAAAGCATT CCGTGAAGAT CAGCGCAAAT TAGCTCAAAA ATTAAACATC 
CAAGAAAATT TAGCTGGAGC TTTAATTGTA GGTCGTTTCC CTGATGGCAC TCCAGTAACT 
CTTTCAGATA TACCGACTTA TGCAGTTACA CCCACAAATA ACTTCAATTA TGATAATGAT 
TTAGCCGCAA CTAAGTGTCC ATTTCACTCT CATACACGTA AAACTAATCC TCGTGGAGAT 
ACAGCCAGAT TGTTAACTGC TGATGCTCAC TTTGATGAAG CATTTAAGGA AGAAAAAGGC 
CATAGGATTA CTCGTCGTGC AGTTAGTTAT GGCGAAAATA ATCCTAATAA AGAACCAGTT 
TTAGGTTCAG GATTACTGTT TCTTTGTTTT CAATCCAACA TTGAAAATCA GTTCAATTTT 
ATCCAATCAC GATGGGCTAA TCCTCAAAAT TTTGTTCAGG TGAATACTGG GCCAGATCCG 
TTAATTGGTC AACCATCGGG AACTCAGAAA TGGCCAAAGA AATGGGGTGA ACCAGAAACA 
GAAGAATATA ATTTTAAACT CTGGATAAAT ATGAAAGGTG GCGAGTATTT TTTCGCTCCT 
AGTATCAGTT TTCTCAAAAC CTTGGCATAG

Protein sequence

MALTEKDLKH LPEDGIDSEN PGKYRNLLND LQGNILKGHG RDHSVHLFLQ FKPEQVEVVK 
QWIQNFAQTY ITSAKKQSDE AFKYRQKGIP GQVFGNFFLS RHGYEYLEIE PFQIPGDKPF 
RMGMKNEEIR TSLGDPKIET WDIGFQNEIH ALILLADDDI IDLLQIVNQM TQELRLIAEI 
VHREDGFILR NQSGQIIEHF GFVDGVSQPL FMKRDVVKER VNNCDFDKWD PKAPLDSILV 
EDPNGNTKDS YGSYLVYRKL EQNVKAFRED QRKLAQKLNI QENLAGALIV GRFPDGTPVT 
LSDIPTYAVT PTNNFNYDND LAATKCPFHS HTRKTNPRGD TARLLTADAH FDEAFKEEKG 
HRITRRAVSY GENNPNKEPV LGSGLLFLCF QSNIENQFNF IQSRWANPQN FVQVNTGPDP 
LIGQPSGTQK WPKKWGEPET EEYNFKLWIN MKGGEYFFAP SISFLKTLA