Gene Ava_0042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_0042
Symbol
ID	3683551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	47745
End bp	49103
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	38%
IMG OID	637715369
Product	radical SAM family protein
Protein accession	YP_320563
Protein GI	75906267
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.467834
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTTT CACATTATCA TGTAGTAACA CAACCATTTT TCGATGAAAT TGAAGAACGA 
ACAAAGCGCG TTATCTTTTC TAGTCGAACA TCAAATGTCA GAATTATTGA TGAGCATAGT 
TGGCACATTT TAGCTAGTGG TGATTTTGCT CAATTACCTC AATATATATT GTTTGATCTA 
GTTGATGTTG AACTAATTGT ACCTGATGAT GAAAACGAAT TACAAACTAT TTTAGATTAC 
AATAATGCCT TAGCAATTGA TAACGATGAT CTACATTTAG TTGTTCAACC AACTGCTTTT 
TGTCAACTGG GTTGTCATTA CTGTGGTCAG GAACATACTA GCAAAATGAT GACCGAAGAT 
GAGCAACAAA AATTTATAGA ACGAACTGCT AAAAAACTCG CCAGCAAGAA CTTTCGTAGT 
CTCTCAATTG GTTGGTTTGG TGCAGAACCT TTGGTAGGTC TGCCAGTGAT GAGAACTCTT 
ACGCCAAAAC TACAGGCTCT TGCGGCCAGT TTTGGTTGTA GTTATCATGC AAAAGTTGTC 
ACCAATGGTT TAGCTTTAAC ACATCAAGTA GCAACGGAAA TTGTTCAAGA ATTAGGCGTA 
AATTCTGTTG AAATTACTCT TGATGGCACT GGTGAATATC ATGATGTTCG GCGGATGCAG 
AAAAATGGCT TACCTACATT TGAGAAAATT TTTGCTAATA CGGTTGCCTT AGCTCATCGG 
CAAGATTTGG ATGTACAAAT TAATATTCGT TGTAATGTTG ATTATCAAAA TTATGAATCT 
GTCTCTTTGT TACTACAAAA ATTAGCTGAG GCAGAGATAC AAGATAAGAT TAATTTCTAT 
GTTGCACCGA TTCATTCTTG GGGAAATGAT GCTCATACTC GTTCCTTATC GAAAGAAGAA 
TTTGCTGATT GGGAAATAAC TTGGCTTGGG GAAATGATTG AGTTAGGTTT CAAGGTTGGG 
CTACTACCAG AGCGCAGACC TCTAGTTTGT ATGGCTGTAA TGCCCCATTC GGAATTAGTT 
GATGCCTATG GCAATATTTT TAATTGTACA GAGGTGTCTT ATGTTCCTAC ATACGGCACA 
CCTAATGAAT ATGCCATTGA TCATTTATCA GGTAAACAGA TGCCCGGTAA AAGGGAACGT 
TTAGCTAGTT TCAATGATAA AGTGCGTCAA GGTGCATATC CCTGTTCTAC TTGCCCCATG 
CTACCTGTTT GCGGTGGTTC CTGTCCGAAG AGTTGGTTAG AAGGTATTGA ACCATGCCCC 
AGTGCTAAAC ATAACATTGA GCAACGTTTA TTACTTACCT ATGCGTTATC TCGGATTGAA 
GAAGCAGAAA CCAACGAGGA GGCTTTAGTT TATGCTTAA

Protein sequence

MKLSHYHVVT QPFFDEIEER TKRVIFSSRT SNVRIIDEHS WHILASGDFA QLPQYILFDL 
VDVELIVPDD ENELQTILDY NNALAIDNDD LHLVVQPTAF CQLGCHYCGQ EHTSKMMTED 
EQQKFIERTA KKLASKNFRS LSIGWFGAEP LVGLPVMRTL TPKLQALAAS FGCSYHAKVV 
TNGLALTHQV ATEIVQELGV NSVEITLDGT GEYHDVRRMQ KNGLPTFEKI FANTVALAHR 
QDLDVQINIR CNVDYQNYES VSLLLQKLAE AEIQDKINFY VAPIHSWGND AHTRSLSKEE 
FADWEITWLG EMIELGFKVG LLPERRPLVC MAVMPHSELV DAYGNIFNCT EVSYVPTYGT 
PNEYAIDHLS GKQMPGKRER LASFNDKVRQ GAYPCSTCPM LPVCGGSCPK SWLEGIEPCP 
SAKHNIEQRL LLTYALSRIE EAETNEEALV YA