Gene Ava_0234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_0234
Symbol
ID	3682998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	296554
End bp	297828
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	43%
IMG OID	637715562
Product	transposase IS4
Protein accession	YP_320755
Protein GI	75906459
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTAGCTC GTTTCCAAGA ACTAGGTTGG CTCAAAAATC GCGGCCGTGT CAGAACTGAT 
TCAACTCACG TATTAGCCGC AGTACGACAG TTAAATCGTT TGGAATTAGT GGGAGAAACT 
TTACGTCATA CCTTAAATGA CTTGGCTTAT TTTGCCCCTG ATTGGCTCAA ATCGAGAGTT 
GACGTTGATT GGTTTGAACG TTACTCCCTG AGATTTGAGC AATACCGCTT GCCCAAATCA 
AAAGCCGAAC GTGAGAAATT GAGGCGAAAA ATTGGTGAGG ATGGTCATCA TTTGCTATCC 
GCTTTGTATG CAGACTCAAC TTGTAATTGG CTGTGGCAGA TTCCATCAGT GGAAACATTA 
CGTATAGTTT GGGTGCAACA ATACTATATT CAATTGCAAC AAGTCTATTG GCGAGAACAA 
GATAACTTAC CACCAAATAG ACTACAGATT GAATCTCCTT ACGATGTTGA TGCACGCAAT 
TCCAGCAAGC GAGAAATCAA CTGGACTGGT TATAATCTGC ATCTGACAGA AATTTGTCAC 
CCCATACTGC CAAACTTAAT TATCAATGTG GAAACGTCCG TGGCCACAAG TGCGGATGTT 
GAGATGACAC CAGTAATTCA TTCTCGTTTA AACCAGAACA ATCTTTTGCC ACAAGAACAT 
GTTGTCGATA CTGGCTATGT CAATGCTCAA AACTTAGTCG ATAGTCAATC CCATTTTCAT 
GTTGATTTAG TAGGAAAAGT TCCCCCCGGA ACTAGTTGGC AAGCAACAGC ACAATCCGGC 
TTTGAGCAAA ATTGCTTCAC TATTCATTGG GATTTGATGC GTGTTGATTG CCCAATGGGT 
AAACAAAGTA AGTCCTGGCG TACAACTGTC GATAGCCATG ACAATCCAGT AGTCAAAATA 
CAATTTGACA AATCCGATTG TTCGCTTTGT TCAAGTCGCT CAAAATGCAC TCGCTCCAAA 
AAACTACCGC GTCTTCTGAC CCTCAAACCA CAGGAACTAC ATCTTGCATT ACATGATGCT 
CGCATTCGCC AAAAAACTGA ATCTTTTCAA CAAATTTATC ACCAACGTGC TGGCGTTGAA 
GGCTTGATTT CCCAAGCTAC TGGTCGCTAC CAATTACGCC GTTGTCGCTA CATTGGTCTT 
GCCAAAACTC TCTTGCAGCA TGTCATTACT GCTGCTGCTA TCAACTTCAG TCGGATGTGG 
GATTGGTGGC AACATGTCCC ACGCAGTCAG ACTCGCGTTT CTCACTTTGC TCGAATTGCT 
CCCACTGCCT CATAG

Protein sequence

MLARFQELGW LKNRGRVRTD STHVLAAVRQ LNRLELVGET LRHTLNDLAY FAPDWLKSRV 
DVDWFERYSL RFEQYRLPKS KAEREKLRRK IGEDGHHLLS ALYADSTCNW LWQIPSVETL 
RIVWVQQYYI QLQQVYWREQ DNLPPNRLQI ESPYDVDARN SSKREINWTG YNLHLTEICH 
PILPNLIINV ETSVATSADV EMTPVIHSRL NQNNLLPQEH VVDTGYVNAQ NLVDSQSHFH 
VDLVGKVPPG TSWQATAQSG FEQNCFTIHW DLMRVDCPMG KQSKSWRTTV DSHDNPVVKI 
QFDKSDCSLC SSRSKCTRSK KLPRLLTLKP QELHLALHDA RIRQKTESFQ QIYHQRAGVE 
GLISQATGRY QLRRCRYIGL AKTLLQHVIT AAAINFSRMW DWWQHVPRSQ TRVSHFARIA 
PTAS