Gene Ava_C0226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_C0226
Symbol
ID	3678025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007412
Strand	+
Start bp	263282
End bp	266677
Gene Length	3396 bp
Protein Length	1131 aa
Translation table	11
GC content	47%
IMG OID	637715306
Product	helicase-like
Protein accession	YP_320500
Protein GI	75812883
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0240002
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAATA CTCCTGCCGA AGTGCGTTCA TGTCTCATTG ATGCCCTACA ACTTGACTTA 
GTGGGGCCTA CGCCCAATGA TATCGCCCAT GTTGACGAAA TTATTGACCA AGCTCCATCT 
AAGTGGTATC TCACGGGTTT TTTAGTGCCT TATGAAGCTT CGGTAGAACA GCGTTCAGAA 
GATATAGGTA ACGATGACAT AGACGAGATT TCTCAGGTGA ACGCTGGCGA TGATGAAAAG 
CAACCCGACA GTGCCTCCGC CCGGAGAGCA TTTTTCCCCT CATCAATGGG TTTAAGCATC 
CTTGTACCAG CAACTGCTAA GGAAATAAAT GTTACTGTTC ACTGGGGCGA TTACAGTCCG 
GTTGATGAAG AGGATGAAGA AAATCAAGAA GACTCTAAAA GCCAACTCCA GTTGCCCCGG 
CTGTGGCAAA GAACCCCCGG ACAAGCAGAA TTAACTGTTC CTCTCCATTT AAGTAATGTC 
CCCAAACATT GGGAAATTCC TGGTAGTAAC GGTTTGAGAC TCGTTACCTC AGTGCGTCCC 
GTAACTGCGG CGGAGTTAGT TCCTGTTGGT ACTCGTTCCG TATCCGTATT CCTGGTGAAC 
TATCGCCCGC CAGTAGCCAA CCCCTACAGC GATATTGCTT TCGCCTTCCA AACTTGCCTC 
ATCATCCGCA CCCCTTCTTC TCTCGTTCCT CGTCCCAACC TGCGCGGACG ACACGGTGAT 
GATTGGGATG AGAAGGTAGC AGATTTACAG TATCGAGATG ATTATGAGTA CGCAGTGGGA 
CATAACGTTT CAGCTGTCGC TGTCACTAAC GATGATGCTA CTTGTCAAGA AGTCCGCACT 
GCTTGGATGC CCATTGCTGA TGTAGAAAAG GTAGTACCTG AAAAAGTTCC AGGCGTGGAA 
CTGGGAATGG AAGCACTCGC CGCCGCACCC ACGGTGGAAA CTCTGCGAAA TATGATGTCT 
GGGATAGTTG ATGCTTATAG GGTGTGGATT GAAGCACAAA AGCTAAATCT TCCTAATGAT 
CCCGAACGAC TGGAAGTTGC TAACGATTTA CTCAACCGGG CAACCAGGGC AAACAAACGC 
ATCGCCGCCG GATTAAAAGC ACTAGATGAT CCTAATGTAT TAGAAGCATT TCAAATTGCC 
AATCGCGCGA TCGCCACTGC TATCCGTCAG CGTCTTACCC ACAATACAGA TACTACCCCA 
GAATCAGTCA AGCCTCCGGC ATGGCGACCT TTTCAGCTGG CGTTTTTATT AATGAACTTG 
GTTGGTATCG CCTATCCCGA ACACCCTGAC CGAGAATTAG TAGACTTGCT GTTTTTCCCC 
ACAGGCGGCG GTAAAACTGA AGCTTACTTA GGATTAGCAG CATTCGCAAT GGTATTGCGC 
CGCCTGCGAA ACCCCACAAT AAACTCAGCC GGCGTAAGTG TCTTGATGCG TTATACCCTG 
CGCCTGCTTA CCCTTGACCA ATTAAGCCGT GCTGCGACTC TTGTCTGCGC CTTAGAGTTA 
GAAAGACAAA AAGATACACA AAAATTAGGC CCCTGGCCTT TTGAAATTGG ACTATGGGTA 
GGACAAACCG CTACTCCCAA CCGTATGGGA AAAAAAGGCG ACAACGATGA ATACACCGCC 
CGCGCCCGTA CTATTGCCTT TCAAAATGAC ACCCGCAAAC CTTCACCCAT CCCTTTAGAA 
AACTGTCCTT GGTGCGGTAA ACGGTTTACC TCTGACTCCT TCCAATTACT CCCAGATGCA 
AATCAGCCAA AATCTCTGCA AATTACTTGT ATCAACCGAA AATGCAAATT TACCCGCAAT 
CAATCGTTGC CCATCGTTGC CGTAGATGAA CCAATTTACC AACGATTACC CAGCTTTATT 
ATCGCCACTG TCGATAAATT CGCCAATCTC CCTTGGGTAG GAGAAACTGG GGCATTATTT 
GGACTGGTAG ACCGTTATGA CAAAGATGGT TTTTACGGGC CTGCCCATCC CGGTCGCGGT 
CAAGCACTTG CAGGTCATTT ACCAGCCCCA GACTTGATTA TTCAAGACGA GTTGCACCTA 
ATTTCCGGCC CCTTGGGAAC AATGGTAGGG TTATATGAGA CTGCCATTGA CGAACTGAGC 
AGCAGAGAAA TTAACGGTAA AAAAATACGC CCTAAAATTA TTGCTTCTAC CGCAACAGTA 
CGGAGAGCTA GTAAACAAAT TCGAGCCTTA TTTGGTCGAG ATGCTGTAGA TATTTTCCCA 
CCTCCCGGCC CCGATCGCCG CGATTCATTT TTCGCTAAAA CAGTACCAGC AAGTGAAAGT 
AATGCCCGTA CCTATGTAGG CATTGCGGCC CAGGGACGAA GCTTAAAAGT GGTACTGTTA 
CGAACTTACT TAGCACTACT GGGTGCTGCA CAGAAACATT ATCAAGCAGC CGGAGGAGCA 
AAAAATCCTG ATAACCCCGC AGATCCTTAC ATGACCTTGC TGGGATATTT TAACTCCCTA 
CGCGAACTAG GTGGTAGTCG CCGCATCGTT GAAGATGAAG TCAACTCTCG TTTAGCAAGG 
TATAGCCTGA GAAAACGAGT CAACGAAACT GAAGGTTTAT TTGCTGACCG TCAAATTGCC 
TATGAACCGG CGGAATTGAC TTCCCGTGTC AGCACTAATG TTGTTGCTGA AATCAAAAGC 
TGCTTGGCAC TACCATTTCA CGAAAAGAAA CATATCGATG TAGCCTTAGC AACAAATATG 
ATATCCGTGG GTTTGGATAT CACCCGTTTA GGGTTAATGG TCGTGTTGGG TCAACCAAAA 
ACAGCATCCG AGTATATTCA ATCTACCAGT CGGGTGGGAC GGGATGAAAA TCGCCCTGGT 
TTGGTGATTA CATTATTAAA TATACATCGA CCACGCGATC GCTCTCACTA CGAACGCTTC 
CCAGCTTGGC ATACCAGCTT TTATCGTTCT GTAGAAGCAA CTAGCGTCAC TCCATTTTCA 
CCTCGTGCTA TTGACAGGGG TATTGCTGCT ATTTCCGTTG CCTTGGCGCG TTTAGGACAT 
CCTGGCATGA CTGCACCACC CCGCGCTATC GAGATTTTAC AACATCGGCA GGATTTAGAA 
TATGTTGTCG ATGCCATTAG CGATCGCGCA GAAATGCACG ATAAAGAACT TGATGCCGTA 
GAAGCCGAAG CACTACGTCA AAAAGTTCGC GGACGGGTGA AAGATTTACT AGACACTTGG 
GAACGCATTG CTAGTCAAAA AATCAGCTTG CAATACCAAC AAGAAGTAGG TCAAGCACCG 
CCATTATTAT TCGACCCCCT TGACCCAGAA CTTGAAAAGC AACCAATGGA AGCACGCAAG 
TTCAAAGCAC AACGCAGCCT GCGAGATGTG GAACCAACAG TCAACTTGTG GGTTTGCAAC 
CCTGATGGTT TTGAGGTTGA GGAGGACGAA AAATGA

Protein sequence

MPNTPAEVRS CLIDALQLDL VGPTPNDIAH VDEIIDQAPS KWYLTGFLVP YEASVEQRSE 
DIGNDDIDEI SQVNAGDDEK QPDSASARRA FFPSSMGLSI LVPATAKEIN VTVHWGDYSP 
VDEEDEENQE DSKSQLQLPR LWQRTPGQAE LTVPLHLSNV PKHWEIPGSN GLRLVTSVRP 
VTAAELVPVG TRSVSVFLVN YRPPVANPYS DIAFAFQTCL IIRTPSSLVP RPNLRGRHGD 
DWDEKVADLQ YRDDYEYAVG HNVSAVAVTN DDATCQEVRT AWMPIADVEK VVPEKVPGVE 
LGMEALAAAP TVETLRNMMS GIVDAYRVWI EAQKLNLPND PERLEVANDL LNRATRANKR 
IAAGLKALDD PNVLEAFQIA NRAIATAIRQ RLTHNTDTTP ESVKPPAWRP FQLAFLLMNL 
VGIAYPEHPD RELVDLLFFP TGGGKTEAYL GLAAFAMVLR RLRNPTINSA GVSVLMRYTL 
RLLTLDQLSR AATLVCALEL ERQKDTQKLG PWPFEIGLWV GQTATPNRMG KKGDNDEYTA 
RARTIAFQND TRKPSPIPLE NCPWCGKRFT SDSFQLLPDA NQPKSLQITC INRKCKFTRN 
QSLPIVAVDE PIYQRLPSFI IATVDKFANL PWVGETGALF GLVDRYDKDG FYGPAHPGRG 
QALAGHLPAP DLIIQDELHL ISGPLGTMVG LYETAIDELS SREINGKKIR PKIIASTATV 
RRASKQIRAL FGRDAVDIFP PPGPDRRDSF FAKTVPASES NARTYVGIAA QGRSLKVVLL 
RTYLALLGAA QKHYQAAGGA KNPDNPADPY MTLLGYFNSL RELGGSRRIV EDEVNSRLAR 
YSLRKRVNET EGLFADRQIA YEPAELTSRV STNVVAEIKS CLALPFHEKK HIDVALATNM 
ISVGLDITRL GLMVVLGQPK TASEYIQSTS RVGRDENRPG LVITLLNIHR PRDRSHYERF 
PAWHTSFYRS VEATSVTPFS PRAIDRGIAA ISVALARLGH PGMTAPPRAI EILQHRQDLE 
YVVDAISDRA EMHDKELDAV EAEALRQKVR GRVKDLLDTW ERIASQKISL QYQQEVGQAP 
PLLFDPLDPE LEKQPMEARK FKAQRSLRDV EPTVNLWVCN PDGFEVEEDE K