Gene Ava_3803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_3803
Symbol
ID	3678773
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	4737473
End bp	4738717
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	46%
IMG OID	637719154
Product	GCN5-related N-acetyltransferase
Protein accession	YP_324303
Protein GI	75910007
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.013575
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCTC AAATCAACAT GACTTCATTA CTTCCTCGAA ATCTTAGCGT TGTCATCCGG 
CCAGTCTATT ATCGGGACTT GGACGGAATT GAGCGAATAT CTCAAGAATC CTTCGCAGCT 
CATACCCCCC AAGGAGCTAG TTCTATTGCT AATCGGATGC AATGGTTGCG TCGCTGGTAT 
GGGTTACTCA AGTTTTTGAG TTGGTTCCCT AACCCGCTAC AATACCGCTT TTGCGCCTAT 
GTAGCCGAAC AGGGGCGGAT GCTCTTAGGG ATGATTCAAG TTTCGCCGTT TAACCGGACA 
CGCAGCACTT GGCGAGTTGA CCGGGTGATT TTGGATCGGG CTGTCGATAA GCAGGGAATT 
GGTTCACAGC TACTACGCCA CTGTTTTGAA GGGATTTTAG AAGCTCGTAC TTGGTTGTTA 
GAAGTTAATG TCAATGATAC AGATGCACTA GCGCTTTATC GGCAAAATGG ATTTCAGCGT 
TTAGCAGAAA TGACATATTG GGAAATAGAT CCCGAATTAT TAAGTGAATT AGCGCAAGCA 
GAGCCAGATT TACCCAATCT TTTACCAGTC AGCAATGCGG ATGCTCAGTT GTTGTATCAA 
TTGGATACAG CATCGATGCC ACCGTTGGTA CGTCAAGTAT TCGATCGCAA TACCCGCGAT 
TTTAAAACCA GTTTGTTCGG CGCTTTAAGA GATGCAGTCA AACAATGGGT GACAAAAATT 
GAAGTTGTAA GCGGCTACGT GTTTGAACCA CAACGCAAAG CAGCAATAGG TTATTTCCAG 
TTACAGCTAG ACCGCAAAGG TGAAACTCCC CACGTTGCCA CCTTGACAGT CCACCCTGCT 
TATACTTGGC TATACCCAGA ATTATTATCT CAACTGGCGC GAATTGCCCA AGATTTTCCC 
CAACAAGGTT TACAACTAGC CTCCTCTGAT TACCAACCAG AGCGAGAAGA ATATTTAGAA 
CGCATTGGTG CCAAGCGCAT AGAACACACG CTGATCATGT CTCGTTCAGT CTGGCACAAA 
CTGCGGGAGT CAAAATTTGT CTCTCTAGAA GGGATTCAAT GGACTGATGT TCTCCAAGGA 
CTGCAACCTG CGCGCAAACC CATCCCTGGG GGAATGTCCT GGGTACACAC AAGACAGCAA 
TCATCCCCAG ATATCCCAGT ACCCAGTTCA TCAGAACCAA TGGCCTTTGG GATTAAAGAT 
GTACCCAATC AGCCAGATTC AGAAGAAGGG GAGATTGGGG AGTAG

Protein sequence

MAAQINMTSL LPRNLSVVIR PVYYRDLDGI ERISQESFAA HTPQGASSIA NRMQWLRRWY 
GLLKFLSWFP NPLQYRFCAY VAEQGRMLLG MIQVSPFNRT RSTWRVDRVI LDRAVDKQGI 
GSQLLRHCFE GILEARTWLL EVNVNDTDAL ALYRQNGFQR LAEMTYWEID PELLSELAQA 
EPDLPNLLPV SNADAQLLYQ LDTASMPPLV RQVFDRNTRD FKTSLFGALR DAVKQWVTKI 
EVVSGYVFEP QRKAAIGYFQ LQLDRKGETP HVATLTVHPA YTWLYPELLS QLARIAQDFP 
QQGLQLASSD YQPEREEYLE RIGAKRIEHT LIMSRSVWHK LRESKFVSLE GIQWTDVLQG 
LQPARKPIPG GMSWVHTRQQ SSPDIPVPSS SEPMAFGIKD VPNQPDSEEG EIGE