Gene Ava_4097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4097
Symbol
ID	3681562
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	5089916
End bp	5091094
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	44%
IMG OID	637719445
Product	hypothetical protein
Protein accession	YP_324593
Protein GI	75910297
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.407724
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.826772
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTAGCT TAGATGCACT GGCTCTCAAA AACTCTACAC ACTTATGGCT AGAAATTTCG 
GAAACTGAGC AAAAAAAAAT TTGGCAGCAA AGCCAAGCTT TTTCCTCAGA TAGTCGGCGG 
TGGAGTGCCT ATCTCAATCG CTTGAGCCTG AACACTTTTC TACCTTGGCT ACAAGCCGAA 
CACAATCCCG ATGCGACTCC TTTTCCCCGA CTGGCTGCGC TACCCAGTGT TTGGGAAGTA 
GTCAATGGTT TTGGGATTTC TTTCGGGACA AAACGTATGG TATTAATTCC TACGGAAGCA 
GTTGATTTAA GCGAACTGCG CGTTCCACAA GAATGGGTAG ATATTCCTAG TTGGACAGCA 
GACTATTACC TAGCCGTACA AGTAAATCTC GAAGAAGGCT GCATCCGGAT TTGGGGATAC 
ACCACCCATG CGCTACTGAA GAGTATGGGT ACTTATGACG CAAGCGATCG CGCCTACTGT 
GTGGATGGAG AGAATTTGAT TGCTAATCTT GGTATTTTGT GGATAGCAAG TCAACTTTGT 
GTGGAAGAAC CCACACGTTC TGAAGAAACA GTACCTTTAC AAGAGTTAGC GATCGCGCAA 
GCACAAAATT TACTGCAACG TCTCGGAAAT CCGGCTCTAA TTTTACCCCG TCTAGCAGTA 
CCCTTTCCCA CTTGGGGTGC GCTCCTACAA CATGGCGGTT GGCGGGAACA TTTGTATGAA 
CAGCGTCAAG GACAACAACA AAAGTGGTCA ATTACCCAAT GGTTGCAAGC TGGTGTATCG 
GATTTTGCAC AAGCATTCGG CTGGCATAGT GTCGAGCTAG AGTCAAATTT TGCAGGAGCT 
AGAGGTTTAG AATCAAAAAC TGAATTACCA ACTTTAGTGC GAACACTCAC TATTGCTGGG 
CAAGAATATG AATTGCGAGT CAAGGCAAAA AATAGTATTA CAGATAGAGT CTGGCGATTT 
GAATTACAAA ATGCAATGAG AGGTGAAATG ATTGCCCAGG GAATAAAATT ACGACTGTTG 
ACAGAAAATT TACAACCATT TTATGGCAAT CAAGTACAGG CTAATACTCC AGTAAATAAG 
CTATACCTGG AAGTGGCACT GGGTGATACT GAGGAAGGAT TGGTATGGGA AATAGAGCCA 
ACTCCTGAAG ATTTTGAACA CGAAATTTTG TTTTTTTGA

Protein sequence

MVSLDALALK NSTHLWLEIS ETEQKKIWQQ SQAFSSDSRR WSAYLNRLSL NTFLPWLQAE 
HNPDATPFPR LAALPSVWEV VNGFGISFGT KRMVLIPTEA VDLSELRVPQ EWVDIPSWTA 
DYYLAVQVNL EEGCIRIWGY TTHALLKSMG TYDASDRAYC VDGENLIANL GILWIASQLC 
VEEPTRSEET VPLQELAIAQ AQNLLQRLGN PALILPRLAV PFPTWGALLQ HGGWREHLYE 
QRQGQQQKWS ITQWLQAGVS DFAQAFGWHS VELESNFAGA RGLESKTELP TLVRTLTIAG 
QEYELRVKAK NSITDRVWRF ELQNAMRGEM IAQGIKLRLL TENLQPFYGN QVQANTPVNK 
LYLEVALGDT EEGLVWEIEP TPEDFEHEIL FF