Gene Ava_4008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4008
Symbol
ID	3680479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	4991164
End bp	4992417
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	44%
IMG OID	637719360
Product	hypothetical protein
Protein accession	YP_324508
Protein GI	75910212
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.758896
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGGGA TAGTGCTTGA AAGCTACTCA GGATTGGTAA TTAAGAAAAT GATAAAATTT 
AGAACTGCGA TATGTGCGAG TGTCATTTTA TTTGGAACTC AGCTTGATGT GGAACCGAGC 
AAAGCTCTCC CTGCGTCACA TAAGGCAGGG ACTCCTCTAC CTAATCCAAC CGTGATATTA 
GGATTTGGTG GAGTTTTGCA ACTGGACTGT ATTCGACAGG TTGAAGCGGG TGAATATCGC 
TGTGCAAAGC GTTGGGCAGA AGTCACCCAT TTGCTCAAAT CATTAGTTTA TCAAGATGTT 
GAATCGCAAC TTATTCCACC CCTGCAAAAT CAACTGGCGA TCGCAAATCA ATCCTGGCAT 
CAGTTTCAAA CACAACACTG CCAACAGTTA ACTCAACGCT TACGCAATAC ACCAGATTTT 
CCAATTGCAA CATCTGTCTG TTTAGCGCGA TTAAATAACG ATCGCATTCT AGAATTACAG 
AGAGGTGTTA AAATCATAAC CTTCCAATCT CACGATCCTC GATTTGAATC CTTACTCGAT 
CAACTCAAAT TGAGAAATTC ATCGGTGCAA CGCCACTGGG AGGAATATCA AACTCAGTAT 
TGCCAAATTG AAAAAGCTCT ATTCTCCCTG AATACCCTGA GATTGGCGGA ATGTCATCAG 
GGTCTGAGAC AGGCTCGACT TCACCAACTG GAAGAACTTT TGGCAGCACC TGCTCGTGGC 
TTGGCTATCT TCAATAGTTC TGTACGACCT GGAATTCCAG AGCTAAATTG TGTGGATGAG 
ACGCAGATCG GGTTAAATCA ATGCGCGGTC TATTGGTCAA AAACAACTCA GTTTTTGCAA 
TCAAGCATTT ATGGCGATTG GGCAGAAAGA CTATCGAAGC AGTATCAGCC AACATTTGGG 
ATCGCACAGA AATACTGGCA AGACTATCGT GAAGCACATT GTACTGAGTT GGTTGAACCT 
TTTCAGGAAG GTTCTATGGC ACCGATGCTC TATCATCGCT GTTTAGCTCG GCTAAATAAC 
GATCGCATTG CGGATCTAAA GGGGATAGCT GTATACGATT CAGAAGACGA GGCGCAGCAA 
GCCCCAGTTA CATCTGGGCA AGATACCACT CAAGCTCTGT GGGAGCGTTA TCAAACTGAG 
TACTGCAAGT TTGAGTCACT GTTTTTTGGT AGTCAAACCA GAAGCAAGCA ATGCCCAAAT 
CGTTTAAATC TGGGGCGTTT GCGCCATATC AAAGCAATGA TAAATACTCG TTAA

Protein sequence

MPGIVLESYS GLVIKKMIKF RTAICASVIL FGTQLDVEPS KALPASHKAG TPLPNPTVIL 
GFGGVLQLDC IRQVEAGEYR CAKRWAEVTH LLKSLVYQDV ESQLIPPLQN QLAIANQSWH 
QFQTQHCQQL TQRLRNTPDF PIATSVCLAR LNNDRILELQ RGVKIITFQS HDPRFESLLD 
QLKLRNSSVQ RHWEEYQTQY CQIEKALFSL NTLRLAECHQ GLRQARLHQL EELLAAPARG 
LAIFNSSVRP GIPELNCVDE TQIGLNQCAV YWSKTTQFLQ SSIYGDWAER LSKQYQPTFG 
IAQKYWQDYR EAHCTELVEP FQEGSMAPML YHRCLARLNN DRIADLKGIA VYDSEDEAQQ 
APVTSGQDTT QALWERYQTE YCKFESLFFG SQTRSKQCPN RLNLGRLRHI KAMINTR