Gene Ava_4601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4601
Symbol
ID	3679990
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	5755596
End bp	5756768
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	47%
IMG OID	637719956
Product	NHL repeat-containing protein
Protein accession	YP_325093
Protein GI	75910797
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCAACCAG AATTAACAAA AACTCCAGCA AATTTCCCCC TTTCACCTCC AGGGGCGGCG 
GTGATTTTAG GTGATATTCC TAACTCAGAA TTATTAGCGA TTCCCCTAGC GCCTACTCCT 
AGCACCATGT TCGGCCCCCG TGGTGCTTGT TTGGTGGCGG AAACAGGGGC GTTATGGGTG 
TCAGATACGG GACATCATCG GTTGTTGGGT TGGCGTAAGT TACCTACAAC AGATAGTCAA 
CCGGCTGACT GGGTAATTGG ACAACCAGAT TTTTATCATG AGGGACAAAA TGCTAAGGGT 
ACGCCAGGTA GGGCTACTGT GAGTGTACCG ACGGGGATTT GTGTCTGTGG TGGAGGTTTG 
GCAATTGCTG ATGCCTGGAA TCACCGGGTT TTGATTTGGC ACAAGATACC GGAAGATAAC 
AATGTGCCGG CGGATTTGGT GTTGGGACAA GGGAATTTTT CTGACAATGA ACCAAATCGG 
GGTAAGCAAT CACCAGATGC GAATACTATG CACTGGCCTT ACGGGGTTGC ATATCATCAA 
GGACGGCTAT TTGTGGCTGA CACTGGTAAT CGTCGGTTGT TGATTTGGCA GGAGTTACCA 
ACAGAAAATG GACAACCGGC TGATATAGTT TTGGGACAGC CGGATATGAT ATCTCGCAAT 
GAGAATGGTG GTGGTTCCCC CACGGCTGGG AGTATGCGTT GGTGTCATGA TATTGCCTTT 
TGGGATGATA ATTTAGTTGT CACCGATGCG GGTAATAATC GGGTGATGAT TTGGCAGGGG 
ATACCTACCG AAAATAATGT CCCCTGTGCG GTGGTGTTGG GGCAGAAAAG TTTTGATTTG 
GTGGAGATGA ACCAAGGGGT TTATTTTCCC AGTGCTGGTA GTTTAAGTAT GCCTTATGGG 
GTGGGGACGA CTGAGGATTG GTTGCTGGTG GCGGATACTG CTAATTCTCG GTTGCTAGGA 
TGGAGGAAAC GAGAGTCGAT ATTATTATTG CAGGGGGCGA TCGCTGATGG CATCATCGGC 
CAAAATTCTT TTCAAAGTAA AAGTGAAAAT CGGCATTTTG GGTTGCCTAC AAGGGATAGT 
TTGAATTGGT GTTATGGGGT AAAGGTTTGT GGTAGTACGG CGGTAATATC TGATTCTGGG 
AATAATCGGG TTTTGTTATG GCGCTTTTTG TAA

Protein sequence

MQPELTKTPA NFPLSPPGAA VILGDIPNSE LLAIPLAPTP STMFGPRGAC LVAETGALWV 
SDTGHHRLLG WRKLPTTDSQ PADWVIGQPD FYHEGQNAKG TPGRATVSVP TGICVCGGGL 
AIADAWNHRV LIWHKIPEDN NVPADLVLGQ GNFSDNEPNR GKQSPDANTM HWPYGVAYHQ 
GRLFVADTGN RRLLIWQELP TENGQPADIV LGQPDMISRN ENGGGSPTAG SMRWCHDIAF 
WDDNLVVTDA GNNRVMIWQG IPTENNVPCA VVLGQKSFDL VEMNQGVYFP SAGSLSMPYG 
VGTTEDWLLV ADTANSRLLG WRKRESILLL QGAIADGIIG QNSFQSKSEN RHFGLPTRDS 
LNWCYGVKVC GSTAVISDSG NNRVLLWRFL