Gene Ava_1143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_1143
Symbol
ID	3683397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	1400667
End bp	1402421
Gene Length	1755 bp
Protein Length	584 aa
Translation table	11
GC content	42%
IMG OID	637716479
Product	surface antigen (D15)
Protein accession	YP_321662
Protein GI	75907366
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2831] Hemolysin activation/secretion protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0908627
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00528068
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGAAAAATA TTGACTTAGG CAGGAATGAT GCCCGAATTA AAGCAAAATT TCCCTGTCCC 
AGATTATTTC TGCTACTAAC CTTAATTAGC TTTCCTGGTG TTGCGTCTGC CCAATCTACA 
CCACCGGCAG GGGTGACAAT TCCCCCTACT ACACCAGAAA CTATCGACCA AACTATCCCT 
AAACCCTCCC CTATTCCCAC TGTTCCTACT CCCCCTTCTC CTACCACACC TATTCTTCCT 
GTGCCTCCTG TGCCAACACC ATCGGATGTT ACTTCTCCTA CTGGTGAAAG CTTTTTAGTG 
ACCAAAATTG AAGTTTTGGG GTCTACAGTC TTAAAAAATG AAATCGCCAA GTTGATTAAA 
CCATTCGAGA ACCGTCGAGT TACTTTTGCA GATTTAATTC AACTACGCTC AGATATTACC 
GAACTTTATA TTGAAAACGG CTACATCACC AGTGGCGCAT TTTTACCCAA CAATCAAAAT 
CTGACTGATG GTGTGGTAAA AATTCAGGTG GTGGAAGGAG AACTAGAGAA AATTGAGATT 
ACTGGGTTAA GAAGTCTTCA ATCAGTATAC GTGCGATCGC GTCTCGCCAA AGCTACCTCC 
ACGCCATTAA ATCGCCAACG CATAGAAGCA GCATTGCAAC TATTACAACT AGACCCCGTG 
ATTCAACGGG TAAATGCTGA GTTAACTGCT GGCAGTACTT CTGGTAGTAG TATCTTGCTA 
GTAAATATCA CCGAAGCACC AGCATTTCAT AGGGGAGTTT TTACAGCCAA TAACCAAACT 
CCCAGTATTG GTTCGACTCA ACTAGGGGTA TTTTTGAATC ATGATAACTT GCTCGGTTTT 
GGCGATCGCC TCGCTGCCGA ATATACAATT ACTGAAGGAC TTAACTTGTA TGATGTCAGC 
TATACAATTC CGGTAAACGG CAATAATGAC ACATTGAGTT TTCGGGTAAA TAATGCCAAT 
AGCCACATTA TTACAGATGA TTTCCGCGAT TTGGACATTA GAAGCGAAAC TCAAACCTAT 
TCCCTCAGTT ATCGTCATCC TCTCTACCGC CAACCCCAAA CAGAACTTGC CCTGAGTTTA 
GGCTTAGATT TACGTCGTTC GCAAACATTT CTCCTCGATA ATATCCCTTT TTCTTTTTCT 
CCTGGTGCGG AGGATGGAGA ATCAAAAATT ACCGCCATTC GTTTTTCTCA AGATTGGGTA 
AAACGAGATT CCACAAGTGT TTTAGCAGCT CGCTCCCAAT TTAGCCTTGG TATTGGCGCT 
TTTGATGCTA CAGTCAACGA CACTGATACG GATGGGCGCT TCTTTTCTTG GTTAGGACAA 
TTTCAATGGG TGCAGTTATT ATCTTCACGA ACATTAATCC TCACTAGAGT CAATGCCCAA 
CTGACGGGAG ATGCTTTATT ATCATTAGAA AAATTTAGTA TTGGTGGGTT TGATACAGTT 
CGTGGTTATA CTCAAAACAA ACTCGTAGCC GACAATGGTT TTACGGCTTC TGTGGAAGTT 
CGTCTTCCCT TAACTGCTAA CTCTAATGCT TTGCAGATAG CACCTTTTTT TGATATTGGT 
ACTGTGTGGA ATAATCGCGG TAGTAATCCC CAACCACAGA CAATCTCCAG TCTCGGTTTA 
GGCTTGCTTT GGCAACCAAG TCGAGATTTA AACCTACGTT TAGATTATGG TATTCCCTTA 
ACGAATGTTA ACTATAGCGG AAACACACTG CAAGAAAATG GTCTTCACTT TTCACTGCGT 
TATCAACCAT TTTAA

Protein sequence

MKNIDLGRND ARIKAKFPCP RLFLLLTLIS FPGVASAQST PPAGVTIPPT TPETIDQTIP 
KPSPIPTVPT PPSPTTPILP VPPVPTPSDV TSPTGESFLV TKIEVLGSTV LKNEIAKLIK 
PFENRRVTFA DLIQLRSDIT ELYIENGYIT SGAFLPNNQN LTDGVVKIQV VEGELEKIEI 
TGLRSLQSVY VRSRLAKATS TPLNRQRIEA ALQLLQLDPV IQRVNAELTA GSTSGSSILL 
VNITEAPAFH RGVFTANNQT PSIGSTQLGV FLNHDNLLGF GDRLAAEYTI TEGLNLYDVS 
YTIPVNGNND TLSFRVNNAN SHIITDDFRD LDIRSETQTY SLSYRHPLYR QPQTELALSL 
GLDLRRSQTF LLDNIPFSFS PGAEDGESKI TAIRFSQDWV KRDSTSVLAA RSQFSLGIGA 
FDATVNDTDT DGRFFSWLGQ FQWVQLLSSR TLILTRVNAQ LTGDALLSLE KFSIGGFDTV 
RGYTQNKLVA DNGFTASVEV RLPLTANSNA LQIAPFFDIG TVWNNRGSNP QPQTISSLGL 
GLLWQPSRDL NLRLDYGIPL TNVNYSGNTL QENGLHFSLR YQPF