Gene Ava_A0004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_A0004
Symbol
ID	3677975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007411
Strand	-
Start bp	3684
End bp	5078
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	44%
IMG OID	637715057
Product	von Willebrand factor, type A
Protein accession	YP_320251
Protein GI	75812633
COG category	[R] General function prediction only
COG ID	[COG2304] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAATG TGCTAAACGT ATCTATTACC CCTCACAGGG AATTTATGCC TGCGGAAACT 
GAGGGACAAA AGCTATTTCT GATGCTGAAA CTGCGCCCAA CAAAAGAAGT TGCAGTTTCT 
CGTCCACCTA CTACCTTTGC TTTTGTCATT GATACTAGTG GTTCCATGTA TGAAATAGTT 
ACAGGAGAAA CAACGCCTAC AGGTGTGACT TATACCCAAG ATGCTAAGGA ATATAGCCAG 
GTGACAGGGG GTAAATCAAA AATTGATATT GTCATCGAGT CTTTGTTAGC ACTGGTGCGT 
TCTGGCAGAT TAGAAGCAAG CGATCGCGTG GCGATTGTCC AGTTTGATGA TACAGCTTCC 
CAGATTATTG ACTTGACCCC AGCGACGCAA GTTAGTCAAT TAGAAAATGC GATCGCTCAA 
CTTCGCAGTT TTTCTGGTGG TACTCGCATG GGCTTGGGTT TGCGTCGCGC TTTAGATATG 
CTTAGTGGTC AGGATATGGC TGTCCGACGT ACCCTACTGT TCACAGATGG TCAAACTTTT 
GATGAAGATA TCTGTCGGGC GCTCGCATCA GATTTTGCTA CTAAAAATAT CCCGATTACC 
GCCTTGGGAG TTGGTGAAGA CTTCAAAGAA GATTTACTTT CTCATCTGAG CGATTCTACA 
GGTGGAACCC TATTTTATGT AGTTCCGGGA AACGCTGTTG GTACTCAAGT TTCTATTTTA 
GATTTACCAA ATAGAATTAT TGCCGACTAC ATTCAGGCAC AGAAAGAAGT TATTACTAAC 
TTAGCTTTAA CAGTCAAAAC TGTTAAAGGT GTAGAATTGA ACCGCATTGT TCGCGCCTAT 
CCCACTCAAG CAGAATTTTC TCTTACTCAA GAATCTTATC CCATTGGCAA TGCAGCTGCC 
GGTGATGAAA CAATCTTCAT CCTCGAATTC CGCATGAATA GCCGTCCTGC ATCCCGTGTC 
CGGATTGCTC AACTTGGTTT AACCTACGAT ATTCCAGGAC AAAACCGACG CGGTGAACTT 
CCACCCCAAA ACTTAGTAGT GCAATTTGTT GCTGGACAGG GAGGTGCAAC GCAAGTGGAT 
CAAGAAGTCA TGGATTATGT ACAGCAATGC AATATTTCCA ATTTAGTCAA CCAAGCGACT 
AAAATTGCTG ACCGCGACCC ACAAAAAGCC GAAGAACTAT TAGAAACTGC ACGGCGTATG 
ACAGTGAGAA TTGGCAACAA AGAAATGGAA GAATCCCTCA ACGGCGCTCA ACAAGAGTTA 
CGTAAAACTC GCCAGATATC TGCCGGAACC CGTAAAACTG TCAAGATGGG AGCCAAAGGT 
AAAACCGTCA AAATAGGTAG CGATATTAAT GACGAGCTTT CAGAAGAAGA AATGCGTAAA 
CTCACAGGAA CTTAA

Protein sequence

MSNVLNVSIT PHREFMPAET EGQKLFLMLK LRPTKEVAVS RPPTTFAFVI DTSGSMYEIV 
TGETTPTGVT YTQDAKEYSQ VTGGKSKIDI VIESLLALVR SGRLEASDRV AIVQFDDTAS 
QIIDLTPATQ VSQLENAIAQ LRSFSGGTRM GLGLRRALDM LSGQDMAVRR TLLFTDGQTF 
DEDICRALAS DFATKNIPIT ALGVGEDFKE DLLSHLSDST GGTLFYVVPG NAVGTQVSIL 
DLPNRIIADY IQAQKEVITN LALTVKTVKG VELNRIVRAY PTQAEFSLTQ ESYPIGNAAA 
GDETIFILEF RMNSRPASRV RIAQLGLTYD IPGQNRRGEL PPQNLVVQFV AGQGGATQVD 
QEVMDYVQQC NISNLVNQAT KIADRDPQKA EELLETARRM TVRIGNKEME ESLNGAQQEL 
RKTRQISAGT RKTVKMGAKG KTVKIGSDIN DELSEEEMRK LTGT