Gene Ava_1359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_1359
Symbol
ID	3682868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	1675409
End bp	1677121
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	43%
IMG OID	637716697
Product	von Willebrand factor, type A
Protein accession	YP_321878
Protein GI	75907582
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1240] Mg-chelatase subunit ChlD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00054034
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0176573
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCTCA AAGGGTCTTG GTTAAATACA CGCCTTGTAG CAGTTTTAGG TGTCCTGTTA 
CTAACCGCTT GTAGCAGTAA CCCCAACTCA ACAGATAATT TTACGGGTTT AAAGATCAAA 
GTTTTAGTTG GCAGCGCCTT GGGGGATTTT TGTAACCAAG CTGCAAAAAA TTTTAATGCA 
ACGCAACCTA AGTTAGATAA TGGTAATGCT TTACGGGTGG AATGTGAGGC GCAAGGTAGC 
GGTGATGTTG TTACTAAGTT GCTAGGATTG ACCACTCAAC TAAAAAACGG CACTTTACAA 
CCTGATGGGG CAGATTTTCC CACAATAATT TCCCTGGATG GAGATATATA TCACAGTCAG 
TTAATTTACC GAATCAACCA AGTTTTTCCG GGGCAAAATT ACATTCCGGA AATTACCGAT 
GCGCCATTGC TGGCTAATAG TCCAATGGTA TTTATGGCAC AGGCGGATGT GGCTGGCGGT 
TTGCAGAAAG TACCTGATGC TTATAAGGCT TTAGTGACAG CGAAAACTCA CCGCGATATA 
GACCCTGCTT CACCATCGTT AACAGTTAAT TACGTCCACA CTGCACCGAC TCGTTCTAAT 
TCGGGGTTGC AAACTTTAGT AGCTCAGTAT ACTAGTGTGT CTGGAAAGCG TCCTGAAGAA 
TTAACCATTG CTGATGTGCA GACTTTTCAG CCGCAAATTC AGCAAATCCA AAGTAAGATT 
ACTCGTTACG GTGTTTCTAC TAATTCTCTG GCTCAAGCGA TGGTGAAAAA CGGGCCGTTT 
TGGGCTTCTG TGGGGTCTGT GTATGAATCG AGTGTGATTG CTGCAAATTC CAGCTTGCAA 
CCAGGACAGG AGCGTTATCA GGCAGTGTAC CCCAAGACAA CGTTTACTTC TAATATGCGA 
GCAATTGTGC CGAATGCGCC TTGGGTGAGT GCTGATGAGA AGGCTGGTGC AGAGAAGTTT 
ATCACTTATT GGCGATCGCC TGATACTCAG AAAATTGCCC CAGATTTAGG TCTGCGACCA 
GGAACCCCAG GAGTAGCTTT AGGTGCAAAG TTCTCTCCTG AGTTTGGTGT TGTAGCACAA 
GCTAAGTACG ATTCTTTGCG TCCACCAAAA CCAGAGGTAG TAGATGCAAT GTTGAAATCT 
TGGCAGGAGG CTTCTAAAAA ACCATCTTTG GTGGTGGTTG TGGTGGATTC TTCAGGGTCA 
ATGGAGGGTA ATAAGTTACC AGCCGTCCAA AATACTTTGC AAAATTATAT TAAGAATTTG 
GGCAAAAAAG AACAAATTGC TTTGATAGAT TTTGACTCAG AAATTAGAGA GCCTGTCTTA 
GTAGATGGTA CTCCCCAAGG ACGCGATCGC GGTGTGCAGT TTATTAGCGG TCTTCGGGCT 
GACGGCGGGA CAAAGTTATA TGATGCTGCT ATCCAAGCGC GGAATTGGTT ACAAAAAAAT 
CGTCGTCAAG GGGCGATTAA TGCAGTTTTA ATATTAACTG ATGGGGAAGA TTCTGGTTCA 
AAAATATCTT TGGACAATCT ATCAGCAGAG TTGCAAAAAA GTGGTTTTTC TACTGACCAA 
AGAATTGGCT TTTTTACAGT TGGTTATGGT GAGGAAGGGG AGTTTAATCC TGATGCTTTA 
AAGAAGATTG CTGAGTTGAA TGGAGGTTAT TATTCTAAAG GTGATCCTGA GACGATTTCG 
CGGTTGATGT CTGATTTACA GGTGGAGTTT TAA

Protein sequence

MILKGSWLNT RLVAVLGVLL LTACSSNPNS TDNFTGLKIK VLVGSALGDF CNQAAKNFNA 
TQPKLDNGNA LRVECEAQGS GDVVTKLLGL TTQLKNGTLQ PDGADFPTII SLDGDIYHSQ 
LIYRINQVFP GQNYIPEITD APLLANSPMV FMAQADVAGG LQKVPDAYKA LVTAKTHRDI 
DPASPSLTVN YVHTAPTRSN SGLQTLVAQY TSVSGKRPEE LTIADVQTFQ PQIQQIQSKI 
TRYGVSTNSL AQAMVKNGPF WASVGSVYES SVIAANSSLQ PGQERYQAVY PKTTFTSNMR 
AIVPNAPWVS ADEKAGAEKF ITYWRSPDTQ KIAPDLGLRP GTPGVALGAK FSPEFGVVAQ 
AKYDSLRPPK PEVVDAMLKS WQEASKKPSL VVVVVDSSGS MEGNKLPAVQ NTLQNYIKNL 
GKKEQIALID FDSEIREPVL VDGTPQGRDR GVQFISGLRA DGGTKLYDAA IQARNWLQKN 
RRQGAINAVL ILTDGEDSGS KISLDNLSAE LQKSGFSTDQ RIGFFTVGYG EEGEFNPDAL 
KKIAELNGGY YSKGDPETIS RLMSDLQVEF