Gene Afer_0310 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Afer_0310
Symbol
ID	8322365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidimicrobium ferrooxidans DSM 10331
Kingdom	Bacteria
Replicon accession	NC_013124
Strand	-
Start bp	322801
End bp	324747
Gene Length	1947 bp
Protein Length	648 aa
Translation table	11
GC content	70%
IMG OID	644951458
Product	von Willebrand factor type A
Protein accession	YP_003108951
Protein GI	256371127
COG category	[R] General function prediction only
COG ID	[COG4867] Uncharacterized protein with a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGACCG TGCGCTATGG AGGCGTCGAT CCCGAGCCCC TCGGCCCGGA GGCCGACGAC 
GTCCTCGCCG CCCTCAGCGA CGACCTGGCC TACCACGGCA ACCTTGCGAG CGCACTCGCC 
GACCTGCTGC AGCGAGGCTT GGACGACATG CCTGGGCTTG CCGAGCTCCT CACACGGCTA 
CGCGAACGTC GCGACCAGCT GCTCGCGCGC TACGACCCCA ACGCGACGCT CAGTCGCGTG 
CGCGAGGAAC TCGACGCCAT CGTGTCGAAG GAGCGAGCCA GCCGCGAAGC TGCACACGAG 
CGCACCCAAG CGCCCGAGCA CCTCCTCGCA CAGATGGAGC TCGATGCGCT CCCCTACGAC 
ATCGCCGAAC GCCTCACGGC GCTCGAGCAC TACGACTTCT TCGACGAGGC AGCCCACGAG 
CGCTTCGACG ACCTGCTCGC GAGCCTTCGC TCCTCGCTGC TGGCGCAGTC GTTCGAGCAG 
CTGGCGTCGG CGATCGAGGC GGGCGACGCC GATGCGTACG CGGCGATGCT CAGCGACCTC 
GCGTCGCTGA TCGAGCGCTT TGCGCGTGGC GAGGACATCA GCGACGACCT TGAGGCGTTC 
CAGGAACGCT ACCCAGGGAT CATCGCCCCG GGGGAATCGT TCGAAGACTT CCTCGCCCGC 
CTCGCGGCGA GTCGCATGGA CCTCGAACGC CTCCTGGCAT CCGTGGACGA CGACACGCGA 
CGTGCCCTCG AGCGCCTCCA GGACGCACTC GCTGGATCCC CCGCGATCGC CGAAGCCATG 
CGGCGCCTCG GGGAGGCACT CGGCACCATC GCGGGGTTCG ACGCCGACGC GATGGGGTTC 
AGGGGCTCCG AACCGCTCGG TCTCGGCGAG CTCGGCCCGG TGATGCGCGA ACTCGGGCGC 
CTCGACACGC TCGAAGCCGC ACTCCGTCAA GCCACGACCC CCGATCGCCT CGGTGCGATC 
GAGCTCGACG AGGTGCGCGA CCTCCTCGGC GCGGACGCCC AGGCAGCGCT GGAGCGCCTC 
TCGCGCACGA CCGAAGCGCT CGAGGCAGCC GGCCTCATGA ATCGCACCGG GGGTCGCGTC 
GAGCTCTCAC CGCGCGCCGT GTGGCGCCTC GGTGACCTGC TCCTTCGTGA CCTCGCGCGT 
CAAGGCGTGC TCGGGCCCCT CGGGCAGCAC GCCGTGCGAC GCACTGGGGT CGGCACCGAG 
CCCAACGGCG AAGTGCGCGA GTGGCGCTTT GGCGATCCGT TCCGCCTCGC CCTCGCTGAC 
ACCCTTCGAG GTTCGCTCGC TCGGAACGGG CCGGGGATAC CGCTCCGGCT CGATCCCGAC 
GACTTCATGA TCGAACAGGT CGACGACCAG GCGCGCCAAG GCACCGTCCT TGCGCTGGAC 
CTGTCGCTCT CGATGCCGCT CAACGACACC TTCTTGCCGG CCAAGCGCGT CGCCCTCGCG 
CTCGCCTCCC TGGTGCGGGC ACGGTTCCCT GCCGACGACT TCTCGGTGGT GGTCTTCTCG 
GAGACCGCGC GAGAGGTCCC GATCACCGCG CTGCCTGAGG CGCAGTGGGA CTACGTCTAC 
GGGACCAACA TTCAGCACGC CCTGGCCCTG GCCCGCCAGC GCCTGCGCCG AGTTCGCGGA 
CGCCGCCAAG TTCTCCTCGT CACCGACGGC GAACCCACCG CCCACGCCGA CGACGAGGGC 
TCGGTGCACT TTGCCTATCC CCCGACCCCA GAGACCCTCC GTCGCACCCT CGCCGAGGTA 
GTCCGTGCCA CCCGCGAGCG CATCGAGATC AGCGTCTTCG TCCTCGCTCG CGATCGCGGG 
CTACGACGCT TCGTCGAGCA GGTGGTCGCC ATCAACCACG GCAAGGCCTA CTACCCCGGC 
GACGGAGAGC TCGGCACCGT GCTCCTCGAC GAGTTCCTGA CCAACCGACT CGGAGCTGCA 
CACACCGCTC GCCGAACCGA CAGCTAG

Protein sequence

MSTVRYGGVD PEPLGPEADD VLAALSDDLA YHGNLASALA DLLQRGLDDM PGLAELLTRL 
RERRDQLLAR YDPNATLSRV REELDAIVSK ERASREAAHE RTQAPEHLLA QMELDALPYD 
IAERLTALEH YDFFDEAAHE RFDDLLASLR SSLLAQSFEQ LASAIEAGDA DAYAAMLSDL 
ASLIERFARG EDISDDLEAF QERYPGIIAP GESFEDFLAR LAASRMDLER LLASVDDDTR 
RALERLQDAL AGSPAIAEAM RRLGEALGTI AGFDADAMGF RGSEPLGLGE LGPVMRELGR 
LDTLEAALRQ ATTPDRLGAI ELDEVRDLLG ADAQAALERL SRTTEALEAA GLMNRTGGRV 
ELSPRAVWRL GDLLLRDLAR QGVLGPLGQH AVRRTGVGTE PNGEVREWRF GDPFRLALAD 
TLRGSLARNG PGIPLRLDPD DFMIEQVDDQ ARQGTVLALD LSLSMPLNDT FLPAKRVALA 
LASLVRARFP ADDFSVVVFS ETAREVPITA LPEAQWDYVY GTNIQHALAL ARQRLRRVRG 
RRQVLLVTDG EPTAHADDEG SVHFAYPPTP ETLRRTLAEV VRATRERIEI SVFVLARDRG 
LRRFVEQVVA INHGKAYYPG DGELGTVLLD EFLTNRLGAA HTARRTDS