Gene Avin_18800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_18800
Symbol
ID	7760814
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	1865013
End bp	1866020
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	74%
IMG OID	643804778
Product	von Willebrand factor, type A (VWA) domain protein
Protein accession	YP_002799067
Protein GI	226943994
COG category	[R] General function prediction only
COG ID	[COG2304] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00117552
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGAAT TCGCCTGGCC CTGGGTCTTC CTGCTCGCCC CGCTGCCCTG GCTGCTGCGC 
CTCGTGCTGC CGCCGGCCGA CAGCGGCGAG ACGGCGCTGC GGGTGAGCTT CCTCGGCGAG 
CTGGAAAGCC TCAGCGGCCG CCGCGCCCGC CTGCGCCTGC CGGGCTGGCG GCAACAGGCG 
CCGTTCGTCC TGCTCTGGCT GCTGCTGCTC GGCGCCGCCG CGCGCCCCGA ATGGGTCGGC 
GAACCCCGGC CGCTGCCCGC CAGCGGCCGC GATCTGCTGC TGGCGGTAGA CGTTTCCGGC 
TCCATGGAAT ACGCCGACAT GCACTGGCAG GGCGAGAGCA TCGGCCGCCT GGAACTGGTC 
AAGCACCTGC TCGGCCAATT CATCGAGGAC CGCCGGGGCG ACCGCGTCGG GCTGATCCTG 
TTCGGCAGCC AAGCCTACCT GCAGGCGCCG CTGACCTTCG ATCGCCGGAC CGTGCGCACC 
TGGCTGGAGG AAGCCGCGAT CGGCATCGCC GGCAAGGACA CCGCCATCGG CGACGCCATC 
GGCCTGGGCC TCAAGCGCCT GCGCCAGCGT CCGGCGCAGA GCCGCGTGCT GATCCTGGTC 
ACCGACGGCG CCAACACCGC CGGCGAGATC GCTCCGTCGG TCGCCGCCCG CCTGGCCGCC 
GCGGAAGGGG TACGCATCCA TACCATCGGC ATCGGCGCCG ATCCCCGGCA GGACGGACCG 
CCCGGCCTGC TCGGCCTGAC GCCGGGACTG GATCTCGACG AGCCGACCCT GCGCGCCATC 
GCCGAAGAGA CCGGCGGCAG CTACTTCCGC GCCCGCAGCA GCGAGGAACT GCGCGCCATC 
GAGGAAACCC TCGCGCGCCT GGAGCCGGTC GCCCAGCCGC CGACCCAGGC GCGCCCGGCC 
CGCCCGCTGT ATCCCTGGCC GCTGGCCACG GCGCTATTGC TCGGCCTGCT GCTGGTGGCC 
CGCAGCCTCT GGCCGGCGCG CGCGCGCTCG CGAGGAACGC GCCGATGA

Protein sequence

MFEFAWPWVF LLAPLPWLLR LVLPPADSGE TALRVSFLGE LESLSGRRAR LRLPGWRQQA 
PFVLLWLLLL GAAARPEWVG EPRPLPASGR DLLLAVDVSG SMEYADMHWQ GESIGRLELV 
KHLLGQFIED RRGDRVGLIL FGSQAYLQAP LTFDRRTVRT WLEEAAIGIA GKDTAIGDAI 
GLGLKRLRQR PAQSRVLILV TDGANTAGEI APSVAARLAA AEGVRIHTIG IGADPRQDGP 
PGLLGLTPGL DLDEPTLRAI AEETGGSYFR ARSSEELRAI EETLARLEPV AQPPTQARPA 
RPLYPWPLAT ALLLGLLLVA RSLWPARARS RGTRR