Gene Anae109_1513 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_1513
Symbol
ID	5375525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	+
Start bp	1716379
End bp	1717779
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	77%
IMG OID	640843024
Product	VWA containing CoxE family protein
Protein accession	YP_001378704
Protein GI	153004379
COG category	[R] General function prediction only
COG ID	[COG3552] Protein containing von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0878716
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCACGCGC GCGTCGTCGA GTTCGCGGGG CTGCTCCGCA CGAACGGGGT GCGGGTCTCG 
CCGGCCGAGG TCGCCGACGC GGTCGAGGCC GCGGCGCTGG TGGGCGCGTC GGACCGCGGC 
AGCTTCCGGG CGGCGCTGCG CGCCACGCTC GTGAAGCGCT CGCGCGACGT CCCCGTCTTC 
GACGGGCTGT TCGAGCTCTA CTTCTCCGCG CTGGGCCGCG TCGTCGAAGG GCTCGAGCGC 
GGCGTGGTCG GCGAGCTCGC CGCCCGCGGG CTCCTCGAGG GGGACGATCT CGAGGTCGTC 
GCGCGGACGA TGGAGGAGCT CCTGCGCGGC ATGAGTCCCC TCGCGCGCGC CGCGCTGGGC 
GGCGATCCCG CGCTGCTCGC GCGGTTGCTG CGCGGCGCGG CGCTGCAGGT GGACTTCGGC 
GCGTTCGCGA GCGCCGGCGC CACCGGGTTC CAGGCGCGGC GGCTGCTCGC CGCGGCGGGG 
GGCGCCGCGC TCGCCGACGA CGCCGCCGCG CTCGAGCGGG CGCTGCGCGC GCGCGGGCTC 
GCTCCCGGCG CGCTCCAGCT CGTGACCGGC TCCCTGGAGG CCGCCCTCCG CAAGGTCGAG 
GAGGCGGCGC GGAGCTGGGC GGAGCTGGAG GGGAGGGCGC GCACGCTGCG CGAGGACCGG 
GGCGGCGGCC TCGCGCCGGT GTCGCGCGAG CAGATCGCTC GCATGGAGGT CGCGGTGCGG 
CGGCTGGCGG AGCGGCTGCG GGCGCGGCTC GTCCGGCGTG AGCGCTCTCG CCGGCGGGGC 
GCGCTCGCCG TGCGCCGCAC CCTTCGCCGC AACCTCGGCC TCGGCGGCGT CCCGGCCCGG 
CTCGTGTTCC GCCACCGGCG GCCGCAGCGG CCCGACGTGG TGGTGCTGTG CGACGTCTCC 
GAGTCGGTCC GGCACGTCAC CCGGCTCATG CTGCTGTTCC TGTACACGCT GCAGAGCCTC 
TTCACGCGCG TGCGCACCTT CGTGTTCGTC TCCGACCTCG CGGAGGTGAC GGACCAGCTG 
AGGGCCGAGA AGGACCCGGC GCGCGCCGCC GGGCTCGCCG TCGCCGGGCG CGCGGTGAGC 
CTCGCCGCGA ACTCGAACTA CGGGCGGGCG CTGAAGACCT TCCACGACGA CTTCCGCGGC 
GCCGTCACCC GCCGCACCAC CGTGATCGTC ATCGGGGACG GGCGGAACAA CTACAACGCG 
CCGGAGGCCT GGGTGCTCGA CGAGCTCCGG CGGCGGGCGC GGCGCGTGCT GTGGATCTGC 
CCCGAGGCGC GCGCGGCCTG GGGCATGGGC GACAGCGAGA TGCCGCTCTA CGCCCCGCGC 
TGCAGCCGGG TCGCGACCGT GGGCTCGCTC GAGGACCTGG AGGAGCTCGC CGACGCGCTC 
GTGCCGGGGG GCGGGGGGTA G

Protein sequence

MHARVVEFAG LLRTNGVRVS PAEVADAVEA AALVGASDRG SFRAALRATL VKRSRDVPVF 
DGLFELYFSA LGRVVEGLER GVVGELAARG LLEGDDLEVV ARTMEELLRG MSPLARAALG 
GDPALLARLL RGAALQVDFG AFASAGATGF QARRLLAAAG GAALADDAAA LERALRARGL 
APGALQLVTG SLEAALRKVE EAARSWAELE GRARTLREDR GGGLAPVSRE QIARMEVAVR 
RLAERLRARL VRRERSRRRG ALAVRRTLRR NLGLGGVPAR LVFRHRRPQR PDVVVLCDVS 
ESVRHVTRLM LLFLYTLQSL FTRVRTFVFV SDLAEVTDQL RAEKDPARAA GLAVAGRAVS 
LAANSNYGRA LKTFHDDFRG AVTRRTTVIV IGDGRNNYNA PEAWVLDELR RRARRVLWIC 
PEARAAWGMG DSEMPLYAPR CSRVATVGSL EDLEELADAL VPGGGG