Gene Acry_0472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_0472
Symbol
ID	5161594
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009484
Strand	+
Start bp	525547
End bp	526758
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	72%
IMG OID	640552388
Product	VWA containing CoxE family protein
Protein accession	YP_001233615
Protein GI	148259488
COG category	[R] General function prediction only
COG ID	[COG3552] Protein containing von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.180421
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCCT CCGATACGGG ACGGCTCGCG CCGAATGTGA TGCATTTCGC GCGCCTGCTC 
CGGCGTGCCG GCCTGCCTGT CGGCCCCGGC GAGGTCATCG CCGCCGCCGA GGCGCTCACC 
CATGTCGACA TCACCGACCG GCGGGTGATG CGAGCGGCGC TGCAGGCGGT GATGCTGCGC 
CGGCACGAGC ACGCGCTGCT GTTCGACCAG GCCTTCTCGG TCTTCTGGCG CAACCCCGAC 
GCCGCCAAAT TCGCCCAGAT GCTGGCAGCG ATGGATGGCC GCGCCCCGCG CGAGGAAAAG 
GCCGCCGCCG GCGCCCGCCG CCTTGCCGAG GCGATGCAGG CGGCCAAGTC GCGCGAGCAG 
GAACCCCGCC CCGACGAACG CCGCGAGGTC GACGCGCTGC TCTCCGCCTC TGGCCAGGAA 
CGCCTCGAAT CCCTCGATTT CGAGGCGATG AGCGCCGAGG AGATCGCCGC CGCCAAGGCC 
GAGATCGCCC GCCTCACCCT CCCGCTCGAC GAACGGCGCA CCCGCCGCTT CCGCCTCGCC 
GCCCGCGGCT GCCGGGTCGA TCTCAAGCGC ACCCTGCGCG ATTCGATGCG CCATTCCGGC 
GAGGTGTTCG ACATCGCCCG CCGCGTGCCG CTCACCCGCC CGCCGCCGCT CGTCGTCCTG 
TGCGACATTT CCGGCTCGAT GGCCCGCTAC GCGCAGATCC TGCTGCACTT CCTCCATGCC 
GTCGCCAACG AGCGCGACCG CGTGACCACC TTCCTCTTCG GCACAAGGCT GACCAACATC 
TCCCGCCAGC TCGCCCGGCG CGACCCGGAA GAGGCGTTCG AGCAGGTTGC CGGCGCGGTG 
CCGGACTGGT CGGGCGGCAC CCGCATCGGC GAGGCGCTCG GCCAGTTCAA CCGGCTCTGG 
GCCCGCCGCG TGCTGGCGCA GGGCGCGGTC GTCCTTCTCG TCACCGACGG GCTCGACCGC 
GAGGGCGCCG TCGGCCTCGC CGACAACATG GCAAGGCTGC ACCGCTCCTC GCGCCGGCTG 
ATCTGGCTCA ACCCGCTCTT GCGCTACGAT GGCTTCGCGC CGAAATCGCA AGGCGCACGG 
GCGATGCTGC CCTATGTGGA CGAGTTCCGC CCGGTGCATA ACCTGGCCAG CCTGCGCAGC 
CTGGTCCAAG CCCTGTCGGG CGAGGCGCCG CCGCGCCTGC AGGCCGCCGC CCTGTGGGAG 
ACCCGCCAAT GA

Protein sequence

MSASDTGRLA PNVMHFARLL RRAGLPVGPG EVIAAAEALT HVDITDRRVM RAALQAVMLR 
RHEHALLFDQ AFSVFWRNPD AAKFAQMLAA MDGRAPREEK AAAGARRLAE AMQAAKSREQ 
EPRPDERREV DALLSASGQE RLESLDFEAM SAEEIAAAKA EIARLTLPLD ERRTRRFRLA 
ARGCRVDLKR TLRDSMRHSG EVFDIARRVP LTRPPPLVVL CDISGSMARY AQILLHFLHA 
VANERDRVTT FLFGTRLTNI SRQLARRDPE EAFEQVAGAV PDWSGGTRIG EALGQFNRLW 
ARRVLAQGAV VLLVTDGLDR EGAVGLADNM ARLHRSSRRL IWLNPLLRYD GFAPKSQGAR 
AMLPYVDEFR PVHNLASLRS LVQALSGEAP PRLQAAALWE TRQ