Gene Afer_0206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Afer_0206
Symbol
ID	8322259
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidimicrobium ferrooxidans DSM 10331
Kingdom	Bacteria
Replicon accession	NC_013124
Strand	+
Start bp	210627
End bp	211787
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	70%
IMG OID	644951353
Product	putative type IV secretory pathway VirD4 protein
Protein accession	YP_003108848
Protein GI	256371024
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3505] Type IV secretory pathway, VirD4 components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.415512
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCTCG GTGCACTGAT CGGAGGCCTC GCTGCCATCG CGACCCTGGC CGGTGTCGGC 
AGGCCCCGTA CAAGAGAGCA TCGCAGTGGC CCGCGACCAC TGCCGCGCAC CGCGGGGATC 
GGCATCGTCC GCAGCGACGA GATCGTGGTT CGACTCGGGC GCTGGCGCCG TGTCGGCGTG 
GGGCGAGGAT CGTCGTTGCT CGTGGTCGGC CCGACCCAGA GCGGCAAGAC GCGCAGGGTC 
GTGGCGGAGA ACCTGCGACG TCATCCGGGG ACCGTCCTCG TCACCTCCGT CAAGGGTGAC 
GTCCTCGATG CGCGTGCGCT CGAGCGGCGT CACGACCTCG GGGACGTGTG GGTCCTCGGT 
GATACGCCGC GAGCGACGCA CGAGTGGCAG CCCTGGTTCG AGGCCATCGA CGACACCCAT 
GCACTCGCGA TGGCAGATCG ACTGCTGGCG ATGGTGCCCG AGCGCAGAAC CCCGAGCGCC 
GAGGTTCGGT TCTGGCACGA GCTTGCACGT CCCTACGTGG CCGCGTGGCT GCGCCTTGCG 
TGGTACGGAG AGCAGGTGCC GGTGGGTGAG TTGCTCGTCC GCGCAGCCGA GGTGGCGGGG 
GACGAACTTC GTGCGGCCCT TGATGAGACG GTCGCCGATG GCCGTCAGCG TGACTCGCTG 
CACGTGACCA TCCAGGCAGC GCTCGGCGCG GCCCGAGGAC CGAGGAGTCG TGGGTGGCCG 
GTCCGACTCG GCGAGGCCCT CGCCCCGACG GTCGTGGTGG TGGGTTCGCT CGCCGAGCAG 
GAGCGCCGCT CCGCCTGGTA TGCGACGCTC CTCGACACGG CCTTCGAGGC CATCTTGCGC 
CAGCCGGCCA ACACGCTCGT CCTCCTCGAC GAGGTGGCCC ACCTCGCGCC GGTGCCTCGC 
CTCGCGCACG TCGCTGCCGT CAGCGTGGGT CTGGGCGCAC GGCTGGTGAC GATCGCACAG 
GACTTTGCCC AGTTGGAGGC GGCCTTCGGG GTCGAAGCAG CCTCATTGGT TGCCAACCAC 
CGTGCCCGAC TGTTCCTCGA CCCCGCCCAC GATCCTGGGG TTCGAGCGCA CCTCGCGGCC 
CTCGGGCTGC GAGGTGACGA GGGCGCCATC CTCCTCGGCC CTCGTGGTGC GCGGCGTCCG 
ATCCTTGGGT CGGTGGCTTA G

Protein sequence

MSLGALIGGL AAIATLAGVG RPRTREHRSG PRPLPRTAGI GIVRSDEIVV RLGRWRRVGV 
GRGSSLLVVG PTQSGKTRRV VAENLRRHPG TVLVTSVKGD VLDARALERR HDLGDVWVLG 
DTPRATHEWQ PWFEAIDDTH ALAMADRLLA MVPERRTPSA EVRFWHELAR PYVAAWLRLA 
WYGEQVPVGE LLVRAAEVAG DELRAALDET VADGRQRDSL HVTIQAALGA ARGPRSRGWP 
VRLGEALAPT VVVVGSLAEQ ERRSAWYATL LDTAFEAILR QPANTLVLLD EVAHLAPVPR 
LAHVAAVSVG LGARLVTIAQ DFAQLEAAFG VEAASLVANH RARLFLDPAH DPGVRAHLAA 
LGLRGDEGAI LLGPRGARRP ILGSVA