Gene Afer_0874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Afer_0874
Symbol
ID	8322938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidimicrobium ferrooxidans DSM 10331
Kingdom	Bacteria
Replicon accession	NC_013124
Strand	-
Start bp	894443
End bp	896053
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	71%
IMG OID	644952008
Product	PEP-utilizing protein
Protein accession	YP_003109492
Protein GI	256371668
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1080] Phosphoenolpyruvate-protein kinase (PTS system EI component in bacteria)
TIGRFAM ID	[TIGR01417] phosphoenolpyruvate-protein phosphotransferase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGGAAC GTCACACCCT TCGCGGTCAA CCAGGCTCCC AGGGAGCCGG CGTCGGGACA 
GCCGTCCGCG TCGACGCGGT CGCCGAGCGC ACCGAGGTCG ATCCCGCCAG CGTGCGCCGA 
GCGCTCGAGG AGGTCGCCGA CGACCTCGAG GCTTCCAGCC GACGTGCGAG CGGCGAGCTG 
TCCCAGATCC TCGCCGCCGA CGCAGCCATC GCGCGAGACC CCATGCTCGT CGATGCCGTG 
GAGCGTCACC TCGCCGACGA TCCCTCCACC GTCGGGGTCC ACGACGCCTT CGACGAGGTC 
GCAGGCGTCC TCCGTTCCGT CGGCGGCGCG ATCGCCGAAC GAGCGGCGGA CCTCGGCGCG 
ATCGAACGGC GCCTCATCGC CCGCCTCAGG GGCACCCAAG GACCGATGCT CGAAGGCAAG 
GTCGTCGTCG CGAACGAGCT CGGCCCAGCA GATCTCCTCG CGATCGAGCA CGAACGGCCG 
GCAGCGCTCT TGCTCGCTGG CGCCAGCCCG ACCGCCCACG TCGCCATCCT CGCCCGAGCA 
CTCGGCATCC CCGCCCTCAC CGGCGTGGTG GGCCTCGACG GGGTGCACGA CGGCGACACC 
GTGCTCGTCG ATACCGTGCG CGCGGTCGCG ATCGTGAACC CCAACGACGA CGATGTCACT 
GGGCTGCGAG CCGCAGAGCG TACGCCCGCG CGAACGACGC TCCCTCGAGA CCGTGCCGCC 
ATCGGCGCCG TCGCCATCAT GGCCAACGTC GCCGGCGTCG CCGACGCGCA GGGGGCGATC 
GACGCCGGCG CGGTCGGTAT CGGCCTTTTG CGCACCGAGT TCTTGTTCCT CGACCGCGAC 
GAGGCTCCCT CTCGCGCCGA GCAAGCCGAG GCCTACACCG AGATCCTCAC CCCATTCCGG 
GGCCGCCGTT GCATCGTCCG CACGCTCGAC GCCGGTGCCG ACAAGCCACT CGCGTTCATC 
GATCTGCCTC GCTCGGCCAA CCCCGCGCTC GGCGTCCGAG GATGGAGGGC ACGCGCCGTG 
GCGCCGGCCG TGATCGACAC CCAGATCGCA GCGATCGCCG ACGCCCAGCG CGCGACCGGT 
GCCGAGGTCG GTCTCATGGC CCCGATGGTG ACGACGATCG ACGAAGCGCG CGAGGTGGTC 
GAGCGAGCCC ACGCCGCAGG GATCCCGAGT GCAGGCGTCA TGGTGGAGGT CCCTGCTCTG 
TGCCTGCTCG GCGACGAGCT CGCCCGCAGC GTCGACTTCG TCTCGATCGG CACCAACGAC 
CTCGCGCAGT ACCTCTTCGC CGCCGACCGC GAGGAGTCGG CGGTCGCAGC CCTCGCCGAT 
CCCTTCTCGC CGCCACTCGC TCGACTCCTC GCTCGCCTCG TCGACGACGT CGACGGTCGC 
ATCCCCATCG GTGTCTGCGG CGAGCTCGCC GCAGATCCCC TCGCCGCCGT CTGGCTGGCG 
GGCCTCGGCA TCACGAGCTT GTCCATGACG CCGAGCGCGA TCGCACCCGT CACCCGTCTG 
CTCGCTTCCG TCGAGCGTAC GACCGCTCGC CGAGCAGCAG AAGCGGTCCG CACCGCGAGC 
GATGCTCAGC GTGCACGAGA CGCGGCGGCG CGTATCGTCG GCCTTGCCTA G

Protein sequence

MPERHTLRGQ PGSQGAGVGT AVRVDAVAER TEVDPASVRR ALEEVADDLE ASSRRASGEL 
SQILAADAAI ARDPMLVDAV ERHLADDPST VGVHDAFDEV AGVLRSVGGA IAERAADLGA 
IERRLIARLR GTQGPMLEGK VVVANELGPA DLLAIEHERP AALLLAGASP TAHVAILARA 
LGIPALTGVV GLDGVHDGDT VLVDTVRAVA IVNPNDDDVT GLRAAERTPA RTTLPRDRAA 
IGAVAIMANV AGVADAQGAI DAGAVGIGLL RTEFLFLDRD EAPSRAEQAE AYTEILTPFR 
GRRCIVRTLD AGADKPLAFI DLPRSANPAL GVRGWRARAV APAVIDTQIA AIADAQRATG 
AEVGLMAPMV TTIDEAREVV ERAHAAGIPS AGVMVEVPAL CLLGDELARS VDFVSIGTND 
LAQYLFAADR EESAVAALAD PFSPPLARLL ARLVDDVDGR IPIGVCGELA ADPLAAVWLA 
GLGITSLSMT PSAIAPVTRL LASVERTTAR RAAEAVRTAS DAQRARDAAA RIVGLA