Gene Afer_0452 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Afer_0452
Symbol
ID	8322511
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidimicrobium ferrooxidans DSM 10331
Kingdom	Bacteria
Replicon accession	NC_013124
Strand	+
Start bp	451746
End bp	452804
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	67%
IMG OID	644951604
Product	sortase family protein
Protein accession	YP_003109093
Protein GI	256371269
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3764] Sortase (surface protein transpeptidase)
TIGRFAM ID	[TIGR01076] LPXTG-site transpeptidase (sortase) family protein

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGGGGA AGGGCCGGGG AGCGCACAGC CGACAGCGAG GTCGGGGAAT CGCGATCGTA 
GGGGTCGTGG CGATGCTCGC TGGTCTCGGC CTCATCGGCT CGATCGTCGC CTTCTACGTG 
CGCTCCTCCC TTGTGGGTGG CGGACTCATC CAGCAAGCGC AGAAGGCCCG GACGGTCGCG 
GCGTGGCCGC GATCGCTGCT CGCGATCGTG CGTATCCCCT CGATCGGGCT CGTCGCGCCG 
GTGGAGCAGG GCACCGGCCA GTCGGTGCTC GCTGTGGCGG TGGGTCATCT CACGACGAGC 
GCGCTCCCTG GGAAACCAGG CACGTCGGTG CTCGCGGCGC ACAACGTCAG CTGGTTCTCG 
GGCCTCGGTG GTCTCGGCTC GGGATCTCTC ATTGAGGTCG ATACACCGTA CGGGCAGCAG 
GTCTATCGTG TGGCCTGGCA TCGCGTCGTG CACGTCGGTG CGCCCGTGGC CAACACCGCC 
GCACCGACTC TGGTGCTCGA AGCGTGCTGG CCGCTCAATG CGCTCTACTT GACGCCCGAG 
CGCTACCTCG TTGGTGCCAC CTTGGTGGCG ACGACGAAGA TCGCGGTCAC GCCGGTCACG 
CCGTCGTCGG ACAGCTACCA GCCGCTCGGG CTTGCGCCGA CGCTCGCGCA CGAGAACCTC 
TCGCTCGCGG CCAACGACCT ACCGATGGGG GTGCTCGCCA CCGTTGGCTC GCCTGCTGCA 
GCATGGACGA GTTCACAGCG ACCCTACAAC TTCGCTGGAG CGGAAGTGAC GTGGACCATT 
GCGTTGTTGC ATGCGCTCGA AGCTCACGAC CTCGTGCTCG TCGAATCGGT GACCCACGAG 
CCAGCAAGCG TGGTCGCACC ATTGCTCAGC TGGGACGGAG GCTTCGCGAG CCTCGACGAC 
CTCACCGAGG TCGTCGATGG TGTCACGGCG TCGGCTGGCT CCTCGCGAGT GTCGCTCCAG 
ACCGATCACG GGCCGCTCGT CGTTACCTTG CGTTTTCGGG TCATCGGGCA TGGGGTCGAG 
GTAGCTGGCG CTGCGGTCGG GACGTCGCAG GGCTCGTAG

Protein sequence

MRGKGRGAHS RQRGRGIAIV GVVAMLAGLG LIGSIVAFYV RSSLVGGGLI QQAQKARTVA 
AWPRSLLAIV RIPSIGLVAP VEQGTGQSVL AVAVGHLTTS ALPGKPGTSV LAAHNVSWFS 
GLGGLGSGSL IEVDTPYGQQ VYRVAWHRVV HVGAPVANTA APTLVLEACW PLNALYLTPE 
RYLVGATLVA TTKIAVTPVT PSSDSYQPLG LAPTLAHENL SLAANDLPMG VLATVGSPAA 
AWTSSQRPYN FAGAEVTWTI ALLHALEAHD LVLVESVTHE PASVVAPLLS WDGGFASLDD 
LTEVVDGVTA SAGSSRVSLQ TDHGPLVVTL RFRVIGHGVE VAGAAVGTSQ GS