Gene Afer_0021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Afer_0021
Symbol
ID	8322067
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidimicrobium ferrooxidans DSM 10331
Kingdom	Bacteria
Replicon accession	NC_013124
Strand	+
Start bp	20600
End bp	22321
Gene Length	1722 bp
Protein Length	573 aa
Translation table	11
GC content	65%
IMG OID	644951168
Product	hypothetical protein
Protein accession	YP_003108669
Protein GI	256370845
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.587255
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTGGGCG GTCTGCGGTC GGTCTCCTAC GAGCACGGGA GGGAGAACAG GTTGAGTCGC 
CAACCAGCCG GTACGCATGG ACAGCGAGCG CAGGTTCGGC TCGTCGGTCA GGCCGCTCAG 
GTCCCCGAGT CCCGCATCGT GACGGCGCGC CTCGCAATTA TGACCACTAT TGGTGGTTGG 
GTCGGTTACC TGATCTACTG GTTCTACTCA CAGTTCCTGC GCCAAGGGGC CTACACGACG 
CAGGCGAAGG CCGAGGCGAT CGCCTACCTC GCCATGATCA CCCTGCTCGA GGCGTCGTCG 
TTGGCGTACC TCGTGGCGAG GCTCGGCCAT ATTTACCGAG CTCGCGAGCA TCGTCGGGTA 
CCGCGGGCTC ACCTCGACGG CTACTTCTGG CAGCGTCGAC CGAGCCTCAC CATGATCATC 
CCCTCGTACC GCGAGGAGAC TCGCGTCATT CGCAATACGT TGCTGTCAGC GGCGCTACAG 
GAGTATCCCG ACAAGCGCAT CGTGCTCCTG ATCGATGATC CTCCCAACCC GACGGAGGAA 
CGCCATCGCG TCCTCCTCGA AGCGGCACGG TCTCTGCCGA GTCAGCTCGA GTCGCTCCTC 
GCGTACCCTG CCACCGCGGC TCGTCGAGCT TACGACGAGT TCCGCGAGCG TGTCGGTTCC 
AGAGTGAGCC AGCTGCCCGC GATCGTTCAC GAGGGTGGAT CGGACTCCGG TGCCGCGTGG 
GACGGCGTGG TGGTCGACCC GAGCGAGCTC GAACAGCTCG CCGATACCTA TGCCCTGGCG 
GCGAGCTGGC TCACCCTTCA GAGCGAAGAA CTCCCGATCA TCGACCACAC CGACGAGTTC 
CTTCGAGACG AAGTGTTCGT CCGGCTGGCC CACGAATTTG CACAGATCGC CGACACGCTG 
CGAGAGGGCG CGAGCTACGG CCGTGAGGTC GACGCGGCTC GCCTCGCGCA GCTGTACGAA 
CGGCTCCTCA ACGTCTTTGG CGCGCGCATC ACGAGCTTCG AGCGCAAGCT CTACGCGTCA 
CTCTCGAGCG AGCCGAACAA GGCCATGAAC CTGAACTCGT ACATCGGCTT GATGGGCGGT 
GCCTATAGCG TCCATCGCAC GCTCTCGGGT CAGGTCCTCG TGTCCGACGA CCCCGAGCAC 
GCGGACCTCG TCATCCCCGA CCCGGACTAC GTGCTCACCT TGGATGCGGA CTCGACCCTG 
CTCCCCGAGT ACTGCCTCCG GCTCGTCTAC TTGATGGAGC AGGAGGCGTA CGCGCATGTC 
GCGGTCGCGC AGACGCCCTA CTCGGCCTAT CCGGGCCCCG CGTCGCGTCT CGAGCGGATC 
GCGGGTGCGA CCACCGACGT CCAGCATGTG GTCCACCAAG GGCTCGCCAA CTACCGGGCG 
GGTTTCTGGG TCGGCGCGAA CGCCGTCATT CGCAAGCGCG CGCTCAACTC CTTGGAGGAG 
ATCACCTGGG AAGGCGGCTA CCCGATCAAG CGCTACATCC GCGACCGTAC CGCGATCGAG 
GACACGGAGT CGTCGGTCGA CATCGTCGCC CAGGGCTGGG AAATCTACAA CTACCCCGAG 
CGGCTGAGCT ACTCGGCCAC CCCCCCGACT TCGGTGCCTT GTGCATCCAG CGTCGCCGTT 
GGGCTGATGG CGGCCTGCTC GTCGTGCCGA AGCTGTGGCG TTACCACAAG CGGGCCAAGG 
AGACCGGGCG TCAGTCGTTC GCCGAGTTCT TCCTCCGCAT GA

Protein sequence

MVGGLRSVSY EHGRENRLSR QPAGTHGQRA QVRLVGQAAQ VPESRIVTAR LAIMTTIGGW 
VGYLIYWFYS QFLRQGAYTT QAKAEAIAYL AMITLLEASS LAYLVARLGH IYRAREHRRV 
PRAHLDGYFW QRRPSLTMII PSYREETRVI RNTLLSAALQ EYPDKRIVLL IDDPPNPTEE 
RHRVLLEAAR SLPSQLESLL AYPATAARRA YDEFRERVGS RVSQLPAIVH EGGSDSGAAW 
DGVVVDPSEL EQLADTYALA ASWLTLQSEE LPIIDHTDEF LRDEVFVRLA HEFAQIADTL 
REGASYGREV DAARLAQLYE RLLNVFGARI TSFERKLYAS LSSEPNKAMN LNSYIGLMGG 
AYSVHRTLSG QVLVSDDPEH ADLVIPDPDY VLTLDADSTL LPEYCLRLVY LMEQEAYAHV 
AVAQTPYSAY PGPASRLERI AGATTDVQHV VHQGLANYRA GFWVGANAVI RKRALNSLEE 
ITWEGGYPIK RYIRDRTAIE DTESSVDIVA QGWEIYNYPE RLSYSATPPT SVPCASSVAV 
GLMAACSSCR SCGVTTSGPR RPGVSRSPSS SSA