Gene Afer_0998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Afer_0998
Symbol
ID	8323062
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidimicrobium ferrooxidans DSM 10331
Kingdom	Bacteria
Replicon accession	NC_013124
Strand	-
Start bp	1019956
End bp	1021182
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	73%
IMG OID	644952125
Product	Respiratory-chain NADH dehydrogenase domain 51 kDa subunit
Protein accession	YP_003109609
Protein GI	256371785
COG category	[C] Energy production and conversion
COG ID	[COG1894] NADH:ubiquinone oxidoreductase, NADH-binding (51 kD) subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.353019
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCCGC CGCCCAGGTC CGTCGCACGC CTCAGCGCCG GCTGGAGCCG ACTCGTGAGC 
GACGACCTCG CGATCGCTGA GCTCGATGCG CCGCCTCTCT CGCTCGACGC GCACCGCGCC 
ATCTACGGCT CCCTGCCCCC ACGACCACCA CTCGCCACCG CCGAGCACAT CGTCGGCAGG 
GGCGGCGCGG GCTTCCCCCT GGCGCGCAAG CTTGCTGCGG TCGCGTCCCA GCGTGGGCCA 
CGTGTCGTGG TCGCCAACGG CGCCGAGAGC GAGCCCGGCG CGCGCAAGGA CAAGGCGCTG 
CTCACCCATG CGCCGCACCT CGTGCTCGAT GGCCTCGGGC TCGCGACACG ACTCCTCGAG 
GCCCGAGAAG CCATCGTGGC CGTCGAGGAC GCGACCGCAG CCGACGTCCT CGAGCGAGCC 
ATTCGTGAAC GCAGCGACGC GGTCCGCGTC GCACTCCTCG ACCGCTCGTA TCTCACCGGT 
CAAGAGACGG CGCTGCTCGC CGCGCTCGAG GGGCGTCCCG CACTCCCGCG GTTCCAGCTC 
GCACGCGTCG CAGAGCGCGG CTACAAGAGC AGGCCGACCC TCGTCGCCAA CGTCGAGACG 
CTCGCGCAGT GGGCCCTCGC CGCGCGCTTT GGCACCTCCT GGCACCAGAG CGCCGGAACC 
CGAGGCCACG ACCGCTCGAC GCGCATCGTC TCGATCGCGC TCCCGGGCTC GACGCCCACG 
GTGGTCGAAC TCGCCCCAGG GGCGACCGTT CGGAGCCTCC TCGACGCGGT CGGCGTCACC 
ACGGGTCTCG CCCTCGTCGG CGGTCTCTTC GGCGAGCTCA TCTCGGTCGC CGACGAGCGG 
GCGATGGCAC GTGTCCTCGT CGACCGTGCC GACTCATCGG ACGAGCTGGC GCTCGGCGCG 
GGCTCCGTGC TGCTCGCCCC ATCGGCGACC TGCGTCGTCT GTGCGACCAG CGAGCTCGTC 
GGCTACCTCA GCGAGGAGCG AGCCGGCCAG TGCGGACCCT GTGACCGTGG GCTCCCCGAA 
CTTGCCCGTG CACTCGGTGC CGGGGCTCGT CCCGCCGAAC TTGCGACCGT GGCGAGGCTG 
ATCGCCCGCC GAGGCGCTTG CGCGCTACCC GACGCCGCAG CACACCTCGC GACGGCCATC 
ACCCCGGCCG ATGCGGCCGG CCACCAGCGC CGGCGCTGCC ACGAGCGCCC CTTCGCGCTC 
GAGAGCCGGG AGCCGAGCCG TGGCTAG

Protein sequence

MTPPPRSVAR LSAGWSRLVS DDLAIAELDA PPLSLDAHRA IYGSLPPRPP LATAEHIVGR 
GGAGFPLARK LAAVASQRGP RVVVANGAES EPGARKDKAL LTHAPHLVLD GLGLATRLLE 
AREAIVAVED ATAADVLERA IRERSDAVRV ALLDRSYLTG QETALLAALE GRPALPRFQL 
ARVAERGYKS RPTLVANVET LAQWALAARF GTSWHQSAGT RGHDRSTRIV SIALPGSTPT 
VVELAPGATV RSLLDAVGVT TGLALVGGLF GELISVADER AMARVLVDRA DSSDELALGA 
GSVLLAPSAT CVVCATSELV GYLSEERAGQ CGPCDRGLPE LARALGAGAR PAELATVARL 
IARRGACALP DAAAHLATAI TPADAAGHQR RRCHERPFAL ESREPSRG