Gene Lferr_0849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lferr_0849
Symbol
ID	6876814
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 53993
Kingdom	Bacteria
Replicon accession	NC_011206
Strand	+
Start bp	809018
End bp	809980
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	58%
IMG OID	642788731
Product	NADH ubiquinone oxidoreductase 20 kDa subunit
Protein accession	YP_002219306
Protein GI	198282985
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA)

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.761008
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAACG TGCTTTGGCT CCAGGGAGGA GCCTGTTCTG GAAATACCAT GTCTTTTCTC 
AATGCGGAGG AGCCGAGCGC CTGCGATCTG GTGACGGATT TTGGTATCAA CGTGCTCTGG 
CAGCCCTCTC TCGGGATGGA CATGGGGGAC AATGTTCAGA AGTTGCTTCG GGATTGTGTG 
TCTGGGGCAA TTCCCCTGGA TATATTCGTT TTCGAGGGTA CCGTGGTCAA CGCCCCCAAT 
GGTACGGGTA CCTGGAATCG CTTTGCCGGT CGTCCGATGA AAGACTGGGT GAAGGAGTTA 
TCAGGTGCAG CCCAGTTCGT GGTGGCGTTG GGAGATTGCG CGACATGGGG AGGCATCCCG 
GCGACCGCCC CGAACCCCAG TGATTCCAAG GGACTTCAGT TCCTCAAAAA GCAGCATGGC 
GGTTTCCTGG GGGCGGGCTT CAAGAGCAAG GCCGGGCTTC CTGTCATCAA TATCCCCGGT 
TGTCCCGCCC ATCCGGACTG GGTCACCCAA GTACTGGTGG CGGTGGCGAC AGGCCGCGCC 
GGAGAACTGG AACTGGATGA TCTGCAGCGT CCAAAGACGT TTTTCAAGAG CTTCACCCAG 
ACGGGATGTA CCCGCAACAT GCACTTTGCC TACAAGGTTT CCGCCACGGA ATTCGGGCAG 
CGAAAGGGCT GTCTCTTTTA TGACCTGGGC TGCCGTGGCC CGATGACCCA TTCGCCCTGT 
AACCGCATCC TGTGGAACCG GCAGTCGTCC AAAACCCGGG CGGGGATGCC CTGTCTGGGT 
TGTACCGAAC CGGAGTTCCC CTTCTTCGAT CTGGCGCCGG GCAGTGTGTT CAAAACCCAG 
ACCATGATGG GGGTGCCGAA AGACCTGCCA GAGGGTGTGG ACAAATCCGC TTATATCAAA 
CTTACGGCAG CCGCCAAGAG TGCTTCGCCG GCCTGGGCCG AAAAAGACAT CTTCGTGGTC 
TGA

Protein sequence

MANVLWLQGG ACSGNTMSFL NAEEPSACDL VTDFGINVLW QPSLGMDMGD NVQKLLRDCV 
SGAIPLDIFV FEGTVVNAPN GTGTWNRFAG RPMKDWVKEL SGAAQFVVAL GDCATWGGIP 
ATAPNPSDSK GLQFLKKQHG GFLGAGFKSK AGLPVINIPG CPAHPDWVTQ VLVAVATGRA 
GELELDDLQR PKTFFKSFTQ TGCTRNMHFA YKVSATEFGQ RKGCLFYDLG CRGPMTHSPC 
NRILWNRQSS KTRAGMPCLG CTEPEFPFFD LAPGSVFKTQ TMMGVPKDLP EGVDKSAYIK 
LTAAAKSASP AWAEKDIFVV