Gene Lferr_2600 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lferr_2600
Symbol
ID	6878599
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 53993
Kingdom	Bacteria
Replicon accession	NC_011206
Strand	-
Start bp	2574719
End bp	2576221
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	48%
IMG OID	642790457
Product	extracellular solute-binding protein family 5
Protein accession	YP_002221001
Protein GI	198284680
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGTCA ACTCTTTGCT GCCGGTGGTC AATAATGATT CCAGTGCCAA TGCGCAGATA 
ATCAGCTTGA TGTTTCGGCC TCTTTTGTGG ATTGGCACCA ATCTGAAAAT CAACTGGCCG 
CAATCCATTG CCAAAAGTAT TACCGTATCG CCGAACCGGC GAAAGTTTAT CATTCATCTC 
AAGGTTTGGC GTTGGTCTGA CGGGAGACCG GTTACGGCTG AAGATACTTT GGCTTGTCTT 
ACGCTGATTC GCCAATACGG GCCAAGATAC CCCAACGCGG GAATGGGAGG AATACCGAAT 
ATTATCGAAA GCGCAGTGGT TATTGATCCT CGGACTCTGG AAATCACACT GAAACGTTCG 
GTGAACCCAA CCTGGTTTGA ACTGAATGGA TTGTCTCAGT TGTTTCCAGT GCCCGCCTGG 
CGCTGGAAAC ACTATTCCAT AGATACACTG TCCAAACTTC AGGATAACCC GGCTATGGTT 
TCCGTGGTGG ATGGTCCATA CAACCTGCAA CGTTTCGTCC CTGGTCGGAG CATCAGCTTT 
ATACGAAACC CTCATTATTC CGGAAATCCA TCCGCTTTGG AGCACCTACA TTTTAAAATG 
TACACCTCTG ATTCCAGTGC CTTTTGGGCT CTGAAAACAG GCACCATTCA GGCGGGAATG 
ATTCCGCATT ACTTGTATGC AGCGCGTAGC ATGGTAAAAA ACCTCAAAAC ATGCGTCAGT 
AACGGTGGTT ATGGTTTTAA TTATGTGACG TTGAATCTCA CCAATCCCCA GGTAGCTTTT 
TTTCGGAATG TAAAGGTGAG GCAGGCGCTT GCTCTGGCGA TCAACCAGAC ACAGATCATC 
CAAATTGCAT TTCATGGATT AGGCGTCCCC AGTTTTAATC CGGTACCCAC TAATCCCGAT 
ACGTATCTTT CTCCAGAGAT GAAGAAGCTC GTGGCACGCC CAGCCCTCGC CTATAATCCT 
TCTGCTGCGA AACAGTTACT AGCGGAGGCG GGATGGCAAC CAGGTCTGGA TGGGGTCCGG 
ATGCGAAATG GGCAGCGTCT TCAGTTTACG ATGATGGTTC CAGACACCAG CCAGACGCTG 
ATAGCCGTGG CGGAAATGTT GAAAGCGGAC TGGCAGGCTG TTGGTATAGA TATGCGCCTG 
CGCGTCCTGC CATTCAATCT GGAACTAGCT AAATTGCACC CCCATGGGAA ATGGGATGCT 
TCCATGATCG TCTGGTCCTA TGATCCGGAT TACTATCCTA GCGGTGATGG TTTGTTTAAT 
ACTGGTGGTG GTAGTAATTA TGGGGATTAT AGCAACTCCA TGATGGACAA GCTGGTTCGC 
GATAGCACAG AAAAAAACAG TACAAAATTT TTGTATCAAT ATGAGAATTA TGCGTACGCT 
CAGCAACCGG TGATTTTTCT ACCTTATCCG AAGTACGTTG TGAAATATAC TCAAGACTTG 
ACCCACGCAC AGTTGATGGA AGGTGTTTAT TCTGTAGATT GCCATCCTCA ACGCCTACAC 
TGA

Protein sequence

MNVNSLLPVV NNDSSANAQI ISLMFRPLLW IGTNLKINWP QSIAKSITVS PNRRKFIIHL 
KVWRWSDGRP VTAEDTLACL TLIRQYGPRY PNAGMGGIPN IIESAVVIDP RTLEITLKRS 
VNPTWFELNG LSQLFPVPAW RWKHYSIDTL SKLQDNPAMV SVVDGPYNLQ RFVPGRSISF 
IRNPHYSGNP SALEHLHFKM YTSDSSAFWA LKTGTIQAGM IPHYLYAARS MVKNLKTCVS 
NGGYGFNYVT LNLTNPQVAF FRNVKVRQAL ALAINQTQII QIAFHGLGVP SFNPVPTNPD 
TYLSPEMKKL VARPALAYNP SAAKQLLAEA GWQPGLDGVR MRNGQRLQFT MMVPDTSQTL 
IAVAEMLKAD WQAVGIDMRL RVLPFNLELA KLHPHGKWDA SMIVWSYDPD YYPSGDGLFN 
TGGGSNYGDY SNSMMDKLVR DSTEKNSTKF LYQYENYAYA QQPVIFLPYP KYVVKYTQDL 
THAQLMEGVY SVDCHPQRLH