Gene Lferr_1784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lferr_1784
Symbol
ID	6877766
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 53993
Kingdom	Bacteria
Replicon accession	NC_011206
Strand	-
Start bp	1764960
End bp	1766165
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	62%
IMG OID	642789652
Product	Squalene synthase
Protein accession	YP_002220212
Protein GI	198283891
COG category	[I] Lipid transport and metabolism
COG ID	[COG1562] Phytoene/squalene synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGCGA CGGGTCGCGG TGCGCAGATC CGGGTGGGCG GCATAGGGCT GCAAGACTTG 
CAGAATGGGC CGGGGATCGT TACATTGCCG CCAGATGACA GGGTGTTTGT GCACACCCGG 
ACAAACACAA CAAGGAGTTT GGATGTCACC AGACAGGACC GCATGTTGAT GGCGGCGTTG 
GAGCGGGCTT TGGCGTACCA GGCACAAAGC CTTCAGGTTG TTTCCAGAAC TTTTGCCCTG 
ACCATCCCCC AGTTGCCGGA AGCGCTCCGG GACGCAGTCG GTAACGGTTA TCTGTTGTGC 
CGCATTGCCG ACACCATTGA AGACGATCCG GATATGCCCT GGGAAAAAAA AGCCTGTTGG 
CAGGCCAAAT TTCTTCAGGT CGTGGAGGGT GCGGACGATC CCGCCGCCTT TGCTGCCGCA 
TTGGGCGCAG ACCTGTCGCC GGAGATGCCC GAAGCCGAGC ACGATCTGAT TCGCCACACT 
CCGGAAGTCG TCGCCATCAC CCACAGCCTC AACCCCACCC AGCAGGCGGC ATTGTCCCGC 
TGCGTGCGGA TCATGGGAAT GGGGATGGCG GAGTTTCAGC AGCATGCTTC GTTGCAGGGG 
TTGGCGGACA TGGCGGCCCT GGATCGCTAC TGCTATGTGG TTGCGGGTGT CGTCGGTGAA 
ATGCTCACCA GCCTATTTGT CGAGTTCGAG CCGCTGCTGG CGGAGCATGA TGCGGAGATG 
CAGCGTTTGG CGGTGTCCTT CGGGCAGGGC CTGCAGATGA CCAATATTCT CAAGGACATC 
TGGGATGACT GGCAGCGCGG TGTGAGCTGG ATGCCACGCG CGCTGTTTCA GCGTCATGGC 
TGCGATATCG CGGGGGTGCG GCCCGGCAGT CGGGACCCCG CGTTCCAGGC GGGCCTCACC 
GAGCTGCTGG GTATTGCCGC GAACCATCTG CAAAATGCGC TGCGCTATAC GCTGCTGATA 
CCGGCCGGGC AGACGGGGAT GCGGGATTTT TGCCTCTGGG CCATCGCTAT GGCGGTGCTG 
ACCCTGCGGC GGATTGCCGA AAATCCGGCC TTTGCCTCCG GAAGCGAGGT GAAAATCAGC 
CGCCGCAGCG TACATCGGGT GGTATTTCTG TCGCGTCTCC TGCATCGCTC CGATGCGCTC 
CTGCAGTGGA GTTTCCGGGT GGGCGTCAAA CCACTGCCTT TGCCTTCCGC TGTCGCGCAA 
CCATGA

Protein sequence

MTATGRGAQI RVGGIGLQDL QNGPGIVTLP PDDRVFVHTR TNTTRSLDVT RQDRMLMAAL 
ERALAYQAQS LQVVSRTFAL TIPQLPEALR DAVGNGYLLC RIADTIEDDP DMPWEKKACW 
QAKFLQVVEG ADDPAAFAAA LGADLSPEMP EAEHDLIRHT PEVVAITHSL NPTQQAALSR 
CVRIMGMGMA EFQQHASLQG LADMAALDRY CYVVAGVVGE MLTSLFVEFE PLLAEHDAEM 
QRLAVSFGQG LQMTNILKDI WDDWQRGVSW MPRALFQRHG CDIAGVRPGS RDPAFQAGLT 
ELLGIAANHL QNALRYTLLI PAGQTGMRDF CLWAIAMAVL TLRRIAENPA FASGSEVKIS 
RRSVHRVVFL SRLLHRSDAL LQWSFRVGVK PLPLPSAVAQ P