Gene Lferr_2672 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lferr_2672
Symbol
ID	6878671
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 53993
Kingdom	Bacteria
Replicon accession	NC_011206
Strand	-
Start bp	2653495
End bp	2654655
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	58%
IMG OID	642790529
Product	citrate synthase
Protein accession	YP_002221073
Protein GI	198284752
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID	[TIGR01800] 2-methylcitrate synthase/citrate synthase II

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.530506
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGAAC CGAACTTTGC GCCAGGTCTG GAGGGTGTGG CTGCAACCCA GTCCAGCATT 
TCCAACATCG ATGGCGCTGC CGGCCTGCTG AGTTACCGTG GTTTTGCCAT TGCGGATCTT 
GCGGCGCACA GCAGTTTCGA GGAGGTGGCG CTCTTGCTGC TGGATGGTGT CCTGCCCGGC 
GCCGCAGATC TGGAACGGTT CGACCACGGT CTGCGTGCGC ACCGCCAAGT CAAATATAAT 
GTCCGGGAAA TCATGAAGTT CATGCCCGTG ACCGGACACC CCATGGATAT GCTGCACTGT 
GCCGTGGCCA GTCTGGGCAT GTTCTACCCG CAGCAGGAGC TTTCCGATGC CGAACGCGGA 
AATACGCTCC ATTTGGACGC CATGGCGATG CGGATTATCG CGCGCATGCC CACCATTGTC 
GCGATGTGGG AGCAGATGCG TTTCGGCAAT GATCCTATTT CACCTCGCCC GGATCTCAGC 
CATGCGGCCA ACTTTCTCTA TATGCTGTCG GGTCGCGAAC CTGATCCGGC CCATACCAAA 
ATCCTCGACT CCTGCCTGAT TCTGCATGCC GAGCACACCA TCAATGCCAG TACCTTCTCG 
GTACTGGTGA CCGGATCCAC CCTGACCAAT CCTTACCATG TCATCGGGGG GGCGATCGGA 
ACCCTGGCCG GCCCGTTGCA TGGTGGTGCC AATCAGAAGG TGGTGGAAAT GCTGGAAGAA 
ATCAGCTCCG TCCAGCAGGT GGGTGCCTAT CTCGACAGGA AGATGGCCAA CAAGGAGAAG 
ATCTGGGGTT TCGGGCATCG CATCTACAAA ACCCGCGATC CGCGTGCAGT GATTCTCAAG 
GGGATGATGG AGGATATGGC CAGTCATGGA AATCTGCGGC ATAGCAGCCT CTTTGAAATT 
GCCATCGAAG TGGAACGCCA GGCTACGGAG CGGCTCGGTC CCAAGGGGAT TCACGCCAAT 
GTGGATTTCT ATTCGGGCGT GCTGTATCAC GAGATGGGCA TCAAAGCGGA CCTTTTTACG 
CCTATTTTTG CTATGGCTCG TTCTGCGGGC TGGCTGGCTC ACTGGCGGGA GCAACTGGCG 
GATAACCGGA TCTTCCGGCC TACGCAGGTG TATACAGGGG AACAGGATCG ACGCTATGTG 
CCTGTGGCCC AACGTACTTA G

Protein sequence

MAEPNFAPGL EGVAATQSSI SNIDGAAGLL SYRGFAIADL AAHSSFEEVA LLLLDGVLPG 
AADLERFDHG LRAHRQVKYN VREIMKFMPV TGHPMDMLHC AVASLGMFYP QQELSDAERG 
NTLHLDAMAM RIIARMPTIV AMWEQMRFGN DPISPRPDLS HAANFLYMLS GREPDPAHTK 
ILDSCLILHA EHTINASTFS VLVTGSTLTN PYHVIGGAIG TLAGPLHGGA NQKVVEMLEE 
ISSVQQVGAY LDRKMANKEK IWGFGHRIYK TRDPRAVILK GMMEDMASHG NLRHSSLFEI 
AIEVERQATE RLGPKGIHAN VDFYSGVLYH EMGIKADLFT PIFAMARSAG WLAHWREQLA 
DNRIFRPTQV YTGEQDRRYV PVAQRT