Gene Lferr_1687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lferr_1687
Symbol
ID	6877668
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 53993
Kingdom	Bacteria
Replicon accession	NC_011206
Strand	+
Start bp	1649824
End bp	1651005
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	62%
IMG OID	642789555
Product	aminotransferase class I and II
Protein accession	YP_002220116
Protein GI	198283795
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATATCC GTCTTTCCCG CCGCGTCAAT GCGGTGCGCC CATCCCCCAC CCTTGCGGTC 
ACCGCCCGTG CCCAGCAACT GCGCCGCGAA GGAAAGGATA TCGTCAGCCT TGGTGCCGGC 
GAGCCGGATT TCGACACCCC GGAGTACATC AAGGAGGCAG CCATTGCCGC CATTCGCCAG 
GGCTTCACCA AATATACCGC CGTCGGCGGC ACACCGGAAC TGAAGGCCGC CATCATCGGC 
AAATTCGCGC ACGACAACCA TCTGTCATAC CGCCCCGATG AAATTCTCGT TTCCGTCGGC 
GGCAAGCAAA GCTTCTTCAA TCTTTGCCAG GCCCTTCTGG ATGCCGGCGA TGAGGTCATC 
ATTCCCGCGC CCTACTGGGT ATCCTATCCG GACATCGTGC TTCTGGCCGA AGCGCGGCCC 
GTCATCATCG ATACCGGCGC CAACCAGCGT TTCAAGATCA GTCCGGAGCA GCTGGAGGAA 
GCGATCACGC CCAACACCCG CCTGCTGGTC ATCAACAGCC CCTCCAATCC CTCCGGCATG 
ACCTACAGCC GCCCGGAATT GGAAGCCCTG GGTGAGGTCC TCCGCCGTTA TCCCCATATC 
CTCATCGCCA GCGATGACAT GTACGAAAAA ATCCGCTTCC ACGATGAAGA GTTCGTCAAC 
ATCGCCAACG CCTGCCCGGA TCTGGCTCCA CGCTGCATCG TCATGAATGG CGTGTCCAAG 
GCCTATGCCA TGACCGGGTG GCGCATCGGC TACTGCGCCG GCCCCAAGAC GCTGATCACC 
GCAATGAATA CCGTACAGTC CCAGAGCACC TCCAATCCCA CCTCCATCGC TCAGGTGGCC 
GCCCAGGCGG CACTGGAAGG CGGCGACAGC GCCATCCACG AAATGGTGCT GGCTTTCAAG 
CGGCGCCACA CGTATGTCTA CAACCGCCTG AAAGTGCTGC CCGGCGTTGC TGCCATGCCC 
TCCGATGGTA CCTTTTACAG CTTTCCGGGA TTTCGCGAAG TCATGGCGGC GAAAGGCCTG 
CGGGATGATC TTGCCCTGGC CGAGGCCTTG CTGGGAGCCG GAGTGGCCGT CGTACCGGGC 
TCGGCCTTCG GCACTCCTGG CCACATCCGC CTGTCCTTCG CGACCAGCGA CAAGAACCTG 
GAGATGGCCC TGGACCGCAT CAGCGCTTTC GTCAACGCCT GA

Protein sequence

MDIRLSRRVN AVRPSPTLAV TARAQQLRRE GKDIVSLGAG EPDFDTPEYI KEAAIAAIRQ 
GFTKYTAVGG TPELKAAIIG KFAHDNHLSY RPDEILVSVG GKQSFFNLCQ ALLDAGDEVI 
IPAPYWVSYP DIVLLAEARP VIIDTGANQR FKISPEQLEE AITPNTRLLV INSPSNPSGM 
TYSRPELEAL GEVLRRYPHI LIASDDMYEK IRFHDEEFVN IANACPDLAP RCIVMNGVSK 
AYAMTGWRIG YCAGPKTLIT AMNTVQSQST SNPTSIAQVA AQAALEGGDS AIHEMVLAFK 
RRHTYVYNRL KVLPGVAAMP SDGTFYSFPG FREVMAAKGL RDDLALAEAL LGAGVAVVPG 
SAFGTPGHIR LSFATSDKNL EMALDRISAF VNA