Gene AFE_3042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	AFE_3042
Symbol	hisC-1
ID	7134302
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 23270
Kingdom	Bacteria
Replicon accession	NC_011761
Strand	+
Start bp	2732855
End bp	2733934
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	62%
IMG OID	643531393
Product	histidinol-phosphate aminotransferase
Protein accession	YP_002427409
Protein GI	218667068
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGACA GCGCTACGAC CGCCCTGATG CAGGGCCTGC TCCGCCCGGA ATTGCTGGCC 
AGCAAGGCCT ATGCGGTGGC AGACGGCGAG GGGCTCATCA AACTGGATGC CATGGAGAAC 
CCCTATGGCT TACCGGCGGC CTTGCGTGAG CAATGGCTGG AGAGCCTGAC CGACGCGCCC 
CTCAATCGCT ATCCCGACGC ACACCCGACC CTCCTCATGG AGGGGCTCAA GGCCCACATC 
GGCCTGCCTG CCGGAATAGA ACTCATGCTC GGTAACGGCT CCGATGAGCT GATCCAGATT 
CTGGTGACCG CAGTAGCAGG CAGCCGACGC CCCATCATGG CGGTAGACCC CAGTTTCGTC 
ATGTACCGGC TGCTGGCGCA GCAGCTTGGT CTGCCTTTTG TGGGTATTCC CCTGGATGCG 
GACTTCCAGC TCGACCTTCC GGCCATGCTG GCGGCCATCG CCGCGCAACA ACCCGCCATC 
ATTTTTCTCG ACTGGCCCAA CAATCCCAGT GGCAGCCTTT TCCCCGAGAC CGATCTGGAG 
GCCATTGTCG CTGCAGCGCC GGGCCTGGTG GTGGTGGATG AGGCCTATCA CGCCTTCAGT 
CAGAAGACCT TTGCCGATCA CCTGGGACGC ACCCCCAACC TCCTCTTGCT GCGCACCATG 
TCCAAGGAGG GGCTGGCGGG GATGCGGCTG GGAATGCTGG CGGGGCCCGC CGCATGGATT 
CAGGAACTGG ACAAGCTGCG CCTGCCTTAC AATATCAATG TACTCACCCA GCGCAGCGCG 
TCCTTCTACC TGCGTCACAC CGAAGTACTG AATGCCCAGG CCGAAATTCT GCGTGTCGAG 
AGGGAACGGC TCTTCAAGGC CATCCGTGCC TGCGGCCTTT CGGTCTGGCC CAGCGCCGCC 
AATTTCCTGC TCTTTCATGC CCCGGGGCGG GCAGCGGTGC TGTTCTCAGG CCTGCGCGCG 
GGTGGAGTGC TCATCAAAGC CTTTACAGGC CACCCCCGCC TCGGCGAATA TCTACGGGTC 
AGTGTCGGCA CTCCCGCTGA AAATGACCGC TTTCTGGCCG TATTGGAGTC CTTACTGTGA

Protein sequence

MSDSATTALM QGLLRPELLA SKAYAVADGE GLIKLDAMEN PYGLPAALRE QWLESLTDAP 
LNRYPDAHPT LLMEGLKAHI GLPAGIELML GNGSDELIQI LVTAVAGSRR PIMAVDPSFV 
MYRLLAQQLG LPFVGIPLDA DFQLDLPAML AAIAAQQPAI IFLDWPNNPS GSLFPETDLE 
AIVAAAPGLV VVDEAYHAFS QKTFADHLGR TPNLLLLRTM SKEGLAGMRL GMLAGPAAWI 
QELDKLRLPY NINVLTQRSA SFYLRHTEVL NAQAEILRVE RERLFKAIRA CGLSVWPSAA 
NFLLFHAPGR AAVLFSGLRA GGVLIKAFTG HPRLGEYLRV SVGTPAENDR FLAVLESLL