Gene Dole_1983 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1983
Symbol
ID	5694823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2399450
End bp	2400538
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	57%
IMG OID	641264581
Product	histidinol-phosphate aminotransferase
Protein accession	YP_001529864
Protein GI	158521994
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000438985
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATAT CGCCGCCGGA CTATATTTTA TCAATCAAGC CCTATGTGCC GGGAAAGCCC 
ATTGAAGAGC TGGAGCGGGA ATACGGCATC TCGGGATCTA TCAAGCTGGC CTCCAATGAA 
AACCCCCTGG GGCCGTCCCC CCTGGCCCTG GCCGCCATTG AAAAAGCACT TTCCGGGCTG 
CACCGCTACC CCGACGGCAG CGGGTATTAC CTGGTCTCAA AACTTGCGCA AAAACTGGGG 
GTGGCCCCGG AGTCCATTGT CCTGGGCAAC GGTTCCGACG ACATCATCGG CATGCTCACC 
CGGGCCCTGC TGCTGCCCGG CGACGAGGTG ATCATGACCG ATCCCTCATT TGCCATGTAT 
GATATCACCA CCTGCATGGT CAACGCGCGG TCGGTCTATG TGCCGCTGAT CGACCGGGCA 
CTGCCTCTTG ACACCGTGGC CGGTGCCGTT ACGTCAAAAA CAAAGATGGT GTTTCTCACC 
AACCCCAACA ACCCGACCGG CACGGTTTTT TCCGGAAAGG CGTTTGAACG GTTTCTGGAG 
GCGGTGCCCT CCGATGTGGT GATTGTGGTG GATGAGGCCT ACATCGAGTT TGTTCAGGAC 
CCGGAGTGTG CCCGGGCCTT TGATTTTCTT GACAACAGCC GTCCTCTCGT GGCGTTGCGC 
ACCTTTTCAA AGGCCTATGG CCTGGCCGGC ATTCGGGTGG GATACGGCGT CATGCCGCCG 
TATCTGGCGG CGATTCTAAA CCGCATTCGC CAGCCCTTTA ATGTCAACTC CCTGGCTCAG 
GTGGCGGCTA TTGCGGCTCT GGATGATGAG GCCTTTTTAA AACAAACCCT GGCCGTGGTG 
CATGACGGGC TGGCCTGGCT TTATGCCGAG CTGGAGAAAA TGGGCCTTCG CTGTTTTCCC 
TCCCAGGCCA ATTTTTTTCT TGTCGATGTA AAAAAAGATG CCGCCGCTGT TTTTGAAGAG 
ATGTTAAAGC AGGGCGTGAT CATTCGCTCC ATGGTCTCCT ACGGATATCC TTCCTATATC 
CGGGTAACCG TTGGTCTGCC GGAGGAAAAC GCCCGGTTTG TGGCGGCGTT AAAGGCGGTG 
CTGAAATGA

Protein sequence

MKISPPDYIL SIKPYVPGKP IEELEREYGI SGSIKLASNE NPLGPSPLAL AAIEKALSGL 
HRYPDGSGYY LVSKLAQKLG VAPESIVLGN GSDDIIGMLT RALLLPGDEV IMTDPSFAMY 
DITTCMVNAR SVYVPLIDRA LPLDTVAGAV TSKTKMVFLT NPNNPTGTVF SGKAFERFLE 
AVPSDVVIVV DEAYIEFVQD PECARAFDFL DNSRPLVALR TFSKAYGLAG IRVGYGVMPP 
YLAAILNRIR QPFNVNSLAQ VAAIAALDDE AFLKQTLAVV HDGLAWLYAE LEKMGLRCFP 
SQANFFLVDV KKDAAAVFEE MLKQGVIIRS MVSYGYPSYI RVTVGLPEEN ARFVAALKAV 
LK