Gene Dole_1231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1231
Symbol
ID	5694065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	1469564
End bp	1470583
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	60%
IMG OID	641263824
Product	aminotransferase class I and II
Protein accession	YP_001529114
Protein GI	158521244
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAGCA ACGTCAATCC CCTGGGGCCC CCGGCCGGGC TGATCGCGTA TCTTTGCGAT 
CGGATGACCG ACATTGTCTG TCTGCCGGAT CCTGATGCCT TGCACATCCG CCGGTCCTTT 
GCAAAGCGCC ATGGCCTGGC CCCGGGACAC GTGGTGGCGG GCAACGGCAC CACCCAGTTG 
ATTTACGCCC TGCCGCCGGC CCTGGGGTTG GGGCGGGTCC TGGTGCTGGG GCCGGCCTAT 
GCCGATTACG CCCAGGCCTG CGCCATGCAC AACGTGCCCT GTGATTTTCT GCTTGCCGAT 
GAGGCAGGCG GCTTTCGGCA TGATGCCGGC GTAATTGCCC GAAAGATACG GGAGGCAAAG 
CCGGACGCGG TGTTTGTCTG CAACCCTAGC AACCCCACGG GCGTGTTGAT GGACCGGCAG 
GTGATTCTGG ATCTGTGCAA TGAGAGCCCT GATGTGCTGT TTGTGATTGA TGAGTCCTAC 
CTGCCGTTTG TCCGAGAAGG GGAGTCCCTC AGCCTGATCA ACGGGCCCGG CATGGACAAT 
TTGCTGGTTT TAAGCTCCAT GTCGAAAATA TTCCGCGTAC CCGGCCTGCG TATCGGGTTT 
GCCGCGGGCC CTGAGCCGGT TGTAGATCTG CTGGCCCGGC ATCTGCCCTG CTGGAGCGTC 
AATACCCTTG CCCAGGCCGC GGTTGACTGG ATTCTGGAGC ACAAACGCGA AGTGAACCGG 
TTTATAGACG ATGCCGTGAC CCTGGTGGAA GAGGAACGGT CGTTTCTGCT TCAGCGACTT 
GCCGCATCCG GAGTGGTGAG CCTTTTCCCC TCGGTGGCAT CTTTTATGCT GGGCGTCCTG 
CATTCGGGCT TTACCTCAGC ATCTGTCTGT GACGCCCTTG CGCAGGGGCG CATTCTGATC 
CGGGACTGCG CCAATTTTGA AGGGCTTTCC GACCGGCACA TTCGTATTTC CCTTAAAACA 
CGGGAGCACA ACAGCCTGCT GGTCGACCGT TTATTTAACC TGTGTCCATC CTCGTTATGA

Protein sequence

MSSNVNPLGP PAGLIAYLCD RMTDIVCLPD PDALHIRRSF AKRHGLAPGH VVAGNGTTQL 
IYALPPALGL GRVLVLGPAY ADYAQACAMH NVPCDFLLAD EAGGFRHDAG VIARKIREAK 
PDAVFVCNPS NPTGVLMDRQ VILDLCNESP DVLFVIDESY LPFVREGESL SLINGPGMDN 
LLVLSSMSKI FRVPGLRIGF AAGPEPVVDL LARHLPCWSV NTLAQAAVDW ILEHKREVNR 
FIDDAVTLVE EERSFLLQRL AASGVVSLFP SVASFMLGVL HSGFTSASVC DALAQGRILI 
RDCANFEGLS DRHIRISLKT REHNSLLVDR LFNLCPSSL