Gene Dshi_2088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_2088
Symbol
ID	5713083
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	2212787
End bp	2213905
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	71%
IMG OID	641268010
Product	histidinol-phosphate aminotransferase
Protein accession	YP_001533426
Protein GI	159044632
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCATA CGCCCGGCCC CCGCTTCACC CCTCTCGCCC AGTCCCTGCC CGCCACGGTC 
CCCTTCGTCG GCCCCGAAAC CCAGGAACGC GCCCGCGGCC GCCCCTTCGC CGCCCGGCTC 
GGCGCAAACG AGAGCGCCTT TGGCCCCTCG CCCCGGGCCG TGGCCGCCAT GGCCGAGGCC 
GCGACCGGCG CGTGGATGTA TGGCGACCCG GAAAGTCACG ATCTGCGCGC GGCGCTGGCC 
GCCCATCACC GGGTCGGGAT GGAGAACGTG ATCGTCGGCG AAGGCATCGA CGGGCTGCTG 
GGCTATCTCG TGCGGCTGCT GGTGGCGCCG GGCGATACGG TCGTGACCTC CGCCGGGGCT 
TATCCGACCT TCAACTACCA TGTGGCGGGC TTCGGCGGCA CGCTCCATGC GGTGCCTTAC 
CGCGACGACC ACGAGGACCC GCAGGCGCTC CTGGACATGG CCCGGGCGGT GGACGCCAAG 
GCGATCTATC TCGCCAACCC CGACAACCCC ATGGGCAGCT GGCACGCCGC CGGTGTGATC 
ACCGACATGA TTGACGCACT GCCGCCCGGC TGTCTTCTGC TGCTGGACGA AGCCTATATC 
GAGCTTGCCC CCGACGGCAC CGCCCCCGAG ATCGCTCCGG ACGACCCCCG CGTCATCCGC 
CTGCGCACCT TCTCCAAGGC CCGGGGACTG GCCGGCGCGC GGGTCGGCTA CGGCATCGCC 
GCGCCCGGGC TGATTTCCGC CTTCGGCAAG GTGCGCAACC ATTTCGGCAT GAGCCGCGTC 
TCGCAAGCCG CGGCCCTCGC CGCGCTACAG GACAGCGACC ACCTCGCGAA GGTGGTGGCC 
AAGACCGCCG CCGCCCGCAC CCGGATCGCC GAGATCGGCG CGGCCCATGG CCTGCGCGCC 
CTACCCTCGG CCACCAATTT CGTCACGCTG GATTGCGGCG GTGACGGCGC GCGGGCCAAG 
GCCATCCTGG AGGCCCTGAT CGCCCGGGAC ATCTTCGTCC GCATGCCCTT CGTCGCCCCC 
CAGGACCGCT GCATCCGCAT CTCCTGCGGC ACGCCGGAGA TGCTCGATCT ACTGGCAGAG 
CGCCTGCCGG ATGCGCTCGC GGCCGCCACA AAGCCCTGA

Protein sequence

MTHTPGPRFT PLAQSLPATV PFVGPETQER ARGRPFAARL GANESAFGPS PRAVAAMAEA 
ATGAWMYGDP ESHDLRAALA AHHRVGMENV IVGEGIDGLL GYLVRLLVAP GDTVVTSAGA 
YPTFNYHVAG FGGTLHAVPY RDDHEDPQAL LDMARAVDAK AIYLANPDNP MGSWHAAGVI 
TDMIDALPPG CLLLLDEAYI ELAPDGTAPE IAPDDPRVIR LRTFSKARGL AGARVGYGIA 
APGLISAFGK VRNHFGMSRV SQAAALAALQ DSDHLAKVVA KTAAARTRIA EIGAAHGLRA 
LPSATNFVTL DCGGDGARAK AILEALIARD IFVRMPFVAP QDRCIRISCG TPEMLDLLAE 
RLPDALAAAT KP