Gene Dshi_2946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_2946
Symbol	hisC
ID	5710797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	3105385
End bp	3106470
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	68%
IMG OID	641268872
Product	histidinol-phosphate aminotransferase
Protein accession	YP_001534280
Protein GI	159045486
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.0271169
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAGA TCACCCCCCA GCCCGGCATC ATGGACATCG CGCTCTACGA GGGTGGGGCG 
TCGAAAGTGG ACGGTCTCGA CACCGTCATC AAGCTCAGCT CGAACGAGAA TCCGCTGGGC 
CCCAGCCCCG CCGCGATCGC CGCCTACAAG GCGGCTGCGG GGGAGTTGCA CCGCTATCCC 
TCCACCGATC ACGCGGGCCT GCGCGGCGCG ATCGCCGAGG TCTATGGCCT TGATCCCGAA 
CGGATAATCT GCGGCGCCGG GTCGGACGAG ATCATCGCGT TCCTGTGCCA GGCCTATGTC 
GGGCCCGGCG ACGAGGTGAT CCATACCGAA CACGGCTTTG CCATGTACCG CATCAGCACC 
CTGGCCGCCG GCGGCACCCC CGTCGAAGTG CCGGAACGGG AGCGCGTGAC GGATGTGGAC 
GCGATCCTCG CCGGGGTGAC CGACCGCACC CGGCTGGTGT TCATCGCCAA CCCCAACAAC 
CCCACCGGCA CCATGATCGG CGGCAACGCC TTGGCCCGTC TCGCGGACGG GTTGCCGGAG 
GGGTGCTTGC TGGTTCTGGA CGGGGCTTAC GCGGAATATG TGCCGGATTA CGACGCCGGA 
AAGGCGCTGG TCGAGAGCCG CGAGAATGTG GTGATGACCC GAACGTTTTC AAAGATTTAC 
GGGCTGGGTG CCCTGCGCGT CGGCTGGGGC TACGGGCCGC GCCACGTCAT TGATGTGCTC 
AACCGCGTGC GGGGTCCGTT CAACCTGTCG ACCGGGGCGC TGGCGGCGGC GGAGGCGGCC 
GTGCGGGACC GCGCCTATAC CGAGACCTGC CGCGCCGAGA ACGCCAAATG GCGCGGCTGG 
CTGGCCAGCG AACTGGCCGC TCTCGGCATC CCCTCGGATA CCTCCTCGGC CAATTTCGTG 
CTGGCCCGTT TCGCCAGCCC GGAGGAGGCA GGCGCCTGCG ACGACTTTCT CAAGGCGCGC 
GGGATCATCG TCCGGCGCGT TTCGGGCTAC AAGCTGCCCG CCGCCCTGCG CATGACCGTG 
GGCGACGCGG AAGGCTGCCG CGCACTCGTG GACGCCGTCG CCGCCTTCAA GGCGCAGGCG 
GCATGA

Protein sequence

MTQITPQPGI MDIALYEGGA SKVDGLDTVI KLSSNENPLG PSPAAIAAYK AAAGELHRYP 
STDHAGLRGA IAEVYGLDPE RIICGAGSDE IIAFLCQAYV GPGDEVIHTE HGFAMYRIST 
LAAGGTPVEV PERERVTDVD AILAGVTDRT RLVFIANPNN PTGTMIGGNA LARLADGLPE 
GCLLVLDGAY AEYVPDYDAG KALVESRENV VMTRTFSKIY GLGALRVGWG YGPRHVIDVL 
NRVRGPFNLS TGALAAAEAA VRDRAYTETC RAENAKWRGW LASELAALGI PSDTSSANFV 
LARFASPEEA GACDDFLKAR GIIVRRVSGY KLPAALRMTV GDAEGCRALV DAVAAFKAQA 
A