Gene P9211_16101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_16101
Symbol	hisD
ID	5731277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	+
Start bp	1441389
End bp	1442660
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	40%
IMG OID	641285988
Product	histidinol dehydrogenase
Protein accession	YP_001551495
Protein GI	159904151
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCCC TGGAAAGGAT ATCCAATAGA ACTTGCGGAG ACGGTCAAAA AAAGGCTGTT 
CTTACAGTAG AAAAAATCCT TGAACGAGTA AAAAAGGATG GGGATACAGC TCTGATTGAA 
TACACTAAAA AATTTGATGG ATTTGACCCT GATCCCCTTG AGGTTCCTTT AGAAGCAATA 
GAAAGAGCAT GGGAAGAAAC TCCAAAGCCA CTTCAAGATG CTCTAATTAC TGCAAAACAT 
AGAATCCAAG ACTTCCACCA AAAGCAAATT CCAAAAAATA TTCTTTTTAA AGGGATTGAG 
GGTGAGACAT TAGGTAGGCG ATGGCAACCT GTTCAAAAAG CAGGCATCTA TATTCCTGGA 
GGAAGAGCTT CTTATCCCAG CACAGTTCTT ATGAACGCAA TTCCTGCATC TGTAGCGGGA 
GTAAAAGAAA TTATTATGGT TTCTCCTGGA GGTTCTAATG GTCTTGTGAA TCAAACTGTA 
CTCGCTGCGG CTTATATCAC AGGAATAAAA ACAGTTTTTA GGATAGGCGG GGCTCAAGCC 
ATTGGAGCAA TGGCATATGG AACAAACACA ATTCCAAAAG TTAATGTAAT AAGTGGTCCC 
GGCAATTTAT ATGTCACTTT GGCGAAGAAA TACGTTTATG GAGATGTTGG AATTGATGCT 
CTTGCCGGTC CCAGTGAAGT ACTAATTATT GCCGATAATA GTGCCGATGT TCGTCATATT 
GCTGCTGATT TACTTGCACA AGCAGAGCAT GATCCATTGG CAGCGACAAT CTTGCTAACA 
ACTAACTCCG TTCTTGCTGA AAAGATTGAT GATGAAATTA TGGAGCAGTT AGAAGAGCAT 
CCACGAAAAG AAATATGTCT TAAGGCACTT AAAGACTGGG GCCTAATTGT AATTTGCAAT 
GACTTAGAAA CTTGTGCAAA GTTAACAGAT TACTTTGCAC CTGAGCATCT AGAATTATTA 
CTAAAAATGC CATATCAGGT GGCGGATAAA ATCAATAATG CTGGTGCAAT TTTCATAGGC 
GCTTGGAGCC CAGAAGCTAC TGGAGACTAT CTTGCTGGTC CAAACCACAC ATTACCAACA 
TCAGGAACTG CAAGATTTAG TGGGGCTTTA GGGGTGGAGA CTTTCATGAA GAACACTTCA 
ATTATTGAAT TTAATAAACA AGCTTTCGAT AAGAATAGTA AGGCAATTAT TGAGCTTGCG 
AATAGCGAAG GACTTCATAG TCATGCGAAG TCAATAGAGA TTAGACTCTC TAAATCTTCT 
GAAGAGATTT AA

Protein sequence

MTALERISNR TCGDGQKKAV LTVEKILERV KKDGDTALIE YTKKFDGFDP DPLEVPLEAI 
ERAWEETPKP LQDALITAKH RIQDFHQKQI PKNILFKGIE GETLGRRWQP VQKAGIYIPG 
GRASYPSTVL MNAIPASVAG VKEIIMVSPG GSNGLVNQTV LAAAYITGIK TVFRIGGAQA 
IGAMAYGTNT IPKVNVISGP GNLYVTLAKK YVYGDVGIDA LAGPSEVLII ADNSADVRHI 
AADLLAQAEH DPLAATILLT TNSVLAEKID DEIMEQLEEH PRKEICLKAL KDWGLIVICN 
DLETCAKLTD YFAPEHLELL LKMPYQVADK INNAGAIFIG AWSPEATGDY LAGPNHTLPT 
SGTARFSGAL GVETFMKNTS IIEFNKQAFD KNSKAIIELA NSEGLHSHAK SIEIRLSKSS 
EEI