Gene NATL1_18891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_18891
Symbol	hisD
ID	4779203
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1551192
End bp	1552541
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	37%
IMG OID	640085178
Product	histidinol dehydrogenase
Protein accession	YP_001015709
Protein GI	124026594
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.978409
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAAA TAATTAATAA AGACGAGGTT CAAGAAACCT CTTCAAAAAA ATTGACCATA 
AAAACAGCTA ATAGCATTGA TCAGGCACAG TTTGAGCTAA GGAGAATTAC TGAGAGAACA 
TCTGGAACCG TTCAAGATGA AGCTATAAAG GTAGTTGACG ATATTCTTAA AAACGTAAGG 
GAAAGAGGGG ATGAAGCACT TACAGAATAC ACTTCTCGCT TTGATGGATT TCTAACGGAA 
AAATTTCAAG TTTCATCAGA TTTAATACTG AAAGCTTGGG AAGAGACTCC TAGGGAACTT 
CAAGATTCGC TTTTATTGGC AAAAAAAAGA ATTGAAAAAT TTCATAGTCT TCAGGTACCA 
AAAAATATTA CTTATACAGG ACCCAATGGT GAAACACTTG GAAGAAGATG GAGCCCTGTT 
GAAAAAGCAG GCATTTATGT TCCTGGCGGA AGAGCCGCCT ATCCCAGCAC TGTGTTAATG 
AATGCTATTC CTGCTTATGT TGCAGGAGTC AATCAAATTA TTATGGTTTC TCCTGCTAAC 
TCTCAAGGAG AGATAAACCA AACCGTTTTA GCTGCAGCAC ATATTACAGG TATCAACAAA 
ATCTTTCGTC TTGGAGGCGC TCAAGCTATT TGCGCACTTG CTAGTGGAAC TGAATCAATT 
CCAAAAGTAG ATGTAATTAC TGGACCAGGA AATATTTATG TAACGTTGGC AAAGAAAAAA 
GTTTATGGAA AGGTAGGAAT TGATTCTTTG GCTGGTCCAA GCGAGATCCT AATAATCGCT 
GATCAATCAG CAAAATTAGA ACATGTTGCA TCTGATATGT TAGCTCAGTC AGAACATGAT 
CCTTTAGCCT CAGCGATACT AATCACTACA AATACAAAAT TAGCTGAAAA GTTACCCGCA 
GAAATTAACC GTCAATTAAT TAATCATCCA AGATTAAAAA TATGTCAAGA ATCAATTTCC 
AACTGGGGTT TAATAGTCCT TTGTGATGAT TTAGAAACTT GTGCGCAATT GAGCGATACT 
TTTGCCCCAG AACATCTTGA ATTACTTGTA GAGGACCCAA AAAAATTATC AGAAAGCATA 
AACAATGCTG GGGCAATATT TATGGGCCCA TGGAGCCCAG AGGCTATTGG AGATTATCTT 
GGCGGGCCTA ATCACACTCT TCCCACTTCT GGAACTGCAA GATTTGCTGG CGCTCTTGGA 
GTTGAAACTT TTATGAAAAA TACCTCACTT ATAGATTTTT CAAAAGAAGC ATTTAATGAA 
AATAAAAATG CAGTTGTACA ATTAGCCAAT AGCGAGGGAC TACATAGTCA TGCAGAATCA 
ATAAGAATTA GAGACTCTAA ATCTTTTTAA

Protein sequence

MTQIINKDEV QETSSKKLTI KTANSIDQAQ FELRRITERT SGTVQDEAIK VVDDILKNVR 
ERGDEALTEY TSRFDGFLTE KFQVSSDLIL KAWEETPREL QDSLLLAKKR IEKFHSLQVP 
KNITYTGPNG ETLGRRWSPV EKAGIYVPGG RAAYPSTVLM NAIPAYVAGV NQIIMVSPAN 
SQGEINQTVL AAAHITGINK IFRLGGAQAI CALASGTESI PKVDVITGPG NIYVTLAKKK 
VYGKVGIDSL AGPSEILIIA DQSAKLEHVA SDMLAQSEHD PLASAILITT NTKLAEKLPA 
EINRQLINHP RLKICQESIS NWGLIVLCDD LETCAQLSDT FAPEHLELLV EDPKKLSESI 
NNAGAIFMGP WSPEAIGDYL GGPNHTLPTS GTARFAGALG VETFMKNTSL IDFSKEAFNE 
NKNAVVQLAN SEGLHSHAES IRIRDSKSF