Gene Gdia_2140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_2140
Symbol	hisD
ID	6975568
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2371408
End bp	2372721
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	74%
IMG OID	643391669
Product	histidinol dehydrogenase
Protein accession	YP_002276513
Protein GI	209544284
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.480226
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGGC TGGATACCGC GCAACCCGAT TTCCGTGCCG CCTTCGCCCG CCTGCTGGAC 
GACCGCGAGG GCGACACCGC CCGCGTCGAT GCCCCGGTCG CCGAGATCCT GGCCGCCGTG 
CGTGCGCGGG GCGACGAGGC GCTGTGCGCC TATACCGCCC GGTTCGACCG CATGCCGGTC 
ACGCCGGACC GCCTGCGCAT CACCGAGGCC GAGATCGAGG CCGCCTGCGC CCGGGTCCCG 
CCCGACCTGC TGGCGGCCCT GGATGTCGCG GCCACCCGGA TCGAGGCCTT CCACCGCGCC 
CAGATGCCGG CCGACCTGCG CTATACCGAC GCGGACGGGG TGGATCTGGG CATGCGCTGG 
ACGGCGCTGG ACGCGGTCGG GCTGTACGTG CCCGGCGGCA CGGCGGCCTA TCCGTCCTCG 
GTCCTGATGA ACGCCATGCC CGCGCGGGTG GCGGGGGCGG CGCGGCTGGC GATGTGCGTG 
CCGACCCCGG ACGGCGTGCT GAATCCGCTG GTGCTGGCCG CCGCCCGACG CGCCGGCGTG 
ACCGAGATCT ATCGCGTCGG CGGGGCGCAG GCCGTGGCGG CCATGGCCTA CGGCACCGCG 
ACCATCCGCC CGGTGGACCG CGTGGTCGGA CCCGGCAACG CCTATGTGGC CGAGGCCAAG 
CGTCAGGTGT TCGGCCGGGT GGGCATCGAC AGCATCGCCG GCCCGTCCGA GGTCGTGGTG 
GTGGCCGACA GCGGCACCGA TCCGCGCATC GTCGCGCTGG ACCTGCTGGC GCAGGCCGAG 
CATGACGCCC TGGCGCAGTC GATCCTGATC ACCCAGGACG CCACCCTGGC CGACCGGGTG 
GCGGAGGCGG TCGAGGCCGA ACTGCGCACC CTGCCCCGCG CCGCCATCGC GGGGGCGAGC 
TGGGGCGCCC ACGGCGCCAT CATCACCGTG CGCGACCTGG ACGAGGCCGC GTCGCTGATC 
GACGCGATCG CGCCCGAACA TCTGGAACTG CTGCTGGCCG ATCCGGAACC GCTGTTCGCC 
CGGGTCCGCC ATGCCGGGGC GATCTTCCTG GGCCGGCAAT GCGCCGAGGC GATCGGCGAT 
TATGTCGGCG GTCCGAACCA TGTCCTGCCC ACCAGCCGGA CCGCGCGCTT CGCCTCGGGC 
CTGTCGGTGT TCGACTTCCT GAAGCGCACG ACCTTCATCG GCGCGGGGCC GGACGCGCTG 
CGCCGGATCG GGCCGGCGGC GGTGGCCCTG GCGCGGGCCG AGGGGCTGGA CGCACACGCG 
CTGAGCGTGT CGGCGCGGCT GGACGCCGTG GCGCGCGAGT CCGACAAAGC TTGA

Protein sequence

MKRLDTAQPD FRAAFARLLD DREGDTARVD APVAEILAAV RARGDEALCA YTARFDRMPV 
TPDRLRITEA EIEAACARVP PDLLAALDVA ATRIEAFHRA QMPADLRYTD ADGVDLGMRW 
TALDAVGLYV PGGTAAYPSS VLMNAMPARV AGAARLAMCV PTPDGVLNPL VLAAARRAGV 
TEIYRVGGAQ AVAAMAYGTA TIRPVDRVVG PGNAYVAEAK RQVFGRVGID SIAGPSEVVV 
VADSGTDPRI VALDLLAQAE HDALAQSILI TQDATLADRV AEAVEAELRT LPRAAIAGAS 
WGAHGAIITV RDLDEAASLI DAIAPEHLEL LLADPEPLFA RVRHAGAIFL GRQCAEAIGD 
YVGGPNHVLP TSRTARFASG LSVFDFLKRT TFIGAGPDAL RRIGPAAVAL ARAEGLDAHA 
LSVSARLDAV ARESDKA