Gene VC0395_A0703 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A0703
Symbol	hisD
ID	5137724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	+
Start bp	726782
End bp	728077
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	52%
IMG OID	640532161
Product	histidinol dehydrogenase
Protein accession	YP_001216653
Protein GI	147673851
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAACCG TGGTTTGGCA ATCGTTGAGT GAAGCTCAGC AAGAATCGAT TTTAGAACGT 
CCTGCGATTA CCGAAGGAGC AAACATCACT GCCGCAGTTG CGCAGGTGAT TGCGAAAGTG 
CGCAGTGAGG GTGATGCCGC ACTGTTTGAA TTAACTGAAA AATTTGATCG TGTAAAACCC 
GCTTCACTGC GCGTATCTCG CGAAGAGATG GATGCCGCGG CCGCGAGTTT GTCGGAAACA 
ATGAAACAGG CGTTGGAGCA GGCATACAAC AACATCAGCA AATTCCACAA GGCGCAAAAA 
GCGCAACCAA TCAAAGTGGA AACCATGCCC GGAGTGGTGT GTGAGCAAGT CACTCGTCCG 
ATCAACAAAG TGGGTCTGTA TATTCCGGGT GGCAGCGCAC CGCTACCATC AACCGTACTA 
ATGCTCGGTG TGCCTGCGCA AATCGCTGGT TGTCGTAAAG TGGTGCTCTG CTCACCTCCG 
CCAATTGCTG ATGAAATTCT CTACGTCGCT AAGCTGTGTA ACATCGATGA GGTGTACAAC 
CTAGGCGGCG GTCAGGCAAT CGCCGCAATG GCTTACGGTA CGGAAACGGT GACTAAAGTT 
GACAAAATCT TTGGCCCCGG TAACGCCTAT GTGACGGAAG CAAAACGCCA AGTGAGTAAC 
GATTTCCGTG GCGCAGCGAT TGATATGCCT GCAGGACCTT CAGAAGTATT GGTGATTGCT 
GATGAAACGG CGGATGCCAA TTTTATCGCC GCCGATCTAC TCAGTCAGGC AGAGCACGGC 
CCAGATTCAC AGGTGGTTCT GGTCACACCA TCACCAGTGT TGGCCGATCA AGTGACGGAC 
GCAGTGCAAA AGCAGCTTAA AGTGCTTTCG CGCGCCAGCA TTGCTGAAAA AGCCTTGGCT 
TCCAGTCTGA TCATTATTGC TGAATCACTC ACCCAAGCAG TGTCGATTTC TAACTACTAC 
GGCCCTGAGC ACTTGATTGT GCAGACGCGC AACCCGCGTG AGTTGGTTCC ACTGCTCGAT 
AACGCAGGCT CCATTTTCCT TGGCGATTGG TCGCCAGAAT CGGTAGGCGA TTACGCTTCT 
GGTACCAACC ATGTGCTACC CACTTACGGT TACACCCGCA CCTATTCCAG CTTAGGTTTG 
GCCGATTTCA GTAAACGCAT GACAGTGCAA GAGCTGACCG CTGATGGCTT GCAATTGCTT 
GCGCCCACCG TAGTAACGAT GGCGGAAGCG GAAGGGTTAG ACGCGCACAA ACGTGCGGTT 
ACGATTCGAG TAGAAAAATT ACAGAAGGCT CAATAA

Protein sequence

MRTVVWQSLS EAQQESILER PAITEGANIT AAVAQVIAKV RSEGDAALFE LTEKFDRVKP 
ASLRVSREEM DAAAASLSET MKQALEQAYN NISKFHKAQK AQPIKVETMP GVVCEQVTRP 
INKVGLYIPG GSAPLPSTVL MLGVPAQIAG CRKVVLCSPP PIADEILYVA KLCNIDEVYN 
LGGGQAIAAM AYGTETVTKV DKIFGPGNAY VTEAKRQVSN DFRGAAIDMP AGPSEVLVIA 
DETADANFIA ADLLSQAEHG PDSQVVLVTP SPVLADQVTD AVQKQLKVLS RASIAEKALA 
SSLIIIAESL TQAVSISNYY GPEHLIVQTR NPRELVPLLD NAGSIFLGDW SPESVGDYAS 
GTNHVLPTYG YTRTYSSLGL ADFSKRMTVQ ELTADGLQLL APTVVTMAEA EGLDAHKRAV 
TIRVEKLQKA Q