Gene Ava_4204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4204
Symbol	hisD
ID	3680948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	5265756
End bp	5267057
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	49%
IMG OID	637719551
Product	histidinol dehydrogenase
Protein accession	YP_324698
Protein GI	75910402
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.536856
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCGAA TCATTACTCA GCAGGCAGAT GTTAAAGCAG AACTGCAAAG AATCTGCGAT 
CGCACTCACG ACGAACAGGT GCTTCACAAG GAAGCAACTG TGCGGGAAGT GTTGCAAGCA 
GTGAAACGCC AAGGCGACAA AGCTGTTTTG CATTACACAG ATGAATTTGA CAATCAAATT 
CTCAAAGCTG AAGAGTTACG CGTTACAGGT TCAGAACTGG ACGCAGCTTA CCAACAGGTA 
TCCAAGGAAC TGCTGGAGGC GATTCAGCTA GCTAGCCGCC AAATTGAAGC TTTTCATCGT 
CAGCGAGTCC CCAAAAGCTG GGTACACTTT GGCGATGATG ATATTGTACT GGGCAAACGC 
TACACTCCTG TAGACCGTGC GGGTTTGTAT GTTCCTGGTG GTCGTGCTGC TTACGTCAGT 
ACAGTGCTGA TGAACGCAAT TCCGGCGAAG GTGGCTGGTG TACCGCGTAT AGTAATGGCG 
ACACCACCAG GCGCACAGAA AGCGATTAAT CCCGCAGTGT TAGTAGCAGC TCAAGAAGTG 
GGAGTACAAG AAATTTATCG GGTAGGTGGG GCGCAAGCGA TCGCTGCTTT AGCCTATGGT 
ACAGAGACAA TCCCCAAGGT GGATGTAATT ACTGGCCCTG GTAACATCTA TGTCACTTTG 
GCGAAAAAAC TGGTTTACGG CACTGTGGGG ATCGATTCCT TAGCCGGGCC TAGTGAAGTG 
CTGATTATTG CCGATGAAGG AGCAAATCCC GTCCATGTAG CCACTGATAT GCTGGCACAG 
GCGGAACACG ATCCAATGGC GGCGGCAATT TTGTTCACCA CAGACCCAGC TCTAGCGAAG 
AATGTGCAAG TAGCAGTGGA AAGACAATTG GTAGATCATC CACGGCGGAT AGATACCGAA 
AAAGCGATCG CTCATTACGG TTTAATCGTG TTGGTAGAAT CCCTAGATGC AGCCGCAGAA 
CTCTCCAATG AATTTGCACC AGAACACCTA GAGTTAGAAG TTAAAGATCC TTGGGCTGTA 
TTACCCAACA TTCGCCATGC TGGTGCTATC TTCCTCGGTT ATTCCACACC AGAAGCAGTA 
GGGGACTATC TAGCCGGCCC CAACCATACT TTACCTACAT CTGGTGCTGC CCGTTATGCC 
TCTGCCTTAA GTGTAGAAAC TTTCCTCAAA CATTCCAGCA TCATTCAGTA TTCCCAAACT 
GCACTCAATA AGGTAGCTGG AGCCATTGAC GCTTTAGCCA CAGCCGAGGG CTTACCCTCT 
CACGCTGACT CAGTGAAGCG GCGAATTCAG CAAGATGAAT GA

Protein sequence

MLRIITQQAD VKAELQRICD RTHDEQVLHK EATVREVLQA VKRQGDKAVL HYTDEFDNQI 
LKAEELRVTG SELDAAYQQV SKELLEAIQL ASRQIEAFHR QRVPKSWVHF GDDDIVLGKR 
YTPVDRAGLY VPGGRAAYVS TVLMNAIPAK VAGVPRIVMA TPPGAQKAIN PAVLVAAQEV 
GVQEIYRVGG AQAIAALAYG TETIPKVDVI TGPGNIYVTL AKKLVYGTVG IDSLAGPSEV 
LIIADEGANP VHVATDMLAQ AEHDPMAAAI LFTTDPALAK NVQVAVERQL VDHPRRIDTE 
KAIAHYGLIV LVESLDAAAE LSNEFAPEHL ELEVKDPWAV LPNIRHAGAI FLGYSTPEAV 
GDYLAGPNHT LPTSGAARYA SALSVETFLK HSSIIQYSQT ALNKVAGAID ALATAEGLPS 
HADSVKRRIQ QDE