Gene Franean1_1916 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1916
Symbol	hisD
ID	5670317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2297016
End bp	2298311
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	76%
IMG OID	641240837
Product	histidinol dehydrogenase
Protein accession	YP_001506259
Protein GI	158313751
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.215288
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTCAGAA GGCTCGATCT GCGCTCCGCG CAGCCCACCA TGTCGGACGT CCGTCGGCTC 
TTCCCGCGGG CGGCCGTGGA CGTCGACGTC GCGATGGACG CGGTCCGCCC CGTCTGCGAC 
GACGTGCGCG ACCGTGGTGA CGCGGCCGTC CTCGACGCCG CGGAGCGCTT CGACCGGGTC 
CGCCCGGCCG AGCTGCGGGT ACCGGCCGAC GCGCTCGCGA GCGCGCTCGC GGCCCTCGGC 
CCGGCGGTCC GTGACGCGCT GACCGAGGCG ATCCGCCGCG CGCGGCTGGT GCACCGGGCC 
CAGCTCCGGG AGCCGGTGGT CGTCGAGGTG GCCCCCGGCA CGAAGGTCAC CGAGCGCTGG 
ATCCCGGTCG GCCGGGTCGG CCTCTACGTG CCGGGCGGGC GGGTCGCCTA CCCCAGCAGC 
GTGGTCATGA ACGTCGTCCC CGCGCAGGAG GCCGGCGTCG CCTCGCTGGC GGTGACCTCG 
CCGCCCCAGG TCGACAACGG CGGCCTGCCG CATCCGGTCG TACTGGCCGC CTGCGCCCTG 
CTCGGGGTCG ACGAGGTCTA CGCGGCCGGC GGCGCCCAGG CCGTCGCGAT GTTCGCGCAC 
GGCACCGAGA GCTGCCCGGC CGTCGATGTC GTCACCGGCC CCGGCAACGT CTACGTCACC 
GCGGCGAAGC GGCTGCTGCG CGGGCTGGTC GGCGTCGACG CCGAGGCGGG CCCGACCGAG 
GTCGCCATTC TCGCCGACGG CTCGGCCCGC CCCGACTTCG TCGCCGCCGA CCTGATCGCG 
CAGGCCGAGC ACGACCCGAT GGCCGCCTGC CTGCTGGTCA CGACGTCGCC AGAGCTGGCC 
GACGCCGTCG ACGTCGAGCT CGACAAGCAG GTCCCCGCCA CCCGGCACCG GGAGCGGGTC 
ACTGAGGCGC TGGCCGGCCA GGGCGCCGTG GCGATCGTCG CCGACGTCGA CGCGGGTCTC 
GCGGTCGTCG ACGCCTGGGC CGCCGAGCAC CTGGAGATCC ACACCGCGGA CGCGGCGGGT 
GTCGCCGCCC GGGTGCGCAA CGCGGGCGCG ATCTTCGTCG GCGCCTACGC GCCCGTGCCA 
CTCGGGGACT ACCTCGCCGG CTCGAACCAC GTCCTGCCCA CCGGCGGCAC CGCGCGGCAC 
TCCAGCGGCC TCGCCGTGTC CGCCTTCCAG CGCCAGGTCC ATGTCGTCGA GTGCGGCCCC 
GAGGCGCTCG CCGACGTCGC GCCCCGCATC GCCGCGCTCG GCGGAGCCGA GGACCTGATC 
GCCCACGTCG ACGCGGTGGA GGTACGGGCC CGATGA

Protein sequence

MLRRLDLRSA QPTMSDVRRL FPRAAVDVDV AMDAVRPVCD DVRDRGDAAV LDAAERFDRV 
RPAELRVPAD ALASALAALG PAVRDALTEA IRRARLVHRA QLREPVVVEV APGTKVTERW 
IPVGRVGLYV PGGRVAYPSS VVMNVVPAQE AGVASLAVTS PPQVDNGGLP HPVVLAACAL 
LGVDEVYAAG GAQAVAMFAH GTESCPAVDV VTGPGNVYVT AAKRLLRGLV GVDAEAGPTE 
VAILADGSAR PDFVAADLIA QAEHDPMAAC LLVTTSPELA DAVDVELDKQ VPATRHRERV 
TEALAGQGAV AIVADVDAGL AVVDAWAAEH LEIHTADAAG VAARVRNAGA IFVGAYAPVP 
LGDYLAGSNH VLPTGGTARH SSGLAVSAFQ RQVHVVECGP EALADVAPRI AALGGAEDLI 
AHVDAVEVRA R