Gene Jann_1104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_1104
Symbol
ID	3933548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	1064469
End bp	1065794
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	64%
IMG OID	637903452
Product	histidinol dehydrogenase
Protein accession	YP_509046
Protein GI	89053595
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.178168
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGAGT ATCTGAAACG GGGCAAACCA GCCGATGAAC GTGCGGAAGA TGACGCCAAG 
GTGCGCCACA CCGTCGAGGG CATCCTGGGC GATATCGAGG CGCGGGGCGA TGCGGCGGTG 
CGCGATCTGT CGGCTAAATT CGATGGGTAT TCGCCTGAAG CGTTTCGCCT GAGCGCCTCG 
GAGATCGAGG CCGCGATGCA GAAGGTCTCC ACCCGGGAGA TGGAAGATAT CCGCTTTGCC 
CAGACCCAGA TCCGCCGGTT TGCCGAGGCG CAGCGCGCGT CGATGACCGA CATCGAAGTG 
GAAACGATGC CGGGCGTGAT CCTGGGCCAC AAGAATATCC CGGTGAATTC CGTGGGCTGC 
TATGTGCCCG GCGGCAAGTT CCCGATGGTC GCCTCCGCCC ATATGTCGGT GCTGACGGCG 
AAAGTGGCAG GCGTGAAACG CGTCGTGGCC TCCGCCCCGC CGATGAACGG TGCGCCGCAC 
CCGGCGATCG TGGCCGCGAT GCATGAAGGC GGCGCCGATG AAATCCTGTG CCTGGGCGGC 
GTGCAAGCCG TGGGCGCGAT GGCGATTGGA ACGGAAACGG TGAAGCCCGT CGATATGTTG 
GTGGGGCCGG GCAATGCCTT TGTGGCGGAA GCGAAGCGAC AGCTCTTTGG CCGCGTGGGG 
ATTGACCTGT TCGCCGGCCC GACAGAGACC TGCGTGATCG CCGATGAGAC CGTCGACGGG 
GAGATGTGCG CCACGGACCT GCTGGGGCAG GCGGAGCATG GGTATAACTC CCCCGCCGTG 
CTGATCACCA ATTCGCGCAG GTTGGCCGAT GACACCCTGG CCGAGATCGA GCGGATCCTT 
GGGATCCTGC CCACCGCCGA GACGGCGCGC GTGTCTTGGG AGGATTACGG AGAGGTCATC 
GTCTGCGACA GTTACGACGA GATGCTGGCC GTGTCCGAGG ACATCGCGTC GGAGCATATC 
CAAGTGATGA CCGACCGCGA CGACTGGTTT CTGGAGAACA TGACCAGCTA TGGCGCGCTG 
TTTCTGGGGC CGCGCACGAA CGTGGCCAAT GGCGACAAGG TGATTGGCAC GAACCACACG 
CTGCCGACGA AGAAGGCGGG CCGGTATACG GGTGGGCTTT GGGTTGGAAA GTTCCTGAAA 
ACGCATTCGT ATCAGAAGGT TGTGACGGAT GAGGCGGCGA CGCTGGTCGG TGAATACGGC 
TCGCGTCTGT GCATGTTGGA GGGCTTCGTG GGCCACGCGG AGCAATGCAA CATCCGCGTG 
CGCCGGTATG GCGGGTTGAA TGTGCCCTAT GGCGAGGGCG CGCCCTACCA CGACGCGGCG 
GAGTAG

Protein sequence

MAEYLKRGKP ADERAEDDAK VRHTVEGILG DIEARGDAAV RDLSAKFDGY SPEAFRLSAS 
EIEAAMQKVS TREMEDIRFA QTQIRRFAEA QRASMTDIEV ETMPGVILGH KNIPVNSVGC 
YVPGGKFPMV ASAHMSVLTA KVAGVKRVVA SAPPMNGAPH PAIVAAMHEG GADEILCLGG 
VQAVGAMAIG TETVKPVDML VGPGNAFVAE AKRQLFGRVG IDLFAGPTET CVIADETVDG 
EMCATDLLGQ AEHGYNSPAV LITNSRRLAD DTLAEIERIL GILPTAETAR VSWEDYGEVI 
VCDSYDEMLA VSEDIASEHI QVMTDRDDWF LENMTSYGAL FLGPRTNVAN GDKVIGTNHT 
LPTKKAGRYT GGLWVGKFLK THSYQKVVTD EAATLVGEYG SRLCMLEGFV GHAEQCNIRV 
RRYGGLNVPY GEGAPYHDAA E