Gene Cagg_0934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0934
Symbol
ID	7268007
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1162608
End bp	1163915
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	60%
IMG OID	643565782
Product	Histidinol dehydrogenase
Protein accession	YP_002462288
Protein GI	219847855
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0234034
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATTC CGATTATTAC CGATCTTGCT GTTGCCCGTG CCGGGATCTT ACGTCGTGCG 
TTCCTCGATG ACGATACTGC TACGGTGACG ACGGTTGCCG AGATTATTAC CAACGTCCGG 
CAGCGTGGTG ATGCTGCGTT GCGCGAGTAT ACCCATCGTT TCGACGGTGT CGACTGCGAG 
GTTATCGAGA TCCCACGCGA ACGACTGGCA GCGGCAGCGG CCGATATCGA TCAATCATTG 
CGGCAAGCAT TGTTGTTAGC GATCAACGGG ATTCGTCGCT TTCACGAGCG GCAACTGCGC 
AACTCGTGGG TGGAATTTAG CGTCGAAGGA GCATTAGGGC AGATTGTGCG ACCGCTCGAT 
CGGGTCGGAA TATACGTGCC CGGTGGTGCC GCGCCCTTAC CATCGTCGCT GATCCACGCG 
GCAGTGCCGG CTCGGGTCGC CGGTGTGCGT GAGATTGTGG TCTGTTCACC ACCGCAACGC 
TCAACCGGTG AACCGGCAAT GGCGGTCCTC GCGGCGGCGC ACCTGGCCGG GGTTGACCGC 
TTCTTCGCCG TCGGTGGTGC GCAAGCGATA GCTGCCCTTG CTTACGGAAC GGAAAGTGTG 
CCGCGCGTTG ACGCAGTAGC CGGGCCGGGC AATCGTTACG TGATCCAAGC GATGCGGATG 
GTCTATGGGA CGGTTGGAGT GGTGAGTTTG CCAGGACCAA CAGAGACCCT CGTCATCGCC 
GATCAGACGG CAAATCCCCG CTCAGTAGCA GCCGATCTGT TGGCGCAGGC CGAGCATCGC 
GAGGCCAGCG CAATCTTGCT CACGCCCGAT TGGGGGTTGG CCGAGCAAGT GCAGCGCGAA 
GTGGAACGGC AATTAGCAGC GTTGCCGGCG GTGAATGCGC AGGCTGCCCG CGATGCGGTG 
ACGCGGCGTG GTGGGATTGT CATGGTGCCC GATCTGACAA CGGCATTCGC CTTGGCCAAC 
GAATACGGCC CTGAACATCT CTGTTTACTG ATCGCCGAAC CATGGGCTTA CGTTGGTGAA 
GTACGTAATG CCGGTGGTGT TTTTTTAGGT GAAGATTCGT TTGAAGTTCT CGGTGACTAC 
GTGGCCGGTC CGTCACACAT TATGCCGACC GAAGGTACGG CTCGTTATGC CTCGCCGGTC 
AACGTTGATA GTTTTCGGAA AGTGATCTCA CTCGTTGGCC TCAATCGGGC CGGTGTGAAG 
CGGATTGGTC CGGCGGCAAT TCGGATTGCC GAAGCTGAAG GTCTCTTTGC GCACGCGGCG 
GCGGTGCGGA CTCGGCTGGA ATCGCTCGAC AACGACGGGA GGGAGTAA

Protein sequence

MTIPIITDLA VARAGILRRA FLDDDTATVT TVAEIITNVR QRGDAALREY THRFDGVDCE 
VIEIPRERLA AAAADIDQSL RQALLLAING IRRFHERQLR NSWVEFSVEG ALGQIVRPLD 
RVGIYVPGGA APLPSSLIHA AVPARVAGVR EIVVCSPPQR STGEPAMAVL AAAHLAGVDR 
FFAVGGAQAI AALAYGTESV PRVDAVAGPG NRYVIQAMRM VYGTVGVVSL PGPTETLVIA 
DQTANPRSVA ADLLAQAEHR EASAILLTPD WGLAEQVQRE VERQLAALPA VNAQAARDAV 
TRRGGIVMVP DLTTAFALAN EYGPEHLCLL IAEPWAYVGE VRNAGGVFLG EDSFEVLGDY 
VAGPSHIMPT EGTARYASPV NVDSFRKVIS LVGLNRAGVK RIGPAAIRIA EAEGLFAHAA 
AVRTRLESLD NDGRE