Gene Cagg_1679 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1679
Symbol
ID	7268981
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2050659
End bp	2051747
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	59%
IMG OID	643566521
Product	histidinol-phosphate aminotransferase
Protein accession	YP_002463016
Protein GI	219848583
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGATCC ACAAAAAGCC GTTTCTCGCC GCGTTACCAC CGGCCCCACC GCCGCGCCTG 
GCTGCCGACG GTCCACCACC GATCCGCATG GCAGCCAACG AAAACCCATT GGGTCCATCG 
CCACGCGCGG TCGCAGCAGT ACAAGCCGCT ATCAATGAAA TTCACCGCTA TCCCGATGCC 
GGCGGTGCCG CTCTGCGCTA TGCCCTGGCA ACACGTAACG CCTTGTCGCC CGAACATGTG 
ATGCTGGGGA ACGGCTCTGA TGAACTCATT ATGTTGATTT GCCACGCGAT GCTGGGTGAG 
GGCGATGAAG CGGTATTGGC GCAGGGTTCA TTTGTCAGCT ATGCACGACG CATTCAGGCG 
CAAGGTGCCA TTGCCCGCCA AATCCCGTTA CGTGAGATGA CCCATGATCT ACCGGCGATG 
GCCGCAGCAA TAACTGCACG CACCCGCCTG ATGTTCGTCT GTAATCCCAA CAACCCGACC 
GGCACAACCA TCGGTGCGGC TGAGATGGCA GCGTTTCTCG CCCACGTGCC GGATGATGTG 
CTCGTGGTTG TTGATGAAGC CTACATTGAG TTTGTCACCC GCCCTGATTT TCCCGATCTG 
CTGCCCCTGA TCCGCAACGG ACGCGATAAT CTGCTGCTAT TGCGCACCTT TGCCAAGATT 
CACGGCCTGG CCGGGTTACG TCTCGGCTAT GCGTTTGGTG CGCCCGATCT GATTGCCTAC 
CTCGAACGAG CACGCCCGGT GTTCAATGTG AACGCATTGG CCCAGATTGC CGGCCTGGCT 
GCTCTCGACG ATACCGACCA TCTCGCTCGC TCGTTAGCCC ACGCCAATGC GAGCCGCACA 
CGGTTGACGA ACGCCTTGCG CGCACTCGGT TTGACGGTCA TTCCCGGTGA GACGAACTTC 
ATCGCTGTCG CCGTCCACGA CGATCAGGCA ATTGTGGCAA CACTGGCCCG ACGTGGTGTA 
CTGGTGACAC CCTTAACCGG TTGGGGGTTG CCGGGCTGGA TCCGCATATC ATTTGGGACA 
GAGGAAGAAA ACGACGCCTG TATTGCCGCA CTGCAAGCTG CTGTATCGGC CAGCCAGGCT 
TGTAGTTGA

Protein sequence

MPIHKKPFLA ALPPAPPPRL AADGPPPIRM AANENPLGPS PRAVAAVQAA INEIHRYPDA 
GGAALRYALA TRNALSPEHV MLGNGSDELI MLICHAMLGE GDEAVLAQGS FVSYARRIQA 
QGAIARQIPL REMTHDLPAM AAAITARTRL MFVCNPNNPT GTTIGAAEMA AFLAHVPDDV 
LVVVDEAYIE FVTRPDFPDL LPLIRNGRDN LLLLRTFAKI HGLAGLRLGY AFGAPDLIAY 
LERARPVFNV NALAQIAGLA ALDDTDHLAR SLAHANASRT RLTNALRALG LTVIPGETNF 
IAVAVHDDQA IVATLARRGV LVTPLTGWGL PGWIRISFGT EEENDACIAA LQAAVSASQA 
CS