Gene Cagg_1017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1017
Symbol
ID	7268389
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1256291
End bp	1257352
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	57%
IMG OID	643565863
Product	Homoserine dehydrogenase
Protein accession	YP_002462368
Protein GI	219847935
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.698035
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACCCA TTATCCAACT TGGCATCGGT GGCGTCGGAC GAGCTTTAGC ACGACAAATA 
GTAGCCGTCG CGCCTGCCAT TCGCCGACGC TATGGCATAG ATCTACGCTA CATAGCGATT 
GCTGATAGTC GCGGTATCAT TGCCGGTGAT CCGACGGTGA GTGAAGAACA AGTACATCAA 
ATCCTCGCCG TAAAAGAAGC CGGTCATGGG CTTGATAGTA TGACTAATGC GATCACCGAT 
CGGCACTGGA TAGAGTTACT CCCTGCGACA ATAGCAATCG TTGTTGATGT CACGGCAACG 
AGTGAACATA CCGCGCCATT GGCCGCAGCC GTCTCGGCAG GTCATCGCGT TGTATTGGCC 
AATAAACGCC CGCTATGTGA TGAGTACGAT CTGTTTACCG CGCTCACCGA ACGTGGTGCA 
ACCCGCTACG AAGCGACGGT TGGGGCCGGT TTGCCGGTTA TTGGGGTATT ACAGGGCTTG 
CTCGACACCG GTGATGAAGT ACTGCGGATC GAAGCGGCCT TGAGTGGTAC GCTCGGCTTT 
CTGATGAGCG CGTTAGAAGA GGGTAGCAGT TTTGCCGAAG CGGTATGGAA AGCGCACGCA 
CTCGGCTACA CCGAGCCGGA TCCGCGAGAT GACCTGAGCG GAGCTGATGT GGCGCGTAAG 
GCGCTGATTT TGGCCCGTAC CTGTGGTATC CCCGTACCGG CTGACGCGGT GAGTGCTGAA 
TCGCTCTTCC CACCCCAGCT CGCAACGGTC AGTGTGGCAG AGTTCTTGCA ACGCTTGCCC 
GAAGCCGAGG AATCTGTTAT GGAACGCTTT GCCGCGGCCC GTGCCGCCGG CAACGTCTTG 
CGGTATATCA CATGCATCAC GCCGGACAAC ATCGAGGTGG GGTTGCGCGA GTTGCCCGCC 
GATCATCCGC TCGCCGGTCT GCGTGGCCCC GACAATATGA TCAGCTTCAC CACCCGACGT 
TACCACGACC GACCAATGGT GATCCGTGGG CCAGGTGCAG GGGTTGAAGT GACGGCAACC 
GGTGTGTTGA GCGATATTAT TGCGACAGCA CGAGAACTGT GA

Protein sequence

MTPIIQLGIG GVGRALARQI VAVAPAIRRR YGIDLRYIAI ADSRGIIAGD PTVSEEQVHQ 
ILAVKEAGHG LDSMTNAITD RHWIELLPAT IAIVVDVTAT SEHTAPLAAA VSAGHRVVLA 
NKRPLCDEYD LFTALTERGA TRYEATVGAG LPVIGVLQGL LDTGDEVLRI EAALSGTLGF 
LMSALEEGSS FAEAVWKAHA LGYTEPDPRD DLSGADVARK ALILARTCGI PVPADAVSAE 
SLFPPQLATV SVAEFLQRLP EAEESVMERF AAARAAGNVL RYITCITPDN IEVGLRELPA 
DHPLAGLRGP DNMISFTTRR YHDRPMVIRG PGAGVEVTAT GVLSDIIATA REL