Gene Cagg_3476 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3476
Symbol
ID	7269702
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4239473
End bp	4240480
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	58%
IMG OID	643568285
Product	hypothetical protein
Protein accession	YP_002464752
Protein GI	219850319
COG category	[R] General function prediction only
COG ID	[COG2334] Putative homoserine kinase type II (protein kinase fold)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCATCT CTGATTTTCG TCATCTCAAC CAAACTGTTT CGCCCGCGGC TACAGAGTTG 
GGTGAGGCGT GGCAACGCAC GCTCAGTCGG TTAGGCGACT ATACCGCTAT TGTCGTGCGG 
GCACTTAACT TACGCCCACA AGCGGCAACG TTGTACCGGC AGACCGAGCG CCATGTGCTG 
GTGCGGTTGA CGTTGCCGAC GGAACACGTC GTGTTGCGCA TATCGCCGGA AGACGATTTG 
GCAGCGCACG TCGCCTTTTT ACGTGGGATG GCGTTGGAAG GTATTCCGGG CACGCGGATT 
ATTCAGCGCG ATTTGAGTAA AGCTGCGGTA CCCTTCGCCT ATACCCTAGA GAGCTTTGTT 
GCCGGACAAA CGGCTGACAC CCTGCACGAC GATCATCTGC TGCACAGCAT TGCCCGCCAA 
GCAGGACGAG CACTACGGCG ATTGCACCGG CAACGGATGC CGGGCGCAGG TCGACCGACG 
GTTAGTGGGC GCTGGCCGCG GCTTAGTTGG CGGCATGTGT TGATGGCGAT TGGGCAGCGG 
CTGGCTAGTC CGCCAACCCC GCAATTGATT TTTCAGGCGG AAGAAGTTGC TGTGTTGCAA 
GCGATAGTGC ATGATCGGCT GCTCGATTGC GCAACACCGG TGCTCATTCA TGGCAACTTT 
GGCCCGCAGG CGGTACGCTG TACGGTGGGT GGTCAGTACG TTCATTTGGA GGCATTAGAG 
GAGCCGGGCT GGTTTATCAG CGGTGATGGT TTATTCGATG TGGCCTTGGG GATGTGTGCC 
CATCTCCCGA CGGCGTGGCG CGAAGGTCTC TATGAAGGGT ATTGTAGTGC TGGCGTGTTG 
AATGACAGCG AGCGTGAGCG GTTGCAGATG CTCCGTTTAC TGGCCTGTGC GTGGAGTGCC 
TGTGATCGCT ATGCTCGTGG GTTGCCGCAC GAAGCGGATC TGGAGGAAGC GCAGCGATTG 
ATGCGGGCTA TTATCGTGGC AGATGCGAAA TATCTATCGG CGCAGTGA

Protein sequence

MIISDFRHLN QTVSPAATEL GEAWQRTLSR LGDYTAIVVR ALNLRPQAAT LYRQTERHVL 
VRLTLPTEHV VLRISPEDDL AAHVAFLRGM ALEGIPGTRI IQRDLSKAAV PFAYTLESFV 
AGQTADTLHD DHLLHSIARQ AGRALRRLHR QRMPGAGRPT VSGRWPRLSW RHVLMAIGQR 
LASPPTPQLI FQAEEVAVLQ AIVHDRLLDC ATPVLIHGNF GPQAVRCTVG GQYVHLEALE 
EPGWFISGDG LFDVALGMCA HLPTAWREGL YEGYCSAGVL NDSERERLQM LRLLACAWSA 
CDRYARGLPH EADLEEAQRL MRAIIVADAK YLSAQ