Gene Cagg_0969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0969
Symbol
ID	7268043
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1197231
End bp	1198367
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	57%
IMG OID	643565818
Product	homoserine O-acetyltransferase
Protein accession	YP_002462323
Protein GI	219847890
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0768373
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.579179
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGCAA TTGCTCCGGC GCCAACCTCC GAAGGGGTTG GCTTCGTGCG TACCCAGCGC 
ATGCATTGGA CGACACCGCT GACCCTGACG AGCGGCGTGA CATTGGGGCC GCTGACGATT 
GCCTACGAGA CTTACGGTGA ACTAGCGCCC GACCGCTCGA ATGCCATTCT GATTCTGCAC 
GCTTTGTCGG GTGATGCACA CGCAGCCGGT TATCATAGTC CTACTGATCG CAAACCGGGC 
TGGTGGGATG GAATGATCGG GCCGGGCCGC GCATTTGATA CCAACCGCTA CTTTGTGATC 
TGCTCGAATG TGATCGGTGG CTGCCGCGGT TCGACCGGCC CGTCGAGTCC ACATCCGGTT 
GATGGGAAGC CCTACGGTTC ACGGTTTCCG ATCATTACCA TTGAGGATAT GGTACACGCC 
CAACAACGCC TGATTGATGC CCTTGGGATT GATACCTTGT TGGCCGTAGC CGGTGGTTCG 
ATGGGTGGAT TTCAGGCATT GGCATGGGCG GTCGAGTATC CGCAGCGTGT GCGTGGTGCG 
ATCTTGTTGG CGACGAGTGC GCGTTCGAGT CCGCAGACGG TAGCGTGGAA TTATATCGGC 
CGGCGTGCAA TTATGGCCGA TCCGCGTTGG CGTGGTGGCG ACTACTACGA TGGTGAGCCG 
CCACGTGATG GTTTGGCGGT AGCACGCATG CTCGGTCATA TTACGTATCT CTGTGAGCCA 
AAGTTGGAGC AGCGGTTTGG GCGGCGCGGT GATCCCGGAC CGCTTGACCT TGGGCCACAT 
TTTGCGATTG AACACTATCT TGAGCATCAG GCGGCACGTT TCAACGAACG GTTTGATGCC 
AATTCTTATT TGACGATCAC GCGCGCTATG GACAGTTGGG ATCTTGCGGC GCGCTACGGC 
TCCTTAACAG CGGCGTTTGA TCTGGCACGA GCACGGTTTT TGGCGTTGGC CTACAGCAGC 
GATTGGCTCT ATCCACCGAG CGAGACGTAT CACATGGCAG TAGCGGCACA GGCTGCCGGG 
CGGTCGTTTA CAACGCATCT GATCATGACT GACGCCGGCC ACGATGCGTT TCTGACCGAT 
ATAGCTGCCC AGAGTGTTGT CATTCGGGAA TTTTTGGATC GGTTAGGGTC GGAATAG

Protein sequence

MEAIAPAPTS EGVGFVRTQR MHWTTPLTLT SGVTLGPLTI AYETYGELAP DRSNAILILH 
ALSGDAHAAG YHSPTDRKPG WWDGMIGPGR AFDTNRYFVI CSNVIGGCRG STGPSSPHPV 
DGKPYGSRFP IITIEDMVHA QQRLIDALGI DTLLAVAGGS MGGFQALAWA VEYPQRVRGA 
ILLATSARSS PQTVAWNYIG RRAIMADPRW RGGDYYDGEP PRDGLAVARM LGHITYLCEP 
KLEQRFGRRG DPGPLDLGPH FAIEHYLEHQ AARFNERFDA NSYLTITRAM DSWDLAARYG 
SLTAAFDLAR ARFLALAYSS DWLYPPSETY HMAVAAQAAG RSFTTHLIMT DAGHDAFLTD 
IAAQSVVIRE FLDRLGSE