Gene Caci_6242 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_6242
Symbol
ID	8337605
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	7179277
End bp	7180512
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	67%
IMG OID	644959343
Product	homoserine O-acetyltransferase
Protein accession	YP_003116937
Protein GI	256395373
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0424143
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.823707
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACAAAC CCGCCACGGT GCCGCCGACC GGCTCGGTCG GCACCGTCGA GACGCGGTTC 
CTCGACCTGC CCGAACCGGT CCCGCTGGAA TGCGGCCGGG AACTGAGCGG AGTGCGGGTC 
GCCTACGAGA CGTACGGGAG CCTGTCCCCC GCGCGTGACA ACGTCATTCT GATCTGTCAC 
GCCTTGAGCG GGGACGCCCA CGCCGCCGGG ATATCCGCGG CCGCAACCAC GACGGCAGGC 
ACGCGCGACG GCTTCGCCGC CGAGGACCGC GACGGCAGCG CCGGAGCGAG CCTGGGCTGG 
TGGGACGGGA TGATCGGGCC CGGCAAGGCC TTCGACACCG AGCGATACTT CATCATCTCC 
ACCAACTTGC TGGGCGGATG CCGCGGGACG ACCGGACCGC GATCGACGAA CCCTGGCACC 
GGGCTCCCCT ACGGACCGGA CTTCCCGGTG ATCACCGTCG CGGACATGGT GCGGACCCAG 
CGACGCTTTC TGGACCGGCT CGGCATCGAA CGCCTCGCGG CGGTCGCGGG CGGATCCCTT 
GGCGGTATGC AGGCGCTGGA ATGGGCTGTG CTGTTCCCGG ATCAGGTCGA CGCGATCGTG 
GTCATAGCGT CCACGCATGC CCTGCATCCG CAAGGGGTGG CGTGGAACGC AATCGCCCGC 
GAAGCCATCA TGGGCGACCC GGCGTGGCAG GGTGGCCGCT ACCACGGGAC CGGCCGGACG 
CCTGACGCCG GCATGGGTGT GGCGCGCATG GTCGGGCATG TCACCTACCT GTCGGGTCCT 
GCGCTGGAGG CGAAGTTCGC CCGGCGGTTG CAGGCCTCCG AGCAGATCCG CCACACCCTC 
ACCGAGCCTG AGTTCGCGGT TGAGAGCTAT CTGAACCATC AGGCTGCCTC GTTCGTGAAG 
CGGTTTGATG CGAACACTTA TCTATACATG TCGCGCGCGC TGACGTACTT CGACCTGGCG 
CGCCAGCACG GCGACGGCTC GTTGAAGCAC GCGCTGGAAG GCGTCTTGGC GCGGACGCTG 
CTCATCGCGT TCAGCTCGGA CTGGCTGTAT CCGCCTTCGG CTTCGGACGA GATCGCCGAT 
GCGTTGCGCT CGCTCGGCAA GCCGGTGGAC TACCACTTGA TCGAGGCGCC GTACGGGCAC 
GACAGTTTCC TGCTTGAGGA AGCACGCCAG ATTCCCATCG TCCGCCAGTT CCTGGAGGAT 
GGGATCCAGA CGACGATGAG GACTGCGACT CCATGA

Protein sequence

MHKPATVPPT GSVGTVETRF LDLPEPVPLE CGRELSGVRV AYETYGSLSP ARDNVILICH 
ALSGDAHAAG ISAAATTTAG TRDGFAAEDR DGSAGASLGW WDGMIGPGKA FDTERYFIIS 
TNLLGGCRGT TGPRSTNPGT GLPYGPDFPV ITVADMVRTQ RRFLDRLGIE RLAAVAGGSL 
GGMQALEWAV LFPDQVDAIV VIASTHALHP QGVAWNAIAR EAIMGDPAWQ GGRYHGTGRT 
PDAGMGVARM VGHVTYLSGP ALEAKFARRL QASEQIRHTL TEPEFAVESY LNHQAASFVK 
RFDANTYLYM SRALTYFDLA RQHGDGSLKH ALEGVLARTL LIAFSSDWLY PPSASDEIAD 
ALRSLGKPVD YHLIEAPYGH DSFLLEEARQ IPIVRQFLED GIQTTMRTAT P