Gene Caci_1201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_1201
Symbol
ID	8332536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	1355909
End bp	1356919
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	74%
IMG OID	644954348
Product	homoserine kinase
Protein accession	YP_003111967
Protein GI	256390403
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0083] Homoserine kinase
TIGRFAM ID	[TIGR00191] homoserine kinase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.326603
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAGCC CTGTCTTCCG AGCCGCACCG GTGCGCGTCC GCGTCCCGGC CACCAGCGCG 
AACCTCGGAC CCGGCTTCGA CTCCCTGGGC CTGGCGCTCG GGCTGTACGA CGAGGTGATG 
GTCCGGATAG CCGATTCCGG GCTGCGGGTG GACGTCGCGG GGGAGGGCGC CGACACGGTC 
GCGCGCGACG AGCGGCACCT GGTCGTGCGG GCCATGCGCG CGGCGTTCGA GCGGCTCGGC 
GCGCGGCCGC CGGGGCTGGA GCTGGTGTGC GCCAACCGGA TCCCGCACGC TCGAGGGCTG 
GGCTCCTCGG CGGCGGCGAT CTGCGCCGGG ATCGTCGCGG CGCGGGCCCT GACCGTCGGG 
GCGACGCTGT CCGACGACGC CGTGCTGCAG CTGGCCACCG AGATGGAGGG GCATCCGGAC 
AATGTGGCGG CCTGCCTGCG CGGCGGCTTC ACCATCGCCT GGTTGGACCA AGCGGGTGAA 
ATCTCCGACG CCGTCGGCGC GACCGCGCGG GTGCTGGCGA TCGAGCCCGC GCCGAGCCTG 
CGGGCCGTGG CGTTCGTGCC GGACGAGGGC CTGTCGACCG AGGTCGCGCG GGGTCTGCTG 
CCCAAACTGG TGCCGCACGC CGAGGCCGCG CGCAACGCCG GACGGTCCGC TCTGCTGTCC 
GCTGCGGTCG TGCAGGGGCG CGCCGACCTG CTGCTGGCGG CCACGCAGGA CCGCCTGCAC 
CAGGACTACC GGGCGCCGGC CATGCCGCGG ACCGCGGCGC TGATCGCCGA GCTGCGCGGC 
GCCGGACACG CCGCGGTGGT CTCCGGCGCC GGCCCGACGG TCCTGGTTCT GACGACGGAA 
GACCAGGTCC AGACCGTGAT CGCGGACGGC ATGAAGGTCG CGCCGGCCGG CTGGCAGGCG 
TTCGGCCTCG CAGTGGACAA CGCCGGTGCG GTATCCTTGA ACTCGACCGA AGGCGCGGGG 
CGCGGGTTGG ATTCCGATAA GGATTCAAAC CCACGCCACG GGGGACTGTG A

Protein sequence

MPSPVFRAAP VRVRVPATSA NLGPGFDSLG LALGLYDEVM VRIADSGLRV DVAGEGADTV 
ARDERHLVVR AMRAAFERLG ARPPGLELVC ANRIPHARGL GSSAAAICAG IVAARALTVG 
ATLSDDAVLQ LATEMEGHPD NVAACLRGGF TIAWLDQAGE ISDAVGATAR VLAIEPAPSL 
RAVAFVPDEG LSTEVARGLL PKLVPHAEAA RNAGRSALLS AAVVQGRADL LLAATQDRLH 
QDYRAPAMPR TAALIAELRG AGHAAVVSGA GPTVLVLTTE DQVQTVIADG MKVAPAGWQA 
FGLAVDNAGA VSLNSTEGAG RGLDSDKDSN PRHGGL