Gene Caci_5944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_5944
Symbol
ID	8337306
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	6861628
End bp	6863226
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	69%
IMG OID	644959048
Product	AMP-dependent synthetase and ligase
Protein accession	YP_003116643
Protein GI	256395079
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.420174
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.713256
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCCC AGAATGCGTG GCACCCGAGC GGTGACCAGT CCATTGCCCG GCGCGGTACG 
CTTGCCGACT TGTTGCGTCG TAGTGCTGCG CGGGAGCCTG GCAAGCTGGC GCTCGTCTTC 
GGTGGGGTGC GGCAGACTTT TGCCGAGCTT GATGTGACCG TCAGTCGGGC CGCGAATGCC 
CTTGCTGAGC GGGGTGTGCG GTACGGGGAT CGGGTCCTGT TGCTCGCGCA CAATTCGCAC 
GGCTTCGTCG TCGCCTACTT CGCGCTCGCG CGGCTCGGTG CGGTCTCCGT GCCGGTGAAT 
TTCATGCTGG GTCCCGATGA GATCGCCTAC GTTCTCACGC ATTCCGGCGC CGTCGCGGTC 
ATCGCTGAGG ACGCGCTGGC CGACACCGCT GACCGCGCGT GCCAGGTCGC CGGCATCGTG 
CCTGTCGTCA GGGCCGCGAT CAGTAGCGGC GCCACCGAGA CCCCGGAAGG CTGGCTCGAC 
TTCGAGACCG CCTACCGAAA CGCCTCCGCC GACGAGCCCG ACGCCCCCGT CACCGACGAC 
GACCCCGTCC AGATCATGTA CACCTCCGGC ACGGAGTCAC GTCCCAAGGG CGCCGTCATG 
TCCACCCGGA ACCTGATCGC GCAGTACACC AGTGCCATCG TCACCGGCGC CATGTCCGCC 
GACGACATCG AGGTCCACGC CCTCCCGCTC TACCACTGCG CGCAGCTTCA CTGCTTCCTC 
ACCCCCGACA TCCAGCTCGG CGCCACCAGC ATCGTGCTCC CCGGCGCCGA TCCCGCGACG 
ATCCTGCGCA CCGTCGAGCT GGAGCACGTC ACCAAGCTCT TCTGCCCGCC GACGGTCTGG 
ATCGCCCTGC TGCGCCATCC CGATTTCGAC GCCCGCGATC TCAGTACCCT GCGCAAGGGC 
TACTACGGTG CCGCCGCGAT GCCGGTCGAG GTCCTGGCCG AACTGCGCCG CCGGCTTCCC 
GAGCTGCGGC TGTACAACTT CTACGGCCAG ACCGAGATGT CCCCGGTCGC CACCGTGCTC 
GGTCCGGAGG ACCAGGAACG CAAGCCCGGC TCGGCCGGCC GTGCCGCGCT CAACGTCGAG 
ACCCGCGTGG TCGACGACGC CGGGAACGAG GTCCCGCGCG GCGAGGTCGG CGAGATCGTG 
CACCGCGGCC CGCACACGAT GCTCGGCTAC TGGAACGACC CCGAGCGCAC CGCCGAGGCC 
TTCCGCGGCG GCTGGTTCCA CAGCGGCGAC CTCGGCGTCA TGGACGAGGA GGGCTACCTC 
GCCGTCGTGG ACCGGAAGAA GGACATGATC AAGACCGGCG GGGAGAACGT CGCGAGCCGC 
GAGGTCGAGG AGACCGTCTA CCAGCACCCG GCGGTCGCCG AGGTGGCGGT GTTCGGCGTG 
CCGGATCCGT ACTGGATCGA GATGGTCTGC GCGGCGGTGG TGGTCAAGCC GGGGGAGCGG 
CTGGAGCCGG AGGAGGTCGT CGAGTTCTGC CGGGCGCGGC TGGCGGGGTT CAAGACGCCC 
AAGAAGGTGG TCATCGTCCC CGCGCTCCCG AAGAACCCCT CCGGCAAGGT CCTCAAGCGC 
GAACTGCGCG AGATCCACGC TGCCTCTGAC AGCGCATGA

Protein sequence

MTAQNAWHPS GDQSIARRGT LADLLRRSAA REPGKLALVF GGVRQTFAEL DVTVSRAANA 
LAERGVRYGD RVLLLAHNSH GFVVAYFALA RLGAVSVPVN FMLGPDEIAY VLTHSGAVAV 
IAEDALADTA DRACQVAGIV PVVRAAISSG ATETPEGWLD FETAYRNASA DEPDAPVTDD 
DPVQIMYTSG TESRPKGAVM STRNLIAQYT SAIVTGAMSA DDIEVHALPL YHCAQLHCFL 
TPDIQLGATS IVLPGADPAT ILRTVELEHV TKLFCPPTVW IALLRHPDFD ARDLSTLRKG 
YYGAAAMPVE VLAELRRRLP ELRLYNFYGQ TEMSPVATVL GPEDQERKPG SAGRAALNVE 
TRVVDDAGNE VPRGEVGEIV HRGPHTMLGY WNDPERTAEA FRGGWFHSGD LGVMDEEGYL 
AVVDRKKDMI KTGGENVASR EVEETVYQHP AVAEVAVFGV PDPYWIEMVC AAVVVKPGER 
LEPEEVVEFC RARLAGFKTP KKVVIVPALP KNPSGKVLKR ELREIHAASD SA