Gene Caci_5603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_5603
Symbol
ID	8336963
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	6459093
End bp	6460223
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	68%
IMG OID	644958707
Product	ABC transporter substrate-binding protein
Protein accession	YP_003116303
Protein GI	256394739
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.069875
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.939883
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTCTG CCATATCCAA GAAATCGGCT GCGACGAAGA TGCTGATCGT GGCCGCCGCC 
GGCGCCCTGA GCCTGACCGC GCTGAGCGCC TGCTCGTCCT CGAAGAGCTC GAGCAGCTCC 
GCGGCCTCCG GCACCGCCGG CGTCTCGAAG ACCACGCAGC ACGTCACGCT GATGGTCGGC 
GGCATCGACA AGCAGATCTA CCTGCCCTAC AAGCTCGCCG ACCAGCTCGG CTTCTACAAG 
AAGTACAACG TCGACGTCAC GCTGAGCACC GAGCAGGACG GCGGCGTCGG CGCCGAGGAG 
GCCATGGTCT CCGGCCAGGT CGACATGGCC GGCGCGTGGT ACAACCACGC GATCGACTTC 
CAGATGAAGC ACAAGAACGT CGAGGACCTC GTGCAGCTCT CCGGTGCCCC CGGCGAGCGC 
GAGATGTGCG GCAACAAGGC CACTGTGCAC ACCGGGGCAG ACTTCGCGGG CAAGACGATG 
GGCGTCACCG ACCTGGGCTC GGGCACCGAC ACCCTGACCC AGCTGATCGC GGCGCAGAGC 
GGCGTGGCCA AGAACAAGTT CAGCCGCACC GGCGTCGGCG CCGGCTCCAC GGCGCTGGCC 
GCGCTGAAGA ACGGCTCCAT CTCCTGCGTC ATGACCACCC AGCCGACGGT CACCGCCATC 
GAGAAGCAGA ACCTCGGCTA CTCCGCGATC GACCTGGCCA CCACCGAGGG CGCCACCAAG 
GCCCTGGGCG GCGCGTGGCC CGCGGCCGGC GTGCTGGCCC GCACCGACTG GGCCAACCAG 
CACCAGGAGG CCGTGCAGGA CGTGGTGGAC GCCCTGGTGG CCACCATGCA CTGGATCAGC 
ACGCACTCGG CGACCGACAT CGCCAACGCC CTGCCGGCGA GCTACACGAA CAACGCGATC 
ATCTCCAAGG CCGACTACAT CGCCGGCCTG ACCATGGACA AGAGCCAGTT CCTGCCCGAC 
GGCATCATGC CCGCCGGCGG CCCGAAGGTG GTCCTGACCA CCGAGAAGCT GATCGGCAAC 
GCCGACGACT CGGTGAACCT CGGCGCCACG TTCACGAACA CCTACGCGAT CAAGGCCAAC 
CAGCTCGAGG GCTTCACGAC CACCACGACG CCGGCCGGTC CCACCGGCTG A

Protein sequence

MSSAISKKSA ATKMLIVAAA GALSLTALSA CSSSKSSSSS AASGTAGVSK TTQHVTLMVG 
GIDKQIYLPY KLADQLGFYK KYNVDVTLST EQDGGVGAEE AMVSGQVDMA GAWYNHAIDF 
QMKHKNVEDL VQLSGAPGER EMCGNKATVH TGADFAGKTM GVTDLGSGTD TLTQLIAAQS 
GVAKNKFSRT GVGAGSTALA ALKNGSISCV MTTQPTVTAI EKQNLGYSAI DLATTEGATK 
ALGGAWPAAG VLARTDWANQ HQEAVQDVVD ALVATMHWIS THSATDIANA LPASYTNNAI 
ISKADYIAGL TMDKSQFLPD GIMPAGGPKV VLTTEKLIGN ADDSVNLGAT FTNTYAIKAN 
QLEGFTTTTT PAGPTG