Gene Caci_4301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4301
Symbol
ID	8335655
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	4880095
End bp	4881192
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	67%
IMG OID	644957404
Product	aliphatic sulfonates family ABC transporter, periplsmic ligand-binding protein
Protein accession	YP_003115006
Protein GI	256393442
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.389589
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0000586034
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAGAGACA TCAAGACTCT GATTCGTACG GTCGCGGCGG TCGGTGCCGC CCTCGGGATC 
GTCGCCTCGG CCGCCGCGTG CGGGTCGTCG AAGAGCTCTG CCTCGAGTAC GAAGGCCGCG 
GCCGTCTCCA GCGGCTCGGC CGCCACGCAG GTGCGCCTGG GCTACTTCGC CAACGTCACG 
CACGCCACCG CCGTGGTCGG CGTCGCACAC GGCGACTTCG CCAAGGCACT GGGCTCCACC 
AAGCTCTCCA CGCAGGTCTA CAACGCCGGA CCCGCCGAGA TGACCGCCGT CCTCGGCGGA 
CAACTGGACG CCGCCTACGT CGGACCGTCC TCGGCCCTGT CCGCCTTCGT CCAGTCGCAC 
GGCGAGGCCC TGAAGATCGT CGCCGGCGCC ACCGAAGGCG GCGCGGAACT CGTGGTCAAG 
CCCTCAATAG CCTCCGCGGC GGACCTCAAG GGCAAGACCC TCGCAACGCC GCAGAAGGGC 
AACACCCAGG ACGTGGCCCT CCGCTTCTGG CTCAAGCAGC AGGGCCTGAC CGCCAACCCG 
GACGGCTCCG GCGACGTATC GGTGAACCCC CAGGACAACG CCACCACCCT CGACCAGTTC 
AAGGCCGGCC ACATCGACGG CGCCTGGCTC CCCGAACCCT GGGCCTCCCG CCTGGTCGAA 
GAAGCCGGCG CGAAGGTCCT CGTCGACGAA CGCAGCCTGT GGCCCAACAG CCAGTTCTCC 
ACCACCACCC TCGTCGTGGC GACCACCTTC CTGACCAAGC ACCCCGACAC AGTCAGGGCC 
CTGATAGACG GCCAAATCGC CGCCAACACC TGGATCACCT CCAACCCCGC CGACGCCCAA 
AAACTGGTCA ACAGCGAACT CAAGCGCCTC ACCGGCAAAG CCCTGACCGA CGCCGAAATC 
CAGCGCTCCT TCAGCGAACA GAAGGTCACC AACAACCCCG ACGCATCAAC CCTCCAGACC 
TCCCTGGACC ACGCAGTCGC AGTCAACCTC CTGAAGTCCA CCGACCTCCA CGGCATCTTC 
GACCTCTCGA TCCTCAACGC CGAACTCACC AAGAACGGCC AGCCGACCGT CTCCGACGCC 
GGACTGGCAA AGAAGTGA

Protein sequence

MRDIKTLIRT VAAVGAALGI VASAAACGSS KSSASSTKAA AVSSGSAATQ VRLGYFANVT 
HATAVVGVAH GDFAKALGST KLSTQVYNAG PAEMTAVLGG QLDAAYVGPS SALSAFVQSH 
GEALKIVAGA TEGGAELVVK PSIASAADLK GKTLATPQKG NTQDVALRFW LKQQGLTANP 
DGSGDVSVNP QDNATTLDQF KAGHIDGAWL PEPWASRLVE EAGAKVLVDE RSLWPNSQFS 
TTTLVVATTF LTKHPDTVRA LIDGQIAANT WITSNPADAQ KLVNSELKRL TGKALTDAEI 
QRSFSEQKVT NNPDASTLQT SLDHAVAVNL LKSTDLHGIF DLSILNAELT KNGQPTVSDA 
GLAKK