Gene Caci_4219 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4219
Symbol
ID	8335573
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	4784254
End bp	4785453
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	73%
IMG OID	644957322
Product	ABC transporter related
Protein accession	YP_003114924
Protein GI	256393360
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.116014
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCCG CGACCTCTGC CTCCCCACCC TCGCCGCGCG CCTCCGCGCC GCGCCGGCCC 
GACTCCCAGC TGGGCCGGCT GAGCCTGCGC GGCGTCAGCC GGGCCTACGG CGCCCACACC 
GCGCTGCACC CGCTGGACCT GGACATCACC GGCGGCGAGT TCATCGCGCT GCTCGGACCC 
TCCGGCTGCG GCAAGACCAC GGCGCTGAAC TGCCTGGCCG GACTGCTGCC GCTGACCGCC 
GGCGAGATCG AGTTGGACGG CCGCCGCGTC GACACGCTGC CGCCGGAGAA GCGCGGCTTC 
GGCATGGTGT TCCAGAACTA CGCGCTGTTC CCGCACCTGA CCGTGCGCGC GAACGTCGCC 
TTCGGCCTGA AGATGCGCGG CGTGGCCAAA GCAGAGATCG AACGCCGCGT CGCCGAGGTG 
CTGAGCCTGG TCCAGCTCAG CGAGCACGCC GCCAAGCACC CGGCGCAGCT GTCCGGCGGC 
CAGCAGCAGC GGGTCGCGAT CGCCCGCGCC ATCGTGACCG AGCCGGCGCT GGTGCTGATG 
GACGAGCCGT TGTCGAACCT GGACGCGGCC CTGCGCCTGA CGATGCGCGG CGAGATCCGG 
CGCATCCACC AGGACTTCGG GCTGACCACG GTGTACGTCA CGCACGACCA GGAAGAAGCG 
CTGTCGCTGG CAGACCGGCT CGTCGTGCTG CACGACGGGC GCGTCAGCCA GATCGGCACG 
CCGGCCGAGC TGTACGAGCG CCCGGCCGAT CCGCACGTCG CGGCGTTCAT GGGGTATCGC 
AACCTTCTGC CGCTGCGGGT CAGCTCGGTC GACGGCTCGA CGGTGGTCGC CGAGGGCGAC 
GGGCTGCGCG TGGTCGGCAC GGCGGCCGGC GAGCCGCTGC TGGTCGGGCA GGACGCCCTG 
GTCGCGATCC GGCCGGAGGA CTTGCGACCG GCAGCCGAGG GCGAGAGCGC CGTCGGCGAG 
GCGGTCGCGG AGATCGTCGA GTACCACGGC CGCGTGCTGC ACGTGGAGGC GGCGACCGCC 
GAGGGCCGGC GGCTGCACCT CAAGGCGCAC GAGTCGGTAC GCCCCGGCGA TCGGCTGCGG 
GTCGCCGTGG ACGCCGAGCG GGCTCTGGTC TTCCGGTCTG AGGGAGCGTT GCTCCTGGAG 
GTAGAGACAG AGGCTGCAGG CGTTACGGCA CAAGGCGAAC CGGAGGCGCA GGCCTCATGA

Protein sequence

MTAATSASPP SPRASAPRRP DSQLGRLSLR GVSRAYGAHT ALHPLDLDIT GGEFIALLGP 
SGCGKTTALN CLAGLLPLTA GEIELDGRRV DTLPPEKRGF GMVFQNYALF PHLTVRANVA 
FGLKMRGVAK AEIERRVAEV LSLVQLSEHA AKHPAQLSGG QQQRVAIARA IVTEPALVLM 
DEPLSNLDAA LRLTMRGEIR RIHQDFGLTT VYVTHDQEEA LSLADRLVVL HDGRVSQIGT 
PAELYERPAD PHVAAFMGYR NLLPLRVSSV DGSTVVAEGD GLRVVGTAAG EPLLVGQDAL 
VAIRPEDLRP AAEGESAVGE AVAEIVEYHG RVLHVEAATA EGRRLHLKAH ESVRPGDRLR 
VAVDAERALV FRSEGALLLE VETEAAGVTA QGEPEAQAS