Gene Caci_5758 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_5758
Symbol
ID	8337119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	6655507
End bp	6657003
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	68%
IMG OID	644958862
Product	extracellular solute-binding protein family 1
Protein accession	YP_003116457
Protein GI	256394893
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.576382
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.192043
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAATTGTT ACCAGCGCAA TATCTATGAA GCACTGGACA ATCTCCGATG CAAGCGCTTG 
CATTGCCGTC ACTGCGTCGC GGTTCACCAG CACGCGTACG ACACCGGCGA CATGGAAGGC 
GACCACGTGT TTCGATCAGC TTGCCTGCTC GCGGCGGCGG TCGCCGCCAC CACCCTCATG 
ACCGCGTGCT CGAACGGATC CGGCGGGCCC GGCGGTTCCG ACGACTCCGG CCAGACCGGG 
GCGGCGGCTG CGACGCTGAC CGGCGACTGC GCGCAGTACC AGGCGTACGC CGGGCACGCG 
GGCAAGAAGG TGACGATGTT CGCCTCGATC ATCTCGCCGG AGTCGGACTC GCTGCAGCAG 
TCCTGGAAGC AGTTCGAGGA CTGCACGGGG ATCACGATCC AGTACGAGGG ATCGAACGAC 
TTCGAGTCGC AGCTGCCGGT GCGGGTCAGC GGCGGCAACG CCCCCGACCT CGCGGTGATC 
CCCCAGCCGG GGCTGCTGGC GCAGATGGTG GCGAGCGGGC AGGTGGCCAA GCCCTCGGCG 
GGGACGCAGG CGAACGTCGA CAAGTACTGG AACAAGTCCT GGAAGACCTA CGGGACCGTC 
GACGGGACGT TCTACGCCGC ACCGATGTCG GCGAACATGA AGTCGCTCGT CTGGTATTCG 
CCCAAGGCGT TCGCCGCGGC CGGCTACCAA ATACCGACCA CCTGGGAGGC GATGGTGGCG 
CTGTCGAACC AGGTCGCGGC GTCGGGCAAG AAGCCGTGGT GCGCCGGGAT CGGGTCGGGG 
ACGGCGACGG GCTGGCCGGC CACCGACTGG CTGGAGGAGG TCGTGCTGCG CAAGTACGGC 
GGCGCCGTGT ACGACCAGTG GGTCAGCCAC CAGATCACGT TCAGCGATCC GCGCATCGAG 
GACGCGATGA ACACCGTCGC CGGGTGGATG CAGAACCCCG CCTGGGTCAA CGGCGGATAC 
GGGGACGCCA AGACGATCGC GTCCACGTCG TTCCAGGACG CCGGCAAGCC GATCCTCACC 
GGGCAGTGCC TGATGATGCA GCAGGCATCG TTTTACGAGC CGCAGTGGCC GAAGGGGACG 
AAGGTCGGCC CGGACGGCGA CGTCTTCGCC TTCTACCTGC CGGGCATCTC CGCCTCGGTC 
CCGACTCCGG TGGAGGGCGG CGGGGAGTTC GTGACCGCGT TCTCCAGCCG GCCGGAGGTG 
CGGGCCGTCC AGGAGTACCT GTCGACGCCG GGCTGGGCGA CCAGCCGGAT CAAGGTGGCG 
CCGGGCTGGG TGTCGGCGAA CACCGGGGTC GACCCCGCGG TCTACACCGA TCCGATCGAC 
GCCTTGTCGG CCAAATACCT GACCGATCCG AAGGCCACGT TCCGGTTCGA CGCCTCGGAC 
ATGATGCCGG CCGCGGCCGG CTCGGGGGCG GAGTGGACCG CGATGACCGC GTGGTTCGGC 
GAGGGCAAGT CGGTGGCGCA GACCGCCAAG GCGATCGATG ACGCCTGGCC GCGGTGA

Protein sequence

MNCYQRNIYE ALDNLRCKRL HCRHCVAVHQ HAYDTGDMEG DHVFRSACLL AAAVAATTLM 
TACSNGSGGP GGSDDSGQTG AAAATLTGDC AQYQAYAGHA GKKVTMFASI ISPESDSLQQ 
SWKQFEDCTG ITIQYEGSND FESQLPVRVS GGNAPDLAVI PQPGLLAQMV ASGQVAKPSA 
GTQANVDKYW NKSWKTYGTV DGTFYAAPMS ANMKSLVWYS PKAFAAAGYQ IPTTWEAMVA 
LSNQVAASGK KPWCAGIGSG TATGWPATDW LEEVVLRKYG GAVYDQWVSH QITFSDPRIE 
DAMNTVAGWM QNPAWVNGGY GDAKTIASTS FQDAGKPILT GQCLMMQQAS FYEPQWPKGT 
KVGPDGDVFA FYLPGISASV PTPVEGGGEF VTAFSSRPEV RAVQEYLSTP GWATSRIKVA 
PGWVSANTGV DPAVYTDPID ALSAKYLTDP KATFRFDASD MMPAAAGSGA EWTAMTAWFG 
EGKSVAQTAK AIDDAWPR