Gene Caci_6695 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_6695
Symbol
ID	8338059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	7713514
End bp	7715004
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	71%
IMG OID	644959789
Product	Monosaccharide-transporting ATPase
Protein accession	YP_003117382
Protein GI	256395818
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4214] ABC-type xylose transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.159746
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.276743
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGA ACCCGAACCC CGGCGACCCG GGCGGCCCGG GCGGCTCCGA GCACGGCGAG 
GACGCCGCGC CGCTCGGCCT GTCCGGCGCC GGCGACACCG CCGACGAGCG CGGGGCACCG 
GTCGGCAGCC CCCAGTCGGT CACCGGCAAG GTCGAGGAAC TCCTGGCCGC CGGCGCCACC 
CCGGCGGAGG CCACGGCGCA GGCCGCGAAG GCGACCGGGG AGTCCAGGGA GGTCGTCCGG 
GAGATCGTCG AGACGATGGT CCCGGCGGCC GGTTCGGCTG CCGACCCGCG GCTGTTGCAG 
CAACAGGCCG GCCTGGCCGG CTACTGGGCG GCGTTCGTGC GCCGGCTCAA GGGCGGCGAG 
CTCGGCTCGC TGCCGGTGGT CGCGGCGCTG ATCATCATCT GGATCGTGTT CTACGCCCTG 
AACAGCACAT TCCTGTCGGC GCAGAACCTG TCCAACCTCT CCCAGCAGAT CGTCGGCACC 
GGGATGATCG CCCTGGGCAT CGTCTTCGTG CTGCTGCTCG GCGAGATCGA CCTGGCGGCG 
GGCTCGGTGT CGGGTCTGGC GGCCGCGGTG TTCGCCGTGG AGTCGGTGAA CAACGGGGTC 
AACCAGTATC TGGCGCTGCT GCTGGCCCTG GCCACCGGCG CCGGGACCGG GTTCGTCCAC 
GGCTTCTTCT TCGCCCGGAT CGGCGTGCCG GCGTTCGTCG TCACCCTGGC CGGCAACCTG 
GGCTGGAACG GCCTGATGCT CAACATTCTG GGCTCCACCG GCACCGTCAA CCTGCCCAAC 
AACGGCATCG TCTCCAAGCT CTACAACACG ATCTACGGCC AACTCGCCGC GGCGTACGGC 
GCCGCGATCA TCGCGGTCGT GCTCTACGCG CTGGTGGCCC TGTACGGCCG GGCGCGCCGG 
GTCAGGGCCG GGATCCCGGC GCCGCCGATC GGCGAGATCG CGGCGCGGGT GGTCCTGCTG 
GCGATCGTCG CCTTCCTCAC GGCCTACGTG TTCAACCAGT ACAAGGGCCT GCCGCTGGCG 
CCGCTGATCT TCCTGATCTT CATCGTGGTC GGCGACTTCA TCCTGCGCCG CACGGTCTAC 
GGCCGCCGCA TCTTCGCCGT CGGCGGCAAC ATCGAGGCCG CCCGGCGGGC CGGTATCAGC 
GTGCCGTTCA TCCGGCTCAC GGTCTTCATG ATCAGCGGCC TGATGGCCGC GGTCGGCGGT 
CTGTTCCTGG CCGGCCAGAT CGAGTCCGCC TCCCAGACCT CCGGCGGCGG CAACCTGCTG 
CTGAACGCGA TCGCCGCGGC GGTCATCGGC GGCACGAGCC TGTTCGGCGG ACGCGGCAAG 
ACCTGGTCGG CGCTGCTCGG TGCGCTGGTC ATCGGCTCGA TCCAGTCCGG CATGAACATC 
CAGGGCCTGT CGAACAGCAT CCAGTTCATG GTCACCGGCG CCGTGCTGCT GGCCGCGGTG 
GTCATCGACT CCGTGGCGCG GCGGACGCAG AAGGCGAGCG GTCGCGTTTA G

Protein sequence

MSQNPNPGDP GGPGGSEHGE DAAPLGLSGA GDTADERGAP VGSPQSVTGK VEELLAAGAT 
PAEATAQAAK ATGESREVVR EIVETMVPAA GSAADPRLLQ QQAGLAGYWA AFVRRLKGGE 
LGSLPVVAAL IIIWIVFYAL NSTFLSAQNL SNLSQQIVGT GMIALGIVFV LLLGEIDLAA 
GSVSGLAAAV FAVESVNNGV NQYLALLLAL ATGAGTGFVH GFFFARIGVP AFVVTLAGNL 
GWNGLMLNIL GSTGTVNLPN NGIVSKLYNT IYGQLAAAYG AAIIAVVLYA LVALYGRARR 
VRAGIPAPPI GEIAARVVLL AIVAFLTAYV FNQYKGLPLA PLIFLIFIVV GDFILRRTVY 
GRRIFAVGGN IEAARRAGIS VPFIRLTVFM ISGLMAAVGG LFLAGQIESA SQTSGGGNLL 
LNAIAAAVIG GTSLFGGRGK TWSALLGALV IGSIQSGMNI QGLSNSIQFM VTGAVLLAAV 
VIDSVARRTQ KASGRV