Gene Caci_4723 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4723
Symbol
ID	8336077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	5386679
End bp	5387920
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	74%
IMG OID	644957823
Product	major facilitator superfamily MFS_1
Protein accession	YP_003115425
Protein GI	256393861
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0900603
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCGTGA CCACAGTCGA ACATCAGGGA CACCTGCCCG GTACCGCCGA ATACCGCCGT 
GTCCTCACCG CCCTGTTCGC CGCCGGCATC GCCACCTTCG TCCTGCTCTA CGACACCCAG 
GCGCTGCTCC CCGACCTCGC GCACGCCTTC CACGTCTCCC CGGCCGAAAG CACGCTCTCG 
GTCTCGGCGA CCACCGTCGG CCTGGCCGTG GCGCTGCTGG TGTTCGGACC GCTGTCCGAA 
GCGCTGGGTC GCACGGTCCT GATCCGCTTC TCCATGGCCG CCTCGGCGGT GCTGGCGCTC 
GCCTGCGCGG CGGCTCCCAC CTGGGACTCG CTGATCGCGA TCCGGCTGCT GGCCGGGGTG 
GCGCTCGCGG GTCTGCCGGC GGTCGCCACC GCCTACCTGC GCGAGGAGAT GCACCCCTCG 
GCGCAGGCGC GCGCCGCAGG GCTCTACATC GGCGGGACCG CGATCGGCGG GATGGCGGCG 
CGGCTGGTCA CGGCGCCGAT CGCCGAGGCG GCGGGGTGGC GGTGGGCGCT GCTGGCCGCT 
GCGGCGCTGT CCACGGCGTG CGCGGTCGTC GTCGCGGTCA CCCTGCCGCC GTCGCGCCAC 
TTCGTGGCGA CCCGGCTGCG CGGCCGGACC GTGCTCGCGA TGCAGCGCCG GGCCCTGGCG 
GACCCGGCGC TGCTGGCTCT GTACGCGCTC GGCGCCTGCG CGGTCGGCGC GCTGGTGGCG 
GTGTTCAACG CGGTGGGCTT TCGGCTCACC GCCGCGCCGT TCCACCTGGG GGTCGGGCTG 
GTGAGCCTGA TATTCCTGAC CTACTCGCTG GGGACCGTCA GCTCGACGGT GTCCGGGCGG 
CTGGCCGACC GGCTCGGGCG GCGGGCGATC GCGCCGATCG GGTGCGCGGT CGCCTTCGGC 
GGGGTACTGC TGACGCTGAC CGGCTCGCTG CCGGTGGTGA TCGTCGGGAT CGCGGCGCTG 
ACCGTCGGGT TCTTCGCCGT GCACGGCCTG GCCAGCGGCT GGGTGACGGC GCGCTCGCAC 
GCCTCCGGCG CCAGTCCCAG CCAGGCCGCG GCGTTCTATC TGTTCTCGTA CTACGTCGGC 
TCGTCGGTCT TCGGCAACAT GGGCGGCCGG GCCTGGTCGG CCGACGGGTG GCCGGGCGTG 
GTCACGGTAG CGGGCTCGTT GCTGGGGATC GCTGGAGTAC TAGCGCTGGC GCTGCGTCGG 
ATCCCGCCGC TGGTCCCGCC GTCGCCGGCG GCCGTGCCGT GA

Protein sequence

MPVTTVEHQG HLPGTAEYRR VLTALFAAGI ATFVLLYDTQ ALLPDLAHAF HVSPAESTLS 
VSATTVGLAV ALLVFGPLSE ALGRTVLIRF SMAASAVLAL ACAAAPTWDS LIAIRLLAGV 
ALAGLPAVAT AYLREEMHPS AQARAAGLYI GGTAIGGMAA RLVTAPIAEA AGWRWALLAA 
AALSTACAVV VAVTLPPSRH FVATRLRGRT VLAMQRRALA DPALLALYAL GACAVGALVA 
VFNAVGFRLT AAPFHLGVGL VSLIFLTYSL GTVSSTVSGR LADRLGRRAI APIGCAVAFG 
GVLLTLTGSL PVVIVGIAAL TVGFFAVHGL ASGWVTARSH ASGASPSQAA AFYLFSYYVG 
SSVFGNMGGR AWSADGWPGV VTVAGSLLGI AGVLALALRR IPPLVPPSPA AVP