Gene Ksed_17640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ksed_17640
Symbol
ID	8373269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Kytococcus sedentarius DSM 20547
Kingdom	Bacteria
Replicon accession	NC_013169
Strand	+
Start bp	1837193
End bp	1838545
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	71%
IMG OID	644992029
Product	arabinose efflux permease family protein
Protein accession	YP_003149541
Protein GI	256825581
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.00798573
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.929422
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGCAAC GGGCAAGCAG TGCAGGGACA TGGGTCGTCG TCGCCGGCTA CTTCCTCGTG 
ATGCTGGACA CCACGATCGT GAATATCGCC CTGCCCCACC TCGGCACCGG TCTGTCAGTC 
TCACCGGGTG GCCTGGCGTG GATCATGGAC GCGTACACGC TCGTGTTCGC CGCCCTGCTG 
CTGCCCGCCG GCAGCGCCTG CGACCAGTAC GGGGCGCGCC GCGTCTACCT GACCGGCATC 
GCCGTGTTCG CGCTCGCCTC GATCGCGTGC GCCCTGGCCC CGAACGCTGG CCTGCTCATC 
GCGTCCCGCG CGATCCAAGG TATCGGGGCG GCCGCGGTCG TACCGGCCAC CCTCGCCCTG 
ATCACCGAGC TCTTCACCGA CCCCGCCGCA CGAGCCACAG CGGTCGGACT GTGGGGCGCG 
GCCGGCGGCG TGGCCGCGGC GGTCGGGCCG CTGCTCGGCG GCGTGCTCCT CGACGGAATC 
GGCTGGCGCG CCGCTTTCTG GGTCAACGTG CCCGTCGTCG TCGCCATAGC GATTGGCGCC 
CTCCGGTCTC TGCCCGCCCG TACCGCGAGA CCGGGCCGGC TCGACGCGGC CGGTCAGATG 
CTGGCGATCC TGGCGCTGGC CGGGTTGACG TTCGCGATCA TCGACACCGG CGACCACGGC 
CTCACCGCCC GTGCGGCCGC CGGGTTCGCT GTCGCGGTCC TGGCTGCAGT CGGGTTCGTG 
TGGCACGAGC GCCGCAGCCG GACGCCGATG CTGCCACTGT CGATCTTCTC CGCGCCCGGA 
TTCTCCACGG CGACGGTGGT CGGGTTCGTG CTGAACTTCA GCTTCTTCGG GCAACTGCTC 
GCACTCACCC TGTACATCCA GGACACCCGT GGCCTCGCAC CCGCGATCGC GGGGCTCGTC 
ATGGCCCCGC AAGCACTCGG CGCGATCATC GGCGCCCCGC TCGGCGGCCG CATCACCGCC 
GCACACACCC CACAGCGGGC GATGCTCACC GGCCTCGCGA TCGGCACGGC AGGATTCGCG 
AGTCTGATGA TCTTCGACAC CTCTACCCCT TACCCGGTGG TGGCGATCCT GACATTCGTC 
GCAGGGCTGG GAATGGCGAT CGCGATGCCC GCGGCGACCA GCGCCGCGGT CTCCGCCGCC 
CCGGACACCC TGACGGGGAT CGCCGGAAGC GTGATCAACG CCGCCAGACA GACCGGCAGC 
GTCGTCGGCG TCGCCGTGCT CGGCAGCCTC GCAACCGGGT TCGGCAACAT CACCGGCTTC 
CGAGCCGCAG CCCTCGGAGC GGCGATCGCC TTCGCTCTCG GCCTCGCTCT CGTCCTCTGG 
AACGCCGTGA ACAAGCAGTC GCTCTATTCC TGA

Protein sequence

MGQRASSAGT WVVVAGYFLV MLDTTIVNIA LPHLGTGLSV SPGGLAWIMD AYTLVFAALL 
LPAGSACDQY GARRVYLTGI AVFALASIAC ALAPNAGLLI ASRAIQGIGA AAVVPATLAL 
ITELFTDPAA RATAVGLWGA AGGVAAAVGP LLGGVLLDGI GWRAAFWVNV PVVVAIAIGA 
LRSLPARTAR PGRLDAAGQM LAILALAGLT FAIIDTGDHG LTARAAAGFA VAVLAAVGFV 
WHERRSRTPM LPLSIFSAPG FSTATVVGFV LNFSFFGQLL ALTLYIQDTR GLAPAIAGLV 
MAPQALGAII GAPLGGRITA AHTPQRAMLT GLAIGTAGFA SLMIFDTSTP YPVVAILTFV 
AGLGMAIAMP AATSAAVSAA PDTLTGIAGS VINAARQTGS VVGVAVLGSL ATGFGNITGF 
RAAALGAAIA FALGLALVLW NAVNKQSLYS