Gene Arth_0217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0217
Symbol
ID	4447342
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	226224
End bp	227435
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	70%
IMG OID	639688013
Product	major facilitator transporter
Protein accession	YP_829718
Protein GI	116668785
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCAGCGC CCGCTCCCAC CCGGATCCTC GTCGCGGAGG GTGCACCGCG CGGCGGACTC 
GCCGCAATGT GCCTCACCCA GACGACCGCA TGGGGCGTGC TGTACTACGC CTTGGTCGCG 
GCAGTCCCGC GCATCAGCGA GGACACCGGC TGGGGCCCGG CAGGCGTGAC AGGCGCATTT 
TCGGCCGGCC TGCTGGTTTC CGCGGTGGCC GGGATCTTCG TCGGCAGGAT CCTCGACCGG 
ACGGGGCCGC GCACGCTGAT GATCGGCGGG TCCCTCATCG GAGTGCTGGC GCTGGCCATA 
GTGTCGGTTG CACCGAACCT GCCCGTGTTC TTTGCGGCCT GGCTGGTCGC CGGGGCCGCG 
CAGGCCGCCG TGCTGTACCA GCCGGCCTTC ACGGTGATCA GCCGCTGGTA CGGGCCCGCG 
CGCATGCGGC CGCTGACCGT GTTGACCCTC GTCGCCGGGT TCGCATCCAC CATTTTCGCG 
CCCTTCACCG CAGCCCTGAC CGACGCGTTC GGCTGGAGAG GCGCCTTCAT CATCCTCGCC 
GGCACCCTGG GGATCATCAC CGTTCCGCTG CACGCCCGCT TCCTGAACCG GGACTGGGCC 
CCTGCCGCTA TCACGCCACC TGCGGCTGAG CGCCGGGACG CGGTGCGCAC CGTCAGGCGC 
AGTGGTGAAT TCCTTGGCCT GCAGGCCCTC ATGGTCCTGC TGTGCCTGGG TCTTTACACC 
GTGACGCTGA ATGTCATCCC GTTGCTGATC GAAAAAGGAG CCGACTACAC CACGGCCGCG 
CTCGGGCTCG GTCTCGTGGG CGCCGGACAG GTCGGCGGAC GTCTGCTCTT CGGCGCCATC 
CCGCAGGCCG CGCGGCTGCC GGTCATCACC GGTACCGCCA CCGGCGCCGC CCTGCTCCTC 
GCCGTCATGC CCGGGCCGGT GCCCGCACTA ATGGCCGCCG GCATGCTCGC GGGCGCGGTC 
CGAGGGTGCC AGACCCTGCT GCAGGCCACT GTGGTGGCTG ACCGGTGGGG AACCCAACAT 
CTTGGCACTT TGCAGGGACT GTTCGCCGCA CCGCTCACAG CTGTCACCGC CATCGCCCCT 
GCCGCCGGAC CCGCACTGGC AACCTGGCTG GGAAGTTACA CGAACATGGC CTACGCCACG 
GCTGCCGCCA CAGGGACCGC AGCCGTCATT GCCGTCGTCG CCTCACGCCG CCCACGGAGG 
ATCCTTCCCT AA

Protein sequence

MPAPAPTRIL VAEGAPRGGL AAMCLTQTTA WGVLYYALVA AVPRISEDTG WGPAGVTGAF 
SAGLLVSAVA GIFVGRILDR TGPRTLMIGG SLIGVLALAI VSVAPNLPVF FAAWLVAGAA 
QAAVLYQPAF TVISRWYGPA RMRPLTVLTL VAGFASTIFA PFTAALTDAF GWRGAFIILA 
GTLGIITVPL HARFLNRDWA PAAITPPAAE RRDAVRTVRR SGEFLGLQAL MVLLCLGLYT 
VTLNVIPLLI EKGADYTTAA LGLGLVGAGQ VGGRLLFGAI PQAARLPVIT GTATGAALLL 
AVMPGPVPAL MAAGMLAGAV RGCQTLLQAT VVADRWGTQH LGTLQGLFAA PLTAVTAIAP 
AAGPALATWL GSYTNMAYAT AAATGTAAVI AVVASRRPRR ILP