Gene Arth_1989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1989
Symbol
ID	4445468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2243691
End bp	2244869
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	68%
IMG OID	639689798
Product	major facilitator transporter
Protein accession	YP_831470
Protein GI	116670537
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.143925
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCGGTG AACTGGGCCG CCGTTCAGCG CTGGCACTTC TCCTTCACTC GACTCTGATC 
CAGGCCGTGA CCTTCCTGGT CCGGCCGGCA ACCACTTACC GGGCGCTGGA ACTGGACGTG 
CCGGGATATG CCCTGGGCCT CCTCGCGGCC AGCTACGCCG TTTTTCCCCT GCTCCTGGCA 
GTCCCAACCG GCGCCCTCGT GGACCGGTTA GGTGAGAGGC GGCTCATGGT GACCGGGTCC 
GCCGTCGTAC TTGGTTGTTC CCTTTTCCTG CTGTTTTGGG GGACCTCAGT CCCTGCGTTG 
GTTGGCGGTA CGGCGCTGCT TGGCGCAGGA CAGCTGGCGT GTGTCGTGGG GCAGCAGGCT 
GTCGTCGCAA ACAATGCCGT GGCGTCAGGG CTTGACTCCG CGTTCGGATA CCTGACCTTC 
GCGGCGTCGT TGGGCCAGGC GCTGGGCCCG CTGGCAATCT CCGTGGTTGG TGGAGCCTCC 
GTCCGTCCGG ACACGCAGGC AATCTTCTTC CTCTCGGCCG GCATGAGCCT GGTTCTCTTC 
CTCACCACCT TCCTCATCTC GACGAAGGCC ACCGGAAGGA AGTCCGGTGC CGCAGCAACA 
GACGGCCCTA AAGGAAGTGT TGCATCGCTG CTCAGGACGC CGGGGCTGGT CCGGGCACTG 
GCTACCAGCG CCACGGTGCT GGCCGTGGTG GACCTGACCG TGGTCTACCT GCCGGCACTC 
GGCACGGAGC GGGGGTTCAG TGCGGCCGCA GTGGGCCTCA TGCTCGCGGT GCGGGCCGGG 
TTCTCGATGG TTTCGAGGCT GGGGCTCGGG CGCCTGTCCC GGAGGTTCGG CCGGGGGCGG 
CTCATGGCTT CAAGCCTCGC GCTTTCCACC GTCGCACTGG CCGTCGCCGC GATTCCGATG 
CCGCAGTGGC TCCTCTTCAT GGTGATGGCC GGGCTGGGCC TCGGGCTGGG CATCGGCCAG 
CCGCTGACCA TGTCCTGGCT TTCGGCGCAG GCCCCGGACG GCCAGCGCGG AAAGGCCCTG 
GCCCTGCGGC TTGCCGGGAA CAGGGTGGGC CAGGTGGTCC TGCCCAGCGC CATCGGGGTT 
GTGGCGGCTG GGCTCGGGGC GGCCGGGGTG TTCCTGGCGT CAGCGGTCGT TGTGGGCGGA 
ACGCTTCTGC TGGTCCGCGG CGTGCGCCTG GACGACTAA

Protein sequence

MIGELGRRSA LALLLHSTLI QAVTFLVRPA TTYRALELDV PGYALGLLAA SYAVFPLLLA 
VPTGALVDRL GERRLMVTGS AVVLGCSLFL LFWGTSVPAL VGGTALLGAG QLACVVGQQA 
VVANNAVASG LDSAFGYLTF AASLGQALGP LAISVVGGAS VRPDTQAIFF LSAGMSLVLF 
LTTFLISTKA TGRKSGAAAT DGPKGSVASL LRTPGLVRAL ATSATVLAVV DLTVVYLPAL 
GTERGFSAAA VGLMLAVRAG FSMVSRLGLG RLSRRFGRGR LMASSLALST VALAVAAIPM 
PQWLLFMVMA GLGLGLGIGQ PLTMSWLSAQ APDGQRGKAL ALRLAGNRVG QVVLPSAIGV 
VAAGLGAAGV FLASAVVVGG TLLLVRGVRL DD