Gene Arth_1788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1788
Symbol
ID	4445687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2003000
End bp	2004301
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	59%
IMG OID	639689606
Product	major facilitator transporter
Protein accession	YP_831278
Protein GI	116670345
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.158886
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGATTG TTGAGCAGAA CCCAGCCCAA CCCCAGACAG CCCCCGGACG CATCCGGCTT 
CAACGTAAAT CCTTGCTCGC CACGGGCGTG GGTAACCTGC TCGAATGGTT CGACTGGACC 
ATTTACACGG TTGCGTCCGT GTACCTAGCG GGCAGTCTCT TTAACTCCGG CAACCCGATG 
TCGTCACTGC TCAGCACACT GGCTGTCTTT GCCGTCGGCT TTCTAATGCG GCCCATCGGT 
GGACTCGTTT TTGGTCCCCT GGCGGACAAA TGGGGGCGCC GTAAAGTGCT GCTCACCACC 
ATGTTCCTCA TGGCCGGTGC CAGTTTGGGA ATTGCCCTGA TTCCGTCCTA CGCGTCGATC 
GGCAGTTGGG CCTCCTTCCT GCTGCTAGTG GCACGGCTGG TCCAGGGCTT TGCCCACGGC 
GGAGAGGCAA CGACGTCGTA CGCATATATC GCGGAGATTG CCCCGCCCAA GCGACGCGGC 
CTGTGGTCCA GCACAGTCTT CATAGCCGTA GGCTCCGGTT CCCTACTCGC CACCTTCTTC 
ATGGCACTCC TTACTGGCGT CCTCAGCAAG ACTGAAATGA TGGAGTGGGG ATGGCGGTTA 
CCCTTCGCCG CTGGTGCCTT GCTCGCTGTG GCTGCATTGT GGTTGCGCCG GGGCATGATG 
GAAAGCGAGC ACGTGGCCAC TGCCCCCGGC GGCAGCGCGG TGACGCCATG GAGTCCCCGT 
CAAGTCTTCC AGGCCGGGGT GAAGCTGTTC CTGTACGAGG CAGGCTCCAC TTTGACCTAT 
TACACCTGGG TGACCTCGGC GGCGATCTAT GCCATTGGCG TCAAGGGGAT GGATCCGGGT 
CAGGCTTTCT TCATGAGCGT GATCGCACAA GTGGTGTACA TTGCGTTCCT GCCGGTTTCG 
GGATGGATCT CGGACCACTG GGGCCGCAAG GCAACGACCC TGATCTCCCT GGTAGGTATT 
GCAGCCACCG TTTTCCCCCT ATGGGGTTTG ATGTCGAGTG AGCCCTGGAC GTTGCTGGTG 
GCTCAGACCG TCGGGCTGTT GCTGGTTGCG TTCATCACAG GGTCTAAACC AGCCGCCATC 
TCCGAGCAGA TCCCGACACG ATACCGCACC CGCATCTTCG GAGTCTCAAT CTCACTGGGC 
GTTGCAGTCT GCGGCGGAAC GGCGTCCTAC CTGAGTACAT GGTTGTACTC CATCGGATCC 
GGTTGGATAT TCAACGTCTA CGTCATCGCT GTCGCAGCAG TATCCAGTGC TGTCGTTCTT 
ACTTGGAAAA ACAACAAAGG CGTCCCATTG GATCAGATTT AG

Protein sequence

MTIVEQNPAQ PQTAPGRIRL QRKSLLATGV GNLLEWFDWT IYTVASVYLA GSLFNSGNPM 
SSLLSTLAVF AVGFLMRPIG GLVFGPLADK WGRRKVLLTT MFLMAGASLG IALIPSYASI 
GSWASFLLLV ARLVQGFAHG GEATTSYAYI AEIAPPKRRG LWSSTVFIAV GSGSLLATFF 
MALLTGVLSK TEMMEWGWRL PFAAGALLAV AALWLRRGMM ESEHVATAPG GSAVTPWSPR 
QVFQAGVKLF LYEAGSTLTY YTWVTSAAIY AIGVKGMDPG QAFFMSVIAQ VVYIAFLPVS 
GWISDHWGRK ATTLISLVGI AATVFPLWGL MSSEPWTLLV AQTVGLLLVA FITGSKPAAI 
SEQIPTRYRT RIFGVSISLG VAVCGGTASY LSTWLYSIGS GWIFNVYVIA VAAVSSAVVL 
TWKNNKGVPL DQI