Gene Arth_2289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2289
Symbol
ID	4445332
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2574632
End bp	2576008
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	65%
IMG OID	639690098
Product	major facilitator transporter
Protein accession	YP_831769
Protein GI	116670836
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.21518
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATCTG CACCCGCAAC CCGAATCCCG CCACATGACG CCCAGGGCAC GACACCGCGC 
AAAACCCCGG GCAAGGCAGC CTTGGCGTCA TTCCTCGGCA GCACTCTGGA GTACTACGAC 
TTCTTCATCT ACGGAACCGC CGCCGCCCTC GTGTTTCCGC ACCTTTTCTT CCCTTCCGCC 
GACCCCGCCA TCGGCCTGAT CGGCGCCTTC GCCACCTTCG GCGTCGCCTA CGTAGCCCGG 
CCGGTGGGCG GGCTGGTGAT GGGCCACTTC GGCGACAAGC TGGGCCGGAA GAAGATCCTG 
CTGCTGACCT TGGGCATCAT GGGCCTGGCA TCGCTGGGCA TCGGATTCCT GCCCACCTAC 
GAACAGGTCG GCGTCTGGGC ACCGGTCCTC CTGGTGGCGG GGCGGCTGGC ACAGGGCTTC 
TCCGCCGGTG CGGAGTCGGC CGGCGCTTCC ACCCTCACCC TGGAACACTC GCCCGAAGGT 
AAACGCGGCT TCTTCACCAG CTTCGTGATG ACCGGCTACG CCTCCGGCAT GGTGCTGGCC 
ACCCTCGTGT TCATTCCGGT CACGGCCCTG CCGCAGGAAG CAATGATGAG CTGGGGCTGG 
CGCATCCCGT TCTGGCTCTC CATCGTGGTC CTGGCCATCG CCTACTGGGT GCGGACGCAC 
CTGGACGAAA CTCCGGTCTT CGAAGAGGCC CAGGAACACC GGAAGGTCGC CCCGATGCCG 
CTCAAGGAAG TGCTTAAGTT CCAAGGCCCT GATGTGATGC GCGTTGTGGG AATGTCGATC 
ATGTCCGTCA TGCAGACCAT CTTCACCGTT TTCGGCCTGG CGTATGCCAC CTCCACGGCA 
GGCTTTGACC GGGCCTCCAT CCTGACCGTC AACGCCGTCG CCATCGGGCT GTCCATGTTT 
GCCATGCCGG TGGCGGCCAG ACTTTCGGAC CGGATCGGCC GCCGGCCCGT GCTGCTTACG 
GCCGCGTTCG GGTGCTCAGC CACGATCTTC CTGTACTTCC TTGCACTGTC CTCCGGCAAC 
ATCGTGCTGG TCTTCCTGGC GGCTTTCCTG AACATGACGC TGCTGTACTC GGGCTTCAAC 
GGCATCTGGC CCGCATTCTT CGCGGAACAG TTCGCCGCAC CGGTCCGCTA CACAGGCATG 
GCGATGGGAA ACCAGCTGGG ACTCGTCCTG GCCGGCTTCG CCCCGATGAT TGCCGGCCTG 
CTCCTGACCC CGGGCGTCAC CGGCTGGGTT CCCGTGGCTG TGTTCGGCAC GGTGTGCATG 
CTCATAGCTG CAGCCTCGGT GTACTACTCC CGTGAGACGT TCAAAACGCC GATCGGGGAG 
CTGGGTGCTC CGTACCTGGC CGGTACCGCC GCCCGGCGGG ATCTGCAAAA CCATTGA

Protein sequence

MQSAPATRIP PHDAQGTTPR KTPGKAALAS FLGSTLEYYD FFIYGTAAAL VFPHLFFPSA 
DPAIGLIGAF ATFGVAYVAR PVGGLVMGHF GDKLGRKKIL LLTLGIMGLA SLGIGFLPTY 
EQVGVWAPVL LVAGRLAQGF SAGAESAGAS TLTLEHSPEG KRGFFTSFVM TGYASGMVLA 
TLVFIPVTAL PQEAMMSWGW RIPFWLSIVV LAIAYWVRTH LDETPVFEEA QEHRKVAPMP 
LKEVLKFQGP DVMRVVGMSI MSVMQTIFTV FGLAYATSTA GFDRASILTV NAVAIGLSMF 
AMPVAARLSD RIGRRPVLLT AAFGCSATIF LYFLALSSGN IVLVFLAAFL NMTLLYSGFN 
GIWPAFFAEQ FAAPVRYTGM AMGNQLGLVL AGFAPMIAGL LLTPGVTGWV PVAVFGTVCM 
LIAAASVYYS RETFKTPIGE LGAPYLAGTA ARRDLQNH