Gene Arth_4096 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4096
Symbol
ID	4447686
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4618002
End bp	4619201
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	70%
IMG OID	639691927
Product	major facilitator transporter
Protein accession	YP_833571
Protein GI	116672638
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCACAG CGCCAATCCC CACGCCGACC GCAGCCGTCA CCGCGCCACT GTACGCCGCA 
GGCTTTGTCA CAGCCTTTGG TGCCCACAGC ATCGCAGCCG GGATGGGCGC CCACAGCGGT 
GATATCGGCC TGAGCCTGCT CAATCTGGGC GTCCTCCTGG CTGTTTACGA CCTCGCCGAG 
GTGGTGCTGA AACCGGTCTT CGGAGCTTTG AGCGACCGCA TCGGCACAAA GCCGGTGGTC 
GTGGCAGGGC TTTTCGCGTT TGCGCTGATG TCGTTGATCG GATTGTGGGG CTCCAACCCC 
CTGATGCTCG GGCTCGCCCG GATCGGCCAG GGCGCCGCCG CCTCGGCGTT TTCCCCGGCG 
TCCTCGGCGA TGGTGGCCAG GCTTGCCGGC CGCAACGCAG GAACGTATTT CGGCCGCTAC 
GGCTCGTGGA AAAGCCTGGG CTACGTCGCG GGCCCGCTGA TCGGTGCCGG CCTGATCTTC 
CTGGGCGGCT TCACCCTTCT CTTTGCCGCC CTGGCCATCC TCGCGGCGGC CACTGCGGTG 
TGGGCGATGG TGACGCTGCC GCAGCTGGCC CCTCTGCCCC GCCCGCGGTA CACGCTGTTG 
GATCTTGCCC GCCAGGTAAC CCATCGGAGC TTCCTCGTGC CTACGCTCGT TCTTGCGGCA 
GCCACCGGGG CCCTGGGCAC AGCCATCGGC TTCCTCCCTG CGCTGGCAAC GCGGCACGGC 
CTGGACCCTG TGGCGGCCGT TGCCGCGGTC AGCGTGCTGG CACTCGCGTC CGCTGCCACC 
CAACCCTGGA TCGGCCGCCT GCGTGACGGG GGCCGGCTCC ATGACGGCCC CGGCATGACA 
GCCGGGCTGC TGCTGACGGC GGCCGGAATC GCCGCGGTGG CACTGCTTCC GGGACCGGTC 
ACCATTTTTT GCGCTGCGGC GGCCATCGGC ACGGGAATCG GTGTTGCCAC GCCGCTGGGC 
TTCGCGCACC TTGCCGCCAC CACTCCGCCT GAGCGTTTGG GAAGGACCAT GGGAACAGCC 
GAGCTGGGAC GGGAGCTTGG CGACGCCGGT GGTCCGCTCC TGGTTGGCGC CGTGGCTACA 
GCTTCAGCTC TGCCGCTGGG CCTCGGAGTC CTTGCCGCGG CCGTCACCGC CGCGTCCCTG 
CTCGGCGTCG GCAGCATCGG CCGCCGGGCG CCGTCGCCGG AACCGGCCGC CAAACCGTGA

Protein sequence

MTTAPIPTPT AAVTAPLYAA GFVTAFGAHS IAAGMGAHSG DIGLSLLNLG VLLAVYDLAE 
VVLKPVFGAL SDRIGTKPVV VAGLFAFALM SLIGLWGSNP LMLGLARIGQ GAAASAFSPA 
SSAMVARLAG RNAGTYFGRY GSWKSLGYVA GPLIGAGLIF LGGFTLLFAA LAILAAATAV 
WAMVTLPQLA PLPRPRYTLL DLARQVTHRS FLVPTLVLAA ATGALGTAIG FLPALATRHG 
LDPVAAVAAV SVLALASAAT QPWIGRLRDG GRLHDGPGMT AGLLLTAAGI AAVALLPGPV 
TIFCAAAAIG TGIGVATPLG FAHLAATTPP ERLGRTMGTA ELGRELGDAG GPLLVGAVAT 
ASALPLGLGV LAAAVTAASL LGVGSIGRRA PSPEPAAKP