Gene Arth_3164 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3164
Symbol
ID	4444224
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3552774
End bp	3553991
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	71%
IMG OID	639690990
Product	major facilitator transporter
Protein accession	YP_832642
Protein GI	116671709
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.761338
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCTCCG CACAAGCCAC CAAACCCTTC AGCCTCCGCA GCATTGCCGT CCCCGCGTTC 
GGACCGGCGC TGCTGTTCTG CATCGGCGAA GGGGCGGTGC TTCCGGTAGT GGCGCTTTCC 
GCGCGCGACC TCGGCGCGTC CGTGGCGGTG GCCGCGCTGA TCGTCACTCT GATCGGCCTG 
GGCTCATGGT TCTTCAACCT GCCGGCCTCC CTGATCACCC TCAAATTCGG CGAACGCTGG 
TCCATCGTCG GGGCCGCCGC GGCCGGTGCC CTGGCGCTGG CGGCGGCAGC GCTGTCCTCG 
GTGATTCCCG ACGGACTGTG GCTGCTCGCG GCGGCGATGG TCGTCGTCGG GATGGCCGCC 
AGCGTCTTCA GCCTGGCCCG GCAGAAATAC CTGACCGAGG CGGTGCCCGT GGCCTTCCGC 
GCCCGCGCCC TGTCCACGCT GGGCGGCGTG AGCAGGATCG GCATCTTCAT CGGCCCGTTC 
GTGGGCGCCG GCGTCATGCA GTTTGCCGGG ATCAGCGGCG CGTACTGGGT GGGCGTTGCG 
GCCATGGCAG CGGCCGCCAT CCTGTCCGTC ACCATCCCGG ACCTGCCGCC CGCGCCGGGA 
TCCGCCGACG GGAACCGCGG ACCGGAGCCC ACCATGCGGG GCATTGCCGT GTCCCACGCC 
GGCGTGTTCC TTACCGTGGG CGCCGGGATC CTGCTGCTCA GCGCCCTGCG CGCCTCCCGC 
CAGGTGGTCA TCCCGCTGTG GGCGGACAAC CTGGGCATGG ACGCCACGCA CGCCTCGCTG 
ATCTACGGAC TCTCCGGGGC AATCGACATG CTGGTGTTCT ACCCGGCCGG CAAGCTCATG 
GACCGCAAGG GCCGGCAATG GGTGGCCATC CCGTCCACGG TAATCATGGG CACCGCCCTG 
ATGCTCATCC CGATCACGGG CACCTTCGTG GGCCTGCTGC TGGCGGCGCT GCTGATCGGG 
TTCGGCAACG GCATCAGCTC CGGCCTGATC ATGACCCTCG GCGCGGACTT CTCCCCGGAC 
CGCGGCCGCG GCCAGTTCCT GGGACTCTGG CGGTTCATTG CCGACGCCGG CGCCACGGGC 
GGCCCGGTGC TCCTCTCCGG CGTCACCGCC GCCGTCTCAC TGGGGGCCGG CGTGTGGGCC 
ACCGGCGTGC TGGGGTTCGC CGCCGCCGTC GTCTTCGCCA TCACGATTCC GCGGCTCAAA 
CACCGCCGGA ACTACTAG

Protein sequence

MTSAQATKPF SLRSIAVPAF GPALLFCIGE GAVLPVVALS ARDLGASVAV AALIVTLIGL 
GSWFFNLPAS LITLKFGERW SIVGAAAAGA LALAAAALSS VIPDGLWLLA AAMVVVGMAA 
SVFSLARQKY LTEAVPVAFR ARALSTLGGV SRIGIFIGPF VGAGVMQFAG ISGAYWVGVA 
AMAAAAILSV TIPDLPPAPG SADGNRGPEP TMRGIAVSHA GVFLTVGAGI LLLSALRASR 
QVVIPLWADN LGMDATHASL IYGLSGAIDM LVFYPAGKLM DRKGRQWVAI PSTVIMGTAL 
MLIPITGTFV GLLLAALLIG FGNGISSGLI MTLGADFSPD RGRGQFLGLW RFIADAGATG 
GPVLLSGVTA AVSLGAGVWA TGVLGFAAAV VFAITIPRLK HRRNY