Gene Achl_1030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_1030
Symbol
ID	7292472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	-
Start bp	1129819
End bp	1131078
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	68%
IMG OID	643589435
Product	major facilitator superfamily MFS_1
Protein accession	YP_002487113
Protein GI	220911804
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGA TGTTTCGCGC CCTCGAGAAC CGCAACTACC GGATCTGGGC CGGCGGTGCC 
CTGGTCTCCA ACGTGGGCAC CTGGATGCAG CGCATCGCCC AGGACTGGCT GGTACTCACC 
GTCCTGACCA ACCATGACGG CGCCGCCGTC GGCATCACCA CCGGCCTGCA ATTCCTGCCG 
ATGCTGCTGC TGGGCCCTTA CGGCGGAGTC CTGGCAGACC GCTACCGCAA ACGCGTCATC 
CTGCTGTGGA CCCAGCTGGC CATGGGCTTC ACCGGCCTGG CCATCGGCCT GCTGGTGGTC 
ACCGGCACCG CCCAGCTGTG GCATGCCTAC GTCGCCGCCT TGTGCCTGGG CATTGCCAGC 
GCCATTGACG CCCCGGCGCG GCAGTCCTTT GTCTCGGAAC TGGTGGGCCA GGACAACATC 
TCCAATGCCG TGGCCCTGAA CTCGGCATCC TTCAACACTG CCCGCCTCAC GGGCCCGGCC 
GTCGCCGGCG TCCTGATCGC CTGGGTGGGC ACCGGGCCGG TGTTCCTGCT CAACGCCGCC 
AGCTACGCCG CAGTGATCTG GTCCCTGTTC CTGATCCGCA CCTCCGAGCT TGTGCCCACC 
GTGCGGGCAG AGCGCGGCAA ACACCAGGTG ACGGAGGGCA TGCGGTACGT GAAGCAGCGG 
CCGGACCTCG TCCTGATCAT GGTCCTGGTG GGCATCCTCG GAGCCTTCGG CATGAATTTC 
CCCATCACGA ACGCCCTCAT GGCCACCACC GAATTCCACG CCGGGCCGGG CGAGTTCGGC 
CTGCTGGGCT CCATCATGGC CGTTGGCACC CTGGCCGGCG CACTGCTGGC CGCCCGGCGC 
GCGCGGCCGC GACTGCGGTT CCTGCTGGGC GGCGCCCTTG GCTTGGGGAT CTTCACGCTG 
GTAGCCAGCG TGGCGCCGTC GTTCTGGCTG TATACCGCAG TGCTGATTCC GGTGGGCCTG 
GCATCCATCA CGTTCCTGAA CAGCTGCAAC ACCAGCATCC AGCTGTCCGT GGAGCCGCAG 
TTCCGCGGCC GGGTACTTGC CCTCTACCTG GCCATCCTGC AGGGCGGCAC AGCCGTGGGA 
TCGCCGCTGA TCGGGTGGGT GGGCAGCGAA TTCGGCGCCC GCTGGTCCGT GGCGGTGGGT 
GGCCTGGTGG TCCTGCTGAC CGGGCTGGCC GCCGTGATTG TGGTCAGCCG CCGGAGCAAG 
CTCAGCCTCC GCAGGGCGGT CCGTATCGCG TTCAGCGGCA AGCGCGAAGC CGCCGCCTGA

Protein sequence

MSQMFRALEN RNYRIWAGGA LVSNVGTWMQ RIAQDWLVLT VLTNHDGAAV GITTGLQFLP 
MLLLGPYGGV LADRYRKRVI LLWTQLAMGF TGLAIGLLVV TGTAQLWHAY VAALCLGIAS 
AIDAPARQSF VSELVGQDNI SNAVALNSAS FNTARLTGPA VAGVLIAWVG TGPVFLLNAA 
SYAAVIWSLF LIRTSELVPT VRAERGKHQV TEGMRYVKQR PDLVLIMVLV GILGAFGMNF 
PITNALMATT EFHAGPGEFG LLGSIMAVGT LAGALLAARR ARPRLRFLLG GALGLGIFTL 
VASVAPSFWL YTAVLIPVGL ASITFLNSCN TSIQLSVEPQ FRGRVLALYL AILQGGTAVG 
SPLIGWVGSE FGARWSVAVG GLVVLLTGLA AVIVVSRRSK LSLRRAVRIA FSGKREAAA