Gene Arth_4342 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4342
Symbol
ID	4443488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008538
Strand	+
Start bp	82080
End bp	83306
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	66%
IMG OID	639687663
Product	major facilitator transporter
Protein accession	YP_829360
Protein GI	116662306
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACGTA CCGACGATTC TGCACCGGAC GATCCGCGGC GCCTTCGTCG CGACCACCAC 
CTCATCCAGT CAGCGAATCT CGGATTCTCG GTCGCGCAGG CAATGGCGGC CGTCGCCGTG 
CCAATCCTGG CCGTGTACGC GGGGCACCCC ATCGAGCTGA TCGGGATCAT TGTCGCGGTC 
TCTGCGGTGT CGCAGACCGT CGCGCGCCTT GGCATGGGCA CCCTGATGAG CCGGCTGCCC 
ACCAAGCACT TCATTGCTGC CGCTACGCTG CTGCTGTCTG CATCCTGTTT CCTCCTCGGC 
TTCAGCACCG AGTTGTGGGC CTTCATCATT GCCCAGCTCC TGCAAGGAGC CGCGCGCGCG 
TATTTCTGGA CCGGAAGCCA GACGCATGTT GTCCGCGCGT CCGAGTCCGC CGTCACCGCG 
CTCTCCCGCC TGAACGTGGT TCAGGGCGTA GGCCAGCTGA TCGGACCGGC ACTCGCGGGC 
TTCATTGGTG CCTGGTCCCT GCAGATGTCC CTCCTGGCAG CGGGCGCACT CGCGGCGATC 
GCGCTCGCGC CGGCGATCGC ACTCGTCAGA TTTGCCCCGT TCCCACAGCG GAGCCGCCAC 
GGCACCGGGC GCCCTCGGCA GATCTGGCGT CAGCCAGGTG TCGGCATGGC TGCCAGCATG 
GCGGCGGTCG CGGGTGCGTG GCGCGGCATC CTCAATTCCT ACCTGCCCGT TATCCTGACC 
GCGGCCGGCC ACAGCATTCC CGTCGCCGGC GCGCTGATGA CGGTCGCCAA TCTCGCGTCC 
CTTTGCGGCA GTGCGTTCTC CCGCCGCATC CATGCCGCGG GTCCGCGCGT CGCGAATGCG 
ATCGGCACGG CGGGGGCAGG CCTCGGACTT GTGCTTGCGT CGTTTTTCCC GAATCCGATC 
TGGGTAGTCG CTGTGGGGCT CACCATCTCG GGCCTCGGTG CCGGGATTCT GCAGACGGTC 
GGTCCGGCAT TGGCTGTGGA TTCCATCAGC GAAGAGGATC GTGGGCGTGC CATCGCATCC 
ATCGGGACGT TCCGGTCAAT ATCGCTGTTC GTGTCCCCTC TGGCGACCGC AGGGCTCATC 
CTCATCGTTC CCAGCGCTGC TATCGCCGCG GGGATCGCCG GTATCATCAT TTCTACGCCA 
ACCCTGTCTA CTCTGATCAG ACGCAGAGGC CAGGCGAGGA CGTCCCAGGA AGGCACCCAT 
GACCACGACG AAGACTTTGC GAACTGA

Protein sequence

MSRTDDSAPD DPRRLRRDHH LIQSANLGFS VAQAMAAVAV PILAVYAGHP IELIGIIVAV 
SAVSQTVARL GMGTLMSRLP TKHFIAAATL LLSASCFLLG FSTELWAFII AQLLQGAARA 
YFWTGSQTHV VRASESAVTA LSRLNVVQGV GQLIGPALAG FIGAWSLQMS LLAAGALAAI 
ALAPAIALVR FAPFPQRSRH GTGRPRQIWR QPGVGMAASM AAVAGAWRGI LNSYLPVILT 
AAGHSIPVAG ALMTVANLAS LCGSAFSRRI HAAGPRVANA IGTAGAGLGL VLASFFPNPI 
WVVAVGLTIS GLGAGILQTV GPALAVDSIS EEDRGRAIAS IGTFRSISLF VSPLATAGLI 
LIVPSAAIAA GIAGIIISTP TLSTLIRRRG QARTSQEGTH DHDEDFAN