Gene Arth_3956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3956
Symbol
ID	4447774
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4469947
End bp	4471284
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	65%
IMG OID	639691787
Product	major facilitator transporter
Protein accession	YP_833431
Protein GI	116672498
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00119872
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAATG AGGCTCTGAA AATGCGCGGC CACGTGCACG GCACAAAGGA CGCTAAACGC 
GTCGCCATCG GCTCCGGTGT CGGCGCCGTC ATCGAGACTT ATGACTTCAT CGGCTTCGGC 
ACTGCCGCCG CCCTGTACTT CGGAACGGCG TTCTTCCCCA CGGGCGACCC GGTCACCGGC 
ACCCTGGCCG CCTTCGCCAC GCTCGGCGTC GGCTTCGCCG CCCGCCCCAT CGGCGGGATC 
ATCGGCGGCC ACCTCGGCGA CAAGGTGGGC CGCAAGCCCG TCCTGGTGGC CTCCCTGATC 
CTCATGGGTG TCGCCACGTT CCTCATCGGC CTCCTGCCCA CCTACGAACA GGTCGGCCTG 
CTGGCGCCGG CGCTGCTGGT GTTCGTCCGC GTCGTCCAAG GCCTCGCCTT CGGTGCCGAA 
TGGGGCGGCG CCATCCTGAT GAGTTACGAG CACGCGCCCT GGAAGTCCAA GGGAAAATAC 
ACCGGCATCG TGCAGGCCGG CTTCCCCGTG GGCCTCCTCC TGGCCAACCT CGTCTTCCTG 
GTCAGCGTCA ACCTGGGCGG CGAACTCGCC TGGCGCGTCC CGTTCCTGGC CAGCATCCTG 
CTCGTCGTCG TCGGCCTGAT TATCCGCTCC AAGGTGCCGG AATCGCCGGT CTTCGACGAG 
GTCAAGGAGA GCGGTTCCAT CGTCAAGTCG CCGATCCTCG AGGTCATCAA GACGGACTGG 
CGCAGCATCG TCCGGGGCAT CGGCCTCCGC ATTGCCGAGA CCGCGGGCTA CGCCGTATCG 
ATCACCTACA TGATTTCCTA CCTGCACACC CAGCACCTGG CTGACAAGAC CCAGACGCTC 
GTCGCCCTCT GCATCGCCTC CGCAATCGGC ATATTTGCCA CCATGGCCTG GGCAAGGCTC 
ACCGACAGGA TCGGGCGCCG GCCGCTTTAC ATCTGGTCCA CAGCCTTCGC GCTCCTGTTC 
GGCATCCCCA TGTTCCTGCT GGTCAACACC GGAATGTTCG TCTTCATCAT CGCCACCATC 
GTCATCTCCT ACGCTGTCTG CCAGAACTCC CTGGCCGGCG CCCAGGGCCC GTGGTTCCCC 
GAACTGTTCC AGGCGAAGAC CCGCTCCTCC GGAGCCTCGC TGGCGTACCA GATCTCCGCC 
ATGGTCTCCG GATTCACGCC CTTCATCACC ACGCTCCTCT TCGTCAGCCT GGGCTGGATG 
GGCCCCGCCC TTCTCTTCAG CTTCTACGCA GCCATCGGGC TCTGGGCCGC CCTCGTCACC 
CGGGAAACCT GGGGCAAGCG CGAACGGCAG CTGGCAGATG AGGCCACCAA AAACACGCCG 
CAAAAAGTAA ACGCCTGA

Protein sequence

MSNEALKMRG HVHGTKDAKR VAIGSGVGAV IETYDFIGFG TAAALYFGTA FFPTGDPVTG 
TLAAFATLGV GFAARPIGGI IGGHLGDKVG RKPVLVASLI LMGVATFLIG LLPTYEQVGL 
LAPALLVFVR VVQGLAFGAE WGGAILMSYE HAPWKSKGKY TGIVQAGFPV GLLLANLVFL 
VSVNLGGELA WRVPFLASIL LVVVGLIIRS KVPESPVFDE VKESGSIVKS PILEVIKTDW 
RSIVRGIGLR IAETAGYAVS ITYMISYLHT QHLADKTQTL VALCIASAIG IFATMAWARL 
TDRIGRRPLY IWSTAFALLF GIPMFLLVNT GMFVFIIATI VISYAVCQNS LAGAQGPWFP 
ELFQAKTRSS GASLAYQISA MVSGFTPFIT TLLFVSLGWM GPALLFSFYA AIGLWAALVT 
RETWGKRERQ LADEATKNTP QKVNA