Gene Arth_4045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4045
Symbol
ID	4447881
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4565059
End bp	4566324
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	66%
IMG OID	639691876
Product	major facilitator transporter
Protein accession	YP_833520
Protein GI	116672587
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAACGA CGTCGTTGGA AAACAAATCA CGCTGGCCCG TCTGGCTCTG CTGGCTGGCC 
ATGGTCCTGG ACGGCTTTGA CCTGGTAGTG CTTGGCACCG TCATCCCCAC GCTCATCAAG 
ACCCACGACC TTGGCTTCGA CGCCGTGGGC GCCACCTTTG CTGCGACTAT CTCCCTGGTG 
GGCGTGGGCC TCGGAGCGCT GTTCATTGCA CCGCTTTCCG ACCGATTCGG CCGACGGAAC 
CTGCTGGTTG CCTGCGTTAC GTGGTTCTCC ATCTTCACCA TTGCCGTGGT CTTTGCCCCC 
AACGTGGCAG TCTTCAGCGC CTTCAGGCTG CTGGCGGGCC TGGGGCTGGG CGCCTGCCTT 
CCCGCTGCTT TGGCCTACAT GAACGATTAC GCCCCCGCGG GATCCGCCGG CAAGTCCACC 
ACCCGGACCA TGACGGGCTA CCACGCAGGC GCAGTGGCCA CCGCCTTCCT GGCGCTCATG 
GTCATCCCTG ACTGGCGCAT CATGTTCGTA GTTGGCGGCC TTGCGGGCTT CGTGCTGGTC 
CCGTTCCTGT GGTTCAAGCT GCCGGAAACG CTGCCCGCCG TCATCTCCCT TCCGGCGCCC 
GGCAAGGCCG CGGCAAGAGA ACCCGCTCCT GCGGTGGAAG ACCGTGCCAG CTTCAAGGAC 
CTCGGGCGGA AACCGTACCC GCTCGTGGCC GCCGGTGTGG CCGTGGCCTC GTTCATGGGC 
CTGCTGCTGG TGTACGGACT GAATACCTGG CTGCCGCAGC TCATGTCGTC CGCCGGCTAC 
ACGCTCAGCG CCGGGCTCTC CCTCCTGCTG GTCCTGAACG TGGGCGCCGT GGCGGGCCTG 
GTAGTGGCCG GTATCCTGGC GGACAAGCAC GGAACCAAGA AGATCGTGCT TCTCTGGTTC 
GGGCTCTCCG CCGTGTTCCT GGCAGTACTT AGCGTGAAAA TCCAGAACGA GCTGTTCCTG 
AACGCGGCCG TCTTCGTCAC CGGGGTCTTC GTCTTCAGCT CACAGGTGCT GGTGTATGCC 
TGGGTGAGCC AGCTGTTCCC GCCGCGGCTG CGCGGCACCG CGCTGGGCTT CGCCGCAGGC 
GTCGGACGCC TGGGGGCCAT CCTCGGTCCG GCCGTGACAG GCACCCTTGT GGCCGCCGGA 
ATCGCTTACC CCTGGGGCTT CTATGTCTTT GCCGCCGCGG CCGTTCTCGC CGTTGCAGCC 
CTCGCCCTGG TCCCGCAGGC GGTCACCGCG GCGGCGGGCA AGCGGACCGC CGTCGGGCCT 
TCCTAA

Protein sequence

MSTTSLENKS RWPVWLCWLA MVLDGFDLVV LGTVIPTLIK THDLGFDAVG ATFAATISLV 
GVGLGALFIA PLSDRFGRRN LLVACVTWFS IFTIAVVFAP NVAVFSAFRL LAGLGLGACL 
PAALAYMNDY APAGSAGKST TRTMTGYHAG AVATAFLALM VIPDWRIMFV VGGLAGFVLV 
PFLWFKLPET LPAVISLPAP GKAAAREPAP AVEDRASFKD LGRKPYPLVA AGVAVASFMG 
LLLVYGLNTW LPQLMSSAGY TLSAGLSLLL VLNVGAVAGL VVAGILADKH GTKKIVLLWF 
GLSAVFLAVL SVKIQNELFL NAAVFVTGVF VFSSQVLVYA WVSQLFPPRL RGTALGFAAG 
VGRLGAILGP AVTGTLVAAG IAYPWGFYVF AAAAVLAVAA LALVPQAVTA AAGKRTAVGP 
S