Gene Arth_3058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3058
Symbol
ID	4444291
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3429666
End bp	3430994
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	70%
IMG OID	639690884
Product	major facilitator transporter
Protein accession	YP_832537
Protein GI	116671604
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCCC CCAAGACCAC CCTGCCTTCC GCTCCCGGGA AAGGGACCCG CCGCCGGCTG 
CATCCCGCGT GGATCGTAGC CGCCGTCGCC TTCCTTGCCC TGGTGGGCGC AGCCGGCTTC 
CGTGCGGCCC CAGGGGTCCT GATGGTTCCG CTTCAGAACG AATTCGGCTG GTCCACCACC 
GTCCTGTCCG CCGCCGTCAG CATCAACCTG GTGCTCTTTG GCCTCACCGC ACCGTTTGCG 
GCGGCGCTCA TGGAACGGTT CGGCATCCGC GCCGTGACCT CGGTGGCGCT GGTCCTGATC 
GGCGCCGGCA GTGCCCTGAC CGTGCTGGTG AACCAGTCCT GGCAGATCCT GCTGACCTGG 
GGTCTGCTGA TCGGACTGGG CACAGGTTCC ATGGCACTGG TCTTCGCCGC CACGATCGCC 
AACACCTGGT TCGCCAAGAG CCGCGGCCTG GTGATTGGCA TCCTGACGGC CGGGAGTGCC 
GCCGGGCAGC TGGTCTTCCT GCCCTTCATC GCCATGCTGG CGCAGGATCC CGGCTGGCGG 
CAGGCCTCCC TGCTCATCGC CGCCGGAGCG CTGGCCGTGG TGCCGCTGGT GCTTAAATTC 
CTCAAGAACT CACCCGCCGA CGCCGGAGTG CTGCCCTATG GCGCCGACGC CGCAGCTCCG 
GACGGGAACG CAGCGCCTGG TGGGAACGCC GCCGTCCGGG CGCTGCAGGT GCTCAAGCGA 
GCCAGCAAGG TCCGGACGTT CTGGGCGCTG GTGGCCGGGT TCGCGATCTG CGGGGCCACC 
ACCAACGGGC TCATCGGCAC CCACTTCATC CCCTCCGCGC ACGACCACGG CATGGCCGAA 
ACCACCGCCG CTGGGCTGCT CGCCGTCGTC GGGATCTTCG ACATCGTGGG CACCATCGCG 
TCCGGCTGGC TGACGGACCG TTTCAACCCG CGGATCCTGC TGGCGGTGTA CTACCAGTTC 
CGCGGCATCG GACTGCTGGT GCTGCCGCTT CTGCTGAGCG CCACGGTCCA GCCCAGCATG 
ATCGTGTTCG TGGTGATCTA CGGACTGGAC TGGGTGGCCA CCGTCCCGCC CACCGCTGCC 
ATCTGCCGCC AGGTGTTCGG CGCCGACGGC AGCGTGGTGT TCGGCTGGGT CTTCGCGGCC 
CACCAGCTCG GCGCGGCCGC CGCCGCCCTG GCCGCCGGCG CCATCCGTGA CGCCACCGGC 
CAGTACACCT ATGCCTGGTT CGGGGCAGCC GCCATGTGCA CCATCGCCGC CGTCATCAGC 
GCCACCATCC GCAAGGACGC CGCGGCACGG GAGCCCGTCT TCGTGGAGGC CAGGGCCGCC 
GAAGGCTGA

Protein sequence

MSAPKTTLPS APGKGTRRRL HPAWIVAAVA FLALVGAAGF RAAPGVLMVP LQNEFGWSTT 
VLSAAVSINL VLFGLTAPFA AALMERFGIR AVTSVALVLI GAGSALTVLV NQSWQILLTW 
GLLIGLGTGS MALVFAATIA NTWFAKSRGL VIGILTAGSA AGQLVFLPFI AMLAQDPGWR 
QASLLIAAGA LAVVPLVLKF LKNSPADAGV LPYGADAAAP DGNAAPGGNA AVRALQVLKR 
ASKVRTFWAL VAGFAICGAT TNGLIGTHFI PSAHDHGMAE TTAAGLLAVV GIFDIVGTIA 
SGWLTDRFNP RILLAVYYQF RGIGLLVLPL LLSATVQPSM IVFVVIYGLD WVATVPPTAA 
ICRQVFGADG SVVFGWVFAA HQLGAAAAAL AAGAIRDATG QYTYAWFGAA AMCTIAAVIS 
ATIRKDAAAR EPVFVEARAA EG