Gene Arth_3996 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3996
Symbol
ID	4447259
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4510795
End bp	4512111
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	66%
IMG OID	639691827
Product	major facilitator transporter
Protein accession	YP_833471
Protein GI	116672538
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCTGT CAGATCTGCC GGGGCACGTC CCGGACCCCT CCGCTGTGGC CTCGCCGCAA 
GCGGGAAGCC CGACGGCGGC GCTCGCCGAA CCGGAGCGGC GCGTCCGTCC GCTCTGGACC 
ACCGGCGTGG TGCTGGTGAA TGTGGGAATC AACGCGGCTT TCTTCGGCCC CATCCAGGTT 
CTGCTCGGAC AGCAGGCCGC GCACTTCAGC GAAGGTGACA AGGAAGCCAT TCTGGCGCTC 
GTCACCGGCG CCGGAGCCGC TGTCTCCCTG GTGGCCAACC CGCTCTTCGG CGCCTTCAGT 
GACCGCACCA CATCACGGCT GGGCCGCCGG GTGCCGTGGG TTGTGTTCGG GGCTGTTCTT 
GGCGCAGCCG CACTCATTGC CCTGGCCGGC GCTCCGAACG TGGCTGTCAT GACCATCCTC 
TGGTGCCTGG TCCAGGCAGG CTGTAATGGC GCCTACGCCG CCATTACCGC CGCGATCCCG 
GACCGTGTGC CGGTGCCTCA GCGAGGTGCC GTGGGCGGGC TCGCCGCGAT GGGGCAGACG 
GTGGGAATCC TGATCGGCGC GGTGATCGCC GCCGTCGTCA GCGGGAACTT CGGGGTGGGG 
TACCTGGTGT GCGCGGGAGC GCTGATTGCC GGCGTGGCAC TGTATTTCTT CAAGAGCGAC 
GACGTGCCGC TGCCCGCGGA GGCACGCCCG CCATTCAGCC TGGCCGGTTT TGCCAGGGGT 
TTCTGGATCT CGCCCCTCCT CTATCCGGAC TTCGCCTGGG CCTGGTTGAC CCGACTGCTG 
GTGAACATCG GCAACCACAT GGTCACCCTG TACCTGCTGT TCTTCCTGAC GGATGCAGTG 
CACCTGAAGG AGACGCAAGG GATCGAGCCC GCCTTCGGCG TGCTGATCCT TACCGGCCTG 
TACGCGGTGA TGGTGATCGT CACCAGCGTG ATCGGCGGTC CGCTCAGCGA CCGCATGGGC 
AAACGGAAGC CGCTGGTTAT CGCCTCGTCT GTGATCATCG CCGTCGCGTC GCTGATCCTC 
GCATTTGCTC CCAACTGGGC GGGCGCCATA GCGGGCGCTA CGGTCCTGGG AATCGGCTTC 
GGCGCCTACC TGGCAGTGGA CTTCGCCCTC ATCACCCAGG TTCTGCCCAG CGCCCTGGAC 
CGCGGCAAGG ACCTCGGCGT CATTAACATT GCCAATTCGC TGCCGCAGGT CCTGGCACCC 
CTCATTGCAT TCCCGTTCGT CACGCTGTGG GGCGGCTACG TTTCGCTGTA CGTCGCCGCC 
GCAGTGATCG GATTGCTGGG CGCTGTGTTC GTGGTGAAGA TCAAAGGCGT GGACTGA

Protein sequence

MSLSDLPGHV PDPSAVASPQ AGSPTAALAE PERRVRPLWT TGVVLVNVGI NAAFFGPIQV 
LLGQQAAHFS EGDKEAILAL VTGAGAAVSL VANPLFGAFS DRTTSRLGRR VPWVVFGAVL 
GAAALIALAG APNVAVMTIL WCLVQAGCNG AYAAITAAIP DRVPVPQRGA VGGLAAMGQT 
VGILIGAVIA AVVSGNFGVG YLVCAGALIA GVALYFFKSD DVPLPAEARP PFSLAGFARG 
FWISPLLYPD FAWAWLTRLL VNIGNHMVTL YLLFFLTDAV HLKETQGIEP AFGVLILTGL 
YAVMVIVTSV IGGPLSDRMG KRKPLVIASS VIIAVASLIL AFAPNWAGAI AGATVLGIGF 
GAYLAVDFAL ITQVLPSALD RGKDLGVINI ANSLPQVLAP LIAFPFVTLW GGYVSLYVAA 
AVIGLLGAVF VVKIKGVD