Gene Arth_1103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1103
Symbol
ID	4446406
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	1195290
End bp	1196561
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	63%
IMG OID	639688909
Product	inner-membrane translocator
Protein accession	YP_830597
Protein GI	116669664
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4214] ABC-type xylose transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.660627
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCGC TCAAGAAGCT ATTTGGCGGA AACACCCGTC AATTCGGCAT GATCTTCGCC 
CTGGTTGCAC TGATCGTCTT TTTCCAGATT TTCACCGAGG GCCGCACGCT CACCCCGGGC 
AACGTCATCA ACCTCTTCAA CGGCAACTCC TACATTCTGA TCCTGGCGAT CGGCATGGTG 
CTGGTCATCA TTGCCGGCCA CATCGACCTC TCAGTGGGTT CCGTGGCGGC CTTCGTCGGC 
GTCACCGTGG CCCTGGCCAT CCGTGACTGG GGCATCCCCT GGTACGCCGG CGTTCTCCTG 
GGCCTGGCCC TCGGGGCGCT GATCGGGGCG TGGCAAGGGT TCTGGACCGC CTATGTGGGC 
ATTCCCGCCT TCATCGTGAC CCTGGCCGGT ATGCTGCTCT TCCGCGGCTT CAACCAGTTC 
GTCGGCAAGT CCAACACCAT CCCGGTCCCC GCCGATTTCC AGTACCTCGG CTCGGGCTAT 
CTTCCCGAAG TGGGCCCCAA CACCAACTTC AACAACCTCA CGCTGCTCCT GGGCTTGCTG 
GCCGTGGCCT TTGTGATCTT CAGCGAAATC CGTGCCCGCC GGCGGGCCCT TGCCCTCGGC 
GCCGAGGTGC CGGAAGCCTG GGTAATGATC CTCAAGCTCG TCCTGATCTG CGGCGCCATC 
CTGTACGCCA CGTACCTGTT CGCCACCGGC CGTCCGGGAA CGTCCTTCCC CATTCCGGGC 
CTGATCCTGG CCGTCCTGGT CCTCATCTAC GGCTTCATTT CCTCCAAGAC CATCGTCGGC 
CGCCACATCT ACGCCGTCGG CGGCAACAGG CACGCTGCCG AACTCTCCGG CGTGCAGTCC 
AAGAAGGTCA ACTTCCTGGT GATGATGAAC ATGTCCATCC TGGCCGGCCT GGCAGGCATG 
ATCTTCGTGG GCCGCTCCAC CGCTTCCGGA CCGTTCGACG GCGTCGGCTG GGAACTGGAC 
GCCATCGCAG CCGTGTTCAT CGGCGGCGCC GCCGTGACCG GCGGCGTGGG TACCGTGATC 
GGCTCGATCG TTGGTGGCCT GGTGATGGCC GTGCTGAACA ACGGGCTGCA GCTCCTCGGC 
GTCGGCGCCG ACCTCACCCA GATCATCAAG GGCCTGGTCC TCCTGATCGC CGTTGCCTTC 
GACGTCTACA ACAAGACCCA GGGCAAGAAG TCCATCATCG GCATGATGAT GAAGAACTTC 
GGCCGCGGCA GCACCGAGCT CCAGCCGGAC GAGACGACGG CCACCAAGGA CGTCATCCGC 
AAGGAAGCCT GA

Protein sequence

MNALKKLFGG NTRQFGMIFA LVALIVFFQI FTEGRTLTPG NVINLFNGNS YILILAIGMV 
LVIIAGHIDL SVGSVAAFVG VTVALAIRDW GIPWYAGVLL GLALGALIGA WQGFWTAYVG 
IPAFIVTLAG MLLFRGFNQF VGKSNTIPVP ADFQYLGSGY LPEVGPNTNF NNLTLLLGLL 
AVAFVIFSEI RARRRALALG AEVPEAWVMI LKLVLICGAI LYATYLFATG RPGTSFPIPG 
LILAVLVLIY GFISSKTIVG RHIYAVGGNR HAAELSGVQS KKVNFLVMMN MSILAGLAGM 
IFVGRSTASG PFDGVGWELD AIAAVFIGGA AVTGGVGTVI GSIVGGLVMA VLNNGLQLLG 
VGADLTQIIK GLVLLIAVAF DVYNKTQGKK SIIGMMMKNF GRGSTELQPD ETTATKDVIR 
KEA