Gene Arth_1102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1102
Symbol
ID	4446405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	1194142
End bp	1195239
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	62%
IMG OID	639688908
Product	multiple sugar-binding periplasmic receptor
Protein accession	YP_830596
Protein GI	116669663
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4213] ABC-type xylose transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.891182
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAATGA TTGGTAAAGC AGGAAAGGCA GCAGCAATCG CTGCTATTGC GGCACTGGCG 
CTGACAGCCT GCGGCCGCTC CGAGACCGGC ACCACGGGCA GCAGCAGCGG TGGCGAGGCG 
TTCCCGAAGA ACTCCTCGAT CGGCGTCGCG CTCCCGCAGA AGACCAGTGA AAACTGGGTG 
CTGGCCGAGA AGCTGTTCAA CGACGGACTC AACGGAGCCG GTTTCAAGGC TGATGTGCAG 
TTCGCCAACG GCGGCGTATC CGAGCAGCAG AACCAGATCA GCGCCATGGT CACCAAGGGT 
GCAAAGGTCA TCATCGTGGG TGCCATTGAC GGCGCCCAGC TGGGTACCCA GCTCAAGCAG 
GCCAAGGACT CCGGCGCCAC CATCATCGCC TACGACCGCC TGCTCCTGAA CACCGAGAAC 
GTGGACTACT ACGTGGCTTA CGACAACTTC AAGGTGGGTG AACTCCAGGG CCAGGCGCTG 
CTGGACGGCA TGAAGGCCAA GAAGCCTTCC GGCCCGTACA ACATCGAGCT CTTCGCCGGC 
TCCCCGGATG ACGCCAACGC GAAGGTCTTC TTCGACGGCG CCATGAGCGT GCTCAAGCCG 
AAGATCGACG ACGGCACCCT CAAGGTTGTC TCGGGCCAGA CCTCGTTCGA GCAGGCCGTC 
ACCCAGGGCT GGAAGGCTGA GAACGCCCAG CGTCGCGCCG ACACCCTGCT GACCGGCAGC 
TACGGCACCG CTTCCCTGGA CGGCGTCCTG TCCCCGAACG ACACCCTGGC ACGTGCAGTA 
CTGACGTCCG TCAAGGCCGC CGGCAAGCCG CTCCCGATCA TCACCGGCCA GGACTCCGAG 
GTTGAGTCCG TCAAGTCCAT CATGGCCGGC GAGCAGTACT CCACCATCAA CAAGGACACC 
CGCAAGCTCG TAGAGCACGC GATCACCATG GTCAAGGACA TCCAGGCCGG CAAGACGCCT 
GAGATCAACG ATGACAAATC CTACAACAAC ACGGTCAAGA CCGTTCCGGC CTATCTGCTG 
GATCCGGTCA TCGTGACCAA GGAGAACGTC AAGACGGCCT ACGTGGACGA TCCGGTACTG 
GGCCCGATCA CCAAGTAG

Protein sequence

MQMIGKAGKA AAIAAIAALA LTACGRSETG TTGSSSGGEA FPKNSSIGVA LPQKTSENWV 
LAEKLFNDGL NGAGFKADVQ FANGGVSEQQ NQISAMVTKG AKVIIVGAID GAQLGTQLKQ 
AKDSGATIIA YDRLLLNTEN VDYYVAYDNF KVGELQGQAL LDGMKAKKPS GPYNIELFAG 
SPDDANAKVF FDGAMSVLKP KIDDGTLKVV SGQTSFEQAV TQGWKAENAQ RRADTLLTGS 
YGTASLDGVL SPNDTLARAV LTSVKAAGKP LPIITGQDSE VESVKSIMAG EQYSTINKDT 
RKLVEHAITM VKDIQAGKTP EINDDKSYNN TVKTVPAYLL DPVIVTKENV KTAYVDDPVL 
GPITK