Gene Arth_1919 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1919
Symbol
ID	4445538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2160338
End bp	2161432
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	63%
IMG OID	639689729
Product	ABC-type sugar transport system periplasmic component-like protein
Protein accession	YP_831401
Protein GI	116670468
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAGAA CCAAAACTGG AACCCGTCGG AGCAGTAGGC TGGCCGCGGC GGCCCTTTGC 
GCTTCAATCC TGACTGTCGC AACGCTCGGA CTCGCTGGCT GCAAGAGTGG GGCGGCCGCC 
GCCGCCGATG AGGAGGCGAA GGCAACAGGC AAGGGACTGG TCATCGGCTG GAGCCAGCGA 
GGCATCAGCG GCAGCGACTG GTGGAAGACC CTTGTCGAGG GCGGTCAGGC CGAGGCAAGC 
AAGGTCGGGG CGCGACTCGA GTTGCTTGAT GCTAATGGTG ACACCGTGCG GCAGAACGCT 
GACGTGCAGA CCCTCATCAC CAAGGGCGTG GACGTCGTCG TCATGAACCC GAACGACCCG 
ATCGGCGTCG GCCCCTCAGT TCAAGCGCTT AAGGATGCAG GCATACCTGT CGTCACCGTC 
AACTCAAGTC TGGATAAGTC GCTGGTCCCA GACATGTTCT GCTACGTTGC GGAGGACCAG 
GAACATACCG GTTCACTCGC CGGGGAAGTC GCTGCCCAGA AGGCGCTCGA GAAGTACGGC 
GACAGCGGCC AGATCAAGCT TGTCGGTATC GGAGGCTTCC CGGGTGACGT GCTGAGCGAC 
CTGCGGTTTA ACGGCTTTAT GGCTGGCTGG AACCGCGTGA TGGAAAAGCA CCCGGGCGTC 
ACCACGGTGA AGCTCGAAAC GAAGTACGGG GAGTGGAAGC CGGACAAGGC GCTCGCCCCG 
ATCCGGGACG TTGCCACCGC CAACCCGGAC CTCAAGGTCA TTTACAGCAT GAGCGACGTC 
ATGCACGGCG GCATTGTCCA GGGGCTTCAG CAGGCCGGGC TCTGGGGCGA CGGGATCATC 
ATGGCCAGCT ACGACGGCGG CATGGGAGCC ATTAAGGAAA TGGTGGACGA CCCCAAGGGT 
CCGTTGCAGG CCGACGCGTC CAACCAGCCG TGGGACCAGG GAGTTGCCGC CGTGCGGATG 
GCACTTGCCG CCTTCAATGG CGACCAGTCC CAGTGCCCGG ACAAGACGAA CTACATCGAC 
ACGACGGTGA TCACGCCCGT CGAGGCGCCA GAGTACTACG TCCCCTCGGA CACCTACGTC 
CGCGCAAAAA ACTGA

Protein sequence

MQRTKTGTRR SSRLAAAALC ASILTVATLG LAGCKSGAAA AADEEAKATG KGLVIGWSQR 
GISGSDWWKT LVEGGQAEAS KVGARLELLD ANGDTVRQNA DVQTLITKGV DVVVMNPNDP 
IGVGPSVQAL KDAGIPVVTV NSSLDKSLVP DMFCYVAEDQ EHTGSLAGEV AAQKALEKYG 
DSGQIKLVGI GGFPGDVLSD LRFNGFMAGW NRVMEKHPGV TTVKLETKYG EWKPDKALAP 
IRDVATANPD LKVIYSMSDV MHGGIVQGLQ QAGLWGDGII MASYDGGMGA IKEMVDDPKG 
PLQADASNQP WDQGVAAVRM ALAAFNGDQS QCPDKTNYID TTVITPVEAP EYYVPSDTYV 
RAKN