Gene Arth_4004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4004
Symbol
ID	4447267
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4519928
End bp	4521901
Gene Length	1974 bp
Protein Length	657 aa
Translation table	11
GC content	63%
IMG OID	639691835
Product	PTS system, mannitol-specific IIC subunit
Protein accession	YP_833479
Protein GI	116672546
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2213] Phosphotransferase system, mannitol-specific IIBC component [COG4668] Mannitol/fructose-specific phosphotransferase system, IIA domain
TIGRFAM ID	[TIGR00851] PTS system, mannitol-specific IIC component

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.852778
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACAG AGACAGTTGC AAAACCCCGC ACCAGCCTGC GGGTTGGCGT CCAGAAATTC 
GGGACGTTCC TGTCCGGAAT GATCATGCCC AACATCGGCG CTTTCATCGC CTGGGGCATC 
ATCACGGCCT TCTTCATTCC GGCGGGCTTT ACTCCCAATG AGGAACTGGC CAAGCTCGTT 
GGCCCGATGA TCACCTTCCT GCTTCCGCTC CTGATCGGCT ACACCGGCGG TCGCATGGTC 
CACGGCGTCC GTGGCGGCGT TGTCGGCGCG GCCGCAACTA TGGGCGTGAT CGTCGGTACG 
GACATCCCCA TGTTCATCGG CGCCATGATC ATGGGCCCGC TGACCGCATG GATCATGAAG 
AAGCTGGACA AGATCTGGGA AGGCCGGGTC AAGCCGGGCT TCGAGATGCT GATCGACAAC 
TTCACCGCAG GCATCGTGGC AGCAGCCATG GCCATCGTGG GCATGCTGGT GATCGGCCCG 
GTGGTGAAGG CCTTCAGCAA CGGCGCCAGT TCCGTCGTCG AATTCCTGGT CAACAACGGC 
TTGCTGCCGT TCACCAGCAT CTTCATCGAG CCGGCCAAGG TACTGTTCCT GAACAACGCC 
GTGAACCATG GCATCCTGAC GCCGCTGGGT ACGGAACAGG CACTGCAAAA CGGAAAATCC 
ATCCTGTTCC TGCTCGAAGC CAACCCGGGT CCCGGCGTGG GCATCCTGCT TGCGTACATG 
ATCTTCGGCA AGGGCCTGGC CAAGGCGTCA GCCCCCGGCG CCGCCCTGAT CCAGTTTGTT 
GGCGGTATCC ACGAAATCTA CTTCCCGTTC GTACTGATGA AGCCCATCAT CATCCTGGCC 
GCAATCGGAG GCGGGATGAC GGGCATCTTC ACCCTGGTGC TCACCGGCGC AGGCCTGCGC 
TCCCCGGCCG CCCCGGGCAG CATCATCGCC GTCTTCGCCG CGACCGCCAG CGACAGCTAC 
TTCGGAGTGG CGCTGTCCGT GCTGCTCGCC GCCACGGTGT CCTTCCTGAT CGCTTCGGTG 
ATCCTGAAGT CCAGCAAGAC CCCCGTGGGC GAAACCGAGG AGGACAGCCT GAGCGCCGCC 
ACCTCCCGGA TGGAGTCCAT GAAGGGCAAA AAGAGCTCCA TCTCCTCCAC CCTGACCGGT 
GCGGGAGCAA CGACGGCCGT TATGGCTGGC CCCATCAAGA ACATCGTGTT TGCCTGCGAC 
GCCGGCATGG GCTCAAGCGC CATGGGCGCT TCGGTTCTGC GGAACAAGAT CAAGGCGGCC 
GGCTTCCCCG ACGTCAAGGT CACCAACTCC GCCATTGCGA ACCTGAGCGA CACCTACGAT 
GTGGTCATCA CCCACCAGGA CCTGACCGAG CGGGCCAAAC CCGCCACGGG CAGCGCCGTG 
CACGTATCCG TGGACAACTT CATGAACAGC CCGCGCTATG ACGAGATCGT GGAGCTGGTC 
AAGAGCAGCA ACACCGAAGG AACGGCTGGC GCCGCTGCTC CCGCTGCCGC TGCGGCGCCA 
GTGGCGACTG CAGCCCCGTC AGCTGCCGAA GCCGCAACGC CGTCGGACAT CCTGGTGGCT 
GACAGCGTTG TGCTCAATGG CACGGCCACC ACCCGCGACG CCGCAATCGA CGAAGCGGGC 
CGGCTGCTGC TGGACCGCGG CGCCGTGGAC AGTGGCTACA TCGATGCCAT GCACGAACGC 
GAGGAATCCG TGTCCACGTA CATGGGGAGC TTCCTGGCCA TTCCGCACGG CACCAACGCC 
GCCAAGGACC ACATCATGAA GTCCGCCGTG TCCGTGATCC GTTACCCGAA CGGCATCGAC 
TGGAACGGCA AGGAGGTCAA GTTTGTGGTG GGCGTGGCCG GCATCAACAA CGAGCACCTG 
CAGATCCTGT CCTCCATCGC GAAGGTGTTC ACCAACAAGG CCCAGGTGGC ACAGCTCGAG 
GCGGCCACCA CGGTTGACGA AGTGCTGGAA CTGTTCGGAA AGGTCAACGC ATAG

Protein sequence

MATETVAKPR TSLRVGVQKF GTFLSGMIMP NIGAFIAWGI ITAFFIPAGF TPNEELAKLV 
GPMITFLLPL LIGYTGGRMV HGVRGGVVGA AATMGVIVGT DIPMFIGAMI MGPLTAWIMK 
KLDKIWEGRV KPGFEMLIDN FTAGIVAAAM AIVGMLVIGP VVKAFSNGAS SVVEFLVNNG 
LLPFTSIFIE PAKVLFLNNA VNHGILTPLG TEQALQNGKS ILFLLEANPG PGVGILLAYM 
IFGKGLAKAS APGAALIQFV GGIHEIYFPF VLMKPIIILA AIGGGMTGIF TLVLTGAGLR 
SPAAPGSIIA VFAATASDSY FGVALSVLLA ATVSFLIASV ILKSSKTPVG ETEEDSLSAA 
TSRMESMKGK KSSISSTLTG AGATTAVMAG PIKNIVFACD AGMGSSAMGA SVLRNKIKAA 
GFPDVKVTNS AIANLSDTYD VVITHQDLTE RAKPATGSAV HVSVDNFMNS PRYDEIVELV 
KSSNTEGTAG AAAPAAAAAP VATAAPSAAE AATPSDILVA DSVVLNGTAT TRDAAIDEAG 
RLLLDRGAVD SGYIDAMHER EESVSTYMGS FLAIPHGTNA AKDHIMKSAV SVIRYPNGID 
WNGKEVKFVV GVAGINNEHL QILSSIAKVF TNKAQVAQLE AATTVDEVLE LFGKVNA