Gene Arth_0402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0402
Symbol
ID	4447129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	428500
End bp	429624
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	67%
IMG OID	639688201
Product	ABC transporter related
Protein accession	YP_829903
Protein GI	116668970
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0245246
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACCC CGGTATCAGC ACGGCCGGCA CCGGCACCTA AGAGCCAGGA CCGGGGGCAC 
GGCGACACTC CCGCCCTGGC GGTGAAAGGC CTGGTCAAGG ATTTCCACAG CGGCGGGCTG 
TTCTCACGGG CCTCGGTGCG CGCCCTCGGC GGCGTGGACC TTGCCATCAG GAAAAGTGAG 
ATCGTGGCGC TGGTGGGCGA GTCCGGATCC GGCAAGAGCA CGCTGGCCCG CTGCATCGCA 
CGGCTGGAGA AGCCCACCGC CGGCCAGATC CTGCTTAATG GCACGGACGT GCTAAAAAGG 
GACCGTTTCC AGGCCTCAAG GGAATACCGT TCGCAGCTGC AGATGGTGTT CCAGGACCCC 
TTCGGCTCAC TCAACCCCGT CCACCGGATC GAGCACTTCC TCACCCGCTC GCTCACCCTG 
CACGGCAAGG CCGGGACCCC GGCGCAGCTG CGCACCCGCC TGGATGGGCT GATGACCACT 
GTGGGCCTCA CTCCGGACAT GCTCAACTCC TACCCGCATG AACTTTCCGG CGGGCAACGG 
CAGCGCGTGG CCATCGCCCG GGCGCTCGCG GTGGAACCAG AAGTGATCCT CGCGGACGAA 
CCCACGTCGA TGCTGGACGT TTCCGTGCGG ATCGGCATCC TCAACCTGAT GCGCCAGTTG 
CGGGACAAGC AGGGGATCTC CATGCTCTAC ATCACCCACG ACCTCGCCTC CGCACGCTAC 
CTGGCGGACC GGATCGCCGT GATGTTCGCC GGGGAGCTGG TTGAGGAAGG TGAATCGCTG 
GACCTGCTGG CCAACCCGGG CCACCCGTAC ACCCGGCTGC TGGTCTCGGC GGTGCCGGAT 
CCCGCCCGGA CCGGATCCTA CGATCCCCGC GAACGGGCGG CACTGCGCGC AGCGGTGATG 
GAGTCGGCGT CGTGCGCGTT CGACGGCGAC CCGGAGCAGC GCTGTTCCGC CACCGAACCC 
GTCCGGCACC GTGTGGGCGA TCCCGCAAAT GAGCACTGGG TGCGCTGCCA CCTTTACCGG 
CCGCCGGCCA CTGCGGCAAG CCACGCCCTG TCCGCCGAGC CCCTCGAAAC ACCGGAGACG 
CCGCCAACGG ACGGATCCCG CACAGAAAAC AAGGCTTCCT CATGA

Protein sequence

MSTPVSARPA PAPKSQDRGH GDTPALAVKG LVKDFHSGGL FSRASVRALG GVDLAIRKSE 
IVALVGESGS GKSTLARCIA RLEKPTAGQI LLNGTDVLKR DRFQASREYR SQLQMVFQDP 
FGSLNPVHRI EHFLTRSLTL HGKAGTPAQL RTRLDGLMTT VGLTPDMLNS YPHELSGGQR 
QRVAIARALA VEPEVILADE PTSMLDVSVR IGILNLMRQL RDKQGISMLY ITHDLASARY 
LADRIAVMFA GELVEEGESL DLLANPGHPY TRLLVSAVPD PARTGSYDPR ERAALRAAVM 
ESASCAFDGD PEQRCSATEP VRHRVGDPAN EHWVRCHLYR PPATAASHAL SAEPLETPET 
PPTDGSRTEN KASS