Gene Arth_3380 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3380
Symbol
ID	4444109
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	3801560
End bp	3802531
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	64%
IMG OID	639691203
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_832855
Protein GI	116671922
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1175] ABC-type sugar transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAGTA CAGCAAGAGA ACTGGTTCCG CCGGAATCAC GGGAGCCTGA AGGCGCTCCC 
GCGCAGCGGG CAAGGGGCGG CCGGGTCCGC CGCCTGTCCG GACAGGACAA GGTGGTCCTG 
TCGCTGATGG TGGGCATCCC CACCCTGATT GAACTGACCC TGGTGTGGCT GCCCATGCTG 
ATGTCCGTGG GCCTCAGCTT CACCCGGTGG AACGGCCTGG ACCTGGGCGA CATCCGCCCT 
GCGGGCCTGG ACAACTACCA GTACATCTCC CAGGACTACC CGCCGTTCTG GCCGGCGGTG 
CAGCACAACA TGCTGTGGCT CCTGTTCCTG GCCCTCATCG CCACGCCGCT GGGCCTGCTG 
CTGGCCGTGC TGCTGGACCA GAACATCCGC GGCAGCAAGA TCTACCAGAG CATCTTCTTT 
GCACCCGTGA TGCTGTCACT GGCCCTGATC GGCATCATCT GGCAGCTCTT CTACCAGCGC 
GACAACGGCC TGCTGAACTT CCTGCTTGGC ACAGCCGGGA CGCCGCAGGC CGTGGACTGG 
TTCGGGGATT CATCCGTCAA CATCTGGGCT GCGATGATCG CGGCCACCTG GCGGCATGCC 
GGCTACGTCA TGCTCCTGTA CCTGGCCGGG CTCAAGGGTG TGGACCCCAG CCTGAAGGAA 
GCCGCCGCCA TCGACGGCGC GAGCGCCGTC CAGACGTTTT TCCGGGTGGT CTTCCCGGCC 
ATGCGGCCCA TCAACATCGT GATAGTGGTC ATCACCATCA TCGAATCGCT GCGAGCCTTC 
GACGTCGTGT ACGTCATCAA CCGCGGCACC AACGGCCTGG AAATGCTCAG TGCCCTGGTG 
ATCCAGAACC TGGTGGGCGA AGGCCAGGTG ATCGGCGTCG GTTCGGCCCT GGCCGTGGTG 
CTGCTGGTCA TTTCCCTCGT CCCCATCGTC TTCTACCTCA GCCGCACCTT TGGCAAGGAG 
AACAAAGCAT GA

Protein sequence

MSSTARELVP PESREPEGAP AQRARGGRVR RLSGQDKVVL SLMVGIPTLI ELTLVWLPML 
MSVGLSFTRW NGLDLGDIRP AGLDNYQYIS QDYPPFWPAV QHNMLWLLFL ALIATPLGLL 
LAVLLDQNIR GSKIYQSIFF APVMLSLALI GIIWQLFYQR DNGLLNFLLG TAGTPQAVDW 
FGDSSVNIWA AMIAATWRHA GYVMLLYLAG LKGVDPSLKE AAAIDGASAV QTFFRVVFPA 
MRPINIVIVV ITIIESLRAF DVVYVINRGT NGLEMLSALV IQNLVGEGQV IGVGSALAVV 
LLVISLVPIV FYLSRTFGKE NKA