Gene Arth_0414 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0414
Symbol
ID	4447109
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	443519
End bp	444556
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	63%
IMG OID	639688213
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_829915
Protein GI	116668982
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1175] ABC-type sugar transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTACCG AATTGGGCCC GACGCCGGTA AAAAAGCCGG CGTCGGGCAG TCCCGAGATC 
CACCACGCAC CCAAGGGGGT GGGGGAGGAC AACCGGATCG CCAGCCAGGG CAGGTGGGCA 
TCGTGGCTGT TGGCCCCCAC GATCATCGCG CTGGCGGTTG TGATCGTTTA CCCGATCATC 
AGCGCACTCG TTATGTCCTT CCAAAAGGAC GCCGGCCTGG ATCCCGTCAC CGGGCTTTTC 
ACGGCGGGCG GCCCGGCAGG CGTCCAGAAC TACGTGAACT GGCTTGCCCA GCAGTGCTCC 
GCTCCCGGCG GCGGCACCGT GGCCTGCCCT CCCGGTACAC TGGGCGCCCA GTTCTGGTCC 
GCGACGGCCA CCACGTTTTT CTTCACCGTG GTGACCGTGA CCCTGGAAAC CGTCCTCGGT 
TTCTGGATGG CCCTCATCAT GGCCAGGACC TTCCGGGGAC GCAGCCTGGT CCGCGCAGCA 
GTCCTGGTCC CGTGGGCCAT TCCCACCGCT GTGACTGCCA AGCTGTGGCT GTTCATCTTC 
GCTTTTGAGG GCATCGCGAA CAAGCTGTTC AATACCACCA TCCTGTGGAC CGGCAGCGAG 
TGGCCGGCCA AGTGGGCAGT TATCATCGCC GACGTCTGGA AGACCACGCC GTTCATGGCC 
CTCCTCATCC TCGCCGGCCT CCAGATGATC CCCGCAGAGG TCTATGAGGC CGCCAAGGTT 
GACGGTGCCA GCACCTGGCA GCGGTTCCGC CTAATCACCC TGCCGCTGGT CAAGCCGGCG 
CTTATGGTGG CCGTCCTGTT CCGTACCCTG GACGCACTTC GCATGTTCGA CCTGCCGTAC 
ATCCTGACGG GCGGGGCCAA CAACACCACC ACGCTGTCCA TCTTGGTGAT CAACCAGATC 
AGGCAAGGCT TCAACGCGGC GGCAGCATTG TCCACCATTA CGTTCATCAT CATCTTCATC 
GTCGCGTTCA TCTTTGTGCG CTTCCTGGGT GCGAACGTCG TGGAACAAAG CGGAACCACC 
GGTAAGGGGA AGAAATGA

Protein sequence

MATELGPTPV KKPASGSPEI HHAPKGVGED NRIASQGRWA SWLLAPTIIA LAVVIVYPII 
SALVMSFQKD AGLDPVTGLF TAGGPAGVQN YVNWLAQQCS APGGGTVACP PGTLGAQFWS 
ATATTFFFTV VTVTLETVLG FWMALIMART FRGRSLVRAA VLVPWAIPTA VTAKLWLFIF 
AFEGIANKLF NTTILWTGSE WPAKWAVIIA DVWKTTPFMA LLILAGLQMI PAEVYEAAKV 
DGASTWQRFR LITLPLVKPA LMVAVLFRTL DALRMFDLPY ILTGGANNTT TLSILVINQI 
RQGFNAAAAL STITFIIIFI VAFIFVRFLG ANVVEQSGTT GKGKK