Gene Arth_0398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0398
Symbol
ID	4447125
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	423698
End bp	425377
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	64%
IMG OID	639688197
Product	extracellular solute-binding protein
Protein accession	YP_829899
Protein GI	116668966
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.333674
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACAAG CACGATTCCT GAGGTCTGCC CGCATCGCAG CGGCCGGACT GGCCATGGGC 
GCCATGGTGC TCACCGGGTG CTCCGCCAAC GCGGGCAACA CCGGTTCCGC GAAGGCTGAT 
GCTTCGGCCC AGACCGCTCT GCTGACCATT CCCCGCGAGG ACATGGGCAC GTTTGTCCGG 
AACTTCAACC CGTTCGCCCC CACCGTGGCA CCTATGACCC AGCAGGCCAT CTACGAGTCC 
CTGCTCATCT ACAACCCGGC CAACGGCGAC ACCACTCCGT GGCTGGCCAG CGAATGGAAA 
GCCGCAGAGG ACGGCAAGTC CATCACCTTC ACCCTCCGCG ACGGCGTCAA GTGGTCCGAC 
GGCCAGCCCC TGGTCCCTGC CGACGTGGTC ACCACGTTCG CGCTGCAGAA GAAGATCAAG 
GGCGGCTACG ACTACCTGGA CACCGTTACG GCCGAGGGCA CCAACCAGGT CAAGTTCAGC 
TTCAAAACCG CCTGGTCCCC GGCCTTGTTC GACCTCGGCC AGCTGAGCAT CCTTCCGGAC 
CACGTCTGGT CCAAGATTGC CGACCCCGAA AAGGACGCCA ACGAAAAGCC CGTTGGCACG 
GGCCCCTACA CCGAAGTGGA CACCTTCCAG GCACAGTCCT TCGTGCTGAA GAAAAACCCC 
AACTACTGGC AGCCGGAGAA GCAGAAGATC GCAGGCATCA AGATGCTCGC CTTCGCCGGG 
AACGACGGCG CCAACCTCGC CGCCGCGAAC GGCGACGTGG ACTGGGCGCC GCAGTACATG 
CCCAACATCG AGAAGACCTT CATTTCCAAG GACCCGGACC ACCGGAAGTA CTGGTTCCCG 
CCCACGGGGT CCATGATCAA CTGGCAGCTC AACACCACCA AGGCCCCGTT CAACGACACG 
GACGTCCGCA AGGCCCTCAG CATGGCAGTG GACCGGGACC AGGTGACCAA GATCGGCATG 
AGCGGCTACA CCAAGCCGGC GGACTGCACC GGACTTTCCG GCAACTACGA AACGTGGAAG 
AACAAAGCCG TCCAGGACGA CTGCGAGTGG ACCAAGCTCA ACGTCGACGA GGCCAACAAG 
CTCCTGGACA AGGCCGGTTA CGCCAAGGGC GCGGACGGCA AGCGCACGCT GAAGGACGGC 
AAGCCCTTCG AGTTCAAGAT CTCGGTGGGC GCGGCGTCCT CCGACTGGCT GTCCGTGGCC 
AACGTGATCG CACAGAACCT CGCCGAGGTG GGCGTCACGG CCAAGGTTGA TTCCCCGGAC 
TGGGCTGCCG TGGTGGCAGG CTACGAGACC GGTGACTTCG ATTCCGGCAT CGTGTGGAGC 
GCCAACGATC CCAGCCCGTA CAAGTACTTC GCGGGCATCA TGGGCACCAG CACGGTGAAG 
CCGGTAGGGG AGAAGGCCTT TGAGAACTAC CACCGCTTCG GCGATCCCAA AGCCGACGCC 
CTGCTGACCG AGTTCGCCGC TGCCGCTGAC GAGGACACGC AGCACGAGAT CGCGGACAAG 
CTCCAGGAGG AGTACAGCGC GGTTGCCCCG ACCGTCCCGC TGTTCGCCGG CCCGGAATGG 
GGCGCCTACA ACAACACCCG GTTCACCGGC TGGCCCACGG AAGAGAACCC TTACGCCACC 
CTGTCGGTCC GCGCCCCCAC CACGGTGCTG GTCCTGACGT CGCTGGAACC GGCCAAGTAA

Protein sequence

MTQARFLRSA RIAAAGLAMG AMVLTGCSAN AGNTGSAKAD ASAQTALLTI PREDMGTFVR 
NFNPFAPTVA PMTQQAIYES LLIYNPANGD TTPWLASEWK AAEDGKSITF TLRDGVKWSD 
GQPLVPADVV TTFALQKKIK GGYDYLDTVT AEGTNQVKFS FKTAWSPALF DLGQLSILPD 
HVWSKIADPE KDANEKPVGT GPYTEVDTFQ AQSFVLKKNP NYWQPEKQKI AGIKMLAFAG 
NDGANLAAAN GDVDWAPQYM PNIEKTFISK DPDHRKYWFP PTGSMINWQL NTTKAPFNDT 
DVRKALSMAV DRDQVTKIGM SGYTKPADCT GLSGNYETWK NKAVQDDCEW TKLNVDEANK 
LLDKAGYAKG ADGKRTLKDG KPFEFKISVG AASSDWLSVA NVIAQNLAEV GVTAKVDSPD 
WAAVVAGYET GDFDSGIVWS ANDPSPYKYF AGIMGTSTVK PVGEKAFENY HRFGDPKADA 
LLTEFAAAAD EDTQHEIADK LQEEYSAVAP TVPLFAGPEW GAYNNTRFTG WPTEENPYAT 
LSVRAPTTVL VLTSLEPAK