Gene Arth_0846 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0846
Symbol
ID	4446649
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	914474
End bp	915997
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	65%
IMG OID	639688653
Product	Na+/solute symporter
Protein accession	YP_830344
Protein GI	116669411
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGCAA ACTTCGTCAA CATCGCCATC GTGGTGGTGT ACCTGATCGC CATGCTGGCC 
TTCGGCTGGT GGGGCAAATC CCGCACCAAG AACAACAGCG ACTTCCTGGT GGCCGGCCGC 
AGGCTTGGCC CCTTCCTCTA TACCGGGACC ATGGCGGCCG TTGTCCTCGG CGGCGCCTCA 
ACGGTGGGCG GTGTGGGCCT CGGCTACAAG TTCGGCATCT CCGGCATGTG GCTCGTGGTG 
GCCATCGGGT CCGGAGTGCT CCTGCTGAGC CTGCTCTTCG CCGGCACCAT CCAGAAGCTG 
AAGATCTACA CGGTGTCCCA AATGCTGACG CTCCGATACG GCAGCCGCGC CACCCAGACC 
TCAGGAATCG TGATGCTGGC CTACACGCTG ATGCTCTGCG CCACCTCCAC CGGGGCCTAC 
GCCACCATCT TTGTGGTGCT GTTCGGCTGG GACCGCGCCC TCGCCATCGC CGTTGGCGGG 
GCGATCGTCC TGGTGTACTC CACCATTGGC GGCATGTGGT CCATCACCCT TGCGGACCAG 
GTCCAGTTCG TCATCAAGAC GGTGGGGATC TTCCTCCTGA TGCTCCCCTT CACGCTTAAT 
GCAGCCGGAG GCCTGGACGG CATCCGCAGC CGCGTCGAGG ACAGCTTCTT CCAGATCGAC 
GGCATCGGGA TCCAGACCAT CATCACGTAC TTCGTGGTCT ACACCCTCGG CCTCCTGATC 
GGCCAGGACA TCTGGCAGCG CGTCTTCACC GCCAAGACGC CCACCGTGGC ACGCTGGGGC 
GGCGCAACGG CCGGCATCTA CTGCATCCTT TACGGTGCGG CCGGCGCCCT GATCGGCCTG 
GGTGCGCGAG TGGCCCTCCC GGAGATCGAC GTCGCAAACC TCGGCAAGGA CGTTGTCTAT 
GCCGAGGTGG CCCAGAACCT GCTGCCCGTC GGCATCGGCG GACTGGTGCT CGCAGCAGCC 
GTAGCGGCCA TGATGTCCAC CGCCTCCGGC GCCCTGATCG CGGCGGCAAC CGTGGCCCGT 
GCCGACGTCC TTCCGTTCGT TGCCAGCTGG TTCGGCAAGG ACATCAACAC CGATGACACC 
GACAACCCCG AGCACGACGT CAAGGCGAAC CGCATGTGGG TCCTTGGCCT TGGCATCGTG 
GCCATCCTCA TCGCCATCAT CACCAAGGAC GTCGTGGCAG CCCTGACCAT CGCCTACGAC 
ATCCTGGTGG GCGGACTCCT GGTCGCGATC CTTGGCGGAC TCGTCTGGAA ACGGGGCACG 
GGCGTGGCCG CGGCGGCATC CATGGCGGTA GGCACGGTGG TAACACTCGG CACCATGATC 
TACCTGGAGA TCAATGCCGC GGCGCCGCTG GACGGCATCT ACGCCAATGA GCCGATCTAT 
TACGGCCTGC TGGCGTCAGG CATCGTCTAC GTGGTGGTGT CCGTGGCAAC CAAGCCCACC 
GACCCCCGGG TCATGCGGAA CTGGCAGGAG CGCGTCGCCG GCAACGTCGA CGAAGAAGAG 
CCGGCTCCGG CTCTGGTCAA CTAA

Protein sequence

MDANFVNIAI VVVYLIAMLA FGWWGKSRTK NNSDFLVAGR RLGPFLYTGT MAAVVLGGAS 
TVGGVGLGYK FGISGMWLVV AIGSGVLLLS LLFAGTIQKL KIYTVSQMLT LRYGSRATQT 
SGIVMLAYTL MLCATSTGAY ATIFVVLFGW DRALAIAVGG AIVLVYSTIG GMWSITLADQ 
VQFVIKTVGI FLLMLPFTLN AAGGLDGIRS RVEDSFFQID GIGIQTIITY FVVYTLGLLI 
GQDIWQRVFT AKTPTVARWG GATAGIYCIL YGAAGALIGL GARVALPEID VANLGKDVVY 
AEVAQNLLPV GIGGLVLAAA VAAMMSTASG ALIAAATVAR ADVLPFVASW FGKDINTDDT 
DNPEHDVKAN RMWVLGLGIV AILIAIITKD VVAALTIAYD ILVGGLLVAI LGGLVWKRGT 
GVAAAASMAV GTVVTLGTMI YLEINAAAPL DGIYANEPIY YGLLASGIVY VVVSVATKPT 
DPRVMRNWQE RVAGNVDEEE PAPALVN